Fixing pre-hook errors.

s3woz · s3woz · commit 3569fe42c1bf · 2025-04-30T21:08:40.000Z
Signed-off-by: Stanislaw Wozniak &lt;stw@zurich.ibm.com&gt;
diff --git a/tests/models/registry.py b/tests/models/registry.py
@@ -163,7 +163,7 @@ def check_available_online(
                                           {"1b": "EleutherAI/pythia-1.4b"}),
     "GraniteForCausalLM": _HfExamplesInfo("ibm/PowerLM-3b"),
     "GraniteMoeForCausalLM": _HfExamplesInfo("ibm/PowerMoE-3b"),
-    "GraniteMoeHybridForCausalLM": _HfExamplesInfo("ibm-research/granite-4.0-tiny-test"),
+    "GraniteMoeHybridForCausalLM": _HfExamplesInfo("ibm-research/granite-4.0-tiny-test"),  # noqa: E501
     "GraniteMoeSharedForCausalLM": _HfExamplesInfo("ibm-research/moe-7b-1b-active-shared-experts"),  # noqa: E501
     "Grok1ModelForCausalLM": _HfExamplesInfo("hpcai-tech/grok-1",
                                              trust_remote_code=True),
diff --git a/vllm/model_executor/models/granitemoehybrid.py b/vllm/model_executor/models/granitemoehybrid.py
@@ -239,7 +239,8 @@ def __init__(
                 rotary_dim=self.head_dim,
                 max_position=config.max_position_embeddings,
                 base=int(config.rope_theta),
-                rope_scaling=config.rope_scaling if hasattr(config, "rope_scaling") \
+                rope_scaling=config.rope_scaling \
+                    if hasattr(config, "rope_scaling") \
                     and config.rope_scaling is not None else None,
                 is_neox_style=True,
             )
@@ -404,7 +405,7 @@ def _load_expert(n, p, name, shard_id, expert_id):
                 n = n.replace("A_log", "A")
 
             # Logic analogous to: https://github.com/vllm-project/vllm/blob/f49e5aff11c986ed4d45202b1716c5d74786efa9/vllm/model_executor/models/granitemoeshared.py#L215
-            # Mapping different experts' layout: from HF (input_linear, output_linear, router) 
+            # Mapping different experts' layout: from HF (input_linear, output_linear, router)
             # to vLLM (experts_w13({e}.w1, {e}.w2), experts_w3({e}.w3), gate)
             if n.endswith('.block_sparse_moe.input_linear.weight'):
                 for e in range(p.size(0)):
@@ -425,7 +426,7 @@ def _load_expert(n, p, name, shard_id, expert_id):
                         '.block_sparse_moe.output_linear.weight',
                         f".block_sparse_moe.experts.{e}.w2.weight")
                     w2_param = p[e]
-                    _load_expert(n.replace('.output_linear.', '.experts.w2_'), 
+                    _load_expert(n.replace('.output_linear.', '.experts.w2_'),
                                  w2_param, w2_name, shard_id='w2', expert_id=e)
             elif n.endswith('.block_sparse_moe.router.layer.weight'):
                 gate_name = n.replace('.block_sparse_moe.router.layer.weight',
@@ -437,8 +438,8 @@ def _load_expert(n, p, name, shard_id, expert_id):
         return loaded_params
 
 
-class GraniteMoeHybridForCausalLM(nn.Module, HasInnerState, SupportsLoRA, SupportsPP,
-                       IsHybrid, SupportsV0Only, SupportsQuant):
+class GraniteMoeHybridForCausalLM(nn.Module, HasInnerState, SupportsLoRA, 
+        SupportsPP, IsHybrid, SupportsV0Only, SupportsQuant):
     packed_modules_mapping = {}
     embedding_modules = {
         "embed_tokens": "input_embeddings",
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
@@ -65,7 +65,7 @@
     "GPTNeoXForCausalLM": ("gpt_neox", "GPTNeoXForCausalLM"),
     "GraniteForCausalLM": ("granite", "GraniteForCausalLM"),
     "GraniteMoeForCausalLM": ("granitemoe", "GraniteMoeForCausalLM"),
-    "GraniteMoeHybridForCausalLM": ("granitemoehybrid", "GraniteMoeHybridForCausalLM"),
+    "GraniteMoeHybridForCausalLM": ("granitemoehybrid", "GraniteMoeHybridForCausalLM"),   # noqa: E501
     "GraniteMoeSharedForCausalLM": ("granitemoeshared", "GraniteMoeSharedForCausalLM"),   # noqa: E501
     "GritLM": ("gritlm", "GritLM"),
     "Grok1ModelForCausalLM": ("grok1", "Grok1ForCausalLM"),