intel · cyita · Jan 16, 2025 · Jan 17, 2025 · Jan 17, 2025 · Jan 21, 2025
diff --git a/python/llm/src/ipex_llm/transformers/convert.py b/python/llm/src/ipex_llm/transformers/convert.py
@@ -1181,10 +1181,10 @@ def replace_RotaryEmbed(m, target_m,  replace_embed):
 
 
 def replace_func(m, target_m, func_name, new_func):
+    if m.__class__ == target_m:
+        bound_method = new_func.__get__(m, m.__class__)
+        setattr(m, func_name, bound_method)
     for _, sub_m in m.named_children():
-        if sub_m.__class__ == target_m:
-            bound_method = new_func.__get__(sub_m, sub_m.__class__)
-            setattr(sub_m, func_name, bound_method)
         replace_func(sub_m, target_m, func_name, new_func)
 
 
@@ -1646,6 +1646,11 @@ def _optimize_post(model):
         from ipex_llm.transformers.models.qwen2_vl import qwen2_vision_attention_forward
         from ipex_llm.transformers.models.qwen2_vl import qwen2_vl_model_forward
         from ipex_llm.transformers.models.qwen2_vl import qwen2_vl_attention_forward
+        from ipex_llm.transformers.models.qwen2_vl import qwen2_vit_pretrained_model_forward
+        from ipex_llm.transformers.models.qwen2_vl import qwen2_vl_vision_block_forward
+        from ipex_llm.transformers.models.qwen2_vl import qwen2_vl_conditional_generation_forward
+        from ipex_llm.transformers.models.qwen2_vl import get_rope_index
+        from ipex_llm.transformers.models.qwen2_vl import prepare_inputs_for_generation
         convert_forward(model, module.Qwen2RMSNorm, rms_norm_forward)
         convert_forward(model, module.Qwen2MLP, qwen2_mlp_forward)
         model.visual.get_dtype = MethodType(qwen2_vision_get_dtype, model.visual)
@@ -1654,6 +1659,15 @@ def _optimize_post(model):
         convert_forward(model, module.Qwen2VLModel, qwen2_vl_model_forward)
         convert_forward(model, module.Qwen2VLAttention, qwen2_vl_attention_forward)
         convert_forward(model, module.Qwen2VLSdpaAttention, qwen2_vl_attention_forward)
+        convert_forward(model, module.Qwen2VisionTransformerPretrainedModel,
+                        qwen2_vit_pretrained_model_forward)
+        convert_forward(model, module.Qwen2VLVisionBlock, qwen2_vl_vision_block_forward)
+        convert_forward(model, module.Qwen2VLForConditionalGeneration,
+                        qwen2_vl_conditional_generation_forward)
+        replace_func(model, module.Qwen2VLForConditionalGeneration,
+                     "get_rope_index", get_rope_index)
+        replace_func(model, module.Qwen2VLForConditionalGeneration,
+                     "prepare_inputs_for_generation", prepare_inputs_for_generation)
     elif model.config.model_type == "aquila":
         modeling_module_name = model.__class__.__module__
         module = importlib.import_module(modeling_module_name)