vllm/layers at b7b6396584ab5565d3c2cbe1d2257fc4d0718599 - vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-04-25 03:57:04 +08:00

History

[LoRA] Support FusedMoE LoRA Triton kernel for mxfp4 (#29708 )

Signed-off-by: Xin Yang <xyangx@amazon.com>
Signed-off-by: Xin Yang <105740670+xyang16@users.noreply.github.com>
Co-authored-by: Jee Jee Li <pandaleefree@gmail.com>

2025-11-30 10:37:25 +08:00

__init__.py

[LoRA] Optimize 3D MoE logic (#29222 )

2025-11-24 10:27:23 +08:00

base_linear.py

[LoRA] Optimize 3D MoE logic (#29222 )

2025-11-24 10:27:23 +08:00

base.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00

column_parallel_linear.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00

fused_moe.py

[LoRA] Support FusedMoE LoRA Triton kernel for mxfp4 (#29708 )

2025-11-30 10:37:25 +08:00

logits_processor.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00

replicated_linear.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00

row_parallel_linear.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00

utils.py

[Bugfix] Fix getting device for MoE LoRA (#29475 )

2025-11-26 23:16:07 -08:00

vocal_parallel_embedding.py

[LoRA] Continue optimizing MoE LoRA weight loading (#29322 )

2025-11-27 05:56:28 -08:00