vllm/attention at b8533148ed932dd2003bb888bd9949ecdc7e56db - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-04-11 18:47:08 +08:00

History

Pleaplusone d9d342d214

[Performance][MLA][ROCm] Remove redundant D2D copy in deepseek (#27457 )

Signed-off-by: ganyi <ygan@amd.com>

2025-11-26 12:45:28 +08:00

..

[Core] Deprecate xformers (#29262 )

2025-11-24 04:18:55 +00:00

[Core] Generalize Encoder-Decoder seq_lens computation to avoid Whisper hardcoded logic (#29268 )

2025-11-25 11:32:11 +00:00

[Performance][MLA][ROCm] Remove redundant D2D copy in deepseek (#27457 )

2025-11-26 12:45:28 +08:00

[Misc] Refactor Attention kv transfer methods into decorator (#27816 )

2025-11-12 16:05:44 +00:00

__init__.py

[Model][Mamba] Add selector for mamba attention backend and make it pluggable for other device (#26487 )

2025-11-19 16:24:55 +00:00

layer.py

[Core] Deprecate xformers (#29262 )

2025-11-24 04:18:55 +00:00

selector.py

[Core] Deprecate xformers (#29262 )

2025-11-24 04:18:55 +00:00