vllm/attention at bf3ffb61e61525cce5fdec8a249f8114a0c0bfcc - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-13 00:47:28 +08:00

History

Benjamin Chislett bf3ffb61e6

[Bugfix] Fix ChunkedLocalAttention CUDA Graph setting (#28739 )

Signed-off-by: Benjamin Chislett <bchislett@nvidia.com>

2025-11-14 14:14:46 -08:00

..

[CI Failure] Fix backend selection for encoder-only models (#28534 )

2025-11-13 10:11:27 -05:00

[Bugfix] Fix ChunkedLocalAttention CUDA Graph setting (#28739 )

2025-11-14 14:14:46 -08:00

[Bugfix][CI/Test][Spec Decode] Fix illegal memory access in offline_inference/spec_decode.py (Issue 27619) (#28432 )

2025-11-13 22:34:01 -08:00

[Misc] Refactor Attention kv transfer methods into decorator (#27816 )

2025-11-12 16:05:44 +00:00

__init__.py

Convert formatting to use ruff instead of yapf + isort (#26247 )

2025-10-05 07:06:22 -07:00

layer.py

[CI Failure] Fix backend selection for encoder-only models (#28534 )

2025-11-13 10:11:27 -05:00

selector.py

[CI Failure] Fix backend selection for encoder-only models (#28534 )

2025-11-13 10:11:27 -05:00