vllm/block at 9ba0bd6aa6a9a3cefa5c320800ea736a0abbaf36 - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-24 13:17:25 +08:00

History

sroy745 c8f26bb636

[BugFix][Core] Fix BlockManagerV2 when Encoder Input is None (#9103 )

2024-10-07 03:52:42 +00:00

..

__init__.py

[Bugfix] Add __init__.py files for vllm/core/block/ and vllm/spec_decode/ (#3798 )

2024-04-02 12:35:31 -07:00

block_table.py

[BugFix][Core] Fix BlockManagerV2 when Encoder Input is None (#9103 )

2024-10-07 03:52:42 +00:00

common.py

[MISC] Add prefix cache hit rate to metrics (#7606 )

2024-08-19 11:52:07 -07:00

cpu_gpu_block_allocator.py

[Bugfix] Block manager v2 with preemption and lookahead slots (#8824 )

2024-09-29 09:17:45 +08:00

interfaces.py

[Bugfix] Block manager v2 with preemption and lookahead slots (#8824 )

2024-09-29 09:17:45 +08:00

naive_block.py

[Bugfix] Block manager v2 with preemption and lookahead slots (#8824 )

2024-09-29 09:17:45 +08:00

prefix_caching_block.py

[Bugfix] Block manager v2 with preemption and lookahead slots (#8824 )

2024-09-29 09:17:45 +08:00

utils.py

[Core] Subclass ModelRunner to support cross-attention & encoder sequences (towards eventual encoder/decoder model support) (#4942 )

2024-08-06 16:51:47 -04:00