vllm/block at 3f9b7ab9f59f83ab0551a6a2f1894e30bc0cb41c - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-06 23:55:48 +08:00

History

Sungjae Lee c31d4a57a6

[Core] support LoRA and prompt adapter in content-based hashing for Block Manager v2 prefix caching (#8240 )

2024-12-13 07:51:25 -08:00

..

[Core] Add Sliding Window Support with Flashinfer (#10462 )

2024-11-20 19:56:47 -08:00

__init__.py

[Core][Bugfix]Refactor block manager for better testability (#3492 )

2024-03-27 23:59:28 -07:00

conftest.py

[Misc] [CI/Build] Speed up block manager CPU-only unit tests ~10x by opting-out of GPU cleanup (#3783 )

2024-04-02 00:49:51 +00:00

test_block_manager.py

[Core] Deprecating block manager v1 and make block manager v2 default (#8704 )

2024-10-17 11:38:15 -05:00

test_block_table.py

[Core] Optimize block_manager_v2 vs block_manager_v1 (to make V2 default) (#5602 )

2024-07-01 20:10:37 -07:00

test_common.py

[Core][Bugfix]Refactor block manager for better testability (#3492 )

2024-03-27 23:59:28 -07:00

test_cpu_gpu_block_allocator.py

[Misc] Small perf improvements (#6520 )

2024-07-19 12:10:56 -07:00

test_naive_block.py

[Bugfix] Block manager v2 with preemption and lookahead slots (#8824 )

2024-09-29 09:17:45 +08:00

test_prefix_caching_block.py

[Core] support LoRA and prompt adapter in content-based hashing for Block Manager v2 prefix caching (#8240 )

2024-12-13 07:51:25 -08:00