vllm/model_executor at a7be4d00725db5ae4f738f70c3a89fd9dedaf7ec - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-26 09:37:11 +08:00

History

Swapnil Parekh a7be4d0072

[CORE] Improvement in ranks code (#4718 )

2024-05-12 17:47:47 -07:00

..

guided_decoding

Allow user to define whitespace pattern for outlines (#4305 )

2024-04-30 20:48:39 -07:00

[CORE] Improvement in ranks code (#4718 )

2024-05-12 17:47:47 -07:00

[Core] Fix circular reference which leaked llm instance in local dev env (#4737 )

2024-05-10 23:54:32 +09:00

[Model] Add support for IBM Granite Code models (#4636 )

2024-05-11 21:27:24 -07:00

__init__.py

[Core] Refactor Attention Take 2 (#3462 )

2024-03-25 04:39:33 +00:00

pooling_metadata.py

[Model][Misc] Add e5-mistral-7b-instruct and Embedding API (#3734 )

2024-05-11 11:30:37 -07:00

sampling_metadata.py

[Core][Model runner refactoring 1/N] Refactor attn metadata term (#4518 )

2024-05-03 10:20:12 -07:00

utils.py

[Hardware][Neuron] Refactor neuron support (#3471 )

2024-03-22 01:22:17 +00:00