vllm/model_executor at cf8cac8c701079a3fda068ffd1cd6f72a490aa6d - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-23 14:37:14 +08:00

History

Woosuk Kwon 826b82a260

[Misc] Fix expert_ids shape in MoE (#4517 )

2024-05-01 23:47:59 +00:00

..

guided_decoding

Allow user to define whitespace pattern for outlines (#4305 )

2024-04-30 20:48:39 -07:00

[Misc] Fix expert_ids shape in MoE (#4517 )

2024-05-01 23:47:59 +00:00

[Frontend] [Core] Tensorizer: support dynamic num_readers, update version (#4467 )

2024-04-30 16:32:13 -07:00

[Misc] Remove Mixtral device="cuda" declarations (#4543 )

2024-05-01 16:30:52 -07:00

__init__.py

[Core] Refactor Attention Take 2 (#3462 )

2024-03-25 04:39:33 +00:00

sampling_metadata.py

[Core] Refactoring sampler and support prompt logprob for chunked prefill (#4309 )

2024-04-26 13:02:02 +00:00

utils.py

[Hardware][Neuron] Refactor neuron support (#3471 )

2024-03-22 01:22:17 +00:00