vllm/model_loader at c16369455f9568b709d286be0857375a860842ab - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-27 12:57:25 +08:00

History

Li, Jiang 0b952af458

[Hardware][Intel] Support compressed-tensor W8A8 for CPU backend (#7257 )

2024-09-11 09:46:46 -07:00

..

__init__.py

[VLM] Refactor MultiModalConfig initialization and profiling (#7530 )

2024-08-17 13:30:55 -07:00

loader.py

[Hardware][Intel] Support compressed-tensor W8A8 for CPU backend (#7257 )

2024-09-11 09:46:46 -07:00

neuron.py

[Neuron] Adding support for adding/ overriding neuron configuration a… (#8062 )

2024-09-04 16:33:43 -07:00

openvino.py

[Core] Logprobs support in Multi-step (#7652 )

2024-08-29 19:19:08 -07:00

tensorizer.py

[Bugfix] Fix broken OpenAI tensorizer test (#8258 )

2024-09-07 08:02:39 +00:00

utils.py

[Misc] Fused MoE Marlin support for GPTQ (#8217 )

2024-09-09 23:02:52 -04:00

weight_utils.py

[Hardware][NV] Add support for ModelOpt static scaling checkpoints. (#6112 )

2024-09-11 00:38:40 -04:00