vllm/lora at ee93f4f92acbd9759a9af80747bc2a4459f07639 - vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-16 23:37:19 +08:00

History

Qubitium-ModelCloud ee93f4f92a

Co-authored-by: Robert Shaw <rshaw@neuralmagic.com>
Co-authored-by: ZX <zx@lbx.dev>

2024-07-02 22:25:17 +00:00

__init__.py

2024-01-23 15:26:37 -08:00

fully_sharded_layers.py

2024-06-21 04:46:28 +00:00

layers.py

2024-07-02 22:25:17 +00:00

lora.py

2024-06-27 16:03:04 +08:00

models.py

2024-06-30 17:11:15 +00:00

punica.py

2024-06-30 20:07:34 -07:00

request.py

2024-05-18 16:05:23 +09:00

utils.py

2024-06-21 04:46:28 +00:00

worker_manager.py

2024-06-21 15:42:46 -07:00