vllm/model_executor at 3cbb27227b579ffbc2e1369786e6d8f390211235 - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-10 06:47:09 +08:00

History

Chenxi Yang eaedb7d39e

Merge branch 'main' into export-D82469889

2025-09-18 21:06:12 -07:00

..

Merge branch 'main' into export-D82469889

2025-09-18 21:06:12 -07:00

[Docs] Fix warnings in mkdocs build (continued) (#24740 )

2025-09-12 06:43:15 -07:00

[Perf] Optimize memory peak during EAGLE model loading. (#24585 )

2025-09-19 03:31:16 +00:00

[BugFix] Fix DeepGEMM warmup, no m.weight_scale_inv (#25206 )

2025-09-18 14:26:28 -07:00

__init__.py

[Misc] Add SPDX-FileCopyrightText (#19100 )

2025-06-03 11:20:17 -07:00

custom_op.py

[V0 deprecation] Deprecate V0 Neuron backend (#21159 )

2025-09-06 16:15:18 -07:00

parameter.py

[Core] Allow disabling TP sharding for parallel Linear layer (#23024 )

2025-09-05 22:53:58 -07:00

sampling_metadata.py

[Doc]: fix typos in Python comments (#24042 )

2025-09-01 19:07:45 -07:00

utils.py

[Bugfix] Fix _synced_weight_loader (#24565 )

2025-09-11 16:52:33 +08:00