xinyun/vllm - vllm - 丝路新云-代码仓

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-21 18:07:15 +08:00

Author	SHA1	Message	Date
Michael Goin	493b10f8bf	[CI] GPT-OSS GPQA eval test for Blackwell (#24920 ) Signed-off-by: mgoin <mgoin64@gmail.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>	2025-09-16 18:13:21 -07:00
Andrew Sansom	02d4b85454	Use kwargs for long lists of `EngineCoreRequest` arguments in tests and fix extra kwargs (#24987 ) Signed-off-by: Andrew Sansom <andrew@protopia.ai>	2025-09-16 14:06:56 -07:00
Andrew Xia	86daa875fe	[gpt-oss][1][bugfix] fix streaming final output (#24466 ) Signed-off-by: Andrew Xia <axia@meta.com>	2025-09-16 13:56:16 -06:00
Andrew Xia	f4d6eb95cf	[gpt-oss][1b] streaming add item id, content id (#24788 ) Signed-off-by: Andrew Xia <axia@meta.com>	2025-09-16 18:41:12 +00:00
Sage Moore	567939953b	[Core/DBO][1/N] Add Dual-Batch Overlap mechanism to VLLM (#23693 ) Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com> Signed-off-by: Sage Moore <sage@neuralmagic.com> Signed-off-by: Lucas Wilkinson <lwilkinson@neuralmagic.com> Signed-off-by: yewentao256 <zhyanwentao@126.com> Co-authored-by: Lucas Wilkinson <lwilkins@redhat.com> Co-authored-by: Lucas Wilkinson <lwilkinson@neuralmagic.com> Co-authored-by: yewentao256 <zhyanwentao@126.com> Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>	2025-09-16 12:21:48 -04:00
Ming Yang	4e5affeaa1	[CI] Add Decode Context Parallelism (DCP) test to CI (#24487 ) Signed-off-by: Ming Yang <minos.future@gmail.com>	2025-09-16 21:21:28 +08:00
Chen Bruce	7ea5c73ad7	[Feat][EPLB] A novel static EPLB placement strategy for MoE models. (#23745 ) Signed-off-by: bruceszchen <bruceszchen@tencent.com> Signed-off-by: Chen Bruce <bruceszchen@tencent.com> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Signed-off-by: Chen Bruce <cszwwdz@vip.qq.com> Co-authored-by: lemon412 <lemon412@foxmail.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-09-16 10:55:16 +00:00
cascade	17871983a2	[Bugfix] Fix sequence parallelism bug when enable pipeline parallelism (#24021 ) Signed-off-by: cascade812 <cascade812@outlook.com>	2025-09-16 04:32:32 +00:00
Woosuk Kwon	759ef49b15	Remove V0 Encoder-Decoder Support (#24907 ) Signed-off-by: Woosuk Kwon <woosuk@thinkingmachines.ai>	2025-09-15 21:17:14 -07:00
Mark McLoughlin	2942970d44	[Metrics] Hide deprecated metrics with gpu_ prefix (#24245 ) Signed-off-by: Mark McLoughlin <markmc@redhat.com>	2025-09-15 20:15:57 -06:00
Wentao Ye	3c96e7b8a1	[CI] Small Accuracy Eval Test for Deepseek Model (#24259 ) Signed-off-by: yewentao256 <zhyanwentao@126.com>	2025-09-15 20:14:50 -06:00
Gregory Shtrasberg	2891603efd	[ROCm][Bugfix] Fix the case where there's bias (#24895 ) Signed-off-by: Gregory Shtrasberg <Gregory.Shtrasberg@amd.com>	2025-09-15 20:05:12 -06:00
Jiangyun Zhu	5bcc153d7b	[Compile] Fix noop_elimination pass and add tests for noop_elimination (#24880 ) Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>	2025-09-15 23:33:18 +00:00
Mickaël Seznec	45bfa49cb8	[Tests] fix initialization of kv hash in tests (#24273 ) Signed-off-by: Mickael Seznec <mickael@mistral.ai>	2025-09-15 21:48:27 +00:00
Andrew Xia	25aba2b6a3	[gpt-oss] Add IncompleteDetails to ResponsesRepsonse (#24561 ) Signed-off-by: Andrew Xia <axia@meta.com>	2025-09-15 13:07:55 -07:00
Kyle Sayers	a0b26701c9	[Transform] Deterministic Hadacore Transforms (#24106 ) Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>	2025-09-15 12:59:31 -06:00
Harry Mellor	c4afdb69cc	Move `MultiModalConfig` from `config/__init__.py` to `config/multimodal.py` (#24659 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>	2025-09-15 17:43:16 +00:00
Isotr0py	0e219cd50b	[Bugfix] Fix GLM4.1V multimodal processor with compatability for Transformers v4.56 (#24822 ) Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-15 20:45:06 +08:00
ant-yy	72c99f2a75	[Model]: support Ling2.0 (#24627 ) Signed-off-by: vito.yy <vito.yy@antgroup.com> Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-15 05:09:30 -07:00
Ning Xie	bc0f6059a2	[UT] enhance free kv cache block queue popleft_n (#24220 ) Signed-off-by: Andy Xie <andy.xning@gmail.com>	2025-09-15 10:04:37 +00:00
Ce Gao	f4a948f33f	[Frontend] Skip `stop` in reasoning content (#14550 ) Signed-off-by: Ce Gao <cegao@tensorchord.ai> Co-authored-by: Chauncey <chaunceyjiang@gmail.com>	2025-09-15 06:04:55 +00:00
Ning Xie	3f3313981c	[kv cache] update num_free_blocks in the end (#24228 ) Signed-off-by: Andy Xie <andy.xning@gmail.com>	2025-09-15 05:15:12 +00:00
Chen Zhang	8e5cdcda4e	[Hybrid Allocator] Support Pipeline Parallel (#23974 ) Signed-off-by: Chen Zhang <zhangch99@outlook.com>	2025-09-14 15:55:17 -07:00
Wenlong Wang	cfa3234a5b	[CI][Spec Decode] Adjust threshold for flaky ngram spec decoding test again (#24771 ) Signed-off-by: wwl2755 <wangwenlong2755@gmail.com>	2025-09-13 15:45:11 +08:00
Michael Goin	59d7ffc17f	[CI Failure] Fix test_flashinfer_cutlass_mxfp4_mxfp8_fused_moe (#24750 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-09-13 07:29:19 +00:00
Elvir Crnčević	98229db244	[Kernels][DP/EP] Optimize Silu Kernel for R1 (#24054 ) Signed-off-by: elvircrn <elvircrn@gmail.com>	2025-09-13 00:17:27 -07:00
Woosuk Kwon	5febdc8750	[Chore] Remove unused batched RoPE op & kernel (#24789 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2025-09-13 00:08:20 -07:00
Shane A	89e08d6d18	[Model] Add Olmo3 model implementation (#24534 ) Signed-off-by: Shane A <shanea@allenai.org> Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-13 03:26:21 +00:00
Chenheli Hua	7f2ea7074e	[Frontend][Multimodal] Allow skipping media data when UUIDs are provided. (#23950 ) Signed-off-by: Roger Wang <hey@rogerw.io> Signed-off-by: Chenheli Hua <huachenheli@outlook.com> Signed-off-by: Roger Wang <hey@rogerw.me> Co-authored-by: Roger Wang <hey@rogerw.io> Co-authored-by: Roger Wang <hey@rogerw.me>	2025-09-13 02:16:06 +00:00
Nick Hill	4fdd6f5cbf	[Core] Support async scheduling with uniproc executor (#24219 ) Signed-off-by: Nick Hill <nhill@redhat.com> Signed-off-by: Ronald1995 <ronaldautomobile@163.com> Co-authored-by: Ronald1995 <ronaldautomobile@163.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>	2025-09-12 16:34:28 -07:00
Matthew Bonanni	5fe643fc26	Add FLASHINFER_MLA to backend selector test (#24753 ) Signed-off-by: Matthew Bonanni <mbonanni001@gmail.com>	2025-09-12 22:30:07 +00:00
Matthew Bonanni	7ba32aa60b	[Attention][FlashInfer] Enable FP8 FlashInfer (TRTLLM) MLA decode (#24705 ) Signed-off-by: Matthew Bonanni <mbonanni001@gmail.com>	2025-09-12 15:45:53 -06:00
afeldman-nm	c8c42597ab	[CI] Speed up model unit tests in CI (#24253 ) Signed-off-by: Andrew Feldman <afeldman@redhat.com>	2025-09-12 10:36:50 -07:00
dongluw	a5b84f1cbf	[Core] Shared memory based object store for Multimodal data caching and IPC (#20452 ) Signed-off-by: donglu <donglu@cohere.com>	2025-09-12 07:54:17 -07:00
Flora Feng	0377802c20	[Multimodal] Remove legacy multimodal fields in favor of MultiModalFeatureSpec (#24548 ) Signed-off-by: sfeng33 <4florafeng@gmail.com>	2025-09-12 21:42:23 +08:00
Wenlong Wang	72fc8aa412	[Multi Modal] Add FA3 in VIT (#24347 ) Signed-off-by: wwl2755 <wangwenlong2755@gmail.com>	2025-09-12 21:27:24 +08:00
Li, Jiang	59d5d2c736	[CI/Build] Skip prompt embeddings tests on V1-only CPU backend (#24721 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-09-12 18:51:01 +08:00
wang.yuqi	d21a36f5f9	[CI] Add ci_envs for convenient local testing (#24630 ) Signed-off-by: wang.yuqi <noooop@126.com>	2025-09-12 08:52:25 +00:00
Chen Zhang	561a0baee0	[CI] Fix flaky test v1/worker/test_gpu_model_runner.py::test_kv_cache_stride_order (#24640 ) Signed-off-by: Chen Zhang <zhangch99@outlook.com>	2025-09-12 07:49:09 +00:00
Andrew Sansom	ddcec289c7	Fix implementation divergence for BLOOM models between vLLM and HuggingFace when using prompt embeds (#24686 ) Signed-off-by: Andrew Sansom <andrew@protopia.ai>	2025-09-12 04:35:48 +00:00
Maximilien de Bayser	e090b7b45b	Enable conversion of multimodal models to pooling tasks (#24451 ) Signed-off-by: Max de Bayser <mbayser@br.ibm.com>	2025-09-12 03:30:41 +00:00
RichardoMu	40b6c9122b	[V1] feat:add engine v1 tracing (#20372 ) Signed-off-by: Mu Huai <tianbowen.tbw@antgroup.com> Signed-off-by: Ye Zhang <zhysishu@gmail.com> Signed-off-by: RichardoMu <44485717+RichardoMrMu@users.noreply.github.com> Signed-off-by: simon-mo <simon.mo@hey.com> Signed-off-by: Aaron Pham <contact@aarnphm.xyz> Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com> Co-authored-by: Mu Huai <tianbowen.tbw@antgroup.com> Co-authored-by: Ye Zhang <zhysishu@gmail.com> Co-authored-by: Benjamin Bartels <benjamin@bartels.dev> Co-authored-by: simon-mo <simon.mo@hey.com> Co-authored-by: 瑜琮 <ly186375@antfin.com> Co-authored-by: Aaron Pham <contact@aarnphm.xyz> Co-authored-by: 22quinn <33176974+22quinn@users.noreply.github.com>	2025-09-11 17:10:39 -07:00
Michael Goin	c3aea10dc8	[Perf] Use upstream CUTLASS for SM90 Block FP8 kernel (#23280 ) Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>	2025-09-11 15:43:14 -07:00
Duncan Moss	074854b24f	[Kernel][B200] `mxfp4` fused cutlass moe (#23696 ) Signed-off-by: Duncan Moss <djm.moss@gmail.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com> Co-authored-by: Michael Goin <mgoin64@gmail.com>	2025-09-11 17:04:56 -04:00
co63oc	e26fef8397	fix some typos (#24616 ) Signed-off-by: co63oc <co63oc@users.noreply.github.com>	2025-09-11 10:48:46 -07:00
Harry Mellor	c1eda615ba	Fix model name included in responses (#24663 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-09-11 10:47:51 -07:00
Isotr0py	bcbe2a4d9e	[VLM] Optimize GLM4.5-V-style video processing to only decode necessary frames (#24161 ) Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-11 09:44:34 -07:00
wang.yuqi	fd1ce98cdd	[CI] Split mteb test from Language Models Test (#24634 ) Signed-off-by: wang.yuqi <noooop@126.com>	2025-09-11 06:37:51 -07:00
Harry Mellor	5f5271f1ee	Move `LoRAConfig` from `config/__init__.py` to `config/lora.py` (#24644 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-09-11 11:01:38 +00:00
wang.yuqi	a8b0361c92	[CI] Split pooling from entrypoints Test (#24632 ) Signed-off-by: wang.yuqi <noooop@126.com>	2025-09-11 01:53:09 -07:00

1 2 3 4 5 ...

2907 Commits