xinyun/vllm - vllm - 丝路新云-代码仓

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-07-22 06:27:09 +08:00

Author	SHA1	Message	Date
Siyuan Liu	4b29d2784b	[CI][TPU] Fix docker clean up (#22271 ) Signed-off-by: Siyuan Liu <lsiyuan@google.com>	2025-08-05 23:54:56 +00:00
Daniele	d2aab336ad	[CI/Build] get rid of unused VLLM_FA_CMAKE_GPU_ARCHES (#21599 ) Signed-off-by: Daniele Trifirò <dtrifiro@redhat.com>	2025-07-31 15:00:08 +08:00
Li, Jiang	65e8466c37	[Bugfix] Fix environment variable setting in CPU Dockerfile (#21730 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-07-28 11:02:39 +00:00
Ye (Charlotte) Qi	e7c4f9ee86	[CI/Build][Doc] Move existing benchmark scripts in CI/document/example to vllm bench CLI (#21355 ) Signed-off-by: Ye (Charlotte) Qi <yeq@meta.com>	2025-07-26 07:10:14 -07:00
QiliangCui	7728dd77bb	[TPU][Test] Divide TPU v1 Test into 2 parts. (#21431 )	2025-07-26 06:20:30 +00:00
QiliangCui	07d80d7b0e	[TPU][TEST] HF_HUB_DISABLE_XET=1 the test 3. (#21539 ) Signed-off-by: Qiliang Cui <derrhein@gmail.com>	2025-07-24 15:33:04 -07:00
Liangliang Ma	13e4ee1dc3	[XPU][UT] increase intel xpu CI test scope (#21492 ) Signed-off-by: Ma, Liangliang <liangliang.ma@intel.com>	2025-07-23 20:24:04 -07:00
QiliangCui	14bf19e39f	[TPU][TEST] Fix the downloading issue in TPU v1 test 11. (#21418 ) Signed-off-by: Qiliang Cui <derrhein@gmail.com>	2025-07-23 11:29:36 -07:00
Li, Jiang	a15a50fc17	[CPU] Enable shared-memory based pipeline parallel for CPU backend (#21289 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-07-21 09:07:08 -07:00
Woosuk Kwon	752c6ade2e	[V0 Deprecation] Deprecate BlockSparse Attention & Phi3-Small (#21217 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2025-07-19 13:53:17 -07:00
Li, Jiang	e3a0e43d7f	[bugfix] Fix auto thread-binding when world_size > 1 in CPU backend and refactor code (#21032 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-07-19 05:13:55 -07:00
XiongfeiWei	58760e12b1	[TPU] Start using python 3.12 (#21000 ) Signed-off-by: Xiongfei Wei <isaacwxf23@gmail.com>	2025-07-16 19:37:44 -07:00
Chendi.Xue	e9534c7202	[CI][HPU] update for v0 deprecate by switching to VLLM_TARGET_DEVICE=empty (#21006 ) Signed-off-by: Chendi.Xue <chendi.xue@intel.com>	2025-07-15 20:07:05 -07:00
Kunshang Ji	b6e7e3d58f	[Intel GPU] support ray as distributed executor backend for XPU. (#20659 ) Signed-off-by: Kunshang Ji <kunshang.ji@intel.com>	2025-07-09 00:36:58 -07:00
Li, Jiang	7721ef1786	[CI/Build][CPU] Fix CPU CI and remove all CPU V0 files (#20560 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-07-07 22:13:44 -07:00
Liangliang Ma	2c5ebec064	[XPU][CI] add v1/core test in xpu hardware ci (#20537 ) Signed-off-by: Ma, Liangliang <liangliang.ma@intel.com>	2025-07-07 01:16:40 -07:00
Cyrus Leung	9fb52e523a	[V1] Support any head size for FlexAttention backend (#20467 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-07-06 09:54:36 -07:00
Woosuk Kwon	e202dd2736	[V0 deprecation] Remove V0 CPU/XPU/TPU backends (#20412 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Signed-off-by: jiang1.li <jiang1.li@intel.com> Co-authored-by: Li, Jiang <jiang1.li@intel.com>	2025-07-06 08:48:13 -07:00
Li, Jiang	6cc1e7d96d	[CPU] Update custom ops for the CPU backend (#20255 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-07-01 07:25:03 +00:00
Chendi.Xue	a2f14dc8f9	[CI][Intel Gaudi][vllm-Plugin]Add CI for hpu-plugin-v1-test (#20196 ) Signed-off-by: Chendi Xue <chendi.xue@intel.com>	2025-07-01 04:17:07 +00:00
Chengji Yao	04e1642e32	[TPU] add kv cache update kernel (#19928 ) Signed-off-by: Chengji Yao <chengjiyao@google.com>	2025-06-26 10:01:37 -07:00
Kunshang Ji	b69781f107	[Hardware][Intel GPU] Add v1 Intel GPU support with Flash attention backend. (#19560 ) Signed-off-by: Kunshang Ji <kunshang.ji@intel.com>	2025-06-26 09:27:18 -07:00
Elaine Zhao	b6bad3d186	[CI][Neuron] Fail and exit on first error (#19622 ) Signed-off-by: Elaine Zhao <elaineyz@amazon.com> Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>	2025-06-20 12:27:51 +08:00
Li, Jiang	6458721108	[CPU] Refine default config for the CPU backend (#19539 ) Signed-off-by: jiang1.li <jiang1.li@intel.com>	2025-06-13 13:27:39 +08:00
Li, Jiang	e4248849ec	[BugFix][CPU] Fix CPU CI by ignore collecting test_pixtral (#19411 ) Signed-off-by: jiang.li <jiang1.li@intel.com>	2025-06-10 12:02:40 +00:00
Aaruni Aggarwal	c4296b1a27	[CI][PowerPC] Use a more appropriate way to select testcase in tests/models/language/pooling/test_embedding.py (#19253 ) Signed-off-by: Aaruni Aggarwal <aaruniagg@gmail.com>	2025-06-07 11:52:52 +08:00
Nishidha	94ecee6282	Fixed ppc build when it runs on non-RHEL based linux distros (#18422 ) Signed-off-by: Nishidha Panpaliya <nishidha.panpaliya@partner.ibm.com> Signed-off-by: Md. Shafi Hussain <Md.Shafi.Hussain@ibm.com> Signed-off-by: npanpaliya <nishidha.panpaliya@partner.ibm.com> Co-authored-by: Md. Shafi Hussain <Md.Shafi.Hussain@ibm.com>	2025-06-06 11:54:26 -07:00
Siyuan Liu	7ee2590478	[TPU] Update dynamo dump file name in compilation test (#19108 ) Signed-off-by: Siyuan Liu <lsiyuan@google.com>	2025-06-04 16:13:43 -04:00
Siyuan Liu	8e972d9c44	[TPU] Skip hanging tests (#19115 ) Signed-off-by: Siyuan Liu <lsiyuan@google.com>	2025-06-04 01:43:00 -07:00
Li, Jiang	4555143ea7	[CPU] V1 support for the CPU backend (#16441 )	2025-06-03 18:43:01 -07:00
Li, Jiang	8655f47f37	[CPU][CI] Re-enable the CPU CI tests (#19046 ) Signed-off-by: jiang.li <jiang1.li@intel.com>	2025-06-02 20:46:47 -07:00
Concurrensee	4ce42f9204	Adding "LoRA Test %N" to AMD production tests (#18929 ) Signed-off-by: Yida Wu <yidawu@alumni.cmu.edu>	2025-06-02 20:46:44 -07:00
Siyuan Liu	9112b443a0	[Hardware][TPU] Initial support of model parallelism with single worker using SPMD (#18011 ) Signed-off-by: Siyuan Liu <lsiyuan@google.com> Co-authored-by: Hossein Sarshar <hossein.sarshar@gmail.com> Co-authored-by: Chengji Yao <chengjiyao@google.com>	2025-06-03 00:06:20 +00:00
Carol Zheng	3132290a14	[TPU][CI/CD] Clean up docker for TPU tests. (#18926 ) Signed-off-by: Carol Zheng <cazheng@google.com>	2025-05-30 10:24:19 +08:00
Akshat Tripathi	643622ba46	[Hardware][TPU][V1] Multi-LoRA Optimisations for the V1 TPU backend (#15655 ) Signed-off-by: Akshat Tripathi <akshat@krai.ai> Signed-off-by: Chengji Yao <chengjiyao@google.com> Signed-off-by: xihajun <junfan@krai.ai> Signed-off-by: Jorge de Freitas <jorge.de-freitas22@imperial.ac.uk> Signed-off-by: Jorge de Freitas <jorge@krai.ai> Co-authored-by: Chengji Yao <chengjiyao@google.com> Co-authored-by: xihajun <junfan@krai.ai> Co-authored-by: Jorge de Freitas <jorge.de-freitas22@imperial.ac.uk> Co-authored-by: Jorge de Freitas <jorge@krai.ai>	2025-05-28 19:59:09 +00:00
Carol Zheng	b48d5cca16	[CI/Build] [TPU] Fix TPU CI exit code (#18282 ) Signed-off-by: Carol Zheng <cazheng@google.com>	2025-05-27 14:54:59 -07:00
Łukasz Durejko	bbd9a84dc5	[Hardware][Intel-Gaudi] [CI/Build] Fix multiple containers using the same name in run-hpu-test.sh (#18752 ) Signed-off-by: Lukasz Durejko <ldurejko@habana.ai>	2025-05-27 00:10:26 -07:00
Łukasz Durejko	e76be06550	[Hardware][Intel-Gaudi] [CI/Build] Add tensor parallel size = 2 test to HPU CI (#18709 ) Signed-off-by: Lukasz Durejko <ldurejko@habana.ai>	2025-05-26 05:26:07 -07:00
aws-elaineyz	ed5d408255	[Neuron] Remove bypass on EAGLEConfig and add a test (#18514 ) Signed-off-by: Elaine Zhao <elaineyz@amazon.com>	2025-05-22 21:26:32 -07:00
Liangfu Chen	d565e0976f	[neuron] fix authorization issue (#18364 ) Signed-off-by: Liangfu Chen <liangfc@amazon.com>	2025-05-19 23:30:32 +00:00
Alexei-V-Ivanov-AMD	566ec04c3d	Adding "Basic Models Test" and "Multi-Modal Models Test (Extended) 3" in AMD Pipeline (#18106 ) Signed-off-by: Alexei V. Ivanov <alexei.ivanov@amd.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-05-15 08:49:23 -07:00
Carol Zheng	b9fd0d7a69	[CI/Build] Fix TPU V1 Test mixed use of & and && across tests (#17968 )	2025-05-12 12:06:59 -07:00
Aaruni Aggarwal	9fbf2bfbd5	Correcting testcases in builkite job for IBM Power (#17675 ) Signed-off-by: Aaruni Aggarwal <aaruniagg@gmail.com>	2025-05-12 08:11:55 +00:00
Alexei-V-Ivanov-AMD	3b602cdea7	AMD conditional all test execution // new test groups (#17556 ) Signed-off-by: Alexei V. Ivanov <alexei.ivanov@amd.com> Signed-off-by: Yida Wu <yidawu@alumni.cmu.edu>	2025-05-09 15:35:58 -07:00
yarongmu-google	a83a0f92b5	[Test] Attempt all TPU V1 tests, even if some of them fail. (#17334 ) Signed-off-by: Yarong Mu <ymu@google.com>	2025-05-08 17:20:54 +00:00
Akshat Tripathi	c20ef40fd0	[Hardware][TPU][V1] Multi-LoRA implementation for the V1 TPU backend (#14238 ) Signed-off-by: Akshat Tripathi <akshat@krai.ai> Signed-off-by: Chengji Yao <chengjiyao@google.com> Co-authored-by: Chengji Yao <chengjiyao@google.com>	2025-05-07 16:28:47 -04:00
Michael Goin	e50a1f1a9c	[TPU] Add kernel test for moe_pallas (#17496 ) Signed-off-by: Michael Goin <mgoin64@gmail.com>	2025-05-06 17:59:57 -07:00
Alexei-V-Ivanov-AMD	608968b7c5	Enabling multi-group kernel tests. (#17115 ) Signed-off-by: Alexei V. Ivanov <alexei.ivanov@amd.com>	2025-04-29 10:27:27 -07:00
Aaruni Aggarwal	5adf6f6b7f	Updating builkite job for IBM Power (#17111 ) Signed-off-by: Aaruni Aggarwal <aaruniagg@gmail.com>	2025-04-24 10:06:17 -07:00
Michael Goin	14288d1332	Disable enforce_eager for V1 TPU sampler and structured output tests (#17016 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-04-24 02:50:09 -07:00

1 2

57 Commits