xinyun/vllm - vllm - 丝路新云-代码仓

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-04-15 16:37:06 +08:00

Author	SHA1	Message	Date
Reagan	9b0d1aa277	add random-mm, random-rerank	2025-12-24 16:23:24 -08:00
Reagan	a81128725c	rename Signed-off-by: Reagan <reaganjlee@gmail.com>	2025-12-18 18:21:38 -08:00
Reagan	e3dd9108cb	change Signed-off-by: Reagan Lee <reaganjlee@gmail.com> Signed-off-by: Reagan <reaganjlee@gmail.com>	2025-12-16 16:46:43 -08:00
Rohan Potdar	40a046cd82	[Bugfix]: Fix `TokenizerLike` interface (#30009 ) Signed-off-by: Rohan138 <rohanpotdar138@gmail.com>	2025-12-05 20:56:40 -08:00
Ming Yang	f16356fe36	[bench] Support common prefix len config (for decode-only bench) (#29934 ) Signed-off-by: Ming Yang <minos.future@gmail.com>	2025-12-05 10:26:52 +00:00
Cyrus Leung	34a984274e	[Misc] Refactor tokenizer interface (#29693 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-11-29 04:02:21 -08:00
汪志鹏	315068eb4a	[FixBug]Aeala/ShareGPT_Vicuna_unfiltered marked as multimodal benchmark (#28265 ) Signed-off-by: princepride <wangzhipeng628@gmail.com>	2025-11-07 09:35:22 +00:00
Jacob Zhong	d72299d47b	Make the cv2 dependency optional (#27780 ) Signed-off-by: Jacob <cmpute@qq.com>	2025-11-06 05:08:55 +00:00
Eugene Khvedchenya	5e72216d17	Feature/video support in random mm dataset (#25963 ) Signed-off-by: Eugene Khvedchenia <ekhvedchenia@nvidia.com> Signed-off-by: Eugene Khvedchenya <ekhvedchenia@nvidia.com> Co-authored-by: Roger Wang <hey@rogerw.io>	2025-10-29 18:24:52 +08:00
Yeshwanth N	71b1c8b667	[Chore]:Extract math and argparse utilities to separate modules (#27188 ) Signed-off-by: Yeshwanth Surya <yeshsurya@gmail.com> Signed-off-by: Yeshwanth N <yeshsurya@gmail.com> Signed-off-by: yeshsurya <yeshsurya@gmail.com>	2025-10-26 04:03:32 -07:00
Cyrus Leung	4d4d6bad19	[Chore] Separate out `vllm.utils.importlib` (#27022 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-10-17 00:48:59 +00:00
Wentao Ye	23583ee28c	[Bug] Add Assertion for `random-input-len` / `random-output-len` (#26834 ) Signed-off-by: yewentao256 <zhyanwentao@126.com>	2025-10-16 21:36:39 +00:00
kourosh hakhamaneshi	a2986b3e33	[Bugfix] Fixes prefix-repetition benchmark script (#26828 ) Signed-off-by: Kourosh Hakhamaneshi <Kourosh@anyscale.com>	2025-10-15 02:54:43 +00:00
Maximilien de Bayser	fe3edb4cf0	Add support for the /rerank endpoint in vllm bench serve (#26602 ) Signed-off-by: Max de Bayser <mbayser@br.ibm.com>	2025-10-14 04:25:43 +00:00
Harry Mellor	8fcaaf6a16	Update `Optional[x]` -> `x \| None` and `Union[x, y]` to `x \| y` (#26633 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-10-12 09:51:31 -07:00
Cyrus Leung	5be7ca1b99	[Benchmark] Support Infinity API (#26641 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-10-12 01:45:32 +08:00
Cyrus Leung	44b9af5bb2	[Benchmark] Enable MM Embedding benchmarks (#26310 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-10-06 19:51:58 +00:00
Roger Wang	43c146ca42	[Misc] Clean up unnecessary E501 ignore (#26274 ) Signed-off-by: Roger Wang <hey@rogerw.io>	2025-10-06 07:29:18 +00:00
Yasmin Moslem	7c2ec0fe87	[Benchmarking] Add disable_shuffle option for dataset loading (#26258 ) Signed-off-by: Yasmin Moslem <48152713+ymoslem@users.noreply.github.com>	2025-10-06 07:05:44 +00:00
Harry Mellor	d6953beb91	Convert formatting to use `ruff` instead of `yapf` + `isort` (#26247 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-10-05 07:06:22 -07:00
Ekagra Ranjan	ad2d788016	[Bug][Benchmark] Fix duplicate req in oversampling (#26140 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com> Co-authored-by: Roger Wang <hey@rogerw.io>	2025-10-03 02:55:24 +00:00
Ekagra Ranjan	1cab2f9cad	EAGLE 3: Fix preamble so that measured speedup over Eagle 1 becomes 32% instead of 5% on MTBench (#25916 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>	2025-10-02 11:29:35 -07:00
weiliang	f4e4088c99	Fix random dataset mismatched token length with config. (#24937 ) Signed-off-by: Weiliang Liu <weiliangl@nvidia.com> Signed-off-by: Roger Wang <hey@rogerw.io> Co-authored-by: Roger Wang <hey@rogerw.io>	2025-09-28 08:23:44 +00:00
WeiQing Chen	f1d53d150c	[Multimodal][Speculative Decoding]Eagle Eagle3 mm support, enablement on qwen2.5vl (#22872 ) Signed-off-by: Junhong <liujunhong11@huawei.com> Signed-off-by: Junhong Liu <98734602+LJH-LBJ@users.noreply.github.com> Co-authored-by: Junhong <liujunhong11@huawei.com> Co-authored-by: LJH-LBJ <98734602+LJH-LBJ@users.noreply.github.com>	2025-09-27 03:35:47 +00:00
Roger Wang	21da73343a	[Misc] Clean up flags in `vllm bench serve` (#25138 ) Signed-off-by: Roger Wang <hey@rogerw.io>	2025-09-18 12:43:33 +00:00
Punitvara	05b044e698	[Doc] Fix cross-reference warnings (#25058 ) Signed-off-by: Punit Vara <punitvara@gmail.com> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-09-18 02:05:16 -07:00
samzong	4a2d33e371	[Docs] vllm/benchmarks/datasets.py fix docstring param format. (#24970 ) Signed-off-by: samzong <samzong.lu@gmail.com>	2025-09-17 08:11:51 -07:00
Zhuohan Li	6c47f6bfa4	[Core] Remove tokenizer group in vLLM (#24078 ) Signed-off-by: Zhuohan Li <zhuohan123@gmail.com>	2025-09-17 08:42:59 +00:00
Isotr0py	5a411ef6c4	[Benchmarks] Add MMVU video dataset support and clean up deprecated datasets (#24719 ) Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-17 03:29:43 +00:00
Ye (Charlotte) Qi	ff68035932	[Benchmarks] Throw usage error when using dataset-name random and dataset-path together (#24819 ) Signed-off-by: Ye (Charlotte) Qi <yeq@meta.com>	2025-09-14 17:50:01 +00:00
Didier Durand	bcb06d7baf	[Doc]: fix typos in various files (#24726 ) Signed-off-by: Didier Durand <durand.didier@gmail.com>	2025-09-12 06:43:12 -07:00
Ekagra Ranjan	fb1a8f932a	[Benchmark] Add option to skip oversampling in benchmark (#24457 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>	2025-09-09 22:00:17 +00:00
Ekagra Ranjan	41183c1fe0	[Spec Decode] Fix offline spec_decode.py (#24257 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com> Co-authored-by: Roger Wang <hey@rogerw.io>	2025-09-08 20:44:13 +00:00
Ekagra Ranjan	cd08636926	[Spec Decode][Benchmark] Add Blitzedit dataset (#23605 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com> Co-authored-by: Roger Wang <hey@rogerw.io>	2025-09-08 10:32:52 -07:00
Ekagra Ranjan	3feeeb9fea	[Spec Decode][Benchmark] Add Spec Bench Dataset for benchmarking (#23563 ) Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>	2025-09-08 10:32:42 -07:00
Jiangyun Zhu	c83c4ff815	[Benchmark] Add support for local hf dataset path in benchmark (#23999 ) Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>	2025-09-02 17:49:16 +00:00
Jiangyun Zhu	3ecbb14b81	[Benchmarks] add benchmark for embedding models (#23000 ) Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>	2025-08-25 23:57:08 -07:00
Breno Baldas Skuk	0cb7b065c3	Feature/benchmark/random mm data/images (#23119 ) Signed-off-by: breno.skuk <breno.skuk@hcompany.ai>	2025-08-25 01:28:35 -07:00
Cyrus Leung	0c31e28e95	[Bugfix] Fix extra whitespace in strings caused by newline (#23272 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-20 22:03:00 -07:00
Chenheli Hua	1630cc8d0f	[Benchmarks] Add video inputs to ShareGPTDataset. (#23199 ) Signed-off-by: Chenheli Hua <huachenheli@outlook.com>	2025-08-19 23:42:31 +00:00
Ruixiang Tan	03d4235fd2	[Misc] Fix the benchmark's README and improve the error messages for the benchmark's argument checks (#22654 ) Signed-off-by: tanruixiang <tanruixiang0104@gmail.com>	2025-08-19 10:18:51 -07:00
hustxiayang	31436e8b4f	[Misc] Add request_id into benchmark_serve.py (#23065 ) Signed-off-by: yangxia <yangxiast@gmail.com>	2025-08-19 08:32:18 +00:00
Seiji Eicher	00d6cba0cf	Add PrefixRepetitionRandomDataset to `vllm bench serve` datasets (#20638 ) Signed-off-by: Seiji Eicher <seiji@anyscale.com>	2025-08-15 14:09:23 -07:00
Chenheli Hua	993d3d122b	[Benchmarks] Include image data when ShareGPT4V dataset is used. (#22955 ) Signed-off-by: Chenheli Hua <huachenheli@outlook.com>	2025-08-15 18:23:06 +00:00
Breno Baldas Skuk	65a7917be4	Fix(benchmarks): allow multiple mm contents in OpenAI Chat Completion Benchmarks (#22534 ) Signed-off-by: breno.skuk <breno.skuk@hcompany.ai>	2025-08-10 09:03:15 -07:00
Michael Goin	8bb43b9c9e	Add benchmark dataset for mlperf llama tasks (#20338 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-07-14 19:10:07 +00:00
Li Wang	9ff2af6d2b	[Benchmark] Parameterization of streaming loading of multimodal datasets (#20528 ) Signed-off-by: wangli <wangli858794774@gmail.com>	2025-07-09 13:35:16 +00:00
Ekagra Ranjan	9502c38138	[Benchmark][Bug] Fix multiple bugs in bench and add args to spec_decode offline (#20083 )	2025-06-25 22:06:27 -07:00
Ekagra Ranjan	017ef648e9	[Spec Decode][Benchmark] Generalize spec decode offline benchmark to more methods and datasets (#18847 )	2025-06-12 10:30:56 -07:00
Isotr0py	8711bc5e68	[Misc] Add packages for benchmark as extra dependency (#19089 ) Signed-off-by: Isotr0py <2037008807@qq.com>	2025-06-04 04:18:48 -07:00

1 2

59 Commits