vllm/worker at ec2affa8ae2664db88df2ff0248219e355d6629a - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-06-18 08:47:12 +08:00

History

Mahesh Keralapura 933790c209

[Core] Add span metrics for model_forward, scheduler and sampler time (#7089 )

2024-08-09 13:55:13 -07:00

..

__init__.py

[Speculative decoding 2/9] Multi-step worker for draft model (#2424 )

2024-01-21 16:31:47 -08:00

test_encoder_decoder_model_runner.py

[Core] Subclass ModelRunner to support cross-attention & encoder sequences (towards eventual encoder/decoder model support) (#4942 )

2024-08-06 16:51:47 -04:00

test_model_input.py

[Core] Refactor _prepare_model_input_tensors - take 2 (#6164 )

2024-07-17 09:37:16 -07:00

test_model_runner.py

[Core] Add span metrics for model_forward, scheduler and sampler time (#7089 )

2024-08-09 13:55:13 -07:00

test_swap.py

[Core] Pipeline Parallel Support (#4412 )

2024-07-02 10:58:08 -07:00