vllm/layers at 8267b06c3026dd5e27578371886dd2571c5d6f59 - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-05-29 04:17:05 +08:00

History

Woosuk Kwon 8267b06c30

[Kernel] Add Triton MoE kernel configs for DBRX on A100 (#3679 )

2024-03-27 22:22:25 -07:00

..

[Kernel] Add Triton MoE kernel configs for DBRX on A100 (#3679 )

2024-03-27 22:22:25 -07:00

[CI] Try introducing isort. (#3495 )

2024-03-25 07:59:47 -07:00

[CI] Try introducing isort. (#3495 )

2024-03-25 07:59:47 -07:00

__init__.py

Change the name to vLLM (#150 )

2023-06-17 03:07:40 -07:00

activation.py

[1/n][Chunked Prefill] Refactor input query shapes (#3236 )

2024-03-20 14:46:05 -07:00

layernorm.py

Revert "Refactor llama family models (#2637 )" (#2851 )

2024-02-13 09:24:59 -08:00

linear.py

[CI] Try introducing isort. (#3495 )

2024-03-25 07:59:47 -07:00

logits_processor.py

[Hardware][Neuron] Refactor neuron support (#3471 )

2024-03-22 01:22:17 +00:00

rejection_sampler.py

[CI] Try introducing isort. (#3495 )

2024-03-25 07:59:47 -07:00

rotary_embedding.py

[BugFix] tensor.get_device() -> tensor.device (#3604 )

2024-03-24 19:01:13 -07:00

sampler.py

Optimize _get_ranks in Sampler (#3623 )

2024-03-25 16:03:02 -07:00

vocab_parallel_embedding.py

[CI] Try introducing isort. (#3495 )

2024-03-25 07:59:47 -07:00