vllm/models at 1f01a18d39b7fc873b79024b5799597cb6fc88bc - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-08-01 05:14:27 +08:00

History

Zhuohan Li 1f01a18d39

Merge QKV into one linear layer (#15 )

2023-04-02 00:23:29 -07:00

..

__init__.py

Support tensor parallel (#2 )

2023-03-21 13:45:42 -07:00

attention.py

Implement custom kernel for LLaMA rotary embedding (#14 )

2023-03-30 11:04:21 -07:00

input_metadata.py

Support tensor parallel (#2 )

2023-03-21 13:45:42 -07:00

layernorm.py

Add custom kernel for RMS normalization (#16 )

2023-04-01 00:51:22 +08:00

llama.py

Merge QKV into one linear layer (#15 )

2023-04-02 00:23:29 -07:00

memory_analyzer.py

Implement custom kernel for LLaMA rotary embedding (#14 )

2023-03-30 11:04:21 -07:00

model_utils.py

Implement LLaMA (#9 )

2023-03-30 12:25:32 +08:00

opt.py

Merge QKV into one linear layer (#15 )

2023-04-02 00:23:29 -07:00

sample.py

Use FP32 for log probabilities (#19 )

2023-03-31 23:33:43 -07:00

utils.py

FastAPI-based working frontend (#10 )

2023-03-29 14:48:56 +08:00