vllm/vllm at 2b1c116b5acdf3b738e310f98617875132214c37 - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2026-05-22 14:44:29 +08:00

History

Woosuk Kwon 2b1c116b5a

Add minimum capability requirement for AWQ (#1064 )

2023-09-18 12:02:01 -07:00

..

Fix hanging when prompt exceeds limit (#1029 )

2023-09-17 01:48:56 -07:00

align llm_engine and async_engine. (#1081 )

2023-09-18 11:49:10 -07:00

added support for quantize on LLM module (#1080 )

2023-09-18 11:04:21 -07:00

Add minimum capability requirement for AWQ (#1064 )

2023-09-18 12:02:01 -07:00

transformers_utils

Fix warning message on LLaMA FastTokenizer (#1037 )

2023-09-14 17:33:32 -07:00

Align vLLM's beam search implementation with HF generate (#857 )

2023-09-04 17:29:42 -07:00

__init__.py

Bump up the version to v0.1.7 (#1013 )

2023-09-11 00:54:30 -07:00

block.py

[Quality] Add code formatter and linter (#326 )

2023-07-03 11:31:55 -07:00

config.py

Implement AWQ quantization support for LLaMA (#1032 )

2023-09-16 00:03:37 -07:00

logger.py

[Quality] Add code formatter and linter (#326 )

2023-07-03 11:31:55 -07:00

outputs.py

Align vLLM's beam search implementation with HF generate (#857 )

2023-09-04 17:29:42 -07:00

sampling_params.py

Align vLLM's beam search implementation with HF generate (#857 )

2023-09-04 17:29:42 -07:00

sequence.py

Fix get_max_num_running_seqs for waiting and swapped seq groups (#1068 )

2023-09-18 11:49:40 -07:00

utils.py

[Quality] Add code formatter and linter (#326 )

2023-07-03 11:31:55 -07:00