vllm/kernels at 68c4421b6d898c8cfde9da6ef03b4262f7195fce - vllm - 丝路新云-代码仓

xinyun/vllm

mirror of https://git.datalinker.icu/vllm-project/vllm.git synced 2025-12-23 05:55:01 +08:00

History

rasmith 68c4421b6d

[AMD][Quantization] Add TritonScaledMMLinearKernel since int8 is broken for AMD (#12282 )

Signed-off-by: Randall Smith <Randall.Smith@amd.com>

2025-01-23 00:10:37 +00:00

..

mixed_precision

[TPU][Quantization] TPU W8A8 (#11785 )

2025-01-08 19:33:29 +00:00

[AMD][Quantization] Add TritonScaledMMLinearKernel since int8 is broken for AMD (#12282 )

2025-01-23 00:10:37 +00:00

__init__.py

[TPU][Quantization] TPU W8A8 (#11785 )

2025-01-08 19:33:29 +00:00