From a36de682d4283c60777bc3022ed3ce71cd90b904 Mon Sep 17 00:00:00 2001
From: Philipp Moritz <pcmoritz@gmail.com>
Date: Wed, 22 May 2024 15:26:56 -0700
Subject: [PATCH] [Minor] Fix small typo in llama.py: QKVParallelLinear ->
 QuantizationConfig (#4991)

---
 vllm/model_executor/models/llama.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/llama.py b/vllm/model_executor/models/llama.py
index 23141124e69e1..f43a40a0bfd34 100644
--- a/vllm/model_executor/models/llama.py
+++ b/vllm/model_executor/models/llama.py
@@ -57,7 +57,7 @@ class LlamaMLP(nn.Module):
         hidden_size: int,
         intermediate_size: int,
         hidden_act: str,
-        quant_config: Optional[QKVParallelLinear] = None,
+        quant_config: Optional[QuantizationConfig] = None,
         bias: bool = False,
     ) -> None:
         super().__init__()