From 2bdea7ac110d3090d6a3c582aed36577ca480473 Mon Sep 17 00:00:00 2001
From: Zhuohan Li <zhuohan123@gmail.com>
Date: Mon, 17 Jul 2023 00:33:48 -0400
Subject: [PATCH] [Fix] Fix the condition of max_seq_len (#477)

---
 vllm/core/scheduler.py    | 2 +-
 vllm/engine/llm_engine.py | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/vllm/core/scheduler.py b/vllm/core/scheduler.py
index faf392d26085..d6379f93c5a5 100644
--- a/vllm/core/scheduler.py
+++ b/vllm/core/scheduler.py
@@ -190,7 +190,7 @@ class Scheduler:
                     break
 
                 num_prompt_tokens = seq_group.get_seqs()[0].get_len()
-                if num_prompt_tokens >= self.scheduler_config.max_seq_len:
+                if num_prompt_tokens > self.scheduler_config.max_seq_len:
                     logger.warning(
                         f"Input prompt ({num_prompt_tokens} tokens) is too long"
                         " and exceeds limit of "
diff --git a/vllm/engine/llm_engine.py b/vllm/engine/llm_engine.py
index 8936eda70501..1fdb2d04d53a 100644
--- a/vllm/engine/llm_engine.py
+++ b/vllm/engine/llm_engine.py
@@ -300,7 +300,7 @@ class LLMEngine:
                     continue
 
                 # Check if the sequence has reached max_seq_len.
-                if (seq.get_len() >=
+                if (seq.get_len() >
                         self.scheduler.scheduler_config.max_seq_len):
                     self.scheduler.free_seq(
                         seq, SequenceStatus.FINISHED_LENGTH_CAPPED)