From 9d70afe6c6b49e0708785017dbd85264d0efd4a8 Mon Sep 17 00:00:00 2001
From: baonudesifeizhai <baonudesifeizhai@gmail.com>
Date: Wed, 17 Dec 2025 18:13:53 -0500
Subject: [PATCH] Add workaround for TorchInductor get_raw_stream bug

---
 vllm/env_override.py | 18 ++++++++++++++++++
 1 file changed, 18 insertions(+)

diff --git a/vllm/env_override.py b/vllm/env_override.py
index 9ae1af3af46cf..02001209145a4 100644
--- a/vllm/env_override.py
+++ b/vllm/env_override.py
@@ -363,6 +363,24 @@ def _update_scheduler_patched(self) -> None:
         self.scheduler = Scheduler(self.operations)
 
 
+# ===================================================
+# torch 2.9 Inductor get_raw_stream workaround
+# ===================================================
+# Workaround for TorchInductor autotune using get_raw_stream() without defining it.
+# This occurs when compile_sizes > 1 in compilation_config.
+# For more context, see https://github.com/vllm-project/vllm/issues/30905.
+def _patch_get_raw_stream_if_needed():
+    """Workaround for TorchInductor autotune get_raw_stream() bug."""
+    if is_torch_equal("2.9.0") and os.getenv("VLLM_PATCH_GET_RAW_STREAM", "1") == "1":
+        import builtins
+
+        from torch._C import _cuda_getCurrentRawStream as _get_raw_stream
+
+        builtins.get_raw_stream = _get_raw_stream
+
+
+_patch_get_raw_stream_if_needed()
+
 if is_torch_equal("2.9.0"):
     from torch._inductor.codegen.wrapper import PythonWrapperCodegen
     from torch._inductor.graph import GraphLowering