From 4d7231e7743e80078bbc68ccc37b5ba5a1f28bf5 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 21 Nov 2025 17:40:17 +0800
Subject: [PATCH 01/83] Revert #28875 (#29159)

---
 docker/Dockerfile                               | 17 +++++++++++++++++
 docs/deployment/docker.md                       |  7 ++++---
 .../installation/gpu.cuda.inc.md                |  5 ++++-
 3 files changed, 25 insertions(+), 4 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index 709b79e84fbbc..964700e2a43ac 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -56,6 +56,7 @@ ARG UV_EXTRA_INDEX_URL=${PIP_EXTRA_INDEX_URL}
 
 # PyTorch provides its own indexes for standard and nightly builds
 ARG PYTORCH_CUDA_INDEX_BASE_URL=https://download.pytorch.org/whl
+ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL=https://download.pytorch.org/whl/nightly
 
 # PIP supports multiple authentication schemes, including keyring
 # By parameterizing the PIP_KEYRING_PROVIDER variable and setting it to
@@ -97,6 +98,7 @@ RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
 ARG PIP_INDEX_URL UV_INDEX_URL
 ARG PIP_EXTRA_INDEX_URL UV_EXTRA_INDEX_URL
 ARG PYTORCH_CUDA_INDEX_BASE_URL
+ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL
 ARG PIP_KEYRING_PROVIDER UV_KEYRING_PROVIDER
 
 # Activate virtual environment and add uv to PATH
@@ -315,6 +317,7 @@ RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
 ARG PIP_INDEX_URL UV_INDEX_URL
 ARG PIP_EXTRA_INDEX_URL UV_EXTRA_INDEX_URL
 ARG PYTORCH_CUDA_INDEX_BASE_URL
+ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL
 ARG PIP_KEYRING_PROVIDER UV_KEYRING_PROVIDER
 
 # Install uv for faster pip installs
@@ -334,6 +337,20 @@ ENV UV_LINK_MODE=copy
 # or future versions of triton.
 RUN ldconfig /usr/local/cuda-$(echo $CUDA_VERSION | cut -d. -f1,2)/compat/
 
+# arm64 (GH200) build follows the practice of "use existing pytorch" build,
+# we need to install torch and torchvision from the nightly builds first,
+# pytorch will not appear as a vLLM dependency in all of the following steps
+# after this step
+RUN --mount=type=cache,target=/root/.cache/uv \
+    if [ "$TARGETPLATFORM" = "linux/arm64" ]; then \
+        uv pip install --system \
+            --index-url ${PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.') \
+            "torch==2.8.0.dev20250318+cu128" "torchvision==0.22.0.dev20250319" ; \
+        uv pip install --system \
+            --index-url ${PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.') \
+            --pre pytorch_triton==3.3.0+gitab727c40 ; \
+    fi
+
 # Install vllm wheel first, so that torch etc will be installed.
 RUN --mount=type=bind,from=build,src=/workspace/dist,target=/vllm-workspace/dist \
     --mount=type=cache,target=/root/.cache/uv \
diff --git a/docs/deployment/docker.md b/docs/deployment/docker.md
index 0e636c87f38a4..1c639f3533d47 100644
--- a/docs/deployment/docker.md
+++ b/docs/deployment/docker.md
@@ -82,7 +82,8 @@ DOCKER_BUILDKIT=1 docker build . \
 
 ## Building for Arm64/aarch64
 
-A docker container can be built for aarch64 systems such as the Nvidia Grace-Hopper. At time of this writing, this should be considered **experimental**. Using the flag `--platform "linux/arm64"` will attempt to build for arm64.
+A docker container can be built for aarch64 systems such as the Nvidia Grace-Hopper. At time of this writing, this requires the use
+of PyTorch Nightly and should be considered **experimental**. Using the flag `--platform "linux/arm64"` will attempt to build for arm64.
 
 !!! note
     Multiple modules must be compiled, so this process can take a while. Recommend using `--build-arg max_jobs=` & `--build-arg nvcc_threads=`
@@ -93,6 +94,7 @@ A docker container can be built for aarch64 systems such as the Nvidia Grace-Hop
 
     ```bash
     # Example of building on Nvidia GH200 server. (Memory usage: ~15GB, Build time: ~1475s / ~25 min, Image size: 6.93GB)
+    python3 use_existing_torch.py
     DOCKER_BUILDKIT=1 docker build . \
     --file docker/Dockerfile \
     --target vllm-openai \
@@ -100,8 +102,7 @@ A docker container can be built for aarch64 systems such as the Nvidia Grace-Hop
     -t vllm/vllm-gh200-openai:latest \
     --build-arg max_jobs=66 \
     --build-arg nvcc_threads=2 \
-    --build-arg torch_cuda_arch_list="9.0 10.0+PTX" \
-    --build-arg RUN_WHEEL_CHECK=false
+    --build-arg torch_cuda_arch_list="9.0 10.0+PTX"
     ```
 
 !!! note
diff --git a/docs/getting_started/installation/gpu.cuda.inc.md b/docs/getting_started/installation/gpu.cuda.inc.md
index 601d3659af886..b2d0d64a2d355 100644
--- a/docs/getting_started/installation/gpu.cuda.inc.md
+++ b/docs/getting_started/installation/gpu.cuda.inc.md
@@ -158,7 +158,10 @@ uv pip install -e .
 
 ##### Use an existing PyTorch installation
 
-There are scenarios where the PyTorch dependency cannot be easily installed with `uv`, for example, when building vLLM with non-default PyTorch builds (like nightly or a custom build).
+There are scenarios where the PyTorch dependency cannot be easily installed with `uv`, e.g.:
+
+- Building vLLM with PyTorch nightly or a custom PyTorch build.
+- Building vLLM with aarch64 and CUDA (GH200), where the PyTorch wheels are not available on PyPI. Currently, only the PyTorch nightly has wheels for aarch64 with CUDA. You can run `uv pip install --index-url https://download.pytorch.org/whl/nightly/cu128 torch torchvision torchaudio` to [install PyTorch nightly](https://pytorch.org/get-started/locally/) and then build vLLM on top of it.
 
 To build vLLM using an existing PyTorch installation:
 

From b34129bf8e5412e4094b89aba5246605c280a5fd Mon Sep 17 00:00:00 2001
From: WeiQing Chen <40507679+david6666666@users.noreply.github.com>
Date: Fri, 21 Nov 2025 17:41:20 +0800
Subject: [PATCH 02/83] [Misc] remove useless v1 env (#29164)

Signed-off-by: David Chen <530634352@qq.com>
---
 tests/v1/e2e/test_lora_with_spec_decode.py | 2 --
 1 file changed, 2 deletions(-)

diff --git a/tests/v1/e2e/test_lora_with_spec_decode.py b/tests/v1/e2e/test_lora_with_spec_decode.py
index 14532f2795443..8c9ab58c3c0ab 100644
--- a/tests/v1/e2e/test_lora_with_spec_decode.py
+++ b/tests/v1/e2e/test_lora_with_spec_decode.py
@@ -61,8 +61,6 @@ def test_batch_inference_correctness(
     model_setup: (method, model_name, spec_model_name, lora_path, tp_size)
     """
     with monkeypatch.context() as m:
-        m.setenv("VLLM_USE_V1", "1")
-
         # Disable randomness
         m.setenv("CUBLAS_WORKSPACE_CONFIG", ":4096:8")
         torch.manual_seed(SEED)

From aab0102a267eba814cdc09170b530a3aed96be60 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 21 Nov 2025 19:56:59 +0800
Subject: [PATCH 03/83] [V0 deprecation] Remove more V0 references (#29088)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 docs/contributing/model/basic.md              |  2 --
 docs/design/prefix_caching.md                 |  3 ---
 docs/usage/reproducibility.md                 |  9 ++-----
 docs/usage/v1_guide.md                        |  2 +-
 examples/offline_inference/reproducibility.py |  8 ++----
 examples/offline_inference/rlhf_utils.py      |  8 +++---
 .../offline_inference/save_sharded_state.py   | 19 +++-----------
 examples/offline_inference/spec_decode.py     |  6 +----
 .../model_loader/test_sharded_state_loader.py | 13 ++--------
 tests/tool_use/utils.py                       | 25 ++++++++++---------
 vllm/entrypoints/llm.py                       |  1 -
 vllm/entrypoints/openai/protocol.py           |  6 ++---
 .../layers/mamba/mamba_mixer2.py              |  1 -
 vllm/model_executor/models/interfaces.py      |  2 --
 vllm/model_executor/models/plamo2.py          |  1 -
 15 files changed, 31 insertions(+), 75 deletions(-)

diff --git a/docs/contributing/model/basic.md b/docs/contributing/model/basic.md
index d7f5d2f311a37..e828de0adf3c2 100644
--- a/docs/contributing/model/basic.md
+++ b/docs/contributing/model/basic.md
@@ -133,8 +133,6 @@ We consider 3 different scenarios:
 For case (1), we recommend looking at the implementation of [`MambaForCausalLM`](../../../vllm/model_executor/models/mamba.py) (for Mamba-1) or [`Mamba2ForCausalLM`](../../../vllm/model_executor/models/mamba2.py) (for Mamba-2) as a reference.
 The model should inherit protocol `IsAttentionFree` and also implement class methods `get_mamba_state_dtype_from_config` and `get_mamba_state_shape_from_config` to calculate the state shapes and data types from the config.
 For the mamba layers themselves, please use the [`MambaMixer`](../../../vllm/model_executor/layers/mamba/mamba_mixer.py) (for Mamba-1) or [`MambaMixer2`](../../../vllm/model_executor/layers/mamba/mamba_mixer2.py) (for Mamba-2) classes.
-Please *do not* use the `MambaCacheManager` (deprecated in V1) or replicate any of the V0-specific code paths in the existing model implementations.
-V0-only classes and code will be removed in the very near future.
 The model should also be added to the `MODELS_CONFIG_MAP` dictionary in [vllm/model_executor/models/config.py](../../../vllm/model_executor/models/config.py) to ensure that the runtime defaults are optimized.
 
 For case (2), we recommend using as a reference the implementation of [`JambaForCausalLM`](../../../vllm/model_executor/models/jamba.py) (for an example of a model that uses Mamba-1 and attention together) or [`BambaForCausalLM`](../../../vllm/model_executor/models/bamba.py) (for an example of a model that uses Mamba-2 and attention together).
diff --git a/docs/design/prefix_caching.md b/docs/design/prefix_caching.md
index 48536a877bd3f..cf792fdabe1a6 100644
--- a/docs/design/prefix_caching.md
+++ b/docs/design/prefix_caching.md
@@ -94,9 +94,6 @@ To improve privacy in shared environments, vLLM supports isolating prefix cache
 
 With this setup, cache sharing is limited to users or requests that explicitly agree on a common salt, enabling cache reuse within a trust group while isolating others.
 
-!!! note
-    Cache isolation is not supported in engine V0.
-
 ## Data Structure
 
 The prefix caching in vLLM v1 is implemented in the KV cache manager. The basic building block is the “Block” data class (simplified):
diff --git a/docs/usage/reproducibility.md b/docs/usage/reproducibility.md
index d8a1943209c1e..afc25b63902e2 100644
--- a/docs/usage/reproducibility.md
+++ b/docs/usage/reproducibility.md
@@ -1,10 +1,7 @@
 # Reproducibility
 
-vLLM does not guarantee the reproducibility of the results by default, for the sake of performance. You need to do the following to achieve
-reproducible results:
-
-- For V1: Turn off multiprocessing to make the scheduling deterministic by setting `VLLM_ENABLE_V1_MULTIPROCESSING=0`.
-- For V0: Set the global seed (see below).
+vLLM does not guarantee the reproducibility of the results by default, for the sake of performance. To achieve
+reproducible results, you need to turn off multiprocessing to make the scheduling deterministic by setting `VLLM_ENABLE_V1_MULTIPROCESSING=0`.
 
 Example: [examples/offline_inference/reproducibility.py](../../examples/offline_inference/reproducibility.py)
 
@@ -30,8 +27,6 @@ However, in some cases, setting the seed will also [change the random state in u
 
 ### Default Behavior
 
-In V0, the `seed` parameter defaults to `None`. When the `seed` parameter is `None`, the random states for `random`, `np.random`, and `torch.manual_seed` are not set. This means that each run of vLLM will produce different results if `temperature > 0`, as expected.
-
 In V1, the `seed` parameter defaults to `0` which sets the random state for each worker, so the results will remain consistent for each vLLM run even if `temperature > 0`.
 
 !!! note
diff --git a/docs/usage/v1_guide.md b/docs/usage/v1_guide.md
index e46bee3f4ef20..22f4e6761ea9a 100644
--- a/docs/usage/v1_guide.md
+++ b/docs/usage/v1_guide.md
@@ -2,7 +2,7 @@
 
 !!! announcement
 
-    We have started the process of deprecating V0. Please read [RFC #18571](https://github.com/vllm-project/vllm/issues/18571) for more details.
+    We have fully deprecated V0. Please read [RFC #18571](https://github.com/vllm-project/vllm/issues/18571) for more details.
 
 V1 is now enabled by default for all supported use cases, and we will gradually enable it for every use case we plan to support. Please share any feedback on [GitHub](https://github.com/vllm-project/vllm) or in the [vLLM Slack](https://inviter.co/vllm-slack).
 
diff --git a/examples/offline_inference/reproducibility.py b/examples/offline_inference/reproducibility.py
index d909438b41042..e135bc1b2abb7 100644
--- a/examples/offline_inference/reproducibility.py
+++ b/examples/offline_inference/reproducibility.py
@@ -11,13 +11,9 @@ import random
 
 from vllm import LLM, SamplingParams
 
-# V1 only: Turn off multiprocessing to make the scheduling deterministic.
+# Turn off multiprocessing to make the scheduling deterministic.
 os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"] = "0"
 
-# V0 only: Set the global seed. The default seed is None, which is
-# not reproducible.
-SEED = 42
-
 prompts = [
     "Hello, my name is",
     "The president of the United States is",
@@ -28,7 +24,7 @@ sampling_params = SamplingParams(temperature=0.8, top_p=0.95)
 
 
 def main():
-    llm = LLM(model="facebook/opt-125m", seed=SEED)
+    llm = LLM(model="facebook/opt-125m")
     outputs = llm.generate(prompts, sampling_params)
     print("-" * 50)
     for output in outputs:
diff --git a/examples/offline_inference/rlhf_utils.py b/examples/offline_inference/rlhf_utils.py
index 13def88439ef2..5c0787b8778d6 100644
--- a/examples/offline_inference/rlhf_utils.py
+++ b/examples/offline_inference/rlhf_utils.py
@@ -30,8 +30,8 @@ class WorkerExtension:
     """
     The class for vLLM's worker to inherit from.
     By defining an extension class, the code can work no matter what is
-    the underlying worker class. This way, the code can be compatible
-    with both vLLM V0 and V1.
+    the underlying worker class.
+
     NOTE: we define this class in a separate module, and the main module
     should pass the full qualified name as `worker_extension_cls` argument.
     """
@@ -96,8 +96,8 @@ class ColocateWorkerExtension:
     """
     The class for vLLM's worker to inherit from, in the colocate setting.
     By defining an extension class, the code can work no matter what is
-    the underlying worker class. This way, the code can be compatible
-    with both vLLM V0 and V1.
+    the underlying worker class.
+
     NOTE: we define this class in a separate module, and the main module
     should pass the full qualified name as `worker_extension_cls` argument.
     """
diff --git a/examples/offline_inference/save_sharded_state.py b/examples/offline_inference/save_sharded_state.py
index e25f46b126e6f..88ee48b98bff6 100644
--- a/examples/offline_inference/save_sharded_state.py
+++ b/examples/offline_inference/save_sharded_state.py
@@ -67,22 +67,9 @@ def main(args):
     Path(args.output).mkdir(exist_ok=True)
     # Dump worker states to output directory
 
-    # Check which engine version is being used
-    is_v1_engine = hasattr(llm.llm_engine, "engine_core")
-
-    if is_v1_engine:
-        # For V1 engine, we need to use engine_core.save_sharded_state
-        print("Using V1 engine save path")
-        llm.llm_engine.engine_core.save_sharded_state(
-            path=args.output, pattern=args.file_pattern, max_size=args.max_file_size
-        )
-    else:
-        # For V0 engine
-        print("Using V0 engine save path")
-        model_executor = llm.llm_engine.model_executor
-        model_executor.save_sharded_state(
-            path=args.output, pattern=args.file_pattern, max_size=args.max_file_size
-        )
+    llm.llm_engine.engine_core.save_sharded_state(
+        path=args.output, pattern=args.file_pattern, max_size=args.max_file_size
+    )
 
     # Copy metadata files to output directory
     for file in os.listdir(model_path):
diff --git a/examples/offline_inference/spec_decode.py b/examples/offline_inference/spec_decode.py
index 3cdc3b245b72a..67a0732459709 100644
--- a/examples/offline_inference/spec_decode.py
+++ b/examples/offline_inference/spec_decode.py
@@ -158,11 +158,7 @@ def main(args):
             print(f"generated text: {output.outputs[0].text}")
             print("-" * 50)
 
-    try:
-        metrics = llm.get_metrics()
-    except AssertionError:
-        print("Metrics are not supported in the V0 engine.")
-        return
+    metrics = llm.get_metrics()
 
     total_num_output_tokens = sum(
         len(output.outputs[0].token_ids) for output in outputs
diff --git a/tests/model_executor/model_loader/test_sharded_state_loader.py b/tests/model_executor/model_loader/test_sharded_state_loader.py
index 5bb841bf2fa0e..cf06b000efb51 100644
--- a/tests/model_executor/model_loader/test_sharded_state_loader.py
+++ b/tests/model_executor/model_loader/test_sharded_state_loader.py
@@ -60,18 +60,9 @@ def llama_3p2_1b_files():
 
 def _run_writer(input_dir, output_dir, weights_patterns, **kwargs):
     llm_sharded_writer = LLM(model=input_dir, **kwargs)
-    # Check which engine version is being used
-    is_v1_engine = hasattr(llm_sharded_writer.llm_engine, "engine_core")
+
     # Dump worker states to output directory
-    if is_v1_engine:
-        # For V1 engine, we need to use engine_core.save_sharded_state
-        print("Using V1 engine save path")
-        llm_sharded_writer.llm_engine.engine_core.save_sharded_state(path=output_dir)
-    else:
-        # For V0 engine
-        print("Using V0 engine save path")
-        model_executor = llm_sharded_writer.llm_engine.model_executor
-        model_executor.save_sharded_state(path=output_dir)
+    llm_sharded_writer.llm_engine.engine_core.save_sharded_state(path=output_dir)
 
     # Copy metadata files to output directory
     for file in os.listdir(input_dir):
diff --git a/tests/tool_use/utils.py b/tests/tool_use/utils.py
index 38def6f874d7d..d188b21863812 100644
--- a/tests/tool_use/utils.py
+++ b/tests/tool_use/utils.py
@@ -140,21 +140,22 @@ CONFIGS: dict[str, ServerConfig] = {
         "without calling a tool. DO NOT CALL A TOOL THAT IS IRRELEVANT "
         "to the user's question - just respond to it normally.",
     },
-    # V1 Test: Passing locally but failing in CI. This runs the
-    # V0 Engine because of CPU offloading. Need to debug why.
+    # FIXME: This test currently fails, need to debug why.
     # "granite20b": {
-    #     "model":
-    #     "mbayser/granite-20b-functioncalling-FP8-KV",
+    #     "model": "mbayser/granite-20b-functioncalling-FP8-KV",
     #     "arguments": [
-    #         "--tool-call-parser", "granite-20b-fc", "--chat-template",
-    #         str(VLLM_PATH /
-    #             "examples/tool_chat_template_granite_20b_fc.jinja"),
-    #         "--max_num_seqs", "1", "--enforce-eager", "--cpu-offload-gb", "20"
+    #         "--tool-call-parser",
+    #         "granite-20b-fc",
+    #         "--chat-template",
+    #         str(VLLM_PATH / "examples/tool_chat_template_granite_20b_fc.jinja"),
+    #         "--max_num_seqs",
+    #         "1",
+    #         "--enforce-eager",
+    #         "--cpu-offload-gb",
+    #         "20",
     #     ],
-    #     "supports_parallel":
-    #     False,
-    #     "supports_rocm":
-    #     False,
+    #     "supports_parallel": False,
+    #     "supports_rocm": False,
     # },
     "granite-3.0-8b": {
         "model": "ibm-granite/granite-3.0-8b-instruct",
diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
index 7421eb8b8abc9..848916dbd8763 100644
--- a/vllm/entrypoints/llm.py
+++ b/vllm/entrypoints/llm.py
@@ -339,7 +339,6 @@ class LLM:
 
         log_non_default_args(engine_args)
 
-        # Create the Engine (autoselects V0 vs V1)
         self.llm_engine = LLMEngine.from_engine_args(
             engine_args=engine_args, usage_context=UsageContext.LLM_CLASS
         )
diff --git a/vllm/entrypoints/openai/protocol.py b/vllm/entrypoints/openai/protocol.py
index 41172d8ec2f72..b352c3ad01db0 100644
--- a/vllm/entrypoints/openai/protocol.py
+++ b/vllm/entrypoints/openai/protocol.py
@@ -377,7 +377,7 @@ class ResponsesRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."
+            "to 256 bit)."
         ),
     )
 
@@ -763,7 +763,7 @@ class ChatCompletionRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."
+            "to 256 bit)."
         ),
     )
     kv_transfer_params: dict[str, Any] | None = Field(
@@ -1249,7 +1249,7 @@ class CompletionRequest(OpenAIBaseModel):
             "environments. The salt should be random, protected from "
             "access by 3rd parties, and long enough to be "
             "unpredictable (e.g., 43 characters base64-encoded, corresponding "
-            "to 256 bit). Not supported by vLLM engine V0."
+            "to 256 bit)."
         ),
     )
 
diff --git a/vllm/model_executor/layers/mamba/mamba_mixer2.py b/vllm/model_executor/layers/mamba/mamba_mixer2.py
index 900701c46348b..0ea5805305eda 100644
--- a/vllm/model_executor/layers/mamba/mamba_mixer2.py
+++ b/vllm/model_executor/layers/mamba/mamba_mixer2.py
@@ -590,7 +590,6 @@ class MambaMixer2(MambaBase, CustomOp):
             hidden_states, _B, _C = self.split_hidden_states_B_C_fn(hidden_states_B_C)
             return hidden_states
 
-        # NOTE: V0 put prefill before decode, v1 puts decode before prefill
         num_prefills = attn_metadata.num_prefills  # request count
         num_decodes = attn_metadata.num_decode_tokens  # token count (=request)
         num_prefill_tokens = attn_metadata.num_prefill_tokens  # token count
diff --git a/vllm/model_executor/models/interfaces.py b/vllm/model_executor/models/interfaces.py
index dc4caf2f02f9d..9966498e1b4c9 100644
--- a/vllm/model_executor/models/interfaces.py
+++ b/vllm/model_executor/models/interfaces.py
@@ -586,13 +586,11 @@ class IsHybrid(Protocol):
     def get_mamba_state_shape_from_config(
         cls,
         vllm_config: VllmConfig,
-        use_v1: bool = True,
     ) -> tuple[tuple[int, int], tuple[int, int, int]]:
         """Calculate shapes for Mamba's convolutional and state caches.
 
         Args:
             vllm_config: vLLM config
-            use_v1: Get shapes for V1 (or V0)
 
         Returns:
             Tuple containing:
diff --git a/vllm/model_executor/models/plamo2.py b/vllm/model_executor/models/plamo2.py
index 22f9c87fc905b..472de5590dcf8 100644
--- a/vllm/model_executor/models/plamo2.py
+++ b/vllm/model_executor/models/plamo2.py
@@ -290,7 +290,6 @@ class Plamo2MambaMixer(MambaBase, CustomOp):
         has_decode = num_decodes > 0
         num_actual_tokens = num_prefill_tokens + num_decodes
 
-        # NOTE: V0 put prefill before decode, v1 puts decode before prefill
         # Separate prefill and decode by splitting varlen input
         # Split along token dimension
         hidden_states_d, hidden_states_p = torch.split(

From cca2d2cdbe56529205c10e58363c7bd2d31e15df Mon Sep 17 00:00:00 2001
From: Russell Bryant <rbryant@redhat.com>
Date: Fri, 21 Nov 2025 07:01:54 -0500
Subject: [PATCH 04/83] [Core] Align whisper closer to other multimodal models
 (#27292)

Signed-off-by: Russell Bryant <rbryant@redhat.com>
---
 vllm/model_executor/models/whisper.py | 13 ++++---
 vllm/v1/worker/gpu_model_runner.py    | 49 +++++++--------------------
 2 files changed, 21 insertions(+), 41 deletions(-)

diff --git a/vllm/model_executor/models/whisper.py b/vllm/model_executor/models/whisper.py
index 91a10b95a08c0..50587c627160d 100644
--- a/vllm/model_executor/models/whisper.py
+++ b/vllm/model_executor/models/whisper.py
@@ -599,15 +599,16 @@ class WhisperModel(nn.Module):
 
     def forward(
         self,
-        input_features: torch.Tensor | list[torch.Tensor] | None,
         input_ids: torch.Tensor | None,
         positions: torch.Tensor,
+        encoder_outputs: list[torch.Tensor],
     ) -> torch.Tensor:
-        encoder_outputs = self.get_encoder_outputs(input_features)
+        assert len(encoder_outputs) in (0, 1)
+        enc_states = encoder_outputs[0] if len(encoder_outputs) == 1 else None
         decoder_outputs = self.decoder(
             input_ids=input_ids,
             positions=positions,
-            encoder_hidden_states=encoder_outputs,
+            encoder_hidden_states=enc_states,
         )
         return decoder_outputs
 
@@ -894,13 +895,15 @@ class WhisperForConditionalGeneration(
         self,
         input_ids: torch.Tensor,
         positions: torch.Tensor,
+        encoder_outputs: list[torch.Tensor] | None = None,
         **kwargs,
     ) -> torch.Tensor:
-        audio_input = self._parse_and_validate_audio_input(**kwargs)
+        if encoder_outputs is None:
+            encoder_outputs = []
         decoder_outputs = self.model(
-            input_features=audio_input["input_features"],
             input_ids=input_ids,
             positions=positions,
+            encoder_outputs=encoder_outputs,
         )
         return decoder_outputs
 
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 4c65a5e9b0292..e786cd8bc7c97 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -1923,14 +1923,16 @@ class GPUModelRunner(
 
         return mm_kwargs, mm_hashes_pos
 
-    def _execute_mm_encoder(self, scheduler_output: "SchedulerOutput"):
+    def _execute_mm_encoder(
+        self, scheduler_output: "SchedulerOutput"
+    ) -> list[torch.Tensor]:
         # Batch the multi-modal inputs using the helper method.
         mm_kwargs, mm_hashes_pos = self._batch_mm_kwargs_from_scheduler(
             scheduler_output
         )
 
         if not mm_kwargs:
-            return
+            return []
 
         # Batch mm inputs as much as we can: if a request in the batch has
         # multiple modalities or a different modality than the previous one,
@@ -2007,6 +2009,8 @@ class GPUModelRunner(
             logger.debug("Finish execute for mm hash %s", mm_hash)
             self.maybe_save_ec_to_connector(self.encoder_cache, mm_hash)
 
+        return encoder_outputs
+
     def _gather_mm_embeddings(
         self,
         scheduler_output: "SchedulerOutput",
@@ -2095,38 +2099,6 @@ class GPUModelRunner(
 
         return mm_embeds, is_mm_embed
 
-    def _extract_encoder_inputs(
-        self,
-        scheduler_output: "SchedulerOutput",
-    ) -> dict[str, torch.Tensor]:
-        """Extract encoder inputs for encoder-decoder models.
-
-        This method extracts multimodal input features from scheduled encoder
-        inputs and formats them for the encoder-decoder model forward pass.
-        """
-        # Batch the multi-modal inputs using the helper method.
-        mm_kwargs, _ = self._batch_mm_kwargs_from_scheduler(scheduler_output)
-
-        if not mm_kwargs:
-            return {}
-
-        # Group MM kwargs by modality and extract features
-        model = cast(SupportsMultiModal, self.model)
-        encoder_features = {}
-        for _, _, mm_kwargs_group in group_mm_kwargs_by_modality(
-            mm_kwargs,
-            device=self.device,
-            pin_memory=self.pin_memory,
-            merge_by_field_config=model.merge_by_field_config,
-            multimodal_cpu_fields=model.multimodal_cpu_fields,
-        ):
-            # Add the grouped features to encoder_features dict
-            # This allows the model to receive them as kwargs (e.g.,
-            # input_features=...)
-            encoder_features.update(mm_kwargs_group)
-
-        return encoder_features
-
     def get_model(self) -> nn.Module:
         # get raw model out of the cudagraph wrapper.
         if isinstance(self.model, (CUDAGraphWrapper, UBatchWrapper)):
@@ -2416,8 +2388,13 @@ class GPUModelRunner(
             self.model_config.is_encoder_decoder
             and scheduler_output.scheduled_encoder_inputs
         ):
-            encoder_inputs = self._extract_encoder_inputs(scheduler_output)
-            model_kwargs.update(encoder_inputs)
+            # Run the encoder, just like we do with other multimodal inputs.
+            # For an encoder-decoder model, our processing here is a bit
+            # simpler, because the outputs are just passed to the decoder.
+            # We are not doing any prompt replacement. We also will only
+            # ever have a single encoder input.
+            encoder_outputs = self._execute_mm_encoder(scheduler_output)
+            model_kwargs.update({"encoder_outputs": encoder_outputs})
 
         return (
             input_ids,

From 2b1b3dfa4b02456b11b2bdbcd0857ddb96214a71 Mon Sep 17 00:00:00 2001
From: Bhagyashri <Bhagyashri.Gaikwad2@ibm.com>
Date: Fri, 21 Nov 2025 17:54:09 +0530
Subject: [PATCH 05/83] Update Dockerfile to use gcc-toolset-14 and fix test
 case failures on power (ppc64le) (#28957)

Signed-off-by: Bhagyashri <Bhagyashri.Gaikwad2@ibm.com>
---
 .../hardware_ci/run-cpu-test-ppc64le.sh       | 10 +++---
 docker/Dockerfile.ppc64le                     | 32 +++++++++++--------
 requirements/common.txt                       |  4 +--
 3 files changed, 27 insertions(+), 19 deletions(-)

diff --git a/.buildkite/scripts/hardware_ci/run-cpu-test-ppc64le.sh b/.buildkite/scripts/hardware_ci/run-cpu-test-ppc64le.sh
index 39ea180173081..3728f73fa2a36 100755
--- a/.buildkite/scripts/hardware_ci/run-cpu-test-ppc64le.sh
+++ b/.buildkite/scripts/hardware_ci/run-cpu-test-ppc64le.sh
@@ -25,20 +25,22 @@ function cpu_tests() {
 
   # offline inference
   podman exec -it "$container_id" bash -c "
+    export TORCH_COMPILE_DISABLE=1
     set -xve
     python3 examples/offline_inference/basic/generate.py --model facebook/opt-125m" >> $HOME/test_basic.log
 
   # Run basic model test
   podman exec -it "$container_id" bash -c "
+    export TORCH_COMPILE_DISABLE=1
     set -evx
     pip install pytest pytest-asyncio einops peft Pillow soundfile transformers_stream_generator matplotlib
-    pip install sentence-transformers datamodel_code_generator
+    pip install sentence-transformers datamodel_code_generator tblib 
 
     # Note: disable Bart until supports V1
     # pytest -v -s tests/models/language/generation/test_bart.py -m cpu_model
-    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-5-32-openai-community/gpt2]
-    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-5-32-facebook/opt-125m]
-    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-5-32-google/gemma-1.1-2b-it]
+    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-False-5-32-openai-community/gpt2]
+    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-False-5-32-facebook/opt-125m]
+    pytest -v -s tests/models/language/generation/test_common.py::test_models[False-False-5-32-google/gemma-1.1-2b-it]
     pytest -v -s tests/models/language/pooling/test_classification.py::test_models[float-jason9693/Qwen2.5-1.5B-apeach]
     # TODO: Below test case tests/models/language/pooling/test_embedding.py::test_models[True-ssmits/Qwen2-7B-Instruct-embed-base] fails on ppc64le. Disabling it for time being.
     # pytest -v -s tests/models/language/pooling/test_embedding.py -m cpu_model" >> $HOME/test_rest.log
diff --git a/docker/Dockerfile.ppc64le b/docker/Dockerfile.ppc64le
index ad9eae94b83dd..b16bea3607d2f 100644
--- a/docker/Dockerfile.ppc64le
+++ b/docker/Dockerfile.ppc64le
@@ -8,8 +8,8 @@ FROM registry.access.redhat.com/ubi9/ubi-minimal:${BASE_UBI_IMAGE_TAG} AS openbl
 
 ARG MAX_JOBS
 ARG OPENBLAS_VERSION=0.3.30
-RUN microdnf install -y dnf && dnf install -y gcc-toolset-13 make wget unzip \
-    && source /opt/rh/gcc-toolset-13/enable \
+RUN microdnf install -y dnf && dnf install -y gcc-toolset-14 make wget unzip \
+    && source /opt/rh/gcc-toolset-14/enable \
     && wget https://github.com/OpenMathLib/OpenBLAS/releases/download/v$OPENBLAS_VERSION/OpenBLAS-$OPENBLAS_VERSION.zip \
     && unzip OpenBLAS-$OPENBLAS_VERSION.zip \
     && cd OpenBLAS-$OPENBLAS_VERSION \
@@ -57,7 +57,7 @@ COPY --from=openblas-builder /tmp/control /dev/null
 RUN --mount=type=bind,from=openblas-builder,source=/OpenBLAS-$OPENBLAS_VERSION/,target=/openblas/,rw \
     dnf install -y openssl-devel \
     && dnf install -y \
-       git tar gcc-toolset-13 automake libtool \
+       git tar gcc-toolset-14 automake libtool \
        pkgconfig xsimd zeromq-devel kmod findutils protobuf* \
        libtiff-devel libjpeg-devel zlib-devel freetype-devel libwebp-devel \
        harfbuzz-devel libraqm-devel libimagequant-devel libxcb-devel \
@@ -84,7 +84,7 @@ ARG _GLIBCXX_USE_CXX11_ABI=1
 ARG OPENBLAS_VERSION=0.3.30
 
 RUN --mount=type=cache,target=/root/.cache/uv \
-    source /opt/rh/gcc-toolset-13/enable &&  \
+    source /opt/rh/gcc-toolset-14/enable &&  \
     git clone --recursive https://github.com/pytorch/pytorch.git -b v${TORCH_VERSION} && \
     cd pytorch && \
     uv pip install -r requirements.txt && \
@@ -97,7 +97,7 @@ ARG TORCHVISION_VERSION=0.22.0
 ARG TORCHVISION_USE_NVJPEG=0
 ARG TORCHVISION_USE_FFMPEG=0
 RUN --mount=type=cache,target=/root/.cache/uv \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     git clone --recursive https://github.com/pytorch/vision.git -b v${TORCHVISION_VERSION} && \
     cd vision && \
     MAX_JOBS=${MAX_JOBS:-$(nproc)} \
@@ -113,7 +113,7 @@ ARG USE_ROCM=0
 ARG USE_CUDA=0
 ARG TORCHAUDIO_TEST_ALLOW_SKIP_IF_NO_FFMPEG=1
 RUN --mount=type=cache,target=/root/.cache/uv \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     git clone --recursive https://github.com/pytorch/audio.git -b v${TORCHAUDIO_VERSION} && \
     cd audio && \
     MAX_JOBS=${MAX_JOBS:-$(nproc)} \
@@ -130,7 +130,7 @@ ARG MAX_JOBS
 ARG PYARROW_PARALLEL
 ARG PYARROW_VERSION=21.0.0
 RUN --mount=type=cache,target=/root/.cache/uv \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     git clone --recursive https://github.com/apache/arrow.git -b apache-arrow-${PYARROW_VERSION} && \
     cd arrow/cpp && \
     mkdir build && cd build && \
@@ -162,7 +162,7 @@ ARG OPENCV_VERSION=86
 ARG OPENCV_PATCH=97f3f39
 ARG ENABLE_HEADLESS=1
 RUN --mount=type=cache,target=/root/.cache/uv \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     git clone --recursive https://github.com/opencv/opencv-python.git -b ${OPENCV_VERSION} && \
     cd opencv-python && \
     sed -i -E -e 's/"setuptools.+",/"setuptools",/g' pyproject.toml && \
@@ -196,7 +196,7 @@ ARG MAX_JOBS
 ARG NUMBA_VERSION=0.61.2
 
 # Clone all required dependencies
-RUN dnf install ninja-build llvm15 llvm15-devel -y && source /opt/rh/gcc-toolset-13/enable && export PATH=$PATH:/usr/lib64/llvm15/bin && \
+RUN dnf install ninja-build llvm15 llvm15-devel -y && source /opt/rh/gcc-toolset-14/enable && export PATH=$PATH:/usr/lib64/llvm15/bin && \
     git clone --recursive https://github.com/numba/numba.git -b ${NUMBA_VERSION} && \
     cd ./numba && \
     if ! grep '#include "dynamic_annotations.h"' numba/_dispatcher.cpp; then \
@@ -211,6 +211,9 @@ RUN dnf install ninja-build llvm15 llvm15-devel -y && source /opt/rh/gcc-toolset
 
 FROM base-builder AS vllmcache-builder
 
+ENV LLVM_CONFIG=/usr/lib64/llvm15/bin/llvm-config
+ENV PATH=/usr/lib64/llvm15/bin:$PATH
+
 COPY --from=torch-builder /tmp/control /dev/null
 COPY --from=arrow-builder /tmp/control /dev/null
 COPY --from=cv-builder /tmp/control /dev/null
@@ -225,10 +228,13 @@ ARG GRPC_PYTHON_BUILD_SYSTEM_OPENSSL=1
 RUN --mount=type=cache,target=/root/.cache/uv \
     dnf install llvm15 llvm15-devel -y && \
     rpm -ivh --nodeps https://mirror.stream.centos.org/9-stream/CRB/ppc64le/os/Packages/protobuf-lite-devel-3.14.0-16.el9.ppc64le.rpm && \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     git clone https://github.com/huggingface/xet-core.git && cd xet-core/hf_xet/ && \
     uv pip install maturin && \
     uv build --wheel --out-dir /hf_wheels/
+
+ENV CXXFLAGS="-fno-lto -Wno-error=free-nonheap-object" \
+    CFLAGS="-fno-lto"
 RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=bind,from=torch-builder,source=/torchwheels/,target=/torchwheels/,ro \
     --mount=type=bind,from=arrow-builder,source=/arrowwheels/,target=/arrowwheels/,ro \
@@ -236,7 +242,7 @@ RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=bind,from=numa-builder,source=/numactl/,target=/numactl/,rw \
     --mount=type=bind,from=numba-builder,source=/numbawheels/,target=/numbawheels/,ro \
     --mount=type=bind,src=.,dst=/src/,rw \
-    source /opt/rh/gcc-toolset-13/enable && \
+    source /opt/rh/gcc-toolset-14/enable && \
     export PATH=$PATH:/usr/lib64/llvm15/bin && \
     uv pip install /opencvwheels/*.whl /arrowwheels/*.whl /torchwheels/*.whl /numbawheels/*.whl && \
     sed -i -e 's/.*torch.*//g' /src/pyproject.toml /src/requirements/*.txt && \
@@ -260,7 +266,7 @@ FROM base-builder AS lapack-builder
 ARG MAX_JOBS
 ARG LAPACK_VERSION=3.12.1
 RUN git clone --recursive https://github.com/Reference-LAPACK/lapack.git -b v${LAPACK_VERSION} \
-    && cd lapack && source /opt/rh/gcc-toolset-13/enable \
+    && cd lapack && source /opt/rh/gcc-toolset-14/enable \
     && cmake -B build -S . \
     && cmake --build build -j ${MAX_JOBS:-$(nproc)}
 
@@ -299,7 +305,7 @@ RUN --mount=type=cache,target=/root/.cache/uv \
     --mount=type=bind,from=openblas-builder,source=/OpenBLAS-$OPENBLAS_VERSION/,target=/openblas/,rw \
     rpm -ivh https://dl.fedoraproject.org/pub/epel/epel-release-latest-9.noarch.rpm && \
     microdnf install --nodocs -y \
-    libomp tar findutils openssl llvm15 llvm15-devel \
+    libomp libicu tar findutils openssl llvm15 llvm15-devel \
     pkgconfig xsimd g++ gcc-fortran libsndfile \
     libtiff libjpeg openjpeg2 zlib zeromq \
     freetype lcms2 libwebp tcl tk utf8proc \
diff --git a/requirements/common.txt b/requirements/common.txt
index f2d1c0762ef6a..3f8cd588422d0 100644
--- a/requirements/common.txt
+++ b/requirements/common.txt
@@ -19,12 +19,12 @@ pillow  # Required for image processing
 prometheus-fastapi-instrumentator >= 7.0.0
 tiktoken >= 0.6.0  # Required for DBRX tokenizer
 lm-format-enforcer == 0.11.3
-llguidance >= 1.3.0, < 1.4.0; platform_machine == "x86_64" or platform_machine == "arm64" or platform_machine == "aarch64" or platform_machine == "s390x"
+llguidance >= 1.3.0, < 1.4.0; platform_machine == "x86_64" or platform_machine == "arm64" or platform_machine == "aarch64" or platform_machine == "s390x" or platform_machine == "ppc64le"
 outlines_core == 0.2.11
 # required for outlines backend disk cache
 diskcache == 5.6.3
 lark == 1.2.2
-xgrammar == 0.1.27; platform_machine == "x86_64" or platform_machine == "aarch64" or platform_machine == "arm64" or platform_machine == "s390x"
+xgrammar == 0.1.27; platform_machine == "x86_64" or platform_machine == "aarch64" or platform_machine == "arm64" or platform_machine == "s390x" or platform_machine == "ppc64le"
 typing_extensions >= 4.10
 filelock >= 3.16.1 # need to contain https://github.com/tox-dev/filelock/pull/317
 partial-json-parser # used for parsing partial JSON outputs

From 9452863088b458912634f13273784bf6e16c8a4c Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 21 Nov 2025 20:27:43 +0800
Subject: [PATCH 06/83] Revert "Revert #28875 (#29159)" (#29179)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 docker/Dockerfile                               | 17 -----------------
 docs/deployment/docker.md                       |  7 +++----
 .../installation/gpu.cuda.inc.md                |  5 +----
 3 files changed, 4 insertions(+), 25 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index 964700e2a43ac..709b79e84fbbc 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -56,7 +56,6 @@ ARG UV_EXTRA_INDEX_URL=${PIP_EXTRA_INDEX_URL}
 
 # PyTorch provides its own indexes for standard and nightly builds
 ARG PYTORCH_CUDA_INDEX_BASE_URL=https://download.pytorch.org/whl
-ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL=https://download.pytorch.org/whl/nightly
 
 # PIP supports multiple authentication schemes, including keyring
 # By parameterizing the PIP_KEYRING_PROVIDER variable and setting it to
@@ -98,7 +97,6 @@ RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
 ARG PIP_INDEX_URL UV_INDEX_URL
 ARG PIP_EXTRA_INDEX_URL UV_EXTRA_INDEX_URL
 ARG PYTORCH_CUDA_INDEX_BASE_URL
-ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL
 ARG PIP_KEYRING_PROVIDER UV_KEYRING_PROVIDER
 
 # Activate virtual environment and add uv to PATH
@@ -317,7 +315,6 @@ RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
 ARG PIP_INDEX_URL UV_INDEX_URL
 ARG PIP_EXTRA_INDEX_URL UV_EXTRA_INDEX_URL
 ARG PYTORCH_CUDA_INDEX_BASE_URL
-ARG PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL
 ARG PIP_KEYRING_PROVIDER UV_KEYRING_PROVIDER
 
 # Install uv for faster pip installs
@@ -337,20 +334,6 @@ ENV UV_LINK_MODE=copy
 # or future versions of triton.
 RUN ldconfig /usr/local/cuda-$(echo $CUDA_VERSION | cut -d. -f1,2)/compat/
 
-# arm64 (GH200) build follows the practice of "use existing pytorch" build,
-# we need to install torch and torchvision from the nightly builds first,
-# pytorch will not appear as a vLLM dependency in all of the following steps
-# after this step
-RUN --mount=type=cache,target=/root/.cache/uv \
-    if [ "$TARGETPLATFORM" = "linux/arm64" ]; then \
-        uv pip install --system \
-            --index-url ${PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.') \
-            "torch==2.8.0.dev20250318+cu128" "torchvision==0.22.0.dev20250319" ; \
-        uv pip install --system \
-            --index-url ${PYTORCH_CUDA_NIGHTLY_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.') \
-            --pre pytorch_triton==3.3.0+gitab727c40 ; \
-    fi
-
 # Install vllm wheel first, so that torch etc will be installed.
 RUN --mount=type=bind,from=build,src=/workspace/dist,target=/vllm-workspace/dist \
     --mount=type=cache,target=/root/.cache/uv \
diff --git a/docs/deployment/docker.md b/docs/deployment/docker.md
index 1c639f3533d47..0e636c87f38a4 100644
--- a/docs/deployment/docker.md
+++ b/docs/deployment/docker.md
@@ -82,8 +82,7 @@ DOCKER_BUILDKIT=1 docker build . \
 
 ## Building for Arm64/aarch64
 
-A docker container can be built for aarch64 systems such as the Nvidia Grace-Hopper. At time of this writing, this requires the use
-of PyTorch Nightly and should be considered **experimental**. Using the flag `--platform "linux/arm64"` will attempt to build for arm64.
+A docker container can be built for aarch64 systems such as the Nvidia Grace-Hopper. At time of this writing, this should be considered **experimental**. Using the flag `--platform "linux/arm64"` will attempt to build for arm64.
 
 !!! note
     Multiple modules must be compiled, so this process can take a while. Recommend using `--build-arg max_jobs=` & `--build-arg nvcc_threads=`
@@ -94,7 +93,6 @@ of PyTorch Nightly and should be considered **experimental**. Using the flag `--
 
     ```bash
     # Example of building on Nvidia GH200 server. (Memory usage: ~15GB, Build time: ~1475s / ~25 min, Image size: 6.93GB)
-    python3 use_existing_torch.py
     DOCKER_BUILDKIT=1 docker build . \
     --file docker/Dockerfile \
     --target vllm-openai \
@@ -102,7 +100,8 @@ of PyTorch Nightly and should be considered **experimental**. Using the flag `--
     -t vllm/vllm-gh200-openai:latest \
     --build-arg max_jobs=66 \
     --build-arg nvcc_threads=2 \
-    --build-arg torch_cuda_arch_list="9.0 10.0+PTX"
+    --build-arg torch_cuda_arch_list="9.0 10.0+PTX" \
+    --build-arg RUN_WHEEL_CHECK=false
     ```
 
 !!! note
diff --git a/docs/getting_started/installation/gpu.cuda.inc.md b/docs/getting_started/installation/gpu.cuda.inc.md
index b2d0d64a2d355..601d3659af886 100644
--- a/docs/getting_started/installation/gpu.cuda.inc.md
+++ b/docs/getting_started/installation/gpu.cuda.inc.md
@@ -158,10 +158,7 @@ uv pip install -e .
 
 ##### Use an existing PyTorch installation
 
-There are scenarios where the PyTorch dependency cannot be easily installed with `uv`, e.g.:
-
-- Building vLLM with PyTorch nightly or a custom PyTorch build.
-- Building vLLM with aarch64 and CUDA (GH200), where the PyTorch wheels are not available on PyPI. Currently, only the PyTorch nightly has wheels for aarch64 with CUDA. You can run `uv pip install --index-url https://download.pytorch.org/whl/nightly/cu128 torch torchvision torchaudio` to [install PyTorch nightly](https://pytorch.org/get-started/locally/) and then build vLLM on top of it.
+There are scenarios where the PyTorch dependency cannot be easily installed with `uv`, for example, when building vLLM with non-default PyTorch builds (like nightly or a custom build).
 
 To build vLLM using an existing PyTorch installation:
 

From fc9f821d2062d412474ced64b9087c881651eb30 Mon Sep 17 00:00:00 2001
From: who who who <fsx950223@outlook.com>
Date: Fri, 21 Nov 2025 20:55:43 +0800
Subject: [PATCH 07/83] fix cross attention (#28346)

Signed-off-by: fsx950223 <fsx950223@outlook.com>
---
 vllm/v1/attention/backends/triton_attn.py | 17 +++++++++--------
 1 file changed, 9 insertions(+), 8 deletions(-)

diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index 889c79db18ef5..09c36043c8c86 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -244,14 +244,11 @@ class TritonAttentionImpl(AttentionImpl):
 
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
-        if attn_type != AttentionType.DECODER:
+        if attn_type not in [AttentionType.DECODER, AttentionType.ENCODER_DECODER]:
             raise NotImplementedError(
-                "Encoder self-attention and "
-                "encoder/decoder cross-attention "
-                "are not implemented for "
-                "TritonAttentionImpl"
+                "Encoder self-attention is not implemented for TritonAttentionImpl"
             )
-
+        self.attn_type = attn_type
         self.fp8_dtype = current_platform.fp8_dtype()
 
         self.sinks = sinks
@@ -312,7 +309,11 @@ class TritonAttentionImpl(AttentionImpl):
         num_actual_tokens = attn_metadata.num_actual_tokens
         key_cache, value_cache = kv_cache.unbind(1)
 
-        if self.kv_sharing_target_layer_name is None:
+        if (
+            self.kv_sharing_target_layer_name is None
+            and key is not None
+            and value is not None
+        ):
             # Reshape the input keys and values and store them in the cache.
             # Skip this if sharing KV cache with an earlier attention layer.
             if self.kv_cache_dtype.startswith("fp8"):
@@ -346,7 +347,7 @@ class TritonAttentionImpl(AttentionImpl):
         max_seqlen_k = attn_metadata.max_seq_len
         block_table = attn_metadata.block_table
 
-        descale_shape = (cu_seqlens_q.shape[0] - 1, key.shape[1])
+        descale_shape = (cu_seqlens_q.shape[0] - 1, key_cache.shape[2])
 
         unified_attention(
             q=query[:num_actual_tokens],

From 2092ce8c39a4f01a93dcb32d3c92d05586507e7c Mon Sep 17 00:00:00 2001
From: sfbemerk <benjaminmerkel@mail.de>
Date: Fri, 21 Nov 2025 13:57:19 +0100
Subject: [PATCH 08/83] Tool Call Parser logs should not contain user input /
 model output except on DEBUG (#29160)

Signed-off-by: Benjamin Merkel <benjamin.merkel@tngtech.com>
Co-authored-by: Benjamin Merkel <benjamin.merkel@tngtech.com>
Co-authored-by: Chauncey <chaunceyjiang@gmail.com>
---
 .../openai/tool_parsers/glm4_moe_tool_parser.py    |  2 +-
 .../openai/tool_parsers/qwen3coder_tool_parser.py  | 14 +++++++-------
 2 files changed, 8 insertions(+), 8 deletions(-)

diff --git a/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
index 120e63b929b16..389e9754b34da 100644
--- a/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/glm4_moe_tool_parser.py
@@ -78,7 +78,7 @@ class Glm4MoeModelToolParser(ToolParser):
                         .get("type", None)
                     )
                     return arg_type == "string"
-            logger.warning("No tool named '%s'.", tool_name)
+            logger.debug("No tool named '%s'.", tool_name)
             return False
 
         def _deserialize(value: str) -> Any:
diff --git a/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py b/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
index 26261c0065ead..9d4c079eba188 100644
--- a/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
+++ b/vllm/entrypoints/openai/tool_parsers/qwen3coder_tool_parser.py
@@ -128,7 +128,7 @@ class Qwen3CoderToolParser(ToolParser):
                     return params
                 else:
                     return {}
-        logger.warning("Tool '%s' is not defined in the tools list.", func_name)
+        logger.debug("Tool '%s' is not defined in the tools list.", func_name)
         return {}
 
     def _convert_param_value(
@@ -141,7 +141,7 @@ class Qwen3CoderToolParser(ToolParser):
 
         if param_name not in param_config:
             if param_config != {}:
-                logger.warning(
+                logger.debug(
                     "Parsed parameter '%s' is not defined in the tool "
                     "parameters for tool '%s', directly returning the "
                     "string value.",
@@ -169,7 +169,7 @@ class Qwen3CoderToolParser(ToolParser):
             try:
                 return int(param_value)
             except (ValueError, TypeError):
-                logger.warning(
+                logger.debug(
                     "Parsed value '%s' of parameter '%s' is not an "
                     "integer in tool '%s', degenerating to string.",
                     param_value,
@@ -186,7 +186,7 @@ class Qwen3CoderToolParser(ToolParser):
                     else int(float_param_value)
                 )
             except (ValueError, TypeError):
-                logger.warning(
+                logger.debug(
                     "Parsed value '%s' of parameter '%s' is not a float "
                     "in tool '%s', degenerating to string.",
                     param_value,
@@ -197,7 +197,7 @@ class Qwen3CoderToolParser(ToolParser):
         elif param_type in ["boolean", "bool", "binary"]:
             param_value = param_value.lower()
             if param_value not in ["true", "false"]:
-                logger.warning(
+                logger.debug(
                     "Parsed value '%s' of parameter '%s' is not a boolean "
                     "(`true` or `false`) in tool '%s', degenerating to "
                     "false.",
@@ -216,7 +216,7 @@ class Qwen3CoderToolParser(ToolParser):
                     param_value = json.loads(param_value)
                     return param_value
                 except (json.JSONDecodeError, TypeError, ValueError):
-                    logger.warning(
+                    logger.debug(
                         "Parsed value '%s' of parameter '%s' cannot be "
                         "parsed with json.loads in tool '%s', will try "
                         "other methods to parse it.",
@@ -227,7 +227,7 @@ class Qwen3CoderToolParser(ToolParser):
             try:
                 param_value = ast.literal_eval(param_value)  # safer
             except (ValueError, SyntaxError, TypeError):
-                logger.warning(
+                logger.debug(
                     "Parsed value '%s' of parameter '%s' cannot be "
                     "converted via Python `ast.literal_eval()` in tool "
                     "'%s', degenerating to string.",

From 434f3d3eb869606af221f0307e16548c1f99da20 Mon Sep 17 00:00:00 2001
From: Julien Denize <40604584+juliendenize@users.noreply.github.com>
Date: Fri, 21 Nov 2025 15:01:20 +0100
Subject: [PATCH 09/83] Fix mistral config (#29172)

Signed-off-by: Julien Denize <julien.denize@mistral.ai>
Signed-off-by: Julien Denize <40604584+juliendenize@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Patrick von Platen <patrick.v.platen@gmail.com>
---
 vllm/transformers_utils/configs/mistral.py | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/vllm/transformers_utils/configs/mistral.py b/vllm/transformers_utils/configs/mistral.py
index 8f72f0b28b0de..fe202b2ed1568 100644
--- a/vllm/transformers_utils/configs/mistral.py
+++ b/vllm/transformers_utils/configs/mistral.py
@@ -90,6 +90,10 @@ def _remap_mistral_yarn_args(config: dict) -> dict:
         "rope_type": "yarn",
         "mscale_all_dim": 1,
     }
+
+    if rope_theta := config.pop("rope_theta", None):
+        config["rope_parameters"]["rope_theta"] = rope_theta
+
     for old_name, new_name in yarn_config_map.items():
         if old_name in yarn_config:
             config["rope_parameters"][new_name] = yarn_config.pop(old_name)

From f1805db1a671ffb1c99b2eae98e1b1b729fbcc65 Mon Sep 17 00:00:00 2001
From: skaraban3807 <siddappa.karabannavar@amd.com>
Date: Fri, 21 Nov 2025 19:43:52 +0530
Subject: [PATCH 10/83] [Perf] These changes enhance the NUMA functionality of
 vllm for systems with more than one NUMA nodes per socket (#25559)

Signed-off-by: Siddappa Karabannavar <siddappa.karabannavar@amd.com>
---
 csrc/cpu/utils.cpp | 65 +++++++++++++++++++++++++++++++---------------
 1 file changed, 44 insertions(+), 21 deletions(-)

diff --git a/csrc/cpu/utils.cpp b/csrc/cpu/utils.cpp
index c5a48352e3089..5199ba2af024f 100644
--- a/csrc/cpu/utils.cpp
+++ b/csrc/cpu/utils.cpp
@@ -45,31 +45,54 @@ std::string init_cpu_threads_env(const std::string& cpu_ids) {
   // Memory node binding
   if (numa_available() != -1) {
     int mem_node_id = numa_node_of_cpu(omp_cpu_ids.front());
-    // Verify all CPUs are on the same NUMA node
-    for (size_t i = 1; i < omp_cpu_ids.size(); ++i) {
-      int node_id = numa_node_of_cpu(omp_cpu_ids[i]);
-      TORCH_CHECK(node_id == mem_node_id, "CPU ", omp_cpu_ids[i],
-                  " is on NUMA node ", node_id, ", but CPU ",
-                  omp_cpu_ids.front(), " is on NUMA node ", mem_node_id,
-                  ". All CPUs should be on the same NUMA node for optimal "
-                  "performance. Memory will be bound to NUMA node ",
-                  mem_node_id, ".");
+    std::set<int> node_ids;
+    for (const auto& cpu_id : omp_cpu_ids) {
+      int node_id = numa_node_of_cpu(cpu_id);
+      if (node_id != -1) {
+        node_ids.insert(node_id);
+      }
+      TORCH_WARN(node_id == mem_node_id, "CPU ", cpu_id, " is on NUMA node ",
+                 node_id, ", but CPU ", omp_cpu_ids.front(),
+                 " is on NUMA node ", mem_node_id,
+                 ". All CPUs should be on the same NUMA node for optimal "
+                 "performance. Memory will be bound to NUMA node ",
+                 mem_node_id, ".");
     }
-    bitmask* mask = numa_parse_nodestring(std::to_string(mem_node_id).c_str());
-    bitmask* src_mask = numa_get_membind();
+    // Concatenate all node_ids into a single comma-separated string
+    if (!node_ids.empty()) {
+      std::string node_ids_str;
+      for (const int node_id : node_ids) {
+        if (!node_ids_str.empty()) {
+          node_ids_str += ",";
+        }
+        node_ids_str += std::to_string(node_id);
+      }
 
-    int pid = getpid();
+      bitmask* mask = numa_parse_nodestring(node_ids_str.c_str());
+      bitmask* src_mask = numa_get_membind();
 
-    // move all existing pages to the specified numa node.
-    *(src_mask->maskp) = *(src_mask->maskp) ^ *(mask->maskp);
-    int page_num = numa_migrate_pages(pid, src_mask, mask);
-    if (page_num == -1) {
-      TORCH_WARN("numa_migrate_pages failed. errno: " + std::to_string(errno));
+      int pid = getpid();
+
+      if (mask && src_mask) {
+        // move all existing pages to the specified numa node.
+        *(src_mask->maskp) = *(src_mask->maskp) ^ *(mask->maskp);
+        int page_num = numa_migrate_pages(pid, src_mask, mask);
+        if (page_num == -1) {
+          TORCH_WARN("numa_migrate_pages failed. errno: " +
+                     std::to_string(errno));
+        }
+
+        // restrict memory allocation node.
+        numa_set_membind(mask);
+        numa_set_strict(1);
+
+        numa_free_nodemask(mask);
+        numa_free_nodemask(src_mask);
+      } else {
+        TORCH_WARN("numa_parse_nodestring or numa_get_membind failed. errno: " +
+                   std::to_string(errno));
+      }
     }
-
-    // restrict memory allocation node.
-    numa_set_membind(mask);
-    numa_set_strict(1);
   }
 
   // OMP threads binding

From 4050bae4171edeadb24be5b6b1f8a3287612f872 Mon Sep 17 00:00:00 2001
From: wangxiyuan <wangxiyuan1007@gmail.com>
Date: Fri, 21 Nov 2025 22:57:26 +0800
Subject: [PATCH 11/83] [Doc] Update plugin doc (#28532)

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>
---
 docs/design/plugin_system.md | 98 +++++++++++++++++++++++++++++++++++-
 vllm/plugins/__init__.py     |  3 ++
 vllm/v1/metrics/loggers.py   |  4 +-
 3 files changed, 101 insertions(+), 4 deletions(-)

diff --git a/docs/design/plugin_system.md b/docs/design/plugin_system.md
index e8db8047ca4e6..9c84889f7f03d 100644
--- a/docs/design/plugin_system.md
+++ b/docs/design/plugin_system.md
@@ -4,7 +4,7 @@ The community frequently requests the ability to extend vLLM with custom feature
 
 ## How Plugins Work in vLLM
 
-Plugins are user-registered code that vLLM executes. Given vLLM's architecture (see [Arch Overview](arch_overview.md)), multiple processes may be involved, especially when using distributed inference with various parallelism techniques. To enable plugins successfully, every process created by vLLM needs to load the plugin. This is done by the [load_general_plugins](https://github.com/vllm-project/vllm/blob/c76ac49d266e27aa3fea84ef2df1f813d24c91c7/vllm/plugins/__init__.py#L16) function in the `vllm.plugins` module. This function is called for every process created by vLLM before it starts any work.
+Plugins are user-registered code that vLLM executes. Given vLLM's architecture (see [Arch Overview](arch_overview.md)), multiple processes may be involved, especially when using distributed inference with various parallelism techniques. To enable plugins successfully, every process created by vLLM needs to load the plugin. This is done by the [load_plugins_by_group][vllm.plugins.load_plugins_by_group] function in the `vllm.plugins` module.
 
 ## How vLLM Discovers Plugins
 
@@ -57,6 +57,100 @@ Every plugin has three parts:
 
 - **Being re-entrant**: The function specified in the entry point should be re-entrant, meaning it can be called multiple times without causing issues. This is necessary because the function might be called multiple times in some processes.
 
+### Platform plugins guidelines
+
+1. Create a platform plugin project, for example, `vllm_add_dummy_platform`. The project structure should look like this:
+
+    ```shell
+    vllm_add_dummy_platform/
+    ├── vllm_add_dummy_platform/
+    │   ├── __init__.py
+    │   ├── my_dummy_platform.py
+    │   ├── my_dummy_worker.py
+    │   ├── my_dummy_attention.py
+    │   ├── my_dummy_device_communicator.py
+    │   ├── my_dummy_custom_ops.py
+    ├── setup.py
+    ```
+
+2. In the `setup.py` file, add the following entry point:
+
+    ```python
+    setup(
+        name="vllm_add_dummy_platform",
+        ...
+        entry_points={
+            "vllm.platform_plugins": [
+                "my_dummy_platform = vllm_add_dummy_platform:register"
+            ]
+        },
+        ...
+    )
+        ```
+
+    Please make sure `vllm_add_dummy_platform:register` is a callable function and returns the platform class's fully qualified name. for example:
+
+    ```python
+    def register():
+        return "vllm_add_dummy_platform.my_dummy_platform.MyDummyPlatform"
+    ```
+
+3. Implement the platform class `MyDummyPlatform` in `my_dummy_platform.py`. The platform class should inherit from `vllm.platforms.interface.Platform`. Please follow the interface to implement the functions one by one. There are some important functions and properties that should be implemented at least:
+
+    - `_enum`: This property is the device enumeration from [PlatformEnum][vllm.platforms.interface.PlatformEnum]. Usually, it should be `PlatformEnum.OOT`, which means the platform is out-of-tree.
+    - `device_type`: This property should return the type of the device which pytorch uses. For example, `"cpu"`, `"cuda"`, etc.
+    - `device_name`: This property is set the same as `device_type` usually. It's mainly used for logging purposes.
+    - `check_and_update_config`: This function is called very early in the vLLM's initialization process. It's used for plugins to update the vllm configuration. For example, the block size, graph mode config, etc, can be updated in this function. The most important thing is that the **worker_cls** should be set in this function to let vLLM know which worker class to use for the worker process.
+    - `get_attn_backend_cls`: This function should return the attention backend class's fully qualified name.
+    - `get_device_communicator_cls`: This function should return the device communicator class's fully qualified name.
+
+4. Implement the worker class `MyDummyWorker` in `my_dummy_worker.py`. The worker class should inherit from [WorkerBase][vllm.v1.worker.worker_base.WorkerBase]. Please follow the interface to implement the functions one by one. Basically, all interfaces in the base class should be implemented, since they are called here and there in vLLM. To make sure a model can be executed, the basic functions should be implemented are:
+
+    - `init_device`: This function is called to set up the device for the worker.
+    - `initialize_cache`: This function is called to set cache config for the worker.
+    - `load_model`: This function is called to load the model weights to device.
+    - `get_kv_cache_spaces`: This function is called to generate the kv cache spaces for the model.
+    - `determine_available_memory`: This function is called to profiles the peak memory usage of the model to determine how much memory can be used for KV cache without OOMs.
+    - `initialize_from_config`: This function is called to allocate device KV cache with the specified kv_cache_config
+    - `execute_model`: This function is called every step to inference the model.
+
+    Additional functions that can be implemented are:
+
+    - If the plugin wants to support sleep mode feature, please implement the `sleep` and `wakeup` functions.
+    - If the plugin wants to support graph mode feature, please implement the `compile_or_warm_up_model` function.
+    - If the plugin wants to support speculative decoding feature, please implement the `take_draft_token_ids` function.
+    - If the plugin wants to support lora feature, please implement the `add_lora`,`remove_lora`,`list_loras` and `pin_lora` functions.
+    - If the plugin wants to support data parallelism feature, please implement the `execute_dummy_batch` functions.
+
+    Please look at the worker base class [WorkerBase][vllm.v1.worker.worker_base.WorkerBase] for more functions that can be implemented.
+
+5. Implement the attention backend class `MyDummyAttention` in `my_dummy_attention.py`. The attention backend class should inherit from [AttentionBackend][vllm.attention.backends.abstract.AttentionBackend]. It's used to calculate attentions with your device. Take `vllm.v1.attention.backends` as examples, it contains many attention backend implementations.
+
+6. Implement custom ops for high performance. Most ops can be ran by pytorch native implementation, while the performance may not be good. In this case, you can implement specific custom ops for your plugins. Currently, there are kinds of custom ops vLLM supports:
+
+    - pytorch ops
+      there are 3 kinds of pytorch ops:
+
+        - `communicator ops`: Device communicator op. Such as all-reduce, all-gather, etc.
+          Please implement the device communicator class `MyDummyDeviceCommunicator` in `my_dummy_device_communicator.py`. The device communicator class should inherit from [DeviceCommunicatorBase][vllm.distributed.device_communicators.base_device_communicator.DeviceCommunicatorBase].
+        - `common ops`: Common ops. Such as matmul, softmax, etc.
+          Please implement the common ops by register oot way. See more detail in [CustomOp][vllm.model_executor.custom_op.CustomOp] class.
+        - `csrc ops`: C++ ops. This kind of ops are implemented in C++ and are registered as torch custom ops.
+          Following csrc module and `vllm._custom_ops` to implement your ops.
+
+    - triton ops
+      Custom way doesn't work for triton ops now.
+
+7. (optional) Implement other plugable modules, such as lora, graph backend, quantization, mamba attention backend, etc.
+
 ## Compatibility Guarantee
 
-vLLM guarantees the interface of documented plugins, such as `ModelRegistry.register_model`, will always be available for plugins to register models. However, it is the responsibility of plugin developers to ensure their plugins are compatible with the version of vLLM they are targeting. For example, `"vllm_add_dummy_model.my_llava:MyLlava"` should be compatible with the version of vLLM that the plugin targets. The interface for the model may change during vLLM's development.
+vLLM guarantees the interface of documented plugins, such as `ModelRegistry.register_model`, will always be available for plugins to register models. However, it is the responsibility of plugin developers to ensure their plugins are compatible with the version of vLLM they are targeting. For example, `"vllm_add_dummy_model.my_llava:MyLlava"` should be compatible with the version of vLLM that the plugin targets.
+
+The interface for the model/module may change during vLLM's development. If you see any deprecation log info, please upgrade your plugin to the latest version.
+
+## Deprecation announcement
+
+!!! warning "Deprecations"
+    - `use_v1` parameter in `Platform.get_attn_backend_cls` is deprecated. It will be removed in v0.13.0 or v1.0.0.
+    - `_Backend` in `vllm.attention` is deprecated. It will be removed in v0.13.0 or v1.0.0. Please use `vllm.attention.backends.registry.register_backend` to add new attention backend to `AttentionBackendEnum` instead.
diff --git a/vllm/plugins/__init__.py b/vllm/plugins/__init__.py
index 0d8988f27959f..4c59d5364a763 100644
--- a/vllm/plugins/__init__.py
+++ b/vllm/plugins/__init__.py
@@ -17,6 +17,9 @@ IO_PROCESSOR_PLUGINS_GROUP = "vllm.io_processor_plugins"
 # Platform plugins group will be loaded in all processes when
 # `vllm.platforms.current_platform` is called and the value not initialized,
 PLATFORM_PLUGINS_GROUP = "vllm.platform_plugins"
+# Stat logger plugins group will be loaded in process0 only when serve vLLM with
+# async mode.
+STAT_LOGGER_PLUGINS_GROUP = "vllm.stat_logger_plugins"
 
 # make sure one process only loads plugins once
 plugins_loaded = False
diff --git a/vllm/v1/metrics/loggers.py b/vllm/v1/metrics/loggers.py
index cb36e7973650e..e2d82241ce210 100644
--- a/vllm/v1/metrics/loggers.py
+++ b/vllm/v1/metrics/loggers.py
@@ -16,7 +16,7 @@ from vllm.distributed.kv_transfer.kv_connector.v1.metrics import (
     KVConnectorPrometheus,
 )
 from vllm.logger import init_logger
-from vllm.plugins import load_plugins_by_group
+from vllm.plugins import STAT_LOGGER_PLUGINS_GROUP, load_plugins_by_group
 from vllm.v1.engine import FinishReason
 from vllm.v1.metrics.prometheus import unregister_vllm_metrics
 from vllm.v1.metrics.stats import (
@@ -67,7 +67,7 @@ class StatLoggerBase(ABC):
 def load_stat_logger_plugin_factories() -> list[StatLoggerFactory]:
     factories: list[StatLoggerFactory] = []
 
-    for name, plugin_class in load_plugins_by_group("vllm.stat_logger_plugins").items():
+    for name, plugin_class in load_plugins_by_group(STAT_LOGGER_PLUGINS_GROUP).items():
         if not isinstance(plugin_class, type) or not issubclass(
             plugin_class, StatLoggerBase
         ):

From d7219bcda3e6508cb14881bec303e2d0ab68c898 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Fri, 21 Nov 2025 23:27:44 +0800
Subject: [PATCH 12/83] [Misc] Move dynamic seed initialization to `EngineArgs`
 (#29165)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/config/model.py         | 34 +++++++---------------------------
 vllm/config/speculative.py   |  7 +------
 vllm/engine/arg_utils.py     | 16 +++++++++++++++-
 vllm/v1/worker/tpu_worker.py |  3 ---
 4 files changed, 23 insertions(+), 37 deletions(-)

diff --git a/vllm/config/model.py b/vllm/config/model.py
index 97cba6ea7295e..8f59673f4e1c3 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -146,9 +146,12 @@ class ModelConfig:
     - "bfloat16" for a balance between precision and range.\n
     - "float" is shorthand for FP32 precision.\n
     - "float32" for FP32 precision."""
-    seed: int | None = None
-    """Random seed for reproducibility. Initialized to None in V0, but
-    initialized to 0 in V1."""
+    seed: int = 0
+    """Random seed for reproducibility.
+
+    We must set the global seed because otherwise,
+    different tensor parallel workers would sample different tokens,
+    leading to inconsistent results."""
     hf_config: PretrainedConfig = field(init=False)
     """The Hugging Face config of the model."""
     hf_text_config: PretrainedConfig = field(init=False)
@@ -415,7 +418,7 @@ class ModelConfig:
     def __post_init__(
         self,
         # Multimodal config init vars
-        limit_mm_per_prompt: dict[str, int] | None,
+        limit_mm_per_prompt: dict[str, int | dict[str, int]] | None,
         enable_mm_embeds: bool | None,
         media_io_kwargs: dict[str, dict[str, Any]] | None,
         mm_processor_kwargs: dict[str, Any] | None,
@@ -428,23 +431,6 @@ class ModelConfig:
         skip_mm_profiling: bool | None,
         video_pruning_rate: float | None,
     ) -> None:
-        # Set the default seed to 0 in V1.
-        # NOTE(woosuk): In V1, we use separate processes for workers (unless
-        # VLLM_ENABLE_V1_MULTIPROCESSING=0), so setting a seed here
-        # doesn't affect the user process. However, without a consistent seed,
-        # different tensor parallel workers would sample different tokens,
-        # leading to inconsistent results.
-        if self.seed is None:
-            self.seed = 0
-            if not envs.VLLM_ENABLE_V1_MULTIPROCESSING:
-                logger.warning(
-                    "The global random seed is set to %d. Since "
-                    "VLLM_ENABLE_V1_MULTIPROCESSING is set to False, this may "
-                    "affect the random state of the Python process that "
-                    "launched vLLM.",
-                    self.seed,
-                )
-
         # Keep set served_model_name before maybe_model_redirect(self.model)
         self.served_model_name = get_served_model_name(
             self.model, self.served_model_name
@@ -1151,12 +1137,6 @@ class ModelConfig:
         self,
         parallel_config: ParallelConfig,
     ) -> None:
-        if parallel_config.distributed_executor_backend == "external_launcher":
-            assert self.seed is not None, (
-                "Seed must be set when using external launcher backend to "
-                "make sure sampling results are the same across workers."
-            )
-
         total_num_attention_heads = getattr(
             self.hf_text_config, "num_attention_heads", 0
         )
diff --git a/vllm/config/speculative.py b/vllm/config/speculative.py
index a0c65b6049e1e..d7c019c73d598 100644
--- a/vllm/config/speculative.py
+++ b/vllm/config/speculative.py
@@ -9,6 +9,7 @@ from pydantic import Field, SkipValidation, model_validator
 from pydantic.dataclasses import dataclass
 from typing_extensions import Self
 
+from vllm.config.model import ModelConfig
 from vllm.config.parallel import ParallelConfig
 from vllm.config.utils import config
 from vllm.logger import init_logger
@@ -18,10 +19,8 @@ if TYPE_CHECKING:
     from transformers import PretrainedConfig
 
     import vllm.model_executor.layers.quantization as me_quant
-    from vllm.config import ModelConfig
 else:
     PretrainedConfig = Any
-    ModelConfig = Any
 
     me_quant = LazyLoader(
         "model_executor", globals(), "vllm.model_executor.layers.quantization"
@@ -316,10 +315,6 @@ class SpeculativeConfig:
             self.prompt_lookup_min = 0
 
             if self.model is not None:
-                # TODO: Move this import to the top once `ModelConfig`
-                # lives in `vllm.config.model`.
-                from vllm.config import ModelConfig
-
                 self.draft_model_config = ModelConfig(
                     model=self.model,
                     runner="draft",
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index bcb90119f9b04..6eaf328eb1655 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -367,7 +367,7 @@ class EngineArgs:
     config_format: str = ModelConfig.config_format
     dtype: ModelDType = ModelConfig.dtype
     kv_cache_dtype: CacheDType = CacheConfig.cache_dtype
-    seed: int | None = ModelConfig.seed
+    seed: int | None = None
     max_model_len: int | None = ModelConfig.max_model_len
     cuda_graph_sizes: list[int] | None = CompilationConfig.cudagraph_capture_sizes
     cudagraph_capture_sizes: list[int] | None = (
@@ -1188,6 +1188,20 @@ class EngineArgs:
         if check_gguf_file(self.model):
             self.quantization = self.load_format = "gguf"
 
+        # NOTE(woosuk): In V1, we use separate processes for workers (unless
+        # VLLM_ENABLE_V1_MULTIPROCESSING=0), so setting a seed here
+        # doesn't affect the user process.
+        if self.seed is None:
+            self.seed = 0
+            if not envs.VLLM_ENABLE_V1_MULTIPROCESSING:
+                logger.warning(
+                    "The global random seed is set to %d. Since "
+                    "VLLM_ENABLE_V1_MULTIPROCESSING is set to False, this may "
+                    "affect the random state of the Python process that "
+                    "launched vLLM.",
+                    self.seed,
+                )
+
         if self.disable_mm_preprocessor_cache:
             logger.warning(
                 "`--disable-mm-preprocessor-cache` is deprecated "
diff --git a/vllm/v1/worker/tpu_worker.py b/vllm/v1/worker/tpu_worker.py
index 569b2aaa766e4..e1a109eca0a88 100644
--- a/vllm/v1/worker/tpu_worker.py
+++ b/vllm/v1/worker/tpu_worker.py
@@ -106,9 +106,6 @@ class TPUWorker:
                 "Profiling enabled. Traces will be saved to: %s", self.profile_dir
             )
 
-        if self.model_config.seed is None:
-            self.model_config.seed = 0
-
     def initialize_cache(self, num_gpu_blocks: int, num_cpu_blocks: int) -> None:
         self.cache_config.num_gpu_blocks = num_gpu_blocks
         self.cache_config.num_cpu_blocks = num_cpu_blocks

From 711241c13cf9c1e543a1948bb25a40623f3da78c Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 21 Nov 2025 09:58:38 -0600
Subject: [PATCH 13/83] [CI/Build] Fix illegal memory access and unsupported
 test in kernels/attention/test_cache.py (#29118)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/kernels/attention/test_cache.py | 9 +++++++++
 1 file changed, 9 insertions(+)

diff --git a/tests/kernels/attention/test_cache.py b/tests/kernels/attention/test_cache.py
index f33a27d1fd85a..028e164cb801b 100644
--- a/tests/kernels/attention/test_cache.py
+++ b/tests/kernels/attention/test_cache.py
@@ -68,6 +68,7 @@ def test_copy_blocks(
         pytest.skip()
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
     # Generate random block mappings where each source block is mapped to two
     # destination blocks.
     assert 2 * num_mappings <= num_blocks
@@ -152,6 +153,7 @@ def test_reshape_and_cache(
         pytest.skip()
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
     # Create a random slot mapping.
     num_slots = block_size * num_blocks
     slot_mapping_lst = random.sample(range(num_slots), num_tokens)
@@ -272,6 +274,7 @@ def test_reshape_and_cache_flash(
 ) -> None:
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
     assert implementation in ["cuda", "triton"]
     if implementation == "triton" and kv_cache_layout == "HND":
         pytest.skip("Triton implementation only supports NHD layout.")
@@ -593,6 +596,7 @@ def test_concat_and_cache_mla(
 ) -> None:
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
 
     total_slots = num_blocks * block_size
     slot_mapping_lst = random.sample(range(total_slots), num_tokens)
@@ -662,11 +666,14 @@ def test_concat_and_cache_ds_mla(
     seed: int,
     device: str,
 ) -> None:
+    if current_platform.is_rocm():
+        pytest.skip("concat_and_cache_mla doesn't support fp8_ds_mla on ROCm")
     if dtype.itemsize != 2:
         pytest.skip("ds_mla only supports 16-bit input")
     kv_cache_dtype = "fp8_ds_mla"
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
 
     total_slots = num_blocks * block_size
     slot_mapping_lst = random.sample(range(total_slots), num_tokens)
@@ -779,6 +786,7 @@ def test_copy_blocks_mla(
 ) -> None:
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
 
     entry_size = kv_lora_rank + qk_rope_head_dim
 
@@ -843,6 +851,7 @@ def test_swap_blocks_mla(
 ) -> None:
     current_platform.seed_everything(seed)
     torch.set_default_device(device)
+    torch.cuda.set_device(device)
 
     entry_size = kv_lora_rank + qk_rope_head_dim
 

From 1f400c58b8a6d2852b137cd841206a6ea8aaf43a Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Fri, 21 Nov 2025 11:20:33 -0500
Subject: [PATCH 14/83] [CI] Add batch invariant test to ci (#27842)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 .buildkite/test-pipeline.yaml                 | 12 ++++++++++++
 tests/v1/determinism/test_batch_invariance.py |  2 ++
 tests/v1/determinism/utils.py                 |  3 ++-
 3 files changed, 16 insertions(+), 1 deletion(-)

diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index 6169b279dc8a4..a5719d438eece 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -346,6 +346,18 @@ steps:
   commands:
     - pytest -v -s v1/attention
 
+- label: Batch Invariance Tests (H100) # 10min
+  timeout_in_minutes: 25
+  gpu: h100
+  source_file_dependencies:
+    - vllm/
+    - tests/v1/determinism/
+  commands:
+    - export VLLM_WORKER_MULTIPROC_METHOD=spawn
+    - pip install pytest-timeout pytest-forked
+    - pytest -v -s v1/determinism/test_batch_invariance.py
+    - pytest -v -s v1/determinism/test_rms_norm_batch_invariant.py
+
 - label: V1 Test attention (B200) # 10min
   timeout_in_minutes: 30
   gpu: b200
diff --git a/tests/v1/determinism/test_batch_invariance.py b/tests/v1/determinism/test_batch_invariance.py
index 74ae5e182da78..b9e2daafb8705 100644
--- a/tests/v1/determinism/test_batch_invariance.py
+++ b/tests/v1/determinism/test_batch_invariance.py
@@ -190,6 +190,7 @@ def test_logprobs_bitwise_batch_invariance_bs1_vs_bsN(
         max_num_seqs=32,
         max_model_len=8192,
         dtype="bfloat16",  # not everything is supported
+        gpu_memory_utilization=0.9,
     )
 
     # Use more realistic prompts for better token generation
@@ -444,6 +445,7 @@ def test_logprobs_without_batch_invariance_should_fail(
     monkeypatch.setenv("VLLM_ATTENTION_BACKEND", backend)
 
     # CRITICAL: Disable batch invariance for this test
+    monkeypatch.setenv("VLLM_BATCH_INVARIANT", "0")
     monkeypatch.setattr(batch_invariant, "VLLM_BATCH_INVARIANT", False)
     seed = int(os.getenv("VLLM_TEST_SEED", "12345"))
     random.seed(seed)
diff --git a/tests/v1/determinism/utils.py b/tests/v1/determinism/utils.py
index 7ee442551e2c3..ecbb6a1126933 100644
--- a/tests/v1/determinism/utils.py
+++ b/tests/v1/determinism/utils.py
@@ -6,6 +6,7 @@ import random
 import pytest
 import torch
 
+from vllm.attention.utils.fa_utils import flash_attn_supports_mla
 from vllm.platforms import current_platform
 
 skip_unsupported = pytest.mark.skipif(
@@ -18,7 +19,7 @@ BACKENDS: list[str] = [
     "FLASHINFER",
 ]
 
-if current_platform.is_cuda() and current_platform.is_device_capability(90):
+if flash_attn_supports_mla():
     BACKENDS.append("FLASH_ATTN_MLA")
 
 DEFAULT_MODEL = "Qwen/Qwen3-1.7B"

From 30b44a1598ea62fd3dcfd0d72a799ca4685e829e Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Fri, 21 Nov 2025 08:20:55 -0800
Subject: [PATCH 15/83] GPU Model Runner V2 (#25266)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 .github/CODEOWNERS                       |   3 +
 vllm/envs.py                             |   5 +
 vllm/v1/attention/backends/flashinfer.py |   3 +
 vllm/v1/core/sched/output.py             |  24 +
 vllm/v1/core/sched/scheduler.py          |  28 +-
 vllm/v1/worker/gpu/README.md             |   4 +
 vllm/v1/worker/gpu/__init__.py           |   0
 vllm/v1/worker/gpu/async_utils.py        |  89 +++
 vllm/v1/worker/gpu/attn_utils.py         | 187 ++++++
 vllm/v1/worker/gpu/block_table.py        | 315 +++++++++
 vllm/v1/worker/gpu/cudagraph_utils.py    | 198 ++++++
 vllm/v1/worker/gpu/dp_utils.py           |  22 +
 vllm/v1/worker/gpu/input_batch.py        | 265 ++++++++
 vllm/v1/worker/gpu/model_runner.py       | 814 +++++++++++++++++++++++
 vllm/v1/worker/gpu/sampler.py            | 327 +++++++++
 vllm/v1/worker/gpu/states.py             | 265 ++++++++
 vllm/v1/worker/gpu/structured_outputs.py |  76 +++
 vllm/v1/worker/gpu_worker.py             |  26 +-
 18 files changed, 2639 insertions(+), 12 deletions(-)
 create mode 100644 vllm/v1/worker/gpu/README.md
 create mode 100644 vllm/v1/worker/gpu/__init__.py
 create mode 100644 vllm/v1/worker/gpu/async_utils.py
 create mode 100644 vllm/v1/worker/gpu/attn_utils.py
 create mode 100644 vllm/v1/worker/gpu/block_table.py
 create mode 100644 vllm/v1/worker/gpu/cudagraph_utils.py
 create mode 100644 vllm/v1/worker/gpu/dp_utils.py
 create mode 100644 vllm/v1/worker/gpu/input_batch.py
 create mode 100644 vllm/v1/worker/gpu/model_runner.py
 create mode 100644 vllm/v1/worker/gpu/sampler.py
 create mode 100644 vllm/v1/worker/gpu/states.py
 create mode 100644 vllm/v1/worker/gpu/structured_outputs.py

diff --git a/.github/CODEOWNERS b/.github/CODEOWNERS
index 6e178bb690c56..0e834c057c401 100644
--- a/.github/CODEOWNERS
+++ b/.github/CODEOWNERS
@@ -35,6 +35,9 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 /vllm/v1/kv_cache_interface.py @heheda12345
 /vllm/v1/offloading @ApostaC
 
+# Model runner V2
+/vllm/v1/worker/gpu @WoosukKwon
+
 # Test ownership
 /.buildkite/lm-eval-harness @mgoin 
 /tests/distributed/test_multi_node_assignment.py @youkaichao
diff --git a/vllm/envs.py b/vllm/envs.py
index 888a09cf6d3ec..d2d6917403420 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -231,6 +231,7 @@ if TYPE_CHECKING:
     VLLM_DISABLE_SHARED_EXPERTS_STREAM: bool = False
     VLLM_SHARED_EXPERTS_STREAM_TOKEN_THRESHOLD: int = 256
     VLLM_COMPILE_CACHE_SAVE_FORMAT: Literal["binary", "unpacked"] = "binary"
+    VLLM_USE_V2_MODEL_RUNNER: bool = False
 
 
 def get_default_cache_root():
@@ -1522,6 +1523,10 @@ environment_variables: dict[str, Callable[[], Any]] = {
     "VLLM_COMPILE_CACHE_SAVE_FORMAT": env_with_choices(
         "VLLM_COMPILE_CACHE_SAVE_FORMAT", "binary", ["binary", "unpacked"]
     ),
+    # Flag to enable v2 model runner.
+    "VLLM_USE_V2_MODEL_RUNNER": lambda: bool(
+        int(os.getenv("VLLM_USE_V2_MODEL_RUNNER", "0"))
+    ),
 }
 
 # --8<-- [end:env-vars-definition]
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index 3ad7e8c52fc1f..e3f499216d7f1 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -593,6 +593,9 @@ class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
             )
         return self._workspace_buffer
 
+    def set_workspace_buffer(self, workspace_buffer: torch.Tensor):
+        self._workspace_buffer = workspace_buffer
+
     def _get_prefill_wrapper(
         self,
     ) -> BatchPrefillWithPagedKVCacheWrapper | BatchDCPPrefillWrapper:
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
index 20fdb3446404b..7902513dce49a 100644
--- a/vllm/v1/core/sched/output.py
+++ b/vllm/v1/core/sched/output.py
@@ -44,11 +44,15 @@ class NewRequestData:
     lora_request: LoRARequest | None
     prompt_embeds: "torch.Tensor | None" = None
 
+    # Only used for v2 model runner.
+    prefill_token_ids: list[int] | None = None
+
     @classmethod
     def from_request(
         cls,
         request: Request,
         block_ids: tuple[list[int], ...],
+        prefill_token_ids: list[int] | None = None,
     ) -> "NewRequestData":
         return cls(
             req_id=request.request_id,
@@ -60,6 +64,7 @@ class NewRequestData:
             num_computed_tokens=request.num_computed_tokens,
             lora_request=request.lora_request,
             prompt_embeds=request.prompt_embeds,
+            prefill_token_ids=prefill_token_ids,
         )
 
     def __repr__(self) -> str:
@@ -68,6 +73,7 @@ class NewRequestData:
             f"NewRequestData("
             f"req_id={self.req_id},"
             f"prompt_token_ids={self.prompt_token_ids},"
+            f"prefill_token_ids={self.prefill_token_ids},"
             f"mm_features={self.mm_features},"
             f"sampling_params={self.sampling_params},"
             f"block_ids={self.block_ids},"
@@ -183,6 +189,10 @@ class SchedulerOutput:
     # freed from the encoder cache.
     free_encoder_mm_hashes: list[str]
 
+    # Request IDs that are preempted in this step.
+    # Only used for v2 model runner.
+    preempted_req_ids: set[str] | None = None
+
     # Whether the scheduled requests have all the output tokens they
     # need to perform grammar bitmask computation.
     pending_structured_output_tokens: bool = False
@@ -193,6 +203,20 @@ class SchedulerOutput:
     # EC Cache Connector metadata
     ec_connector_metadata: ECConnectorMetadata | None = None
 
+    @classmethod
+    def make_empty(cls) -> "SchedulerOutput":
+        return cls(
+            scheduled_new_reqs=[],
+            scheduled_cached_reqs=CachedRequestData.make_empty(),
+            num_scheduled_tokens={},
+            total_num_scheduled_tokens=0,
+            scheduled_spec_decode_tokens={},
+            scheduled_encoder_inputs={},
+            num_common_prefix_blocks=[],
+            finished_req_ids=set(),
+            free_encoder_mm_hashes=[],
+        )
+
 
 @dataclass
 class GrammarOutput:
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 1ac8520a8ed25..9195b112d8690 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -6,6 +6,7 @@ from collections import defaultdict
 from collections.abc import Iterable
 from typing import Any
 
+from vllm import envs
 from vllm.config import VllmConfig
 from vllm.distributed.ec_transfer.ec_connector.base import (
     ECConnectorMetadata,
@@ -187,6 +188,7 @@ class Scheduler(SchedulerInterface):
             pcp_world_size=self.pcp_world_size,
         )
         self.use_pp = self.parallel_config.pipeline_parallel_size > 1
+        self.use_v2_model_runner = envs.VLLM_USE_V2_MODEL_RUNNER
 
     def schedule(self) -> SchedulerOutput:
         # NOTE(woosuk) on the scheduling algorithm:
@@ -658,12 +660,25 @@ class Scheduler(SchedulerInterface):
                 )
 
         # Construct the scheduler output.
-        new_reqs_data = [
-            NewRequestData.from_request(
-                req, req_to_new_blocks[req.request_id].get_block_ids()
-            )
-            for req in scheduled_new_reqs
-        ]
+        if self.use_v2_model_runner:
+            scheduled_new_reqs = scheduled_new_reqs + scheduled_resumed_reqs
+            scheduled_resumed_reqs = []
+            new_reqs_data = [
+                NewRequestData.from_request(
+                    req,
+                    req_to_new_blocks[req.request_id].get_block_ids(),
+                    req._all_token_ids,
+                )
+                for req in scheduled_new_reqs
+            ]
+        else:
+            new_reqs_data = [
+                NewRequestData.from_request(
+                    req, req_to_new_blocks[req.request_id].get_block_ids()
+                )
+                for req in scheduled_new_reqs
+            ]
+
         with record_function_or_nullcontext("schedule: make_cached_request_data"):
             cached_reqs_data = self._make_cached_request_data(
                 scheduled_running_reqs,
@@ -685,6 +700,7 @@ class Scheduler(SchedulerInterface):
             scheduled_spec_decode_tokens=scheduled_spec_decode_tokens,
             scheduled_encoder_inputs=scheduled_encoder_inputs,
             num_common_prefix_blocks=num_common_prefix_blocks,
+            preempted_req_ids={req.request_id for req in preempted_reqs},
             # finished_req_ids is an existing state in the scheduler,
             # instead of being newly scheduled in this step.
             # It contains the request IDs that are finished in between
diff --git a/vllm/v1/worker/gpu/README.md b/vllm/v1/worker/gpu/README.md
new file mode 100644
index 0000000000000..093f524b3250f
--- /dev/null
+++ b/vllm/v1/worker/gpu/README.md
@@ -0,0 +1,4 @@
+# [Experimental] Model Runner V2
+
+This directory contains the new model runner which is under active development.
+Ping [Woosuk Kwon](https://github.com/WoosukKwon) for any changes.
diff --git a/vllm/v1/worker/gpu/__init__.py b/vllm/v1/worker/gpu/__init__.py
new file mode 100644
index 0000000000000..e69de29bb2d1d
diff --git a/vllm/v1/worker/gpu/async_utils.py b/vllm/v1/worker/gpu/async_utils.py
new file mode 100644
index 0000000000000..638ec6fb0b082
--- /dev/null
+++ b/vllm/v1/worker/gpu/async_utils.py
@@ -0,0 +1,89 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from contextlib import contextmanager
+
+import numpy as np
+import torch
+
+from vllm.v1.outputs import (
+    AsyncModelRunnerOutput,
+    ModelRunnerOutput,
+    SamplerOutput,
+)
+
+
+class AsyncOutput(AsyncModelRunnerOutput):
+    def __init__(
+        self,
+        model_runner_output: ModelRunnerOutput,
+        sampler_output: SamplerOutput,
+        num_sampled_tokens: np.ndarray,
+        copy_stream: torch.cuda.Stream,
+        copy_event: torch.cuda.Event,
+    ):
+        self.model_runner_output = model_runner_output
+        self.sampler_output = sampler_output
+        self.num_sampled_tokens = num_sampled_tokens
+        self.copy_stream = copy_stream
+        self.copy_event = copy_event
+
+        default_stream = torch.cuda.current_stream()
+        with torch.cuda.stream(self.copy_stream):
+            self.copy_stream.wait_stream(default_stream)
+
+            # NOTE(woosuk): We must ensure that CPU tensors are not freed
+            # before the device-to-host copy is fully completed. For instance,
+            # operations like
+            # self.sampled_token_np = ...to("cpu", non_blocking=True).numpy()
+            # are unsafe because the underlying CPU tensor can be prematurely freed and
+            # reused by other tensors before the asynchronous copy finishes, potentially
+            # causing race conditions. To prevent this, we delay freeing by holding
+            # references until the copy event signals completion.
+            # Likewise, we also need to keep the reference to the GPU tensors.
+            # This is done by keeping the reference to sampler_output and
+            # model_runner_output.
+            self.sampled_token_ids = sampler_output.sampled_token_ids.to(
+                "cpu", non_blocking=True
+            )
+            if sampler_output.logprobs_tensors is not None:
+                self.logprobs_tensors = (
+                    sampler_output.logprobs_tensors.to_cpu_nonblocking()
+                )
+            else:
+                self.logprobs_tensors = None
+            self.prompt_logprobs_dict = {}
+            if self.model_runner_output.prompt_logprobs_dict:
+                for k, v in self.model_runner_output.prompt_logprobs_dict.items():
+                    self.prompt_logprobs_dict[k] = v.to_cpu_nonblocking()
+            self.copy_event.record(self.copy_stream)
+
+    def get_output(self) -> ModelRunnerOutput:
+        self.copy_event.synchronize()
+
+        # NOTE(woosuk): The following code is to ensure compatibility with
+        # the existing model runner.
+        # Going forward, we should keep the data structures as NumPy arrays
+        # rather than Python lists.
+        sampled_token_ids_np = self.sampled_token_ids.numpy()
+        num_reqs = sampled_token_ids_np.shape[0]
+        sampled_token_ids: list[np.ndarray] = [
+            sampled_token_ids_np[i, : self.num_sampled_tokens[i]]
+            for i in range(num_reqs)
+        ]
+        self.model_runner_output.sampled_token_ids = sampled_token_ids
+
+        if self.logprobs_tensors is not None:
+            self.model_runner_output.logprobs = self.logprobs_tensors.tolists()
+        self.model_runner_output.prompt_logprobs_dict = self.prompt_logprobs_dict
+        return self.model_runner_output
+
+
+@contextmanager
+def async_barrier(event: torch.cuda.Event | None):
+    if event is not None:
+        event.synchronize()
+    try:
+        yield
+    finally:
+        if event is not None:
+            event.record()
diff --git a/vllm/v1/worker/gpu/attn_utils.py b/vllm/v1/worker/gpu/attn_utils.py
new file mode 100644
index 0000000000000..8850c18092299
--- /dev/null
+++ b/vllm/v1/worker/gpu/attn_utils.py
@@ -0,0 +1,187 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from collections.abc import Sequence
+from typing import Any
+
+import torch
+
+from vllm.attention.backends.abstract import AttentionBackend
+from vllm.config import VllmConfig, get_layers_from_vllm_config
+from vllm.model_executor.layers.attention_layer_base import AttentionLayerBase
+from vllm.v1.attention.backends.utils import (
+    AttentionMetadataBuilder,
+    CommonAttentionMetadata,
+)
+from vllm.v1.kv_cache_interface import (
+    KVCacheConfig,
+    KVCacheSpec,
+)
+from vllm.v1.utils import CpuGpuBuffer
+from vllm.v1.worker.utils import bind_kv_cache
+
+
+def get_kv_cache_spec(vllm_config: VllmConfig) -> dict[str, KVCacheSpec]:
+    kv_cache_spec: dict[str, KVCacheSpec] = {}
+    attn_layers = get_layers_from_vllm_config(vllm_config, AttentionLayerBase)
+    for layer_name, attn_module in attn_layers.items():
+        # Skip modules that don't need KV cache (eg encoder-only attention)
+        if spec := attn_module.get_kv_cache_spec(vllm_config):
+            kv_cache_spec[layer_name] = spec
+    return kv_cache_spec
+
+
+def init_attn_backend(
+    kv_cache_config: KVCacheConfig,
+    vllm_config: VllmConfig,
+    device: torch.device,
+):
+    attn_backends: dict[str, AttentionBackend] = {}
+    attn_metadata_builders: list[AttentionMetadataBuilder] = []
+    flashinfer_workspace: torch.Tensor | None = None
+    for kv_cache_group_spec in kv_cache_config.kv_cache_groups:
+        layer_names = kv_cache_group_spec.layer_names
+        any_layer_name = next(iter(layer_names))
+
+        attn_layers = get_layers_from_vllm_config(
+            vllm_config, AttentionLayerBase, layer_names
+        )
+        attn_backend = attn_layers[any_layer_name].get_attn_backend()
+        for layer_name in layer_names:
+            attn_backends[layer_name] = attn_backend
+
+        attn_metadata_builder = attn_backend.get_builder_cls()(
+            kv_cache_group_spec.kv_cache_spec,
+            layer_names,
+            vllm_config,
+            device,
+        )
+        attn_metadata_builders.append(attn_metadata_builder)  # type: ignore
+
+        if "FLASHINFER" in attn_backend.get_name():
+            if flashinfer_workspace is None:
+                flashinfer_workspace = attn_metadata_builder._get_workspace_buffer()
+            else:
+                attn_metadata_builder.set_workspace_buffer(flashinfer_workspace)
+    return attn_backends, attn_metadata_builders
+
+
+def _allocate_kv_cache(
+    kv_cache_config: KVCacheConfig,
+    device: torch.device,
+):
+    kv_cache_raw_tensors: dict[str, torch.Tensor] = {}
+    for kv_cache_tensor in kv_cache_config.kv_cache_tensors:
+        tensor = torch.zeros(kv_cache_tensor.size, dtype=torch.int8, device=device)
+        for layer_name in kv_cache_tensor.shared_by:
+            kv_cache_raw_tensors[layer_name] = tensor
+
+    layer_names = set()
+    for group in kv_cache_config.kv_cache_groups:
+        for layer_name in group.layer_names:
+            layer_names.add(layer_name)
+    assert layer_names == set(kv_cache_raw_tensors.keys()), (
+        "Some layers are not correctly initialized"
+    )
+    return kv_cache_raw_tensors
+
+
+def _reshape_kv_cache(
+    kv_cache_config: KVCacheConfig,
+    kv_cache_raw_tensors: dict[str, torch.Tensor],
+    attn_backends: dict[str, AttentionBackend],
+) -> dict[str, torch.Tensor]:
+    kv_caches: dict[str, torch.Tensor] = {}
+    for kv_cache_group_spec in kv_cache_config.kv_cache_groups:
+        kv_cache_spec = kv_cache_group_spec.kv_cache_spec
+        for layer_name in kv_cache_group_spec.layer_names:
+            raw_tensor = kv_cache_raw_tensors[layer_name]
+            assert raw_tensor.numel() % kv_cache_spec.page_size_bytes == 0
+            num_blocks = raw_tensor.numel() // kv_cache_spec.page_size_bytes
+
+            attn_backend = attn_backends[layer_name]
+            kv_cache_shape = attn_backend.get_kv_cache_shape(
+                num_blocks,
+                kv_cache_spec.block_size,
+                kv_cache_spec.num_kv_heads,
+                kv_cache_spec.head_size,
+            )
+
+            # FIXME(woosuk): Add kv_cache_stride_order to all attention backends.
+            try:
+                kv_cache_stride_order = attn_backend.get_kv_cache_stride_order()
+                assert len(kv_cache_stride_order) == len(kv_cache_shape)
+            except (AttributeError, NotImplementedError):
+                kv_cache_stride_order = tuple(range(len(kv_cache_shape)))
+
+            kv_cache_shape = tuple(kv_cache_shape[i] for i in kv_cache_stride_order)
+            inv_order = [
+                kv_cache_stride_order.index(i)
+                for i in range(len(kv_cache_stride_order))
+            ]
+
+            dtype = kv_cache_spec.dtype
+            raw_tensor = raw_tensor.view(dtype)
+            raw_tensor = raw_tensor.view(kv_cache_shape)
+            kv_caches[layer_name] = raw_tensor.permute(*inv_order)
+    return kv_caches
+
+
+def init_kv_cache(
+    runner_kv_caches: list[torch.Tensor],
+    forward_context: dict[str, Any],
+    kv_cache_config: KVCacheConfig,
+    attn_backends: dict[str, AttentionBackend],
+    device: torch.device,
+) -> None:
+    kv_cache_raw_tensors = _allocate_kv_cache(kv_cache_config, device)
+    kv_caches = _reshape_kv_cache(kv_cache_config, kv_cache_raw_tensors, attn_backends)
+    bind_kv_cache(kv_caches, forward_context, runner_kv_caches)
+
+
+def build_attn_metadata(
+    attn_metadata_builders: list[AttentionMetadataBuilder],
+    num_reqs: int,
+    num_tokens: int,
+    query_start_loc: CpuGpuBuffer,
+    seq_lens: CpuGpuBuffer,
+    num_computed_tokens_cpu: torch.Tensor,
+    block_tables: Sequence[torch.Tensor],
+    slot_mappings: torch.Tensor,
+    kv_cache_config: KVCacheConfig,
+) -> dict[str, Any]:
+    query_start_loc_gpu = query_start_loc.gpu[: num_reqs + 1]
+    query_start_loc_cpu = query_start_loc.cpu[: num_reqs + 1]
+    max_query_len = int(query_start_loc.np[: num_reqs + 1].max())
+    seq_lens_gpu = seq_lens.gpu[:num_reqs]
+    seq_lens_cpu = seq_lens.cpu[:num_reqs]
+    max_seq_len = int(seq_lens.np[:num_reqs].max())
+
+    attn_metadata: dict[str, Any] = {}
+    kv_cache_groups = kv_cache_config.kv_cache_groups
+    for i, kv_cache_spec in enumerate(kv_cache_groups):
+        block_table = block_tables[i]
+        slot_mapping = slot_mappings[i]
+
+        common_attn_metadata = CommonAttentionMetadata(
+            query_start_loc=query_start_loc_gpu,
+            query_start_loc_cpu=query_start_loc_cpu,
+            seq_lens=seq_lens_gpu,
+            seq_lens_cpu=seq_lens_cpu,
+            max_seq_len=max_seq_len,
+            num_computed_tokens_cpu=num_computed_tokens_cpu,
+            num_reqs=num_reqs,
+            num_actual_tokens=num_tokens,
+            max_query_len=max_query_len,
+            block_table_tensor=block_table,
+            slot_mapping=slot_mapping,
+            causal=True,
+        )
+
+        attn_metadata_builder = attn_metadata_builders[i]
+        metadata = attn_metadata_builder.build(
+            common_prefix_len=0,
+            common_attn_metadata=common_attn_metadata,
+        )
+        for layer_name in kv_cache_spec.layer_names:
+            attn_metadata[layer_name] = metadata
+    return attn_metadata
diff --git a/vllm/v1/worker/gpu/block_table.py b/vllm/v1/worker/gpu/block_table.py
new file mode 100644
index 0000000000000..ff24e88ede2c0
--- /dev/null
+++ b/vllm/v1/worker/gpu/block_table.py
@@ -0,0 +1,315 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from collections.abc import Iterable
+
+import torch
+import triton
+import triton.language as tl
+
+from vllm.attention.backends.utils import PAD_SLOT_ID
+from vllm.utils.math_utils import cdiv
+from vllm.v1.utils import CpuGpuBuffer
+
+
+class BlockTables:
+    def __init__(
+        self,
+        block_sizes: list[int],
+        max_num_reqs: int,
+        max_num_batched_tokens: int,
+        max_model_len: int,
+        device: torch.device,
+        pin_memory: bool,
+    ):
+        self.block_sizes = block_sizes
+        self.max_num_reqs = max_num_reqs
+        self.max_num_batched_tokens = max_num_batched_tokens
+        self.max_model_len = max_model_len
+        self.device = device
+        self.pin_memory = pin_memory
+
+        self.num_kv_cache_groups = len(self.block_sizes)
+        # num_kv_cache_groups x [max_num_reqs, max_num_blocks]
+        self.block_tables: list[torch.Tensor] = []
+        for i in range(self.num_kv_cache_groups):
+            block_size = self.block_sizes[i]
+            max_num_blocks = cdiv(self.max_model_len, block_size)
+            block_table = torch.zeros(
+                self.max_num_reqs,
+                max_num_blocks,
+                dtype=torch.int32,
+                device=self.device,
+            )
+            self.block_tables.append(block_table)
+        self.block_table_ptrs = self._make_ptr_tensor(self.block_tables)
+
+        # Block tables used for model's forward pass.
+        # num_kv_cache_groups x [max_num_reqs, max_num_blocks]
+        self.input_block_tables: list[torch.Tensor] = [
+            torch.zeros_like(block_table) for block_table in self.block_tables
+        ]
+        self.input_block_table_ptrs = self._make_ptr_tensor(self.input_block_tables)
+
+        self.block_table_strides = torch.tensor(
+            [b.stride(0) for b in self.block_tables],
+            dtype=torch.int64,
+            device=self.device,
+        )
+        self.block_sizes_tensor = torch.tensor(
+            self.block_sizes, dtype=torch.int32, device=self.device
+        )
+        self.num_blocks = torch.zeros(
+            self.num_kv_cache_groups,
+            self.max_num_reqs,
+            dtype=torch.int32,
+            device=self.device,
+        )
+        self.slot_mappings = torch.zeros(
+            self.num_kv_cache_groups,
+            self.max_num_batched_tokens,
+            dtype=torch.int64,
+            device=self.device,
+        )
+
+        # Misc buffers.
+        self.req_indices = self._make_buffer(self.max_num_reqs, dtype=torch.int32)
+        self.overwrite = self._make_buffer(self.max_num_reqs, dtype=torch.bool)
+        self.cu_num_new_blocks = self._make_buffer(
+            self.num_kv_cache_groups, self.max_num_reqs + 1, dtype=torch.int32
+        )
+
+    def _make_buffer(self, *args, dtype: torch.dtype) -> CpuGpuBuffer:
+        return CpuGpuBuffer(
+            *args, dtype=dtype, pin_memory=self.pin_memory, device=self.device
+        )
+
+    def _make_ptr_tensor(self, x: Iterable[torch.Tensor]) -> torch.Tensor:
+        # NOTE(woosuk): Use uint64 instead of int64 to cover all possible addresses.
+        ptrs_tensor_cpu = torch.tensor(
+            [t.data_ptr() for t in x],
+            dtype=torch.uint64,
+            device="cpu",
+            pin_memory=self.pin_memory,
+        )
+        return ptrs_tensor_cpu.to(self.device, non_blocking=True)
+
+    def append_block_ids(
+        self,
+        # [num_reqs]
+        req_indices: list[int],
+        # [num_kv_cache_groups, num_reqs + 1]
+        cu_num_new_blocks: tuple[list[int], ...],
+        # [num_kv_cache_groups, num_new_blocks]
+        new_block_ids: tuple[list[int], ...],
+        # [num_reqs]
+        overwrite: list[bool],
+    ) -> None:
+        num_reqs = len(req_indices)
+        self.req_indices.np[:num_reqs] = req_indices
+        self.overwrite.np[:num_reqs] = overwrite
+        for i in range(self.num_kv_cache_groups):
+            self.cu_num_new_blocks.np[i, : num_reqs + 1] = cu_num_new_blocks[i]
+
+        # NOTE(woosuk): Here, we cannot use a fixed-size buffer because there's
+        # no clear upper bound to the number of new blocks in a single step.
+        # NOTE(woosuk): The buffer has to be cached, because otherwise we cannot
+        # guarantee that the buffer is not freed before the copy is completed.
+        self.new_block_ids_cpu = torch.empty(
+            self.num_kv_cache_groups,
+            max(len(x) for x in new_block_ids),
+            dtype=torch.int32,
+            device="cpu",
+            pin_memory=self.pin_memory,
+        )
+        new_block_ids_np = self.new_block_ids_cpu.numpy()
+        for i in range(self.num_kv_cache_groups):
+            new_block_ids_np[i, : len(new_block_ids[i])] = new_block_ids[i]
+        new_block_ids_gpu = self.new_block_ids_cpu.to(self.device, non_blocking=True)
+
+        _append_block_ids_kernel[(self.num_kv_cache_groups, num_reqs)](
+            self.req_indices.copy_to_gpu(num_reqs),
+            self.cu_num_new_blocks.copy_to_gpu(),
+            self.cu_num_new_blocks.gpu.stride(0),
+            new_block_ids_gpu,
+            new_block_ids_gpu.stride(0),
+            self.overwrite.copy_to_gpu(num_reqs),
+            self.block_table_strides,
+            self.block_table_ptrs,
+            self.num_blocks,
+            self.num_blocks.stride(0),
+            BLOCK_SIZE=1024,  # type: ignore
+        )
+
+    def gather_block_tables(
+        self,
+        idx_mapping: torch.Tensor,
+    ) -> tuple[torch.Tensor, ...]:
+        num_reqs = idx_mapping.shape[0]
+        _gather_block_tables_kernel[(self.num_kv_cache_groups, num_reqs)](
+            idx_mapping,
+            self.block_table_ptrs,
+            self.input_block_table_ptrs,
+            self.block_table_strides,
+            self.num_blocks,
+            self.num_blocks.stride(0),
+            BLOCK_SIZE=1024,  # type: ignore
+        )
+        return tuple(block_table[:num_reqs] for block_table in self.input_block_tables)
+
+    def get_dummy_block_tables(self, num_reqs: int) -> tuple[torch.Tensor, ...]:
+        return tuple(block_table[:num_reqs] for block_table in self.input_block_tables)
+
+    def compute_slot_mappings(
+        self,
+        query_start_loc: torch.Tensor,
+        positions: torch.Tensor,
+    ) -> torch.Tensor:
+        num_reqs = query_start_loc.shape[0] - 1
+        num_tokens = positions.shape[0]
+        num_groups = self.num_kv_cache_groups
+        _compute_slot_mappings_kernel[(num_groups, num_reqs + 1)](
+            num_tokens,
+            self.max_num_batched_tokens,
+            query_start_loc,
+            positions,
+            self.input_block_table_ptrs,
+            self.block_table_strides,
+            self.block_sizes_tensor,
+            self.slot_mappings,
+            self.slot_mappings.stride(0),
+            PAD_ID=PAD_SLOT_ID,
+            BLOCK_SIZE=1024,  # type: ignore
+        )
+        return self.slot_mappings[:, :num_tokens]
+
+    def get_dummy_slot_mappings(self, num_tokens: int) -> torch.Tensor:
+        self.slot_mappings.fill_(PAD_SLOT_ID)
+        return self.slot_mappings[:, :num_tokens]
+
+
+@triton.jit
+def _append_block_ids_kernel(
+    # Inputs
+    req_indices,  # [num_reqs]
+    cu_num_new_blocks_ptr,  # [num_kv_cache_groups, num_reqs + 1]
+    cu_num_new_blocks_stride,
+    new_block_ids_ptr,  # [num_kv_cache_groups, num_new_blocks]
+    new_block_ids_stride,
+    overwrite,  # [num_reqs]
+    block_table_strides,  # [num_kv_cache_groups]
+    # Outputs
+    block_table_ptrs,  # [num_kv_cache_groups]
+    num_blocks_ptr,  # [num_kv_cache_groups, max_num_reqs]
+    num_blocks_stride,
+    # Constants
+    BLOCK_SIZE: tl.constexpr,
+):
+    group_id = tl.program_id(0)
+    batch_idx = tl.program_id(1)
+    req_idx = tl.load(req_indices + batch_idx)
+    do_overwrite = tl.load(overwrite + batch_idx)
+
+    group_new_blocks_ptr = cu_num_new_blocks_ptr + group_id * cu_num_new_blocks_stride
+    start_idx = tl.load(group_new_blocks_ptr + batch_idx)
+    end_idx = tl.load(group_new_blocks_ptr + batch_idx + 1)
+    num_new_blocks = end_idx - start_idx
+
+    group_num_blocks_ptr = num_blocks_ptr + group_id * num_blocks_stride
+    dst_start_idx = tl.load(group_num_blocks_ptr + req_idx) if not do_overwrite else 0
+    dst_end_idx = dst_start_idx + num_new_blocks
+    tl.store(group_num_blocks_ptr + req_idx, dst_end_idx)
+
+    # Destination
+    block_table_ptr = _load_ptr(block_table_ptrs + group_id, tl.int32)
+    block_table_stride = tl.load(block_table_strides + group_id)
+    row_ptr = block_table_ptr + req_idx * block_table_stride
+
+    group_new_block_ids_ptr = new_block_ids_ptr + group_id * new_block_ids_stride
+    for i in range(0, num_new_blocks, BLOCK_SIZE):
+        offset = i + tl.arange(0, BLOCK_SIZE)
+        block_ids = tl.load(
+            group_new_block_ids_ptr + start_idx + offset, mask=offset < num_new_blocks
+        )
+        tl.store(
+            row_ptr + dst_start_idx + offset, block_ids, mask=offset < num_new_blocks
+        )
+
+
+@triton.jit
+def _gather_block_tables_kernel(
+    batch_idx_to_req_idx,  # [batch_size]
+    src_block_table_ptrs,  # [num_kv_cache_groups]
+    dst_block_table_ptrs,  # [num_kv_cache_groups]
+    block_table_strides,  # [num_kv_cache_groups]
+    num_blocks_ptr,  # [num_kv_cache_groups, max_num_reqs]
+    num_blocks_stride,
+    BLOCK_SIZE: tl.constexpr,
+):
+    # kv cache group id
+    group_id = tl.program_id(0)
+    batch_idx = tl.program_id(1)
+    req_idx = tl.load(batch_idx_to_req_idx + batch_idx)
+
+    group_num_blocks_ptr = num_blocks_ptr + group_id * num_blocks_stride
+    num_blocks = tl.load(group_num_blocks_ptr + req_idx)
+
+    stride = tl.load(block_table_strides + group_id)
+    src_block_table_ptr = _load_ptr(src_block_table_ptrs + group_id, tl.int32)
+    src_row_ptr = src_block_table_ptr + req_idx * stride
+    dst_block_table_ptr = _load_ptr(dst_block_table_ptrs + group_id, tl.int32)
+    dst_row_ptr = dst_block_table_ptr + batch_idx * stride
+
+    for i in tl.range(0, num_blocks, BLOCK_SIZE):
+        offset = i + tl.arange(0, BLOCK_SIZE)
+        block_ids = tl.load(src_row_ptr + offset, mask=offset < num_blocks)
+        tl.store(dst_row_ptr + offset, block_ids, mask=offset < num_blocks)
+
+
+@triton.jit
+def _compute_slot_mappings_kernel(
+    num_tokens,
+    max_num_tokens,
+    cu_num_tokens,  # [num_reqs + 1]
+    pos,  # [num_tokens]
+    block_table_ptrs,  # [num_kv_cache_groups]
+    block_table_strides,  # [num_kv_cache_groups]
+    page_sizes,  # [num_kv_cache_groups]
+    slot_mappings_ptr,  # [num_kv_cache_groups, max_num_tokens]
+    slot_mappings_stride,
+    PAD_ID: tl.constexpr,
+    BLOCK_SIZE: tl.constexpr,
+):
+    # kv cache group id
+    group_id = tl.program_id(0)
+    req_idx = tl.program_id(1)
+    slot_mapping_ptr = slot_mappings_ptr + group_id * slot_mappings_stride
+
+    if req_idx == tl.num_programs(1) - 1:
+        # Pad remaining slots to -1. This is needed for CUDA graphs.
+        for i in range(num_tokens, max_num_tokens, BLOCK_SIZE):
+            offset = i + tl.arange(0, BLOCK_SIZE)
+            tl.store(slot_mapping_ptr + offset, PAD_ID, mask=offset < max_num_tokens)
+        return
+
+    block_table_ptr = _load_ptr(block_table_ptrs + group_id, tl.int32)
+    block_table_stride = tl.load(block_table_strides + group_id)
+    page_size = tl.load(page_sizes + group_id)
+
+    start_idx = tl.load(cu_num_tokens + req_idx)
+    end_idx = tl.load(cu_num_tokens + req_idx + 1)
+    for i in range(start_idx, end_idx, BLOCK_SIZE):
+        offset = i + tl.arange(0, BLOCK_SIZE)
+        positions = tl.load(pos + offset, mask=offset < end_idx, other=0)
+        block_indices = positions // page_size
+        block_numbers = tl.load(
+            block_table_ptr + req_idx * block_table_stride + block_indices
+        )
+        slot_ids = block_numbers * page_size + positions % page_size
+        tl.store(slot_mapping_ptr + offset, slot_ids, mask=offset < end_idx)
+
+
+@triton.jit
+def _load_ptr(ptr_to_ptr, elem_dtype):
+    ptr = tl.load(ptr_to_ptr)
+    ptr = tl.cast(ptr, tl.pointer_type(elem_dtype))
+    return tl.multiple_of(ptr, 16)
diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
new file mode 100644
index 0000000000000..7fd1f76669f48
--- /dev/null
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -0,0 +1,198 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import gc
+from contextlib import contextmanager
+
+import numpy as np
+import torch
+import torch.nn as nn
+from tqdm import tqdm
+
+from vllm.config import VllmConfig
+from vllm.config.compilation import CUDAGraphMode
+from vllm.distributed.parallel_state import graph_capture, is_global_first_rank
+from vllm.forward_context import set_forward_context
+from vllm.v1.attention.backends.utils import AttentionMetadataBuilder
+from vllm.v1.core.sched.output import SchedulerOutput
+from vllm.v1.kv_cache_interface import KVCacheConfig
+from vllm.v1.worker.gpu.attn_utils import build_attn_metadata
+from vllm.v1.worker.gpu.block_table import BlockTables
+from vllm.v1.worker.gpu.input_batch import InputBuffers
+
+
+class CudaGraphManager:
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
+        self.vllm_config = vllm_config
+        self.device = device
+
+        self.max_model_len = vllm_config.model_config.max_model_len
+        self.dp_size = vllm_config.parallel_config.data_parallel_size
+        self.compilation_config = vllm_config.compilation_config
+        assert self.compilation_config is not None
+
+        self.cudagraph_mode = self.compilation_config.cudagraph_mode
+        self.cudagraph_sizes = sorted(self.compilation_config.cudagraph_capture_sizes)
+        self.padded_sizes = self._init_padded_sizes()
+
+        self.graphs: dict[int, torch.cuda.CUDAGraph] = {}
+        self.pool = torch.cuda.graph_pool_handle()
+        self.hidden_states: torch.Tensor | None = None
+
+    def _init_padded_sizes(self) -> dict[int, int]:
+        if not self.cudagraph_mode.has_full_cudagraphs():
+            # Full cuda graphs are not used.
+            return {}
+
+        padded_sizes: dict[int, int] = {}
+        assert len(self.cudagraph_sizes) > 0
+        for i in range(1, self.cudagraph_sizes[-1] + 1):
+            for x in self.cudagraph_sizes:
+                if i <= x:
+                    padded_sizes[i] = x
+                    break
+        return padded_sizes
+
+    def needs_capture(self) -> bool:
+        return len(self.padded_sizes) > 0
+
+    def get_cudagraph_size(
+        self,
+        scheduler_output: SchedulerOutput,
+        num_tokens_after_padding: int,
+    ) -> int | None:
+        if not self.cudagraph_mode.has_full_cudagraphs():
+            return None
+        if self.cudagraph_mode != CUDAGraphMode.FULL:
+            # TODO(woosuk): Support uniform decode with multiple tokens (spec decoding).
+            all_decode = all(
+                x == 1 for x in scheduler_output.num_scheduled_tokens.values()
+            )
+            if not all_decode:
+                # Prefill is included.
+                return None
+        return self.padded_sizes.get(num_tokens_after_padding)
+
+    def capture_graph(
+        self,
+        batch_size: int,
+        model: nn.Module,
+        input_buffers: InputBuffers,
+        block_tables: BlockTables,
+        attn_metadata_builders: list[AttentionMetadataBuilder],
+        kv_cache_config: KVCacheConfig,
+    ) -> None:
+        assert batch_size not in self.graphs
+
+        # Prepare dummy inputs.
+        input_ids = input_buffers.input_ids.gpu[:batch_size]
+        positions = input_buffers.positions.gpu[:batch_size]
+
+        input_buffers.query_start_loc.np[: batch_size + 1] = np.arange(batch_size + 1)
+        input_buffers.query_start_loc.np[batch_size:] = batch_size
+        input_buffers.query_start_loc.copy_to_gpu()
+        input_buffers.seq_lens.np[:batch_size] = self.max_model_len
+        input_buffers.seq_lens.np[batch_size:] = 0
+        input_buffers.seq_lens.copy_to_gpu()
+
+        input_block_tables = [x[:batch_size] for x in block_tables.input_block_tables]
+        slot_mappings = block_tables.slot_mappings[:, :batch_size]
+
+        attn_metadata = build_attn_metadata(
+            attn_metadata_builders=attn_metadata_builders,
+            num_reqs=batch_size,
+            num_tokens=batch_size,
+            query_start_loc=input_buffers.query_start_loc,
+            seq_lens=input_buffers.seq_lens,
+            num_computed_tokens_cpu=None,  # FIXME
+            block_tables=input_block_tables,
+            slot_mappings=slot_mappings,
+            kv_cache_config=kv_cache_config,
+        )
+        if self.dp_size > 1:
+            num_tokens_across_dp = torch.full(
+                (self.dp_size,),
+                batch_size,
+                dtype=torch.int32,
+                device="cpu",
+            )
+        else:
+            num_tokens_across_dp = None
+
+        # Warm up.
+        with set_forward_context(
+            attn_metadata,
+            self.vllm_config,
+            num_tokens=batch_size,
+            num_tokens_across_dp=num_tokens_across_dp,
+        ):
+            hidden_states = model(
+                input_ids=input_ids,
+                positions=positions,
+            )
+            if self.hidden_states is None:
+                self.hidden_states = torch.empty_like(hidden_states)
+        torch.cuda.synchronize()
+
+        # Capture the graph.
+        graph = torch.cuda.CUDAGraph()
+        with (
+            set_forward_context(
+                attn_metadata,
+                self.vllm_config,
+                num_tokens=batch_size,
+                num_tokens_across_dp=num_tokens_across_dp,
+            ),
+            torch.cuda.graph(graph, self.pool),
+        ):
+            hidden_states = model(
+                input_ids=input_ids,
+                positions=positions,
+            )
+            self.hidden_states[:batch_size] = hidden_states
+        self.graphs[batch_size] = graph
+
+    @torch.inference_mode()
+    def capture(
+        self,
+        model: nn.Module,
+        input_buffers: InputBuffers,
+        block_tables: BlockTables,
+        attn_metadata_builders: list[AttentionMetadataBuilder],
+        kv_cache_config: KVCacheConfig,
+    ) -> None:
+        assert self.needs_capture()
+        # Capture larger graphs first.
+        sizes_to_capture = sorted(self.cudagraph_sizes, reverse=True)
+        if is_global_first_rank():
+            sizes_to_capture = tqdm(sizes_to_capture, desc="Capturing CUDA graphs")
+
+        with freeze_gc(), graph_capture(device=self.device):
+            for batch_size in sizes_to_capture:
+                self.capture_graph(
+                    batch_size,
+                    model,
+                    input_buffers,
+                    block_tables,
+                    attn_metadata_builders,
+                    kv_cache_config,
+                )
+
+    def run(self, batch_size: int) -> torch.Tensor:
+        assert batch_size in self.graphs
+        self.graphs[batch_size].replay()
+        assert self.hidden_states is not None
+        return self.hidden_states[:batch_size]
+
+
+@contextmanager
+def freeze_gc():
+    gc.collect()
+    gc.freeze()
+    try:
+        yield
+    finally:
+        gc.unfreeze()
diff --git a/vllm/v1/worker/gpu/dp_utils.py b/vllm/v1/worker/gpu/dp_utils.py
new file mode 100644
index 0000000000000..9bfc7f25bef3a
--- /dev/null
+++ b/vllm/v1/worker/gpu/dp_utils.py
@@ -0,0 +1,22 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import torch
+import torch.distributed as dist
+
+from vllm.distributed.parallel_state import get_dp_group
+
+
+def get_batch_metadata_across_dp(
+    num_tokens: int,
+    cudagraph_size: int,
+    dp_size: int,
+    dp_rank: int,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    assert dp_size > 1
+    # Use CPU group to avoid CPU-GPU synchronization.
+    group = get_dp_group().cpu_group
+    tensor = torch.zeros(2, dp_size, dtype=torch.int32, device="cpu")
+    tensor[0][dp_rank] = num_tokens
+    tensor[1][dp_rank] = cudagraph_size
+    dist.all_reduce(tensor, group=group)
+    return tensor[0], tensor[1]
diff --git a/vllm/v1/worker/gpu/input_batch.py b/vllm/v1/worker/gpu/input_batch.py
new file mode 100644
index 0000000000000..89f375649146f
--- /dev/null
+++ b/vllm/v1/worker/gpu/input_batch.py
@@ -0,0 +1,265 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from dataclasses import dataclass
+from typing import Any
+
+import numba
+import numba.types as types
+import numpy as np
+import torch
+import triton
+import triton.language as tl
+
+from vllm.utils import random_uuid
+from vllm.utils.math_utils import cdiv
+from vllm.v1.utils import CpuGpuBuffer
+
+
+class InputBuffers:
+    def __init__(
+        self,
+        max_num_reqs: int,
+        max_num_tokens: int,
+        hidden_size: int,
+        vocab_size: int,
+        dtype: torch.dtype,
+        device: torch.device,
+        pin_memory: bool,
+    ):
+        self.max_num_reqs = max_num_reqs
+        self.max_num_tokens = max_num_tokens
+        self.device = device
+        self.pin_memory = pin_memory
+
+        self.idx_mapping = self._make_buffer(max_num_reqs, dtype=torch.int32)
+        self.input_ids = self._make_buffer(max_num_tokens, dtype=torch.int32)
+        self.positions = self._make_buffer(max_num_tokens, dtype=torch.int64)
+        self.query_start_loc = self._make_buffer(max_num_reqs + 1, dtype=torch.int32)
+        self.seq_lens = self._make_buffer(max_num_reqs, dtype=torch.int32)
+
+        # Structured outputs.
+        self.bitmask_indices = self._make_buffer(max_num_reqs, dtype=torch.int32)
+        self.grammar_bitmask = self._make_buffer(
+            max_num_reqs, cdiv(vocab_size, 32), dtype=torch.int32
+        )
+
+    def _make_buffer(self, *args, dtype: torch.dtype) -> CpuGpuBuffer:
+        return CpuGpuBuffer(
+            *args, dtype=dtype, pin_memory=self.pin_memory, device=self.device
+        )
+
+
+@dataclass
+class InputBatch:
+    # batch_idx -> req_id
+    req_ids: list[str]
+    num_reqs: int
+
+    # batch_idx -> req_state_idx
+    idx_mapping: torch.Tensor
+    idx_mapping_np: np.ndarray
+
+    # [num_reqs]
+    # batch_idx -> num_scheduled_tokens
+    num_scheduled_tokens: np.ndarray
+    # sum(num_scheduled_tokens)
+    num_tokens: int
+    num_tokens_after_padding: int
+
+    # [num_reqs + 1]
+    query_start_loc: torch.Tensor
+    query_start_loc_np: np.ndarray
+    # [num_reqs]
+    seq_lens: torch.Tensor
+    seq_lens_np: np.ndarray
+
+    # [num_tokens_after_padding]
+    input_ids: torch.Tensor
+    # [num_tokens_after_padding]
+    positions: torch.Tensor
+
+    # layer_name -> Metadata
+    attn_metadata: dict[str, Any]
+
+    # [num_reqs]
+    logits_indices: torch.Tensor
+
+    @classmethod
+    def make_dummy(
+        cls,
+        num_reqs: int,
+        num_tokens: int,
+        input_buffers: InputBuffers,
+        device: torch.device,
+    ) -> "InputBatch":
+        assert 0 < num_reqs <= num_tokens
+        req_ids = [f"req_{i}_{random_uuid()}" for i in range(num_reqs)]
+        idx_mapping_np = np.arange(num_reqs, dtype=np.int32)
+        idx_mapping = torch.arange(num_reqs, dtype=torch.int32, device=device)
+        num_scheduled_tokens = np.full(num_reqs, num_tokens // num_reqs, dtype=np.int32)
+        num_scheduled_tokens[-1] += num_tokens % num_reqs
+        assert int(num_scheduled_tokens.sum()) == num_tokens
+
+        input_buffers.query_start_loc.np[0] = 0
+        input_buffers.query_start_loc.np[1 : num_reqs + 1] = np.cumsum(
+            num_scheduled_tokens
+        )
+        input_buffers.query_start_loc.np[num_reqs + 1 :] = num_tokens
+        query_start_loc_np = input_buffers.query_start_loc.np[: num_reqs + 1]
+        query_start_loc = input_buffers.query_start_loc.copy_to_gpu()[: num_reqs + 1]
+        # seq_len equals to query_len
+        input_buffers.seq_lens.np[:num_reqs] = num_scheduled_tokens
+        input_buffers.seq_lens.np[num_reqs:] = 0
+        seq_lens_np = input_buffers.seq_lens.np[:num_reqs]
+        seq_lens = input_buffers.seq_lens.copy_to_gpu()[:num_reqs]
+
+        input_ids = input_buffers.input_ids.copy_to_gpu(num_tokens)
+        positions = input_buffers.positions.copy_to_gpu(num_tokens)
+        # attn_metadata = defaultdict(lambda: None)
+        logits_indices = query_start_loc[1:] - 1
+        return cls(
+            req_ids=req_ids,
+            num_reqs=num_reqs,
+            idx_mapping=idx_mapping,
+            idx_mapping_np=idx_mapping_np,
+            num_scheduled_tokens=num_scheduled_tokens,
+            num_tokens=num_tokens,
+            num_tokens_after_padding=num_tokens,
+            query_start_loc=query_start_loc,
+            query_start_loc_np=query_start_loc_np,
+            seq_lens=seq_lens,
+            seq_lens_np=seq_lens_np,
+            input_ids=input_ids,
+            positions=positions,
+            attn_metadata=None,  # type: ignore
+            logits_indices=logits_indices,
+        )
+
+
+# NOTE: With the type annotations, this function is pre-compiled
+# before the first call.
+@numba.jit(
+    [
+        types.none(
+            types.int32[:],  # idx_mapping
+            types.int32[:, :],  # token_ids
+            types.int32[:],  # num_computed_tokens
+            types.int32[:],  # num_scheduled_tokens
+            types.int32[:],  # input_ids
+            types.int64[:],  # positions
+            types.int32[:],  # query_start_loc
+            types.int32[:],  # seq_lens
+        )
+    ],
+    nopython=True,
+    cache=True,
+)
+def _prepare_inputs(
+    idx_mapping: np.ndarray,  # batch_idx -> req_idx
+    token_ids: np.ndarray,  # [N, max_model_len]
+    num_computed_tokens: np.ndarray,  # [N]
+    num_scheduled_tokens: np.ndarray,  # [B]
+    input_ids: np.ndarray,  # [num_input_tokens]
+    positions: np.ndarray,  # [num_input_tokens]
+    query_start_loc: np.ndarray,  # [B + 1]
+    seq_lens: np.ndarray,  # [B]
+) -> None:
+    num_reqs = num_scheduled_tokens.shape[0]
+    query_start_loc[0] = 0
+
+    cu_num_tokens = 0
+    for i in range(num_reqs):
+        req_idx = idx_mapping[i]
+        query_len = num_scheduled_tokens[i]
+        start = num_computed_tokens[req_idx]
+        end = start + query_len
+        seq_lens[i] = end
+
+        start_idx = cu_num_tokens
+        end_idx = start_idx + query_len
+        input_ids[start_idx:end_idx] = token_ids[req_idx, start:end]
+        positions[start_idx:end_idx] = np.arange(start, end, dtype=np.int64)
+
+        cu_num_tokens = end_idx
+        query_start_loc[i + 1] = cu_num_tokens
+
+    # Pad the inputs for CUDA graphs.
+    # Note: pad query_start_loc to be non-decreasing, as kernels
+    # like FlashAttention requires that
+    query_start_loc[num_reqs + 1 :].fill(cu_num_tokens)
+    # Fill unused with 0 for full cuda graph mode.
+    seq_lens[num_reqs:].fill(0)
+
+
+def prepare_inputs(
+    idx_mapping: np.ndarray,
+    prefill_token_ids: np.ndarray,
+    num_computed_tokens: np.ndarray,
+    num_scheduled_tokens: np.ndarray,
+    input_ids: CpuGpuBuffer,
+    positions: CpuGpuBuffer,
+    query_start_loc: CpuGpuBuffer,
+    seq_lens: CpuGpuBuffer,
+    num_tokens: int,
+) -> None:
+    _prepare_inputs(
+        idx_mapping,
+        prefill_token_ids,
+        num_computed_tokens,
+        num_scheduled_tokens,
+        input_ids.np,
+        positions.np,
+        query_start_loc.np,
+        seq_lens.np,
+    )
+    input_ids.copy_to_gpu(num_tokens)
+    positions.copy_to_gpu(num_tokens)
+    # NOTE(woosuk): We should copy the whole query_start_loc and seq_lens
+    # tensors from CPU to GPU, because they may include paddings needed
+    # for full CUDA graph mode.
+    query_start_loc.copy_to_gpu()
+    seq_lens.copy_to_gpu()
+    return
+
+
+@triton.jit
+def _combine_last_token_ids_kernel(
+    input_ids_ptr,
+    idx_mapping_ptr,
+    last_token_ids_ptr,
+    query_start_loc_ptr,
+    seq_lens_ptr,
+    prefill_len_ptr,
+):
+    batch_idx = tl.program_id(0)
+    req_state_idx = tl.load(idx_mapping_ptr + batch_idx)
+
+    seq_len = tl.load(seq_lens_ptr + batch_idx)
+    prefill_len = tl.load(prefill_len_ptr + req_state_idx)
+    if seq_len <= prefill_len:
+        # Handling prefill tokens.
+        return
+
+    last_token_id = tl.load(last_token_ids_ptr + req_state_idx)
+    end = tl.load(query_start_loc_ptr + batch_idx + 1)
+    tl.store(input_ids_ptr + end - 1, last_token_id)
+
+
+def combine_last_token_ids(
+    input_ids: torch.Tensor,
+    idx_mapping: torch.Tensor,
+    last_token_ids: torch.Tensor,
+    query_start_loc: torch.Tensor,
+    seq_lens: torch.Tensor,
+    prefill_len: torch.Tensor,
+) -> torch.Tensor:
+    num_reqs = seq_lens.shape[0]
+    _combine_last_token_ids_kernel[(num_reqs,)](
+        input_ids,
+        idx_mapping,
+        last_token_ids,
+        query_start_loc,
+        seq_lens,
+        prefill_len,
+    )
+    return input_ids
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
new file mode 100644
index 0000000000000..08aad9ddd06b3
--- /dev/null
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -0,0 +1,814 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import gc
+import time
+from copy import deepcopy
+from typing import Any
+
+import numpy as np
+import torch
+import torch.nn as nn
+
+from vllm.config import VllmConfig
+from vllm.config.compilation import CUDAGraphMode
+from vllm.forward_context import set_forward_context
+from vllm.logger import init_logger
+from vllm.model_executor.model_loader import get_model_loader
+from vllm.utils.mem_constants import GiB_bytes
+from vllm.utils.mem_utils import DeviceMemoryProfiler
+from vllm.utils.platform_utils import is_pin_memory_available
+from vllm.utils.torch_utils import STR_DTYPE_TO_TORCH_DTYPE
+from vllm.v1.core.sched.output import GrammarOutput, SchedulerOutput
+from vllm.v1.kv_cache_interface import KVCacheConfig
+from vllm.v1.outputs import (
+    EMPTY_MODEL_RUNNER_OUTPUT,
+    LogprobsTensors,
+    ModelRunnerOutput,
+)
+from vllm.v1.sample.sampler import SamplerOutput
+from vllm.v1.worker.gpu.async_utils import AsyncOutput, async_barrier
+from vllm.v1.worker.gpu.attn_utils import (
+    build_attn_metadata,
+    get_kv_cache_spec,
+    init_attn_backend,
+    init_kv_cache,
+)
+from vllm.v1.worker.gpu.block_table import BlockTables
+from vllm.v1.worker.gpu.cudagraph_utils import CudaGraphManager
+from vllm.v1.worker.gpu.dp_utils import get_batch_metadata_across_dp
+from vllm.v1.worker.gpu.input_batch import (
+    InputBatch,
+    InputBuffers,
+    combine_last_token_ids,
+    prepare_inputs,
+)
+from vllm.v1.worker.gpu.sampler import Sampler, compute_prompt_logprobs
+from vllm.v1.worker.gpu.states import RequestState, SamplingMetadata
+from vllm.v1.worker.gpu.structured_outputs import apply_grammar_bitmask
+from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorModelRunnerMixin
+from vllm.v1.worker.lora_model_runner_mixin import LoRAModelRunnerMixin
+
+logger = init_logger(__name__)
+
+
+class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
+    def __init__(
+        self,
+        vllm_config: VllmConfig,
+        device: torch.device,
+    ):
+        self.vllm_config = vllm_config
+        self.model_config = vllm_config.model_config
+        self.cache_config = vllm_config.cache_config
+        self.compilation_config = vllm_config.compilation_config
+        self.lora_config = vllm_config.lora_config
+        self.load_config = vllm_config.load_config
+        self.parallel_config = vllm_config.parallel_config
+        self.scheduler_config = vllm_config.scheduler_config
+        self.speculative_config = vllm_config.speculative_config
+        self.observability_config = vllm_config.observability_config
+
+        self.device = device
+        self.pin_memory = is_pin_memory_available()
+        self.dtype = self.model_config.dtype
+        self.kv_cache_dtype = self.dtype
+        if self.cache_config.cache_dtype != "auto":
+            # Quantized KV cache.
+            self.kv_cache_dtype = STR_DTYPE_TO_TORCH_DTYPE[
+                self.cache_config.cache_dtype
+            ]
+        self.is_pooling_model = False
+
+        self.vocab_size = self.model_config.get_vocab_size()
+        self.max_model_len = self.model_config.max_model_len
+        self.max_num_tokens = self.scheduler_config.max_num_batched_tokens
+        self.max_num_reqs = self.scheduler_config.max_num_seqs
+        self.hidden_size = self.model_config.get_hidden_size()
+
+        self.dp_size = self.parallel_config.data_parallel_size
+        self.dp_rank = self.parallel_config.data_parallel_rank
+
+        self.use_async_scheduling = self.scheduler_config.async_scheduling
+        self.output_copy_stream = torch.cuda.Stream(self.device)
+        self.output_copy_event = torch.cuda.Event()
+        if self.use_async_scheduling:
+            self.input_prep_event = torch.cuda.Event()
+            self.structured_outputs_event = torch.cuda.Event()
+        else:
+            self.input_prep_event = None
+            self.structured_outputs_event = None
+
+        self.req_states = RequestState(
+            max_num_reqs=self.max_num_reqs,
+            max_model_len=self.max_model_len,
+            max_num_batched_tokens=self.max_num_tokens,
+            vocab_size=self.vocab_size,
+            device=self.device,
+            pin_memory=self.pin_memory,
+        )
+        self.input_buffers = InputBuffers(
+            max_num_reqs=self.max_num_reqs,
+            max_num_tokens=self.max_num_tokens,
+            hidden_size=self.hidden_size,
+            vocab_size=self.vocab_size,
+            dtype=self.dtype,
+            device=self.device,
+            pin_memory=self.pin_memory,
+        )
+        self.sampler = Sampler(logprobs_mode=self.model_config.logprobs_mode)
+
+        # CUDA graphs.
+        self.cudagraph_manager = CudaGraphManager(
+            vllm_config=self.vllm_config,
+            device=self.device,
+        )
+
+    def get_supported_tasks(self) -> tuple[str]:
+        return ("generate",)
+
+    def load_model(self, *args, **kwargs) -> None:
+        time_before_load = time.perf_counter()
+        with DeviceMemoryProfiler() as m:
+            model_loader = get_model_loader(self.vllm_config.load_config)
+            logger.info("Loading model from scratch...")
+
+            self.model = model_loader.load_model(
+                vllm_config=self.vllm_config,
+                model_config=self.vllm_config.model_config,
+            )
+            if self.lora_config:
+                self.model = self.load_lora_model(
+                    self.model,
+                    self.vllm_config,
+                    self.device,
+                )
+        time_after_load = time.perf_counter()
+
+        self.model_memory_usage = m.consumed_memory
+        logger.info(
+            "Model loading took %.4f GiB and %.6f seconds",
+            m.consumed_memory / GiB_bytes,
+            time_after_load - time_before_load,
+        )
+
+    def get_model(self) -> nn.Module:
+        return self.model
+
+    def get_kv_cache_spec(self):
+        return get_kv_cache_spec(self.vllm_config)
+
+    def initialize_kv_cache(self, kv_cache_config: KVCacheConfig) -> None:
+        kv_cache_config = deepcopy(kv_cache_config)
+        self.kv_cache_config = kv_cache_config
+        block_sizes = [
+            kv_cache_group.kv_cache_spec.block_size
+            for kv_cache_group in kv_cache_config.kv_cache_groups
+        ]
+
+        self.block_tables = BlockTables(
+            block_sizes=block_sizes,
+            max_num_reqs=self.max_num_reqs,
+            max_num_batched_tokens=self.max_num_tokens,
+            max_model_len=self.max_model_len,
+            device=self.device,
+            pin_memory=self.pin_memory,
+        )
+
+        self.attn_backends, self.attn_metadata_builders = init_attn_backend(
+            self.kv_cache_config,
+            self.vllm_config,
+            self.device,
+        )
+
+        self.kv_caches: list[torch.Tensor] = []
+        init_kv_cache(
+            self.kv_caches,
+            self.compilation_config.static_forward_context,
+            self.kv_cache_config,
+            self.attn_backends,
+            self.device,
+        )
+        # Attention groups are not supported.
+        self.attn_groups = []  # type: ignore
+
+    def prepare_dummy_attn_metadata(self, input_batch: InputBatch) -> None:
+        block_tables = self.block_tables.get_dummy_block_tables(input_batch.num_reqs)
+        slot_mappings = self.block_tables.get_dummy_slot_mappings(
+            input_batch.num_tokens
+        )
+        num_computed_tokens_cpu = torch.zeros(
+            input_batch.num_reqs, dtype=torch.int32, device="cpu"
+        )
+        attn_metadata = build_attn_metadata(
+            attn_metadata_builders=self.attn_metadata_builders,
+            num_reqs=input_batch.num_reqs,
+            num_tokens=input_batch.num_tokens,
+            query_start_loc=self.input_buffers.query_start_loc,
+            seq_lens=self.input_buffers.seq_lens,
+            num_computed_tokens_cpu=num_computed_tokens_cpu,
+            block_tables=block_tables,
+            slot_mappings=slot_mappings,
+            kv_cache_config=self.kv_cache_config,
+        )
+        input_batch.attn_metadata = attn_metadata
+
+    @torch.inference_mode()
+    def _dummy_run(
+        self,
+        num_tokens: int,
+        *args,
+        skip_attn: bool = True,
+        **kwargs,
+    ) -> tuple[torch.Tensor, torch.Tensor]:
+        num_reqs = min(num_tokens, self.max_num_reqs)
+        input_batch = InputBatch.make_dummy(
+            num_reqs=num_reqs,
+            num_tokens=num_tokens,
+            input_buffers=self.input_buffers,
+            device=self.device,
+        )
+        if not skip_attn:
+            self.prepare_dummy_attn_metadata(input_batch)
+
+        if self.dp_size == 1:
+            num_tokens_across_dp: torch.Tensor | None = None
+        else:
+            num_tokens_across_dp = torch.full(
+                (self.dp_size,), num_tokens, dtype=torch.int32, device="cpu"
+            )
+        num_sampled_tokens = np.ones(input_batch.num_reqs, dtype=np.int32)
+        with (
+            self.maybe_dummy_run_with_lora(
+                self.lora_config,
+                input_batch.num_scheduled_tokens,
+                num_sampled_tokens,
+            ),
+            set_forward_context(
+                input_batch.attn_metadata,
+                self.vllm_config,
+                num_tokens=num_tokens,
+                num_tokens_across_dp=num_tokens_across_dp,
+            ),
+        ):
+            hidden_states = self.model(
+                input_ids=input_batch.input_ids,
+                positions=input_batch.positions,
+            )
+            sample_hidden_states = hidden_states[input_batch.logits_indices]
+        return hidden_states, sample_hidden_states
+
+    @torch.inference_mode()
+    def _dummy_sampler_run(
+        self,
+        hidden_states: torch.Tensor,
+    ) -> None:
+        num_reqs = hidden_states.shape[0]
+        sampling_metadata = SamplingMetadata.make_dummy(
+            num_reqs=num_reqs,
+            device=self.device,
+        )
+        logits = self.model.compute_logits(hidden_states)
+        self.sampler(logits, sampling_metadata)
+
+    @torch.inference_mode()
+    def profile_run(self) -> None:
+        hidden_states, sample_hidden_states = self._dummy_run(
+            self.max_num_tokens,
+            skip_attn=True,
+        )
+        self._dummy_sampler_run(sample_hidden_states)
+        torch.cuda.synchronize()
+        del hidden_states, sample_hidden_states
+        gc.collect()
+
+    def reset_mm_cache(self) -> None:
+        pass
+
+    def _get_num_input_tokens(self, num_scheduled_tokens: int) -> int:
+        # SP is not supported yet.
+        return num_scheduled_tokens
+
+    @torch.inference_mode()
+    def capture_model(self) -> int:
+        if not self.cudagraph_manager.needs_capture():
+            logger.warning(
+                "Skipping CUDA graph capture. To turn on CUDA graph capture, "
+                "ensure `cudagraph_mode` was not manually set to `NONE`"
+            )
+            return 0
+
+        start_time = time.perf_counter()
+        start_free_gpu_memory = torch.cuda.mem_get_info()[0]
+
+        with self.maybe_setup_dummy_loras(self.lora_config):
+            self.cudagraph_manager.capture(
+                model=self.model,
+                input_buffers=self.input_buffers,
+                block_tables=self.block_tables,
+                attn_metadata_builders=self.attn_metadata_builders,
+                kv_cache_config=self.kv_cache_config,
+            )
+
+        end_time = time.perf_counter()
+        end_free_gpu_memory = torch.cuda.mem_get_info()[0]
+        elapsed_time = end_time - start_time
+        cuda_graph_size = start_free_gpu_memory - end_free_gpu_memory
+        # This usually takes 5~20 seconds.
+        logger.info(
+            "Graph capturing finished in %.0f secs, took %.2f GiB",
+            elapsed_time,
+            cuda_graph_size / (1 << 30),
+        )
+        return cuda_graph_size
+
+    def warmup_for_prefill(self) -> None:
+        # For FlashInfer, we would like to execute a dummy prefill run
+        # to trigger JIT compilation.
+        if all("FLASHINFER" in b.get_name() for b in self.attn_backends.values()):
+            self._dummy_run(self.max_num_tokens, skip_attn=False)
+            torch.cuda.synchronize()
+
+    def update_states(self, scheduler_output: SchedulerOutput) -> None:
+        for req_id in scheduler_output.preempted_req_ids:
+            self.req_states.remove_request(req_id)
+        for req_id in scheduler_output.finished_req_ids:
+            self.req_states.remove_request(req_id)
+
+        # TODO(woosuk): Change SchedulerOutput.
+        req_indices: list[int] = []
+        cu_num_new_blocks = tuple(
+            [0] for _ in range(self.block_tables.num_kv_cache_groups)
+        )
+        new_block_ids: tuple[list[int], ...] = tuple(
+            [] for _ in range(self.block_tables.num_kv_cache_groups)
+        )
+        overwrite: list[bool] = []
+
+        # Add new requests.
+        for new_req_data in scheduler_output.scheduled_new_reqs:
+            req_id = new_req_data.req_id
+            self.req_states.add_request(
+                req_id=req_id,
+                prompt_len=len(new_req_data.prompt_token_ids),
+                prefill_token_ids=new_req_data.prefill_token_ids,
+                num_computed_tokens=new_req_data.num_computed_tokens,
+                sampling_params=new_req_data.sampling_params,
+                lora_request=new_req_data.lora_request,
+            )
+
+            req_index = self.req_states.req_id_to_index[req_id]
+            req_indices.append(req_index)
+            for i, block_ids in enumerate(new_req_data.block_ids):
+                x = cu_num_new_blocks[i][-1]
+                cu_num_new_blocks[i].append(x + len(block_ids))
+                new_block_ids[i].extend(block_ids)
+            overwrite.append(True)
+
+        # Add new blocks for the existing requests.
+        cached_reqs = scheduler_output.scheduled_cached_reqs
+        for i, req_id in enumerate(cached_reqs.req_ids):
+            req_index = self.req_states.req_id_to_index[req_id]
+
+            req_new_block_ids = cached_reqs.new_block_ids[i]
+            if req_new_block_ids is not None:
+                req_indices.append(req_index)
+                for group_id, block_ids in enumerate(req_new_block_ids):
+                    x = cu_num_new_blocks[group_id][-1]
+                    cu_num_new_blocks[group_id].append(x + len(block_ids))
+                    new_block_ids[group_id].extend(block_ids)
+                overwrite.append(False)
+
+        if req_indices:
+            self.block_tables.append_block_ids(
+                req_indices=req_indices,
+                cu_num_new_blocks=cu_num_new_blocks,
+                new_block_ids=new_block_ids,
+                overwrite=overwrite,
+            )
+
+    def prepare_inputs(
+        self,
+        scheduler_output: SchedulerOutput,
+        num_tokens_after_padding: int,
+    ) -> InputBatch:
+        num_tokens = scheduler_output.total_num_scheduled_tokens
+        assert num_tokens > 0
+        num_reqs = len(scheduler_output.num_scheduled_tokens)
+
+        # Decode first, then prefill.
+        # batch_idx -> req_id
+        req_ids = sorted(
+            scheduler_output.num_scheduled_tokens,
+            key=scheduler_output.num_scheduled_tokens.get,
+        )
+        num_scheduled_tokens = np.array(
+            [scheduler_output.num_scheduled_tokens[i] for i in req_ids], dtype=np.int32
+        )
+
+        idx_mapping_list = [
+            self.req_states.req_id_to_index[req_id] for req_id in req_ids
+        ]
+        idx_mapping = self.input_buffers.idx_mapping
+        idx_mapping.np[:num_reqs] = idx_mapping_list
+        idx_mapping_np = idx_mapping.np[:num_reqs]
+        idx_mapping = idx_mapping.copy_to_gpu(num_reqs)
+
+        # Block tables: num_kv_cache_groups x [num_reqs, max_num_blocks]
+        block_tables = self.block_tables.gather_block_tables(idx_mapping)
+
+        prepare_inputs(
+            idx_mapping_np,
+            self.req_states.prefill_token_ids,
+            self.req_states.num_computed_tokens,
+            num_scheduled_tokens,
+            self.input_buffers.input_ids,
+            self.input_buffers.positions,
+            self.input_buffers.query_start_loc,
+            self.input_buffers.seq_lens,
+            num_tokens,
+        )
+
+        query_start_loc = self.input_buffers.query_start_loc
+        query_start_loc_gpu = query_start_loc.gpu[: num_reqs + 1]
+        query_start_loc_np = query_start_loc.np[: num_reqs + 1]
+        seq_lens_gpu = self.input_buffers.seq_lens.gpu[:num_reqs]
+        seq_lens_np = self.input_buffers.seq_lens.np[:num_reqs]
+
+        # Some input token ids are directly read from the last sampled tokens.
+        combine_last_token_ids(
+            self.input_buffers.input_ids.gpu,
+            idx_mapping,
+            self.req_states.last_sampled_tokens,
+            query_start_loc_gpu,
+            seq_lens_gpu,
+            self.req_states.prefill_len.copy_to_gpu(),
+        )
+
+        # Compute slot mappings: [num_kv_cache_groups, num_tokens]
+        slot_mappings = self.block_tables.compute_slot_mappings(
+            query_start_loc_gpu, self.input_buffers.positions.gpu[:num_tokens]
+        )
+
+        num_computed_tokens_cpu = torch.from_numpy(
+            self.req_states.num_computed_tokens[idx_mapping_np]
+        )
+
+        # Logits indices to sample next token from.
+        logits_indices = query_start_loc_gpu[1:] - 1
+
+        # Layer name -> attention metadata.
+        attn_metadata = build_attn_metadata(
+            attn_metadata_builders=self.attn_metadata_builders,
+            num_reqs=num_reqs,
+            num_tokens=num_tokens,
+            query_start_loc=self.input_buffers.query_start_loc,
+            seq_lens=self.input_buffers.seq_lens,
+            num_computed_tokens_cpu=num_computed_tokens_cpu,
+            block_tables=block_tables,
+            slot_mappings=slot_mappings,
+            kv_cache_config=self.kv_cache_config,
+        )
+
+        input_ids = self.input_buffers.input_ids.gpu[:num_tokens_after_padding]
+        positions = self.input_buffers.positions.gpu[:num_tokens_after_padding]
+        return InputBatch(
+            req_ids=req_ids,
+            num_reqs=num_reqs,
+            idx_mapping=idx_mapping,
+            idx_mapping_np=idx_mapping_np,
+            num_scheduled_tokens=num_scheduled_tokens,
+            num_tokens=num_tokens,
+            num_tokens_after_padding=num_tokens_after_padding,
+            query_start_loc=query_start_loc_gpu,
+            query_start_loc_np=query_start_loc_np,
+            seq_lens=seq_lens_gpu,
+            seq_lens_np=seq_lens_np,
+            input_ids=input_ids,
+            positions=positions,
+            attn_metadata=attn_metadata,
+            logits_indices=logits_indices,
+        )
+
+    def sample(
+        self,
+        hidden_states: torch.Tensor,
+        input_batch: InputBatch,
+        sampling_metadata: SamplingMetadata,
+        grammar_output: GrammarOutput | None,
+    ) -> SamplerOutput:
+        sample_hidden_states = hidden_states[input_batch.logits_indices]
+        logits = self.model.compute_logits(sample_hidden_states)
+        if grammar_output is not None:
+            # Apply grammar bitmask to the logits in-place.
+            with async_barrier(self.structured_outputs_event):
+                apply_grammar_bitmask(
+                    logits,
+                    input_batch.req_ids,
+                    grammar_output.structured_output_request_ids,
+                    grammar_output.grammar_bitmask,
+                    self.input_buffers,
+                )
+        sampler_output = self.sampler(logits, sampling_metadata)
+        return sampler_output
+
+    def compute_prompt_logprobs(
+        self,
+        hidden_states: torch.Tensor,
+        input_batch: InputBatch,
+    ) -> dict[str, LogprobsTensors]:
+        idx_mapping_np = input_batch.idx_mapping_np
+        needs_prompt_logprobs = self.req_states.needs_prompt_logprobs[idx_mapping_np]
+        if not np.any(needs_prompt_logprobs):
+            # No request asks for prompt logprobs.
+            return {}
+
+        num_computed_tokens = self.req_states.num_computed_tokens[idx_mapping_np]
+        prompt_lens = self.req_states.prompt_len[idx_mapping_np]
+        # NOTE(woosuk): -1 because the last prompt token's hidden state is not
+        # needed for prompt logprobs.
+        includes_prompt = num_computed_tokens < prompt_lens - 1
+        # NOTE(woosuk): If the request was resumed after preemption, its prompt
+        # logprobs must have been computed before preemption. Skip.
+        resumed_after_prompt = (
+            prompt_lens < self.req_states.prefill_len.np[idx_mapping_np]
+        )
+        needs_prompt_logprobs &= includes_prompt & ~resumed_after_prompt
+        if not np.any(needs_prompt_logprobs):
+            return {}
+
+        # Just to be safe, clone the input ids.
+        n = input_batch.num_tokens
+        # Shift the input ids by one.
+        token_ids = torch.empty_like(input_batch.input_ids[:n])
+        token_ids[: n - 1] = input_batch.input_ids[1:n]
+        # To avoid out-of-bound access, set the last token id to 0.
+        token_ids[n - 1] = 0
+
+        # Handle chunked prompts.
+        seq_lens = self.input_buffers.seq_lens.np[: input_batch.num_reqs]
+        is_prompt_chunked = seq_lens < prompt_lens
+        prefill_token_ids = self.req_states.prefill_token_ids
+        query_start_loc = self.input_buffers.query_start_loc.np
+        for i, req_id in enumerate(input_batch.req_ids):
+            if not needs_prompt_logprobs[i]:
+                continue
+            if not is_prompt_chunked[i]:
+                continue
+            # The prompt is chunked. Get the next prompt token.
+            req_idx = input_batch.idx_mapping_np[i]
+            next_prompt_token = int(prefill_token_ids[req_idx, seq_lens[i]])
+            idx = int(query_start_loc[i + 1] - 1)
+            # Set the next prompt token.
+            # NOTE(woosuk): This triggers a GPU operation.
+            token_ids[idx] = next_prompt_token
+
+        # NOTE(woosuk): We mask out logprobs for negative tokens.
+        prompt_logprobs, prompt_ranks = compute_prompt_logprobs(
+            token_ids,
+            hidden_states[:n],
+            self.model.compute_logits,
+        )
+
+        prompt_token_ids = token_ids.unsqueeze(-1)
+        prompt_logprobs_dict: dict[str, LogprobsTensors] = {}
+        for i, req_id in enumerate(input_batch.req_ids):
+            if not needs_prompt_logprobs[i]:
+                continue
+
+            start_idx = query_start_loc[i]
+            end_idx = query_start_loc[i + 1]
+            assert start_idx < end_idx, (
+                f"start_idx ({start_idx}) >= end_idx ({end_idx})"
+            )
+            logprobs = LogprobsTensors(
+                logprob_token_ids=prompt_token_ids[start_idx:end_idx],
+                logprobs=prompt_logprobs[start_idx:end_idx],
+                selected_token_ranks=prompt_ranks[start_idx:end_idx],
+            )
+
+            req_extra_data = self.req_states.extra_data[req_id]
+            prompt_logprobs_list = req_extra_data.in_progress_prompt_logprobs
+            if is_prompt_chunked[i]:
+                # Prompt is chunked. Do not return the logprobs yet.
+                prompt_logprobs_list.append(logprobs)
+                continue
+
+            if prompt_logprobs_list:
+                # Merge the in-progress logprobs.
+                prompt_logprobs_list.append(logprobs)
+                logprobs = LogprobsTensors(
+                    logprob_token_ids=torch.cat(
+                        [x.logprob_token_ids for x in prompt_logprobs_list]
+                    ),
+                    logprobs=torch.cat([x.logprobs for x in prompt_logprobs_list]),
+                    selected_token_ranks=torch.cat(
+                        [x.selected_token_ranks for x in prompt_logprobs_list]
+                    ),
+                )
+                prompt_logprobs_list.clear()
+
+            prompt_logprobs_dict[req_id] = logprobs
+        return prompt_logprobs_dict
+
+    def postprocess(
+        self,
+        sampler_output: SamplerOutput,
+        prompt_logprobs_dict: dict[str, LogprobsTensors],
+        input_batch: InputBatch,
+    ) -> AsyncOutput | ModelRunnerOutput:
+        # Store the last sampled token ids.
+        self.req_states.last_sampled_tokens[input_batch.idx_mapping] = (
+            sampler_output.sampled_token_ids
+        )
+        # Get the number of sampled tokens.
+        # 0 if chunked-prefilling, 1 if not.
+        idx_mapping_np = input_batch.idx_mapping_np
+        is_chunked_prefilling = (
+            input_batch.seq_lens_np < self.req_states.num_tokens[idx_mapping_np]
+        )
+        num_sampled_tokens = (~is_chunked_prefilling).astype(np.int32)
+        # Increment the number of tokens.
+        self.req_states.num_tokens[idx_mapping_np] += num_sampled_tokens
+        # Increment the number of computed tokens.
+        self.req_states.num_computed_tokens[idx_mapping_np] += (
+            input_batch.num_scheduled_tokens
+        )
+
+        model_runner_output = ModelRunnerOutput(
+            req_ids=input_batch.req_ids,
+            req_id_to_index={req_id: i for i, req_id in enumerate(input_batch.req_ids)},
+            sampled_token_ids=None,
+            logprobs=None,
+            prompt_logprobs_dict=prompt_logprobs_dict,
+            pooler_output=[],
+            kv_connector_output=None,
+            num_nans_in_logits=None,
+        )
+        async_output = AsyncOutput(
+            model_runner_output=model_runner_output,
+            sampler_output=sampler_output,
+            num_sampled_tokens=num_sampled_tokens,
+            copy_stream=self.output_copy_stream,
+            copy_event=self.output_copy_event,
+        )
+        if self.use_async_scheduling:
+            return async_output
+        return async_output.get_output()
+
+    def get_cudagraph_and_dp_padding(
+        self,
+        scheduler_output: SchedulerOutput,
+    ) -> tuple[CUDAGraphMode, int, torch.Tensor | None]:
+        total_num_scheduled_tokens = scheduler_output.total_num_scheduled_tokens
+        if self.dp_size == 1:
+            # No DP. Only consider CUDA graphs.
+            if total_num_scheduled_tokens == 0:
+                # Special case: no tokens to run.
+                return CUDAGraphMode.NONE, 0, None
+
+            cudagraph_size = self.cudagraph_manager.get_cudagraph_size(
+                scheduler_output, total_num_scheduled_tokens
+            )
+            if cudagraph_size is not None:
+                # Use full CUDA graph.
+                return CUDAGraphMode.FULL, cudagraph_size, None
+            # Fall back to eager mode.
+            # TODO(woosuk): Support piecewise CUDA graphs.
+            return CUDAGraphMode.NONE, total_num_scheduled_tokens, None
+
+        # Consider DP padding and CUDA graph.
+        if total_num_scheduled_tokens == 0:
+            # Special handling is needed for 0.
+            cudagraph_size_before_dp: int | None = 0
+        else:
+            cudagraph_size_before_dp = self.cudagraph_manager.get_cudagraph_size(
+                scheduler_output, total_num_scheduled_tokens
+            )
+            if cudagraph_size_before_dp is None:
+                cudagraph_size_before_dp = -1
+
+        assert cudagraph_size_before_dp is not None
+        num_tokens_across_dp, cudagraph_size_across_dp = get_batch_metadata_across_dp(
+            total_num_scheduled_tokens,
+            cudagraph_size_before_dp,
+            self.dp_size,
+            self.dp_rank,
+        )
+        if all(cudagraph_size_across_dp >= 0):
+            # If all ranks can use CUDA graph, pad to the maximum number of tokens
+            # across DP and use CUDA graph.
+            num_tokens_after_padding = int(cudagraph_size_across_dp.max().item())
+            cudagraph_mode = CUDAGraphMode.FULL
+        else:
+            # If any of the ranks cannot use CUDA graph, use eager mode for all ranks.
+            # No padding is needed except for ranks that have no tokens to run.
+            num_tokens_across_dp = torch.clamp(num_tokens_across_dp, min=1)
+            num_tokens_after_padding = num_tokens_across_dp[self.dp_rank]
+            cudagraph_mode = CUDAGraphMode.NONE
+        return cudagraph_mode, num_tokens_after_padding, num_tokens_across_dp
+
+    @torch.inference_mode()
+    def execute_model(
+        self,
+        scheduler_output: SchedulerOutput,
+        intermediate_tensors: Any | None = None,
+        dummy_run: bool = False,
+    ) -> ModelRunnerOutput | None:
+        assert intermediate_tensors is None
+        if scheduler_output.total_num_scheduled_tokens == 0 and not dummy_run:
+            # No need to run the model.
+            with async_barrier(self.input_prep_event):
+                self.update_states(scheduler_output)
+                return EMPTY_MODEL_RUNNER_OUTPUT
+
+        # NOTE: Call this before the async barrier so CPU all-reduce and
+        # GPU execution can overlap.
+        cudagraph_mode, num_tokens_after_padding, num_tokens_across_dp = (
+            self.get_cudagraph_and_dp_padding(scheduler_output)
+        )
+        with async_barrier(self.input_prep_event):
+            self.update_states(scheduler_output)
+            if num_tokens_after_padding == 0:
+                # All DP ranks have zero tokens to run.
+                return EMPTY_MODEL_RUNNER_OUTPUT
+
+            if not dummy_run:
+                # Common case.
+                # Prepare all the inputs and copy to the input buffers.
+                input_batch = self.prepare_inputs(
+                    scheduler_output,
+                    num_tokens_after_padding,
+                )
+
+                # NOTE(woosuk): Sampling metadata should be built under the async
+                # barrier to avoid race conditions.
+                pos = input_batch.positions[input_batch.logits_indices]
+                sampling_metadata = self.req_states.make_sampling_metadata(
+                    input_batch.idx_mapping_np, pos
+                )
+
+                if self.lora_config:
+                    # Activate LoRA adapters.
+                    lora_inputs = self.req_states.make_lora_inputs(
+                        input_batch.req_ids,
+                        input_batch.idx_mapping_np,
+                        input_batch.num_scheduled_tokens,
+                    )
+                    self._set_active_loras(*lora_inputs)
+            else:
+                # No actual tokens to run. A dummy run for DP.
+                num_reqs = min(num_tokens_after_padding, self.max_num_reqs)
+                input_batch = InputBatch.make_dummy(
+                    num_reqs=num_reqs,
+                    num_tokens=num_tokens_after_padding,
+                    input_buffers=self.input_buffers,
+                    device=self.device,
+                )
+                self.prepare_dummy_attn_metadata(input_batch)
+                sampling_metadata = None
+
+        # Run model.
+        if cudagraph_mode == CUDAGraphMode.FULL:
+            # Run CUDA graph.
+            # NOTE(woosuk): Here, we don't need to pass the input tensors,
+            # because they are already copied to the CUDA graph input buffers.
+            hidden_states = self.cudagraph_manager.run(
+                input_batch.num_tokens_after_padding
+            )
+        else:
+            # Run PyTorch model in eager mode.
+            with set_forward_context(
+                input_batch.attn_metadata,
+                self.vllm_config,
+                num_tokens=input_batch.num_tokens_after_padding,
+                cudagraph_runtime_mode=cudagraph_mode,
+                num_tokens_across_dp=num_tokens_across_dp,
+            ):
+                hidden_states = self.model(
+                    input_ids=input_batch.input_ids,
+                    positions=input_batch.positions,
+                )
+
+        self.execute_model_state = hidden_states, input_batch, sampling_metadata
+        return None
+
+    @torch.inference_mode()
+    def sample_tokens(
+        self,
+        grammar_output: GrammarOutput | None,
+    ) -> AsyncOutput | ModelRunnerOutput:
+        assert self.execute_model_state is not None
+        hidden_states, input_batch, sampling_metadata = self.execute_model_state
+        self.execute_model_state = None  # type: ignore
+        assert sampling_metadata is not None
+
+        sampler_output = self.sample(
+            hidden_states, input_batch, sampling_metadata, grammar_output
+        )
+        prompt_logprobs_dict = self.compute_prompt_logprobs(hidden_states, input_batch)
+        output = self.postprocess(
+            sampler_output,
+            prompt_logprobs_dict,
+            input_batch,
+        )
+        return output
diff --git a/vllm/v1/worker/gpu/sampler.py b/vllm/v1/worker/gpu/sampler.py
new file mode 100644
index 0000000000000..e916aadb6b5a0
--- /dev/null
+++ b/vllm/v1/worker/gpu/sampler.py
@@ -0,0 +1,327 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from collections.abc import Callable
+
+import torch
+import triton
+import triton.language as tl
+
+from vllm.config.model import LogprobsMode
+from vllm.v1.outputs import LogprobsTensors, SamplerOutput
+from vllm.v1.sample.metadata import SamplingMetadata
+from vllm.v1.sample.ops.topk_topp_sampler import apply_top_k_top_p
+
+
+class Sampler:
+    def __init__(
+        self,
+        logprobs_mode: LogprobsMode = "raw_logprobs",
+    ):
+        if logprobs_mode not in ["processed_logprobs", "raw_logprobs"]:
+            raise NotImplementedError(f"Unsupported logprobs_mode: {logprobs_mode}")
+        self.logprobs_mode = logprobs_mode
+
+    def __call__(
+        self,
+        logits: torch.Tensor,
+        sampling_metadata: SamplingMetadata,
+    ) -> SamplerOutput:
+        if sampling_metadata.max_num_logprobs is not None:
+            if self.logprobs_mode == "processed_logprobs":
+                sampled, logits = self.sample(
+                    logits, sampling_metadata, return_logits=True
+                )
+            else:
+                assert self.logprobs_mode == "raw_logprobs"
+                sampled, _ = self.sample(logits, sampling_metadata, return_logits=False)
+
+            logprobs_tensors = compute_topk_logprobs(
+                logits,
+                sampling_metadata.max_num_logprobs,
+                sampled,
+            )
+        else:
+            sampled, _ = self.sample(logits, sampling_metadata, return_logits=False)
+            logprobs_tensors = None
+
+        # These are GPU tensors.
+        sampler_output = SamplerOutput(
+            # The sampled tokens are expanded to 2D tensor with shape
+            # [num_requests, 1], where each row represents one generated
+            # token per request.
+            sampled_token_ids=sampled.view(-1, 1),
+            logprobs_tensors=logprobs_tensors,
+        )
+        return sampler_output
+
+    def sample(
+        self,
+        logits: torch.Tensor,
+        sampling_metadata: SamplingMetadata,
+        return_logits: bool = False,
+    ) -> tuple[torch.Tensor, torch.Tensor | None]:
+        is_greedy = sampling_metadata.temperature == 0
+        temp = torch.where(is_greedy, 1.0, sampling_metadata.temperature)
+        logits = logits / temp.view(-1, 1)
+        logits = apply_top_k_top_p(
+            logits, sampling_metadata.top_k, sampling_metadata.top_p
+        )
+
+        sampled = gumbel_sample(
+            logits,
+            is_greedy,
+            sampling_metadata.seeds,
+            sampling_metadata.pos,
+        )
+        return sampled, logits if return_logits else None
+
+
+@triton.jit
+def _gumbel_sample_kernel(
+    sampled_ptr,
+    logits_ptr,
+    logits_stride,
+    seeds_ptr,
+    pos_ptr,
+    is_greedy_ptr,
+    vocab_size,
+    BLOCK_SIZE: tl.constexpr,
+):
+    req_idx = tl.program_id(0)
+    is_greedy = tl.load(is_greedy_ptr + req_idx)
+
+    if is_greedy:
+        # Greedy sampling. Don't apply gumbel noise.
+        max_val = float("-inf")
+        max_idx = 0
+        for i in range(0, vocab_size, BLOCK_SIZE):
+            block = i + tl.arange(0, BLOCK_SIZE)
+            mask = block < vocab_size
+            logits = tl.load(
+                logits_ptr + req_idx * logits_stride + block,
+                mask=mask,
+                other=float("-inf"),
+            )
+
+            idx = tl.argmax(logits, axis=0)
+            value = tl.max(logits, axis=0)
+            is_greater = value > max_val
+            max_val = tl.where(is_greater, value, max_val)
+            max_idx = tl.where(is_greater, i + idx, max_idx)
+        tl.store(sampled_ptr + req_idx, max_idx)
+        return
+
+    # Random sampling.
+    # Calculate gumbel seed.
+    seed = tl.load(seeds_ptr + req_idx)
+    pos = tl.load(pos_ptr + req_idx)
+    gumbel_seed = tl.randint(seed, pos)
+
+    max_val = float("-inf")
+    max_idx = 0
+    for i in range(0, vocab_size, BLOCK_SIZE):
+        block = i + tl.arange(0, BLOCK_SIZE)
+        mask = block < vocab_size
+
+        # Generate gumbel noise.
+        r = tl.rand(gumbel_seed, block).to(tl.float64)
+        gumbel_noise = -tl.log(-tl.log(r + 1e-20) + 1e-20)
+        gumbel_noise = gumbel_noise.to(tl.float32)
+
+        # Apply gumbel noise.
+        logits = tl.load(logits_ptr + req_idx * logits_stride + block, mask=mask)
+        logits = tl.where(mask, logits + gumbel_noise, float("-inf"))
+
+        # Argmax to get the sampled token.
+        idx = tl.argmax(logits, axis=0)
+        value = tl.max(logits, axis=0)
+        is_greater = value > max_val
+        max_val = tl.where(is_greater, value, max_val)
+        max_idx = tl.where(is_greater, i + idx, max_idx)
+    tl.store(sampled_ptr + req_idx, max_idx)
+
+
+def gumbel_sample(
+    logits: torch.Tensor,  # [num_reqs, vocab_size]
+    is_greedy: torch.Tensor,  # [num_reqs]
+    seed: torch.Tensor,  # [num_reqs]
+    pos: torch.Tensor,  # [num_reqs]
+) -> torch.Tensor:
+    num_reqs, vocab_size = logits.shape
+    # NOTE(woosuk): Use int64 for later indexing.
+    sampled = torch.empty(
+        num_reqs,
+        dtype=torch.int64,
+        device=logits.device,
+    )
+    _gumbel_sample_kernel[(num_reqs,)](
+        sampled,
+        logits,
+        logits.stride(0),
+        seed,
+        pos,
+        is_greedy,
+        vocab_size,
+        num_warps=8,
+        BLOCK_SIZE=16384,  # type: ignore
+    )
+    return sampled
+
+
+@triton.jit
+def _topk_log_softmax_kernel(
+    output_ptr,
+    logits_ptr,
+    logits_stride,
+    topk_ids_ptr,
+    topk,
+    vocab_size,
+    BLOCK_SIZE: tl.constexpr,
+    PADDED_TOPK: tl.constexpr,
+):
+    req_idx = tl.program_id(0)
+    row_ptr = logits_ptr + req_idx * logits_stride
+
+    max_val = float("-inf")
+    for i in range(0, vocab_size, BLOCK_SIZE):
+        block = i + tl.arange(0, BLOCK_SIZE)
+        logits = tl.load(row_ptr + block, mask=block < vocab_size, other=float("-inf"))
+        max_val = tl.max(tl.maximum(logits, max_val))
+    max_val = max_val.to(tl.float32)  # type: ignore
+
+    se = 0.0
+    for i in range(0, vocab_size, BLOCK_SIZE):
+        block = i + tl.arange(0, BLOCK_SIZE)
+        logits = tl.load(row_ptr + block, mask=block < vocab_size, other=0.0)
+        # NOTE(woosuk): Make sure that logits and all following operations use FP32.
+        logits = logits.to(tl.float32)
+        e = tl.exp(logits - max_val)
+        e = tl.where(block < vocab_size, e, 0.0)
+        se += tl.sum(e)
+    lse = tl.log(se)
+
+    k_offset = tl.arange(0, PADDED_TOPK)
+    k_mask = k_offset < topk
+    topk_ids = tl.load(topk_ids_ptr + req_idx * topk + k_offset, mask=k_mask, other=0)
+
+    logits = tl.load(row_ptr + topk_ids, mask=k_mask)
+    logits = logits.to(tl.float32)
+    o = logits - max_val - lse
+    tl.store(output_ptr + req_idx * topk + k_offset, o, mask=k_mask)
+
+
+@triton.jit
+def _ranks_kernel(
+    output_ptr,
+    logits_ptr,
+    logits_stride,
+    token_ids_ptr,
+    vocab_size,
+    BLOCK_SIZE: tl.constexpr,
+):
+    req_idx = tl.program_id(0)
+    row_ptr = logits_ptr + req_idx * logits_stride
+
+    token_id = tl.load(token_ids_ptr + req_idx)
+    x = tl.load(row_ptr + token_id)
+
+    n = 0
+    for i in range(0, vocab_size, BLOCK_SIZE):
+        block = i + tl.arange(0, BLOCK_SIZE)
+        logits = tl.load(row_ptr + block, mask=block < vocab_size, other=float("-inf"))
+        n += tl.sum((logits > x).to(tl.int32))
+    tl.store(output_ptr + req_idx, n)
+
+
+def compute_token_logprobs(
+    logits: torch.Tensor,
+    token_ids: torch.Tensor,
+) -> torch.Tensor:
+    batch_size = logits.shape[0]
+    vocab_size = logits.shape[1]
+    token_ids = token_ids.to(torch.int64)
+    num_logprobs = token_ids.shape[1]
+    logprobs = torch.empty(
+        batch_size,
+        num_logprobs,
+        dtype=torch.float32,
+        device=logits.device,
+    )
+    _topk_log_softmax_kernel[(batch_size,)](
+        logprobs,
+        logits,
+        logits.stride(0),
+        token_ids,
+        num_logprobs,
+        vocab_size,
+        BLOCK_SIZE=1024,  # type: ignore
+        PADDED_TOPK=triton.next_power_of_2(num_logprobs),
+    )
+    return logprobs
+
+
+def compute_topk_logprobs(
+    logits: torch.Tensor,
+    num_logprobs: int,
+    sampled_token_ids: torch.Tensor,
+) -> LogprobsTensors:
+    assert num_logprobs >= 0
+    batch_size, vocab_size = logits.shape
+    if num_logprobs == 0:
+        logprob_token_ids = sampled_token_ids.unsqueeze(-1)
+    else:
+        topk_indices = torch.topk(logits, num_logprobs, dim=-1).indices
+        logprob_token_ids = torch.cat(
+            (sampled_token_ids.unsqueeze(-1), topk_indices), dim=1
+        )
+
+    # NOTE(woosuk): Here, to save GPU memory, we do not materialize the full
+    # logprobs tensor. Instead, we only compute and return the logprobs of
+    # the topk + 1 tokens.
+    logprobs = compute_token_logprobs(logits, logprob_token_ids)
+    token_ranks = torch.empty(
+        batch_size,
+        dtype=torch.int64,
+        device=logits.device,
+    )
+    _ranks_kernel[(batch_size,)](
+        token_ranks,
+        logits,
+        logits.stride(0),
+        sampled_token_ids,
+        vocab_size,
+        BLOCK_SIZE=8192,  # type: ignore
+    )
+    return LogprobsTensors(
+        logprob_token_ids=logprob_token_ids,
+        logprobs=logprobs,
+        selected_token_ranks=token_ranks,
+    )
+
+
+def compute_prompt_logprobs(
+    prompt_token_ids: torch.Tensor,
+    prompt_hidden_states: torch.Tensor,
+    logits_fn: Callable[[torch.Tensor], torch.Tensor],
+) -> tuple[torch.Tensor, torch.Tensor]:
+    # Since materializing the full prompt logits can take too much memory,
+    # we compute it in chunks.
+    CHUNK_SIZE = 1024
+    logprobs = []
+    ranks = []
+    prompt_token_ids = prompt_token_ids.to(torch.int64)
+    for start_idx in range(0, prompt_token_ids.shape[0], CHUNK_SIZE):
+        end_idx = start_idx + CHUNK_SIZE
+        # NOTE(woosuk): logits_fn can be slow because it involves all-gather.
+        prompt_logits = logits_fn(prompt_hidden_states[start_idx:end_idx])
+        prompt_logprobs = compute_topk_logprobs(
+            prompt_logits,
+            0,  # num_logprobs
+            prompt_token_ids[start_idx:end_idx],
+        )
+        logprobs.append(prompt_logprobs.logprobs)
+        ranks.append(prompt_logprobs.selected_token_ranks)
+
+    logprobs = torch.cat(logprobs, dim=0) if len(logprobs) > 1 else logprobs[0]
+    ranks = torch.cat(ranks, dim=0) if len(ranks) > 1 else ranks[0]
+    return logprobs, ranks
diff --git a/vllm/v1/worker/gpu/states.py b/vllm/v1/worker/gpu/states.py
new file mode 100644
index 0000000000000..5d05c3f57790a
--- /dev/null
+++ b/vllm/v1/worker/gpu/states.py
@@ -0,0 +1,265 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+from dataclasses import dataclass, field
+
+import numpy as np
+import torch
+
+from vllm.lora.request import LoRARequest
+from vllm.sampling_params import SamplingParams
+from vllm.v1.outputs import LogprobsTensors
+from vllm.v1.utils import CpuGpuBuffer
+
+_NP_INT64_MIN = np.iinfo(np.int64).min
+_NP_INT64_MAX = np.iinfo(np.int64).max
+NO_LORA_ID = 0
+
+
+@dataclass
+class SamplingMetadata:
+    temperature: torch.Tensor
+
+    top_p: torch.Tensor | None
+    top_k: torch.Tensor | None
+
+    seeds: torch.Tensor
+    pos: torch.Tensor
+
+    # None means no logprobs, 0 means sampled token logprobs only
+    max_num_logprobs: int | None
+
+    @classmethod
+    def make_dummy(
+        cls,
+        num_reqs: int,
+        device: torch.device,
+    ) -> "SamplingMetadata":
+        assert num_reqs > 0
+        temperature = torch.zeros(num_reqs, dtype=torch.float32, device=device)
+        temperature[0] = 0.5
+        # TODO(woosuk): Use top-p and top-k for dummy sampler.
+        # Currently, they are disabled because of memory usage.
+        # top_p = torch.full((num_reqs,), 0.95, dtype=torch.float32, device=device)
+        # top_k = torch.full((num_reqs,), 20, dtype=torch.int32, device=device)
+        top_p = None
+        top_k = None
+        seeds = torch.zeros(num_reqs, dtype=torch.int64, device=device)
+        pos = torch.zeros(num_reqs, dtype=torch.int64, device=device)
+        max_num_logprobs = 20
+
+        return cls(
+            temperature=temperature,
+            top_p=top_p,
+            top_k=top_k,
+            seeds=seeds,
+            pos=pos,
+            max_num_logprobs=max_num_logprobs,
+        )
+
+
+class RequestState:
+    def __init__(
+        self,
+        max_num_reqs: int,
+        max_model_len: int,
+        max_num_batched_tokens: int,
+        vocab_size: int,
+        device: torch.device,
+        pin_memory: bool,
+    ):
+        self.max_num_reqs = max_num_reqs
+        self.max_model_len = max_model_len
+        self.max_num_batched_tokens = max_num_batched_tokens
+        self.vocab_size = vocab_size
+        self.device = device
+        self.pin_memory = pin_memory
+
+        self.req_id_to_index: dict[str, int] = {}
+        self.index_to_req_id: dict[int, str] = {}
+        self.free_indices = list(range(max_num_reqs))
+        self.extra_data: dict[str, ExtraData] = {}
+
+        self.prompt_len = np.zeros(self.max_num_reqs, dtype=np.int32)
+        self.prefill_token_ids = np.zeros(
+            (self.max_num_reqs, self.max_model_len),
+            dtype=np.int32,
+        )
+        self.prefill_len = self._make_buffer(self.max_num_reqs, dtype=torch.int32)
+        self.num_tokens = np.zeros(self.max_num_reqs, dtype=np.int32)
+        self.num_computed_tokens = np.zeros(self.max_num_reqs, dtype=np.int32)
+
+        # Last sampled tokens.
+        self.last_sampled_tokens = torch.zeros(
+            self.max_num_reqs,
+            1,
+            dtype=torch.int64,
+            device=device,
+        )
+
+        # LoRA.
+        self.lora_ids = np.zeros(self.max_num_reqs, dtype=np.int32)
+        self.lora_ids.fill(NO_LORA_ID)
+
+        # Sampling parameters.
+        self.temperature = self._make_param(self.max_num_reqs, torch.float32)
+        self.top_p = self._make_param(self.max_num_reqs, torch.float32)
+        self.top_k = self._make_param(self.max_num_reqs, torch.int32)
+        self.seeds = self._make_param(self.max_num_reqs, torch.int64)
+
+        self.num_logprobs = np.empty(self.max_num_reqs, dtype=np.int32)
+        # -1 means no logprobs are requested.
+        self.num_logprobs.fill(-1)
+        self.needs_prompt_logprobs = np.zeros(self.max_num_reqs, dtype=bool)
+
+    def _make_param(self, size: int, dtype: torch.dtype) -> "Param":
+        return Param(size, dtype=dtype, device=self.device, pin_memory=self.pin_memory)
+
+    def _make_buffer(self, size: int, dtype: torch.dtype) -> CpuGpuBuffer:
+        return CpuGpuBuffer(
+            size, dtype=dtype, device=self.device, pin_memory=self.pin_memory
+        )
+
+    @property
+    def num_reqs(self) -> int:
+        return len(self.req_id_to_index)
+
+    def add_request(
+        self,
+        req_id: str,
+        prompt_len: int,
+        prefill_token_ids: list[int],
+        num_computed_tokens: int,
+        sampling_params: SamplingParams,
+        lora_request: LoRARequest | None,
+    ) -> None:
+        assert len(self.free_indices) > 0, "No free indices"
+        req_idx = self.free_indices.pop()
+        self.req_id_to_index[req_id] = req_idx
+        self.index_to_req_id[req_idx] = req_id
+        self.extra_data[req_id] = ExtraData(lora_request)
+
+        self.prompt_len[req_idx] = prompt_len
+        prefill_len = len(prefill_token_ids)
+        assert prefill_len >= prompt_len, (
+            f"prefill_len {prefill_len} < prompt_len {prompt_len}"
+        )
+        self.prefill_len.np[req_idx] = prefill_len
+        self.prefill_token_ids[req_idx, :prefill_len] = prefill_token_ids
+        self.num_tokens[req_idx] = prefill_len
+        self.num_computed_tokens[req_idx] = num_computed_tokens
+
+        if lora_request is not None:
+            self.lora_ids[req_idx] = lora_request.lora_int_id
+        else:
+            self.lora_ids[req_idx] = NO_LORA_ID
+
+        self.temperature.np[req_idx] = sampling_params.temperature
+        self.top_p.np[req_idx] = sampling_params.top_p
+        if 0 < sampling_params.top_k < self.vocab_size:
+            top_k = sampling_params.top_k
+        else:
+            top_k = self.vocab_size
+        self.top_k.np[req_idx] = top_k
+
+        if sampling_params.seed is not None:
+            seed = sampling_params.seed
+        else:
+            seed = np.random.randint(_NP_INT64_MIN, _NP_INT64_MAX)
+        self.seeds.np[req_idx] = seed
+
+        if sampling_params.logprobs is not None:
+            num_logprobs = sampling_params.logprobs
+        else:
+            num_logprobs = -1
+        self.num_logprobs[req_idx] = num_logprobs
+
+        # For now, only support prompt logprobs for the prompt tokens.
+        needs_prompt_logprobs = sampling_params.prompt_logprobs is not None
+        self.needs_prompt_logprobs[req_idx] = needs_prompt_logprobs
+
+    def remove_request(self, req_id: str) -> None:
+        self.extra_data.pop(req_id, None)
+        req_idx = self.req_id_to_index.pop(req_id, None)
+        if req_idx is None:
+            # Request not found.
+            return
+        self.index_to_req_id.pop(req_idx, None)
+        self.free_indices.append(req_idx)
+
+    def make_sampling_metadata(
+        self,
+        idx_mapping: np.ndarray,
+        pos: torch.Tensor,
+    ) -> SamplingMetadata:
+        temperature = self.temperature.np[idx_mapping]
+        temperature = self.temperature.copy_np_to_gpu(temperature)
+
+        top_p = self.top_p.np[idx_mapping]
+        no_top_p = np.all(top_p == 1.0)
+        top_p = self.top_p.copy_np_to_gpu(top_p) if not no_top_p else None
+
+        top_k = self.top_k.np[idx_mapping]
+        no_top_k = np.all(top_k == self.vocab_size)
+        top_k = self.top_k.copy_np_to_gpu(top_k) if not no_top_k else None
+
+        seeds = self.seeds.np[idx_mapping]
+        seeds = self.seeds.copy_np_to_gpu(seeds)
+
+        num_logprobs = self.num_logprobs[idx_mapping]
+        max_num_logprobs: int | None = int(np.max(num_logprobs))
+        if max_num_logprobs == -1:
+            max_num_logprobs = None
+
+        return SamplingMetadata(
+            temperature=temperature,
+            top_p=top_p,
+            top_k=top_k,
+            seeds=seeds,
+            pos=pos,
+            max_num_logprobs=max_num_logprobs,
+        )
+
+    def make_lora_inputs(
+        self,
+        req_ids: list[str],
+        idx_mapping: np.ndarray,
+        num_scheduled_tokens: np.ndarray,
+    ) -> tuple[tuple[int, ...], tuple[int, ...], set[LoRARequest]]:
+        lora_ids = self.lora_ids[idx_mapping]
+        prompt_lora_mapping = tuple(lora_ids)
+        token_lora_mapping = tuple(lora_ids.repeat(num_scheduled_tokens))
+
+        active_lora_requests: set[LoRARequest] = set()
+        for req_id in req_ids:
+            lora_request = self.extra_data[req_id].lora_request
+            if lora_request is not None:
+                active_lora_requests.add(lora_request)
+        return prompt_lora_mapping, token_lora_mapping, active_lora_requests
+
+
+class Param:
+    def __init__(
+        self,
+        size: int,
+        dtype: torch.dtype,
+        device: torch.device,
+        pin_memory: bool,
+    ):
+        self.buffer = CpuGpuBuffer(
+            size,
+            dtype=dtype,
+            device=device,
+            pin_memory=pin_memory,
+        )
+        self.np = np.zeros_like(self.buffer.np)
+
+    def copy_np_to_gpu(self, x: np.ndarray) -> torch.Tensor:
+        n = x.shape[0]
+        self.buffer.np[:n] = x
+        return self.buffer.copy_to_gpu(n)
+
+
+@dataclass
+class ExtraData:
+    lora_request: LoRARequest | None
+    in_progress_prompt_logprobs: list[LogprobsTensors] = field(default_factory=list)
diff --git a/vllm/v1/worker/gpu/structured_outputs.py b/vllm/v1/worker/gpu/structured_outputs.py
new file mode 100644
index 0000000000000..83051b0ed33ff
--- /dev/null
+++ b/vllm/v1/worker/gpu/structured_outputs.py
@@ -0,0 +1,76 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import numpy as np
+import torch
+
+from vllm.triton_utils import tl, triton
+from vllm.v1.worker.gpu.input_batch import InputBuffers
+
+
+def apply_grammar_bitmask(
+    logits: torch.Tensor,
+    req_ids: list[str],
+    grammar_req_ids: list[str],
+    grammar_bitmask: np.ndarray,
+    input_buffers: InputBuffers,
+) -> None:
+    input_buffers.grammar_bitmask.np[: grammar_bitmask.shape[0]] = grammar_bitmask
+    input_buffers.grammar_bitmask.copy_to_gpu(grammar_bitmask.shape[0])
+
+    batch_size = logits.shape[0]
+    grammar_req_id_to_idx = {req_id: i for i, req_id in enumerate(grammar_req_ids)}
+    # logits -> bitmask mapping
+    mapping = [grammar_req_id_to_idx.get(req_id, -1) for req_id in req_ids]
+    input_buffers.bitmask_indices.np[:batch_size] = mapping
+    input_buffers.bitmask_indices.copy_to_gpu(batch_size)
+
+    vocab_size = logits.shape[-1]
+    BLOCK_SIZE = 8192
+    grid = (batch_size, triton.cdiv(vocab_size, BLOCK_SIZE))
+    _apply_grammar_bitmask_kernel[grid](
+        logits,
+        logits.stride(0),
+        input_buffers.grammar_bitmask.gpu,
+        input_buffers.grammar_bitmask.gpu.stride(0),
+        input_buffers.bitmask_indices.gpu,
+        vocab_size,
+        BLOCK_SIZE=BLOCK_SIZE,
+    )
+
+
+# Adapted from
+# https://github.com/mlc-ai/xgrammar/blob/main/python/xgrammar/kernels/apply_token_bitmask_inplace_triton.py
+@triton.jit
+def _apply_grammar_bitmask_kernel(
+    logits_ptr,
+    logits_stride,
+    bitmask_ptr,
+    bitmask_stride,
+    bitmask_indices_ptr,
+    vocab_size,
+    BLOCK_SIZE: tl.constexpr,
+):
+    logits_idx = tl.program_id(0)
+    bitmask_idx = tl.load(bitmask_indices_ptr + logits_idx)
+    if bitmask_idx == -1:
+        # No bitmask to apply.
+        return
+
+    # Load the bitmask.
+    block_id = tl.program_id(1)
+    bitmask_offset = (block_id * BLOCK_SIZE) // 32 + tl.arange(0, BLOCK_SIZE // 32)
+    packed_bitmask = tl.load(
+        bitmask_ptr + bitmask_idx * bitmask_stride + bitmask_offset,
+        mask=bitmask_offset < bitmask_stride,
+    )
+    # Unpack the bitmask.
+    bitmask = ((packed_bitmask[:, None] >> (tl.arange(0, 32)[None, :])) & 1) == 0
+    bitmask = bitmask.reshape(BLOCK_SIZE)
+
+    # Apply the bitmask to the logits.
+    block_offset = block_id * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    tl.store(
+        logits_ptr + logits_idx * logits_stride + block_offset,
+        -float("inf"),
+        mask=bitmask & (block_offset < vocab_size),
+    )
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
index f1fd5be966c37..6a4bfde5f972b 100644
--- a/vllm/v1/worker/gpu_worker.py
+++ b/vllm/v1/worker/gpu_worker.py
@@ -41,7 +41,7 @@ from vllm.sequence import IntermediateTensors
 from vllm.tasks import SupportedTask
 from vllm.utils.mem_constants import GiB_bytes
 from vllm.utils.mem_utils import MemorySnapshot, memory_profiling
-from vllm.v1.core.sched.output import GrammarOutput
+from vllm.v1.core.sched.output import GrammarOutput, SchedulerOutput
 from vllm.v1.engine import ReconfigureDistributedRequest, ReconfigureRankType
 from vllm.v1.kv_cache_interface import KVCacheConfig, KVCacheSpec
 from vllm.v1.outputs import (
@@ -58,7 +58,6 @@ logger = init_logger(__name__)
 
 if TYPE_CHECKING:
     from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
-    from vllm.v1.core.sched.output import SchedulerOutput
 
 
 class Worker(WorkerBase):
@@ -101,6 +100,8 @@ class Worker(WorkerBase):
         else:
             self.profiler = None
 
+        self.use_v2_model_runner = envs.VLLM_USE_V2_MODEL_RUNNER
+
     def sleep(self, level: int = 1) -> None:
         from vllm.device_allocator.cumem import CuMemAllocator
 
@@ -237,9 +238,17 @@ class Worker(WorkerBase):
             raise RuntimeError(f"Not support device type: {self.device_config.device}")
 
         # Construct the model runner
-        self.model_runner: GPUModelRunner = GPUModelRunner(
-            self.vllm_config, self.device
-        )
+        if self.use_v2_model_runner:
+            from vllm.v1.worker.gpu.model_runner import (
+                GPUModelRunner as GPUModelRunnerV2,
+            )
+
+            # HACK(woosuk): This is a temporary fix to avoid type errors.
+            self.model_runner: GPUModelRunner = GPUModelRunnerV2(  # type: ignore
+                self.vllm_config, self.device
+            )
+        else:
+            self.model_runner = GPUModelRunner(self.vllm_config, self.device)
 
         if self.rank == 0:
             # If usage stat is enabled, collect relevant info.
@@ -573,7 +582,12 @@ class Worker(WorkerBase):
             self.profiler.stop()
 
     def execute_dummy_batch(self) -> None:
-        self.model_runner._dummy_run(1, uniform_decode=True)
+        if self.use_v2_model_runner:
+            self.model_runner.execute_model(
+                SchedulerOutput.make_empty(), dummy_run=True
+            )
+        else:
+            self.model_runner._dummy_run(1, uniform_decode=True)
 
     def add_lora(self, lora_request: LoRARequest) -> bool:
         return self.model_runner.add_lora(lora_request)

From b7f1f490a61c99d0b371e39aefbe5546cba231a9 Mon Sep 17 00:00:00 2001
From: Aleksandr Malyshev <164964928+maleksan85@users.noreply.github.com>
Date: Fri, 21 Nov 2025 08:34:46 -0800
Subject: [PATCH 16/83] Upstream triton fp4 weight preshuffle (#28888)

Signed-off-by: Aleksandr Malyshev <maleksan@amd.com>
Co-authored-by: Aleksandr Malyshev <maleksan@amd.com>
---
 vllm/_aiter_ops.py                            | 25 +++++++
 .../quark/schemes/quark_ocp_mx.py             | 65 +++++++++++++++----
 2 files changed, 76 insertions(+), 14 deletions(-)

diff --git a/vllm/_aiter_ops.py b/vllm/_aiter_ops.py
index e53e4ae6e5296..db79b3f5e8bcb 100644
--- a/vllm/_aiter_ops.py
+++ b/vllm/_aiter_ops.py
@@ -948,6 +948,31 @@ class rocm_aiter_ops:
             (8192, 32768),
         ]
 
+    @staticmethod
+    def is_triton_gemm_afp4wfp4_presh_ws_tuned(n: int, k: int) -> bool:
+        return (n, k) in [
+            (8192, 4096),
+            (1280, 8192),
+            (16384, 53248),
+            (106496, 16384),
+            (57344, 8192),
+            (8192, 2048),
+            (2560, 8192),
+            (10240, 8192),
+            (16384, 16384),
+            (8192, 28672),
+            (28672, 8192),
+            (18432, 16384),
+            (8192, 1024),
+            (7168, 8192),
+            (5120, 8192),
+            (8192, 8192),
+            (8192, 7168),
+            (14336, 8192),
+            (8192, 14336),
+            (8192, 3584),
+        ]
+
     @staticmethod
     def shuffle_weight(
         self, tensor: torch.Tensor, layout: tuple[int, int] = (16, 16)
diff --git a/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py b/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
index 007e78e68d5cd..33e9f9806b27e 100644
--- a/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
+++ b/vllm/model_executor/layers/quantization/quark/schemes/quark_ocp_mx.py
@@ -10,6 +10,7 @@ import torch
 import torch.nn.functional as F
 
 from vllm import envs
+from vllm._aiter_ops import rocm_aiter_ops
 from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization.utils.mxfp4_utils import (
     dequant_mxfp4,
@@ -49,7 +50,10 @@ def is_rocm_aiter_fp4_asm_gemm_enabled() -> bool:
 
 try:
     from aiter.ops.shuffle import shuffle_weight
-    from aiter.ops.triton.gemm_afp4wfp4 import gemm_afp4wfp4
+    from aiter.ops.triton.gemm_afp4wfp4 import (
+        gemm_afp4wfp4,
+        gemm_afp4wfp4_preshuffled_weight_scales,
+    )
     from aiter.ops.triton.quant import dynamic_mxfp4_quant
 
     from vllm.utils.torch_utils import direct_register_custom_op
@@ -66,23 +70,56 @@ try:
         x_scales: torch.Tensor | None = None,
     ) -> torch.Tensor:
         M = x.shape[0]
+        N = weight.shape[0]
+        K = weight.shape[1]
         if rocm_use_aiter_fp4_asm_gemm:
-            if x_scales is None:
-                # use hip quant kernel for performance
-                x_q, x_s = per_1x32_f4_quant_hip(x, shuffle=True)
+            if M <= 64 and rocm_aiter_ops.is_triton_gemm_afp4wfp4_presh_ws_tuned(N, K):
+                if x_scales is None:
+                    # use hip quant kernel for performance
+                    if M >= 32:
+                        x_q, x_s = per_1x32_f4_quant_hip(x, shuffle=True)
+                    else:
+                        x_q, x_s = per_1x32_f4_quant_hip(x, shuffle=False)
+                else:
+                    x_q = x
+                    x_s = x_scales
+
+                if M >= 32:
+                    x_s = x_s.view(torch.uint8).view(x_s.shape[0] // 32, -1)
+                else:
+                    x_s = x_s[:M, ...].view(torch.uint8)
+
+                y = torch.empty(M, N, device=x_q.device, dtype=out_dtype)
+                gemm_afp4wfp4_preshuffled_weight_scales(
+                    x_q.view(torch.uint8),
+                    weight.view(torch.uint8).view(weight.shape[0] // 16, -1),
+                    x_s,
+                    weight_scale.view(torch.uint8).view(
+                        weight_scale.shape[0] // 32, -1
+                    ),
+                    out_dtype,
+                    y,
+                )
             else:
-                x_q = x
-                x_s = x_scales
+                if x_scales is None:
+                    # use hip quant kernel for performance
+                    x_q, x_s = per_1x32_f4_quant_hip(x, shuffle=True)
+                else:
+                    x_q = x
+                    x_s = x_scales
 
-            # 32 alignment is enough for dim0 padding of output for
-            # gemm_a4w4 kernel
-            y = torch.empty(
-                (M + 31) // 32 * 32, weight.shape[0], device=x_q.device, dtype=out_dtype
-            )
+                # 32 alignment is enough for dim0 padding of output for
+                # gemm_a4w4 kernel
+                y = torch.empty(
+                    (M + 31) // 32 * 32,
+                    weight.shape[0],
+                    device=x_q.device,
+                    dtype=out_dtype,
+                )
 
-            gemm_a4w4(
-                x_q, weight, x_s, weight_scale.view(x_s.dtype), y, bpreshuffle=True
-            )
+                gemm_a4w4(
+                    x_q, weight, x_s, weight_scale.view(x_s.dtype), y, bpreshuffle=True
+                )
             return y[:M]
         else:
             if x_scales is None:

From a42ab317acff8c4b7d4808bb34548a530ee04f0f Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Fri, 21 Nov 2025 11:46:20 -0500
Subject: [PATCH 17/83] [Log] Optimize startup log (#28948)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
Signed-off-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Co-authored-by: Nick Hill <nhill@redhat.com>
---
 .../layers/fused_moe/fused_moe.py             |  6 +++--
 .../model_executor/layers/quantization/fp8.py | 10 +++++---
 vllm/profiler/gpu_profiler.py                 | 25 ++++++++++---------
 vllm/v1/core/kv_cache_utils.py                |  3 ++-
 4 files changed, 26 insertions(+), 18 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/fused_moe.py b/vllm/model_executor/layers/fused_moe/fused_moe.py
index f44328418f1bc..df208eae2e71c 100644
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -872,8 +872,10 @@ def get_moe_configs(
     for config_file_path in config_file_paths:
         if os.path.exists(config_file_path):
             with open(config_file_path) as f:
-                logger.info(
-                    "Using configuration from %s for MoE layer.", config_file_path
+                logger.info_once(
+                    "Using configuration from %s for MoE layer.",
+                    config_file_path,
+                    scope="global",
                 )
                 # If a configuration has been found, return it
                 tuned_config = json.load(f)
diff --git a/vllm/model_executor/layers/quantization/fp8.py b/vllm/model_executor/layers/quantization/fp8.py
index 92fbdd7093483..91bd45bf879cb 100644
--- a/vllm/model_executor/layers/quantization/fp8.py
+++ b/vllm/model_executor/layers/quantization/fp8.py
@@ -162,9 +162,11 @@ def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
     # deepGEMM on supported platforms with block-quantized weights
     if envs.VLLM_USE_DEEP_GEMM and envs.VLLM_MOE_USE_DEEP_GEMM and block_quant:
         if not has_deep_gemm():
-            logger.warning_once("DeepGEMM backend requested but not available.")
+            logger.warning_once(
+                "DeepGEMM backend requested but not available.", scope="local"
+            )
         elif is_deep_gemm_supported():
-            logger.info_once("Using DeepGEMM backend for FP8 MoE")
+            logger.info_once("Using DeepGEMM backend for FP8 MoE", scope="local")
             return Fp8MoeBackend.DEEPGEMM
 
     # CUTLASS BlockScaled GroupedGemm on SM100 with block-quantized weights
@@ -173,7 +175,9 @@ def get_fp8_moe_backend(block_quant: bool) -> Fp8MoeBackend:
         and current_platform.is_device_capability(100)
         and block_quant
     ):
-        logger.info_once("Using Cutlass BlockScaled GroupedGemm backend for FP8 MoE")
+        logger.info_once(
+            "Using Cutlass BlockScaled GroupedGemm backend for FP8 MoE", scope="local"
+        )
         return Fp8MoeBackend.CUTLASS_BLOCK_SCALED_GROUPED_GEMM
 
     # default to Triton
diff --git a/vllm/profiler/gpu_profiler.py b/vllm/profiler/gpu_profiler.py
index 2155b67a3db4b..3e2cbe7296e9d 100644
--- a/vllm/profiler/gpu_profiler.py
+++ b/vllm/profiler/gpu_profiler.py
@@ -139,18 +139,19 @@ class TorchProfilerWrapper(WorkerProfiler):
 
         self.local_rank = local_rank
         torch_profiler_trace_dir = envs.VLLM_TORCH_PROFILER_DIR
-        logger.info(
-            "Torch profiling enabled. Traces will be saved to: %s",
-            torch_profiler_trace_dir,
-        )
-        logger.debug(
-            "Profiler config: record_shapes=%s,"
-            "profile_memory=%s,with_stack=%s,with_flops=%s",
-            envs.VLLM_TORCH_PROFILER_RECORD_SHAPES,
-            envs.VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY,
-            envs.VLLM_TORCH_PROFILER_WITH_STACK,
-            envs.VLLM_TORCH_PROFILER_WITH_FLOPS,
-        )
+        if local_rank in (None, 0):
+            logger.info(
+                "Torch profiling enabled. Traces will be saved to: %s",
+                torch_profiler_trace_dir,
+            )
+            logger.debug(
+                "Profiler config: record_shapes=%s,"
+                "profile_memory=%s,with_stack=%s,with_flops=%s",
+                envs.VLLM_TORCH_PROFILER_RECORD_SHAPES,
+                envs.VLLM_TORCH_PROFILER_WITH_PROFILE_MEMORY,
+                envs.VLLM_TORCH_PROFILER_WITH_STACK,
+                envs.VLLM_TORCH_PROFILER_WITH_FLOPS,
+            )
         self.profiler = torch.profiler.profile(
             activities=[
                 torch.profiler.ProfilerActivity.CPU,
diff --git a/vllm/v1/core/kv_cache_utils.py b/vllm/v1/core/kv_cache_utils.py
index 01ecd881115df..b18ba8e8b2c7b 100644
--- a/vllm/v1/core/kv_cache_utils.py
+++ b/vllm/v1/core/kv_cache_utils.py
@@ -1236,10 +1236,11 @@ def _report_kv_cache_config(
     max_concurrency = get_max_concurrency_for_kv_cache_config(
         vllm_config, kv_cache_config
     )
-    logger.info(
+    logger.info_once(
         "Maximum concurrency for %s tokens per request: %.2fx",
         max_model_len_str,
         max_concurrency,
+        scope="local",
     )
 
 

From e99e467384001e284e0722a33362866b10fed65b Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 21 Nov 2025 10:53:09 -0600
Subject: [PATCH 18/83] [CI/Build][Kernel][AMD] Move extra dim to after load in
 _fwd_kv_parallel in lighting_attn.py (#29132)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 vllm/model_executor/layers/lightning_attn.py | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/lightning_attn.py b/vllm/model_executor/layers/lightning_attn.py
index 99853680eac6c..ffccdc12241cb 100644
--- a/vllm/model_executor/layers/lightning_attn.py
+++ b/vllm/model_executor/layers/lightning_attn.py
@@ -198,7 +198,7 @@ def _fwd_kv_parallel(
     )
 
     # Load the decay factors for the current head and block
-    k_decay_ptr = K_decay + off_h * BLOCK + tl.arange(0, CBLOCK)[None, :]
+    k_decay_ptr = K_decay + off_h * BLOCK + tl.arange(0, CBLOCK)
 
     kv_index = tl.arange(0, CBLOCK)
 
@@ -228,6 +228,12 @@ def _fwd_kv_parallel(
 
         # Load decay factor and compute weighted key-value outer product
         k_decay = tl.load(k_decay_ptr)
+
+        # NOTE: Need to add the extra dim here due to AMD MLIR lowering error.
+        # Please don't move it back until issue is resolved.
+        # Issue: https://github.com/ROCm/triton/issues/907
+        k_decay = k_decay[None, :]
+
         kv += tl.dot(k_trans * k_decay, v)
 
         # Move to the next sub-block

From b4c8fbaae2592501f442817f86e32cfeb795d81f Mon Sep 17 00:00:00 2001
From: Mingyuan Ma <111467530+Victor49152@users.noreply.github.com>
Date: Fri, 21 Nov 2025 08:54:11 -0800
Subject: [PATCH 19/83] Add TRTLLM MoE NVFP4 kernel to
 CompressedTensorsW4A4MoeMethod (#28892)

Signed-off-by: mingyuanm <mingyuanm@nvidia.com>
Signed-off-by: mgoin <mgoin64@gmail.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
---
 .../compressed_tensors_moe.py                 | 142 +++++++++--
 .../layers/quantization/modelopt.py           | 205 ++--------------
 .../quantization/utils/flashinfer_fp4_moe.py  | 221 ++++++++++++++++++
 3 files changed, 358 insertions(+), 210 deletions(-)

diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
index fa254030a271a..ad547dd409822 100644
--- a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
+++ b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -8,6 +8,7 @@ from enum import Enum
 import torch
 from compressed_tensors import CompressionFormat
 from compressed_tensors.quantization import ActivationOrdering, QuantizationStrategy
+from torch.nn.parameter import Parameter
 
 import vllm.envs as envs
 import vllm.model_executor.layers.fused_moe.modular_kernel as mk
@@ -50,9 +51,15 @@ from vllm.model_executor.layers.quantization.compressed_tensors.utils import (
 from vllm.model_executor.layers.quantization.utils import replace_parameter
 from vllm.model_executor.layers.quantization.utils.flashinfer_fp4_moe import (
     build_flashinfer_fp4_cutlass_moe_prepare_finalize,
+    flashinfer_trtllm_fp4_moe,
+    prepare_static_weights_for_trtllm_fp4_moe,
     reorder_w1w3_to_w3w1,
     select_nvfp4_gemm_impl,
 )
+from vllm.model_executor.layers.quantization.utils.flashinfer_utils import (
+    FlashinferMoeBackend,
+    get_flashinfer_moe_backend,
+)
 from vllm.model_executor.layers.quantization.utils.fp8_utils import (
     expert_weight_is_col_major,
     requant_weight_ue8m0_inplace,
@@ -193,6 +200,13 @@ class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
         self.allow_flashinfer = _nvfp4.allow_flashinfer
         self.use_marlin = _nvfp4.use_marlin
         self.group_size = 16
+        self.flashinfer_moe_backend = None
+        if self.allow_flashinfer:
+            self.flashinfer_moe_backend = get_flashinfer_moe_backend()
+            logger.info_once(
+                f"Using FlashInfer {self.flashinfer_moe_backend.value} kernels"
+                " for CompressedTensorsW4A4MoeMethod."
+            )
 
     def create_weights(
         self,
@@ -344,21 +358,20 @@ class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
         if self.use_marlin:
             prepare_moe_fp4_layer_for_marlin(layer)
             return
-
-        # swizzle weight scales
-        layer.w13_weight_scale = torch.nn.Parameter(
-            swizzle_blockscale(layer.w13_weight_scale), requires_grad=False
-        )
-
-        layer.w2_weight_scale = torch.nn.Parameter(
-            swizzle_blockscale(layer.w2_weight_scale), requires_grad=False
-        )
-
         # w13
-        w13_input_global_scale = layer.w13_input_global_scale.max(dim=1).values.to(
-            torch.float32
-        )
-
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
+            w13_input_global_scale = (
+                layer.w13_input_global_scale.min()
+                .to(torch.float32)
+                .expand(layer.num_experts)
+            )
+        else:
+            w13_input_global_scale = layer.w13_input_global_scale.min(dim=1).values.to(
+                torch.float32
+            )
         layer.g1_alphas = torch.nn.Parameter(
             ((1 / w13_input_global_scale) * layer.w13_weight_scale_2),
             requires_grad=False,
@@ -369,22 +382,92 @@ class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
         )
 
         # w2
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
+            w2_input_global_scale = (
+                layer.w2_input_global_scale.min()
+                .to(torch.float32)
+                .expand(layer.num_experts)
+            )
+        else:
+            w2_input_global_scale = layer.w2_input_global_scale
+
         layer.g2_alphas = torch.nn.Parameter(
-            ((1 / layer.w2_input_global_scale) * layer.w2_weight_scale_2).to(
-                torch.float32
-            ),
+            ((1 / w2_input_global_scale) * layer.w2_weight_scale_2).to(torch.float32),
             requires_grad=False,
         )
 
         layer.w2_input_scale_quant = torch.nn.Parameter(
-            (layer.w2_input_global_scale), requires_grad=False
+            (w2_input_global_scale), requires_grad=False
         )
 
+        # TensorRT-LLM specific processing
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
+            # Prepare static weights for TRT-LLM kernel
+            # alternate: prepare_static_weight_layouts_for_trtllm_moe
+            (
+                gemm1_weights_fp4_shuffled,
+                gemm1_scales_fp4_shuffled,
+                gemm2_weights_fp4_shuffled,
+                gemm2_scales_fp4_shuffled,
+            ) = prepare_static_weights_for_trtllm_fp4_moe(
+                layer.w13_weight,
+                layer.w2_weight,
+                layer.w13_weight_scale,
+                layer.w2_weight_scale,
+                layer.w2_weight.size(-2),  # hidden_size
+                layer.w13_weight.size(-2) // 2,  # intermediate_size
+                layer.w13_weight.size(0),  # num_experts
+            )
+            logger.debug_once("Finished shuffling weights for TRT-LLM MOE")
+
+            layer.gemm1_weights_fp4_shuffled = Parameter(
+                gemm1_weights_fp4_shuffled, requires_grad=False
+            )
+            layer.gemm2_weights_fp4_shuffled = Parameter(
+                gemm2_weights_fp4_shuffled, requires_grad=False
+            )
+            layer.gemm1_scales_fp4_shuffled = Parameter(
+                gemm1_scales_fp4_shuffled, requires_grad=False
+            )
+            layer.gemm2_scales_fp4_shuffled = Parameter(
+                gemm2_scales_fp4_shuffled, requires_grad=False
+            )
+
+            # Additional parameter needed for TRT-LLM
+            layer.g1_scale_c = Parameter(
+                (layer.w2_input_scale_quant * layer.g1_alphas).to(torch.float32),
+                requires_grad=False,
+            )
+
+            # Clean up weights that won't be used by TRT-LLM
+            del layer.w2_weight
+            del layer.w2_weight_scale
+            del layer.w13_weight
+            del layer.w13_weight_scale
+        else:
+            # swizzle weight scales
+            layer.w13_weight_scale = torch.nn.Parameter(
+                swizzle_blockscale(layer.w13_weight_scale), requires_grad=False
+            )
+
+            layer.w2_weight_scale = torch.nn.Parameter(
+                swizzle_blockscale(layer.w2_weight_scale), requires_grad=False
+            )
+
     def maybe_make_prepare_finalize(
         self,
         routing_tables: tuple[torch.Tensor, torch.Tensor, torch.Tensor] | None = None,
     ) -> mk.FusedMoEPrepareAndFinalize | None:
-        if self.use_marlin:
+        if self.use_marlin or (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             return None
         elif not self.allow_flashinfer:
             return super().maybe_make_prepare_finalize(routing_tables)
@@ -411,7 +494,10 @@ class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
     def get_fused_moe_quant_config(
         self, layer: torch.nn.Module
     ) -> FusedMoEQuantConfig | None:
-        if self.use_marlin:
+        if (
+            self.use_marlin
+            or self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
             return None
 
         return nvfp4_moe_quant_config(
@@ -452,6 +538,22 @@ class CompressedTensorsW4A4MoeMethod(CompressedTensorsMoEMethod):
             )
         assert activation == "silu", "Only SiLU activation is supported."
 
+        if (
+            self.allow_flashinfer
+            and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
+        ):
+            return flashinfer_trtllm_fp4_moe(
+                layer=layer,
+                x=x,
+                router_logits=router_logits,
+                top_k=top_k,
+                global_num_experts=global_num_experts,
+                num_expert_group=num_expert_group,
+                topk_group=topk_group,
+                custom_routing_function=custom_routing_function,
+                e_score_correction_bias=e_score_correction_bias,
+            )
+
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
             router_logits=router_logits,
diff --git a/vllm/model_executor/layers/quantization/modelopt.py b/vllm/model_executor/layers/quantization/modelopt.py
index 6b5ed7762eb31..01a23168bdde3 100644
--- a/vllm/model_executor/layers/quantization/modelopt.py
+++ b/vllm/model_executor/layers/quantization/modelopt.py
@@ -15,7 +15,6 @@ from vllm._custom_ops import cutlass_scaled_fp4_mm, scaled_fp4_quant
 from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import (
     FusedMoEQuantConfig,
-    RoutingMethodType,
     fp8_w8a8_moe_quant_config,
     nvfp4_moe_quant_config,
 )
@@ -38,6 +37,8 @@ from vllm.model_executor.layers.quantization.base_config import (
 from vllm.model_executor.layers.quantization.kv_cache import BaseKVCacheMethod
 from vllm.model_executor.layers.quantization.utils.flashinfer_fp4_moe import (
     build_flashinfer_fp4_cutlass_moe_prepare_finalize,
+    flashinfer_trtllm_fp4_moe,
+    prepare_static_weights_for_trtllm_fp4_moe,
     reorder_w1w3_to_w3w1,
     select_nvfp4_gemm_impl,
 )
@@ -1136,7 +1137,6 @@ class ModelOptNvFp4FusedMoE(FusedMoEMethodBase):
         self.allow_flashinfer = _nvfp4.allow_flashinfer
         self.use_marlin = _nvfp4.use_marlin
         self.flashinfer_moe_backend = None
-        self._cache_permute_indices: dict[torch.Size, torch.Tensor] = {}
         if self.allow_flashinfer:
             self.flashinfer_moe_backend = get_flashinfer_moe_backend()
             logger.info_once(
@@ -1303,138 +1303,14 @@ class ModelOptNvFp4FusedMoE(FusedMoEMethodBase):
         )
         layer.register_parameter("w2_input_scale", w2_input_scale)
 
-    def prepare_static_weights_for_trtllm_fp4_moe(
-        self,
-        # args_dequant,
-        # args,
-        gemm1_weights,
-        gemm2_weights,
-        gemm1_scales_linear_fp4_bytes,
-        gemm2_scales_linear_fp4_bytes,
-        hidden_size,
-        intermediate_size,
-        num_experts,
-    ):
-        from flashinfer import nvfp4_block_scale_interleave
-        from flashinfer.fused_moe.core import (
-            _maybe_get_cached_w3_w1_permute_indices,
-            get_w2_permute_indices_with_cache,
-        )
-
-        """Prepare quantized weights for kernel (done offline with weights)."""
-        epilogue_tile_m = 128  # FIXME: this depends on the kernel internals
-
-        # Convert quantized weights to proper formats
-        gemm1_weights_fp4 = gemm1_weights.view(torch.float8_e4m3fn).reshape(
-            num_experts, 2 * intermediate_size, hidden_size // 2
-        )  # packed fp4
-        gemm1_scales_linear_fp4 = gemm1_scales_linear_fp4_bytes.view(
-            torch.float8_e4m3fn
-        ).reshape(
-            num_experts, 2 * intermediate_size, hidden_size // 16
-        )  # fp8 scaling factors
-
-        gemm2_weights_fp4 = gemm2_weights.view(torch.float8_e4m3fn).reshape(
-            num_experts, hidden_size, intermediate_size // 2
-        )  # packed fp4
-        gemm2_scales_linear_fp4 = gemm2_scales_linear_fp4_bytes.view(
-            torch.float8_e4m3fn
-        ).reshape(
-            num_experts, hidden_size, intermediate_size // 16
-        )  # fp8 scaling factors
-
-        gemm1_weights_fp4_shuffled = []
-        gemm1_scales_fp4_shuffled = []
-        gemm2_weights_fp4_shuffled = []
-        gemm2_scales_fp4_shuffled = []
-        for i in range(num_experts):
-            # Calculate the permute indices for the following:
-            # 1. Reorder rows of W1 and scales for fused gated activation
-            # 2. Shuffle weights and scaling factors for transposed mma output
-            # for both w3_w1 and w2 weights and scale factors
-            permute_indices = _maybe_get_cached_w3_w1_permute_indices(
-                self._cache_permute_indices,
-                gemm1_weights_fp4[i].view(torch.uint8),
-                epilogue_tile_m,
-            )
-            gemm1_weights_fp4_shuffled.append(
-                gemm1_weights_fp4[i]
-                .view(torch.uint8)[permute_indices.to(gemm1_weights_fp4.device)]
-                .contiguous()
-            )
-
-            permute_sf_indices = _maybe_get_cached_w3_w1_permute_indices(
-                self._cache_permute_indices,
-                gemm1_scales_linear_fp4[i].view(torch.uint8),
-                epilogue_tile_m,
-                num_elts_per_sf=16,
-            )
-            gemm1_scales_fp4_shuffled.append(
-                nvfp4_block_scale_interleave(
-                    gemm1_scales_linear_fp4[i]
-                    .view(torch.uint8)[
-                        permute_sf_indices.to(gemm1_scales_linear_fp4.device)
-                    ]
-                    .contiguous()
-                )
-            )
-
-            permute_indices = get_w2_permute_indices_with_cache(
-                self._cache_permute_indices,
-                gemm2_weights_fp4[i].view(torch.uint8),
-                epilogue_tile_m,
-            )
-            gemm2_weights_fp4_shuffled.append(
-                gemm2_weights_fp4[i]
-                .view(torch.uint8)[permute_indices.to(gemm2_weights_fp4.device)]
-                .contiguous()
-            )
-
-            permute_sf_indices = get_w2_permute_indices_with_cache(
-                self._cache_permute_indices,
-                gemm2_scales_linear_fp4[i].view(torch.uint8),
-                epilogue_tile_m,
-                num_elts_per_sf=16,
-            )
-            gemm2_scales_fp4_shuffled.append(
-                nvfp4_block_scale_interleave(
-                    gemm2_scales_linear_fp4[i]
-                    .view(torch.uint8)[
-                        permute_sf_indices.to(gemm2_scales_linear_fp4.device)
-                    ]
-                    .contiguous()
-                )
-            )
-
-        # Stack weights for all experts
-        gemm1_weights_fp4_shuffled = torch.stack(gemm1_weights_fp4_shuffled)
-        gemm1_scales_fp4_shuffled = (
-            torch.stack(gemm1_scales_fp4_shuffled)
-            .view(torch.float8_e4m3fn)
-            .reshape(num_experts, 2 * intermediate_size, hidden_size // 16)
-        )
-
-        gemm2_weights_fp4_shuffled = torch.stack(gemm2_weights_fp4_shuffled)
-        gemm2_scales_fp4_shuffled = (
-            torch.stack(gemm2_scales_fp4_shuffled)
-            .view(torch.float8_e4m3fn)
-            .reshape(num_experts, hidden_size, intermediate_size // 16)
-        )
-        return (
-            gemm1_weights_fp4_shuffled,
-            gemm1_scales_fp4_shuffled,
-            gemm2_weights_fp4_shuffled,
-            gemm2_scales_fp4_shuffled,
-        )
-
     def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
         # GEMM 1 processing
         gemm1_weight = layer.w13_weight.data
         gemm1_weight_scale = layer.w13_weight_scale.data
 
-        if (
-            self.allow_flashinfer
-            and self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+        if self.allow_flashinfer and (
+            self.flashinfer_moe_backend == FlashinferMoeBackend.CUTLASS
+            or self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
         ):
             gemm1_weight, gemm1_weight_scale = reorder_w1w3_to_w3w1(
                 gemm1_weight, gemm1_weight_scale, dim=-2
@@ -1508,7 +1384,7 @@ class ModelOptNvFp4FusedMoE(FusedMoEMethodBase):
                 gemm1_scales_fp4_shuffled,
                 gemm2_weights_fp4_shuffled,
                 gemm2_scales_fp4_shuffled,
-            ) = self.prepare_static_weights_for_trtllm_fp4_moe(
+            ) = prepare_static_weights_for_trtllm_fp4_moe(
                 layer.w13_weight,
                 layer.w2_weight,
                 layer.w13_weight_scale,
@@ -1614,68 +1490,17 @@ class ModelOptNvFp4FusedMoE(FusedMoEMethodBase):
             self.allow_flashinfer
             and self.flashinfer_moe_backend == FlashinferMoeBackend.TENSORRT_LLM
         ):
-            import flashinfer
-
-            from vllm.model_executor.models.llama4 import Llama4MoE
-
-            a1_gscale = layer.w13_input_scale_quant
-            (hidden_states_fp4, hidden_states_scale_linear_fp4) = (
-                flashinfer.fp4_quantize(
-                    x,
-                    a1_gscale,
-                    is_sf_swizzled_layout=False,
-                )
-            )
-            use_llama4_routing = (
-                custom_routing_function is Llama4MoE.custom_routing_function
-            )
-            routing_method_type = layer.routing_method_type
-            if use_llama4_routing:
-                routing_method_type = RoutingMethodType.Llama4
-            router_logits = (
-                router_logits.to(torch.float32)
-                if routing_method_type == RoutingMethodType.DeepSeekV3
-                else router_logits
-            )
-            routing_bias = e_score_correction_bias
-            if routing_bias is not None:
-                routing_bias = routing_bias.to(torch.bfloat16)
-            out = flashinfer.fused_moe.trtllm_fp4_block_scale_moe(
-                routing_logits=router_logits,
-                routing_bias=routing_bias,
-                hidden_states=hidden_states_fp4,
-                hidden_states_scale=hidden_states_scale_linear_fp4.view(
-                    torch.float8_e4m3fn
-                ).flatten(),
-                gemm1_weights=layer.gemm1_weights_fp4_shuffled.data,
-                gemm1_weights_scale=layer.gemm1_scales_fp4_shuffled.data.view(
-                    torch.float8_e4m3fn
-                ),
-                gemm1_bias=None,
-                gemm1_alpha=None,
-                gemm1_beta=None,
-                gemm1_clamp_limit=None,
-                gemm2_weights=layer.gemm2_weights_fp4_shuffled.data,
-                gemm2_weights_scale=layer.gemm2_scales_fp4_shuffled.data.view(
-                    torch.float8_e4m3fn
-                ),
-                gemm2_bias=None,
-                output1_scale_scalar=layer.g1_scale_c.data,
-                output1_scale_gate_scalar=layer.g1_alphas.data,
-                output2_scale_scalar=layer.g2_alphas.data,
-                num_experts=global_num_experts,
+            return flashinfer_trtllm_fp4_moe(
+                layer=layer,
+                x=x,
+                router_logits=router_logits,
                 top_k=top_k,
-                n_group=num_expert_group,
+                global_num_experts=global_num_experts,
+                num_expert_group=num_expert_group,
                 topk_group=topk_group,
-                intermediate_size=layer.intermediate_size_per_partition,
-                local_expert_offset=layer.ep_rank * layer.local_num_experts,
-                local_num_experts=layer.local_num_experts,
-                routed_scaling_factor=1.0,
-                tile_tokens_dim=None,
-                routing_method_type=routing_method_type,
-                do_finalize=True,
-            )[0]
-            return out
+                custom_routing_function=custom_routing_function,
+                e_score_correction_bias=e_score_correction_bias,
+            )
 
         topk_weights, topk_ids, _ = FusedMoE.select_experts(
             hidden_states=x,
diff --git a/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py b/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
index 36e8599dd9484..eda40657b1e39 100644
--- a/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
+++ b/vllm/model_executor/layers/quantization/utils/flashinfer_fp4_moe.py
@@ -9,6 +9,7 @@ import vllm.model_executor.layers.fused_moe.modular_kernel as mk
 from vllm.model_executor.layers.fused_moe.config import (
     FusedMoEConfig,
     FusedMoEQuantConfig,
+    RoutingMethodType,
 )
 from vllm.model_executor.layers.fused_moe.flashinfer_cutedsl_moe import (
     FlashInferCuteDSLExperts,
@@ -110,3 +111,223 @@ def select_nvfp4_gemm_impl(
         "CutlassExpertsFp4 doesn't support DP. Use flashinfer CUTLASS "
         "Fused MoE backend instead (set VLLM_USE_FLASHINFER_MOE_FP4=1)"
     )
+
+
+def prepare_static_weights_for_trtllm_fp4_moe(
+    # args_dequant,
+    # args,
+    gemm1_weights,
+    gemm2_weights,
+    gemm1_scales_linear_fp4_bytes,
+    gemm2_scales_linear_fp4_bytes,
+    hidden_size,
+    intermediate_size,
+    num_experts,
+):
+    from flashinfer import nvfp4_block_scale_interleave
+    from flashinfer.fused_moe.core import (
+        _maybe_get_cached_w3_w1_permute_indices,
+        get_w2_permute_indices_with_cache,
+    )
+
+    _cache_permute_indices: dict[torch.Size, torch.Tensor] = {}
+    """Prepare quantized weights for kernel (done offline with weights)."""
+    epilogue_tile_m = 128  # FIXME: this depends on the kernel internals
+
+    # Convert quantized weights to proper formats
+    gemm1_weights_fp4 = gemm1_weights.view(torch.float8_e4m3fn).reshape(
+        num_experts, 2 * intermediate_size, hidden_size // 2
+    )  # packed fp4
+    gemm1_scales_linear_fp4 = gemm1_scales_linear_fp4_bytes.view(
+        torch.float8_e4m3fn
+    ).reshape(
+        num_experts, 2 * intermediate_size, hidden_size // 16
+    )  # fp8 scaling factors
+
+    gemm2_weights_fp4 = gemm2_weights.view(torch.float8_e4m3fn).reshape(
+        num_experts, hidden_size, intermediate_size // 2
+    )  # packed fp4
+    gemm2_scales_linear_fp4 = gemm2_scales_linear_fp4_bytes.view(
+        torch.float8_e4m3fn
+    ).reshape(num_experts, hidden_size, intermediate_size // 16)  # fp8 scaling factors
+
+    gemm1_weights_fp4_shuffled = []
+    gemm1_scales_fp4_shuffled = []
+    gemm2_weights_fp4_shuffled = []
+    gemm2_scales_fp4_shuffled = []
+    for i in range(num_experts):
+        # Calculate the permute indices for the following:
+        # 1. Reorder rows of W1 and scales for fused gated activation
+        # 2. Shuffle weights and scaling factors for transposed mma output
+        # for both w3_w1 and w2 weights and scale factors
+        permute_indices = _maybe_get_cached_w3_w1_permute_indices(
+            _cache_permute_indices,
+            gemm1_weights_fp4[i].view(torch.uint8),
+            epilogue_tile_m,
+        )
+        gemm1_weights_fp4_shuffled.append(
+            gemm1_weights_fp4[i]
+            .view(torch.uint8)[permute_indices.to(gemm1_weights_fp4.device)]
+            .contiguous()
+        )
+
+        permute_sf_indices = _maybe_get_cached_w3_w1_permute_indices(
+            _cache_permute_indices,
+            gemm1_scales_linear_fp4[i].view(torch.uint8),
+            epilogue_tile_m,
+            num_elts_per_sf=16,
+        )
+        gemm1_scales_fp4_shuffled.append(
+            nvfp4_block_scale_interleave(
+                gemm1_scales_linear_fp4[i]
+                .view(torch.uint8)[
+                    permute_sf_indices.to(gemm1_scales_linear_fp4.device)
+                ]
+                .contiguous()
+            )
+        )
+
+        permute_indices = get_w2_permute_indices_with_cache(
+            _cache_permute_indices,
+            gemm2_weights_fp4[i].view(torch.uint8),
+            epilogue_tile_m,
+        )
+        gemm2_weights_fp4_shuffled.append(
+            gemm2_weights_fp4[i]
+            .view(torch.uint8)[permute_indices.to(gemm2_weights_fp4.device)]
+            .contiguous()
+        )
+
+        permute_sf_indices = get_w2_permute_indices_with_cache(
+            _cache_permute_indices,
+            gemm2_scales_linear_fp4[i].view(torch.uint8),
+            epilogue_tile_m,
+            num_elts_per_sf=16,
+        )
+        gemm2_scales_fp4_shuffled.append(
+            nvfp4_block_scale_interleave(
+                gemm2_scales_linear_fp4[i]
+                .view(torch.uint8)[
+                    permute_sf_indices.to(gemm2_scales_linear_fp4.device)
+                ]
+                .contiguous()
+            )
+        )
+
+    # Stack weights for all experts
+    gemm1_weights_fp4_shuffled = torch.stack(gemm1_weights_fp4_shuffled)
+    gemm1_scales_fp4_shuffled = (
+        torch.stack(gemm1_scales_fp4_shuffled)
+        .view(torch.float8_e4m3fn)
+        .reshape(num_experts, 2 * intermediate_size, hidden_size // 16)
+    )
+
+    gemm2_weights_fp4_shuffled = torch.stack(gemm2_weights_fp4_shuffled)
+    gemm2_scales_fp4_shuffled = (
+        torch.stack(gemm2_scales_fp4_shuffled)
+        .view(torch.float8_e4m3fn)
+        .reshape(num_experts, hidden_size, intermediate_size // 16)
+    )
+    return (
+        gemm1_weights_fp4_shuffled,
+        gemm1_scales_fp4_shuffled,
+        gemm2_weights_fp4_shuffled,
+        gemm2_scales_fp4_shuffled,
+    )
+
+
+def flashinfer_trtllm_fp4_moe(
+    layer: torch.nn.Module,
+    x: torch.Tensor,
+    router_logits: torch.Tensor,
+    top_k: int,
+    global_num_experts: int,
+    num_expert_group: int | None,
+    topk_group: int | None,
+    custom_routing_function: object | None,
+    e_score_correction_bias: torch.Tensor | None,
+) -> torch.Tensor:
+    """
+    Apply FlashInfer TensorRT-LLM FP4 MoE kernel.
+
+    Args:
+        layer: The MoE layer with weights and scales
+        x: Input tensor
+        router_logits: Router logits for expert selection
+        top_k: Number of experts to select per token
+        global_num_experts: Total number of experts across all ranks
+        num_expert_group: Number of expert groups (for grouped routing)
+        topk_group: Top-k within each group
+        custom_routing_function: Custom routing function (e.g., Llama4)
+        e_score_correction_bias: Optional routing bias correction
+
+    Returns:
+        Output tensor from the MoE layer
+    """
+    import flashinfer
+
+    from vllm.model_executor.models.llama4 import Llama4MoE
+
+    # Quantize input to FP4
+    a1_gscale = layer.w13_input_scale_quant
+    (hidden_states_fp4, hidden_states_scale_linear_fp4) = flashinfer.fp4_quantize(
+        x,
+        a1_gscale,
+        is_sf_swizzled_layout=False,
+    )
+
+    # Determine routing method type
+    use_llama4_routing = custom_routing_function is Llama4MoE.custom_routing_function
+    routing_method_type = layer.routing_method_type
+    if use_llama4_routing:
+        routing_method_type = flashinfer.RoutingMethodType.Llama4
+
+    # Prepare routing bias
+    routing_bias = e_score_correction_bias
+    if routing_bias is not None:
+        routing_bias = routing_bias.to(torch.bfloat16)
+
+    router_logits = (
+        router_logits.to(torch.float32)
+        if routing_method_type == RoutingMethodType.DeepSeekV3
+        else router_logits
+    )
+
+    # Call TRT-LLM FP4 block-scale MoE kernel
+    out = flashinfer.fused_moe.trtllm_fp4_block_scale_moe(
+        routing_logits=router_logits,
+        routing_bias=routing_bias,
+        hidden_states=hidden_states_fp4,
+        hidden_states_scale=hidden_states_scale_linear_fp4.view(
+            torch.float8_e4m3fn
+        ).flatten(),
+        gemm1_weights=layer.gemm1_weights_fp4_shuffled.data,
+        gemm1_weights_scale=layer.gemm1_scales_fp4_shuffled.data.view(
+            torch.float8_e4m3fn
+        ),
+        gemm1_bias=None,
+        gemm1_alpha=None,
+        gemm1_beta=None,
+        gemm1_clamp_limit=None,
+        gemm2_weights=layer.gemm2_weights_fp4_shuffled.data,
+        gemm2_weights_scale=layer.gemm2_scales_fp4_shuffled.data.view(
+            torch.float8_e4m3fn
+        ),
+        gemm2_bias=None,
+        output1_scale_scalar=layer.g1_scale_c.data,
+        output1_scale_gate_scalar=layer.g1_alphas.data,
+        output2_scale_scalar=layer.g2_alphas.data,
+        num_experts=global_num_experts,
+        top_k=top_k,
+        n_group=num_expert_group if num_expert_group is not None else 0,
+        topk_group=topk_group if topk_group is not None else 0,
+        intermediate_size=layer.intermediate_size_per_partition,
+        local_expert_offset=layer.ep_rank * layer.local_num_experts,
+        local_num_experts=layer.local_num_experts,
+        routed_scaling_factor=None,
+        tile_tokens_dim=None,
+        routing_method_type=routing_method_type,
+        do_finalize=True,
+    )[0]
+
+    return out

From 460d02a417b440ce8b3b8d09c6f5214a2a346426 Mon Sep 17 00:00:00 2001
From: "Chendi.Xue" <chendi.xue@intel.com>
Date: Fri, 21 Nov 2025 10:55:27 -0600
Subject: [PATCH 20/83] [NIXL] Fix after virtual block_size for host_buffer
 with heter kv_layout (#29122)

Signed-off-by: Chendi Xue <chendi.xue@intel.com>
---
 .../kv_transfer/kv_connector/v1/nixl_connector.py  | 14 +++++++++++++-
 vllm/platforms/xpu.py                              |  8 --------
 2 files changed, 13 insertions(+), 9 deletions(-)

diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
index 1626f819af8b5..7c0911240493c 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/nixl_connector.py
@@ -1042,10 +1042,12 @@ class NixlConnectorWorker:
         NOT directly supported by NIXL (e.g., tpu)
         """
         xfer_buffers: dict[str, torch.Tensor] = {}
+        inv_order = [0, 1, 3, 2, 4]
         try:
             for layer_name, kv_cache in kv_caches.items():
                 kv_shape = kv_cache.shape
                 kv_dtype = kv_cache.dtype
+                permute_shape = False
                 if (
                     self.kv_cache_layout == "NHD"
                     and self.vllm_config.kv_transfer_config is not None
@@ -1059,10 +1061,20 @@ class NixlConnectorWorker:
                     # Since NHD will not support Decode/Prefill TP_ratio > 1,
                     # we can leverage host_buffer for permute
                     self.host_buffer_kv_cache_layout = "HND"
-                    kv_shape = tuple(kv_shape[i] for i in [0, 1, 3, 2, 4])
+                    kv_shape = (
+                        tuple(kv_shape[i] for i in inv_order)
+                        if not self.use_mla
+                        else kv_shape
+                    )
+                    permute_shape = not self.use_mla
+
                 xfer_buffers[layer_name] = torch.empty(
                     kv_shape, dtype=kv_dtype, device="cpu"
                 )
+                if permute_shape:
+                    xfer_buffers[layer_name] = xfer_buffers[layer_name].permute(
+                        inv_order
+                    )
         except MemoryError as e:
             logger.error("NIXLConnectorWorker gets %s.", e)
             raise
diff --git a/vllm/platforms/xpu.py b/vllm/platforms/xpu.py
index 65516827a16da..18a3186b142f1 100644
--- a/vllm/platforms/xpu.py
+++ b/vllm/platforms/xpu.py
@@ -251,10 +251,6 @@ class XPUPlatform(Platform):
     ) -> None:
         """Copy blocks from src_cache to dst_cache on XPU."""
         _src_cache = src_cache[:, src_block_indices]
-        if _src_cache.shape[2:] != dst_cache.shape[2:]:
-            # To support TP_ratio, HOST KV might be initiated with HND
-            # while XPU device KV is with NHD
-            _src_cache = _src_cache.permute(0, 1, 3, 2, 4)
         dst_cache[:, dst_block_indices] = _src_cache.to(dst_cache.device)
 
     @classmethod
@@ -267,8 +263,4 @@ class XPUPlatform(Platform):
     ) -> None:
         """Copy blocks from XPU to host (CPU)."""
         _src_cache = src_cache[:, src_block_indices]
-        if _src_cache.shape[2:] != dst_cache.shape[2:]:
-            # XPU device KV is with NHD while HOST KV
-            # might be initiated with HND for TP_ratio support
-            _src_cache = _src_cache.permute(0, 1, 3, 2, 4)
         dst_cache[:, dst_block_indices] = _src_cache.cpu()

From 75648b16ddce1bff02c39c6f06be62a58385ff52 Mon Sep 17 00:00:00 2001
From: Charlie Fu <charlifu@amd.com>
Date: Fri, 21 Nov 2025 11:12:16 -0600
Subject: [PATCH 21/83] [ROCm][CI] Fix config/test_config_generation.py
 (#29142)

Signed-off-by: charlifu <charlifu@amd.com>
---
 docker/Dockerfile.rocm | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docker/Dockerfile.rocm b/docker/Dockerfile.rocm
index 731a97d93da1f..42466d1801cf6 100644
--- a/docker/Dockerfile.rocm
+++ b/docker/Dockerfile.rocm
@@ -7,6 +7,8 @@ FROM ${BASE_IMAGE} AS base
 
 ARG ARG_PYTORCH_ROCM_ARCH
 ENV PYTORCH_ROCM_ARCH=${ARG_PYTORCH_ROCM_ARCH:-${PYTORCH_ROCM_ARCH}}
+ENV RAY_EXPERIMENTAL_NOSET_ROCR_VISIBLE_DEVICES=1
+ENV RAY_EXPERIMENTAL_NOSET_HIP_VISIBLE_DEVICES=1
 
 # Install some basic utilities
 RUN apt-get update -q -y && apt-get install -q -y \
@@ -121,8 +123,6 @@ COPY --from=export_vllm /benchmarks ${COMMON_WORKDIR}/vllm/benchmarks
 COPY --from=export_vllm /examples ${COMMON_WORKDIR}/vllm/examples
 COPY --from=export_vllm /docker ${COMMON_WORKDIR}/vllm/docker
 
-ENV RAY_EXPERIMENTAL_NOSET_ROCR_VISIBLE_DEVICES=1
-ENV RAY_EXPERIMENTAL_NOSET_HIP_VISIBLE_DEVICES=1
 ENV TOKENIZERS_PARALLELISM=false
 
 # ENV that can improve safe tensor loading, and end-to-end time

From ceca06050124a10b33e78ee33d1a25a97edd1f74 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 22 Nov 2025 02:19:25 +0800
Subject: [PATCH 22/83] [Deprecation] Deprecate `seed=None` (#29185)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/engine/arg_utils.py | 19 ++++++++++++++-----
 1 file changed, 14 insertions(+), 5 deletions(-)

diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 6eaf328eb1655..888f57b1ac1df 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -367,7 +367,7 @@ class EngineArgs:
     config_format: str = ModelConfig.config_format
     dtype: ModelDType = ModelConfig.dtype
     kv_cache_dtype: CacheDType = CacheConfig.cache_dtype
-    seed: int | None = None
+    seed: int | None = 0
     max_model_len: int | None = ModelConfig.max_model_len
     cuda_graph_sizes: list[int] | None = CompilationConfig.cudagraph_capture_sizes
     cudagraph_capture_sizes: list[int] | None = (
@@ -1192,6 +1192,12 @@ class EngineArgs:
         # VLLM_ENABLE_V1_MULTIPROCESSING=0), so setting a seed here
         # doesn't affect the user process.
         if self.seed is None:
+            logger.warning_once(
+                "`seed=None` is equivalent to `seed=0` in V1 Engine. "
+                "You will no longer be allowed to pass `None` in v0.13.",
+                scope="local",
+            )
+
             self.seed = 0
             if not envs.VLLM_ENABLE_V1_MULTIPROCESSING:
                 logger.warning(
@@ -1203,28 +1209,31 @@ class EngineArgs:
                 )
 
         if self.disable_mm_preprocessor_cache:
-            logger.warning(
+            logger.warning_once(
                 "`--disable-mm-preprocessor-cache` is deprecated "
                 "and will be removed in v0.13. "
                 "Please use `--mm-processor-cache-gb 0` instead.",
+                scope="local",
             )
 
             self.mm_processor_cache_gb = 0
         elif envs.VLLM_MM_INPUT_CACHE_GIB != 4:
-            logger.warning(
+            logger.warning_once(
                 "VLLM_MM_INPUT_CACHE_GIB` is deprecated "
                 "and will be removed in v0.13. "
                 "Please use `--mm-processor-cache-gb %d` instead.",
                 envs.VLLM_MM_INPUT_CACHE_GIB,
+                scope="local",
             )
 
             self.mm_processor_cache_gb = envs.VLLM_MM_INPUT_CACHE_GIB
 
         if self.enable_multimodal_encoder_data_parallel:
-            logger.warning(
+            logger.warning_once(
                 "--enable-multimodal-encoder-data-parallel` is deprecated "
                 "and will be removed in v0.13. "
-                "Please use `--mm-encoder-tp-mode data` instead."
+                "Please use `--mm-encoder-tp-mode data` instead.",
+                scope="local",
             )
 
             self.mm_encoder_tp_mode = "data"

From 1bed891f72a6cbd32c0c75dfaa29ad21d7a68b75 Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Fri, 21 Nov 2025 10:21:40 -0800
Subject: [PATCH 23/83] [Chore] Fix pre-commit error after #25266 (#29190)

---
 vllm/v1/worker/gpu/async_utils.py     | 20 +++++++++++---------
 vllm/v1/worker/gpu/attn_utils.py      | 14 ++++++++------
 vllm/v1/worker/gpu/cudagraph_utils.py | 12 ++++++++++--
 vllm/v1/worker/gpu/model_runner.py    | 16 ++++++++++------
 vllm/v1/worker/gpu/sampler.py         |  2 +-
 5 files changed, 40 insertions(+), 24 deletions(-)

diff --git a/vllm/v1/worker/gpu/async_utils.py b/vllm/v1/worker/gpu/async_utils.py
index 638ec6fb0b082..e523090aa2172 100644
--- a/vllm/v1/worker/gpu/async_utils.py
+++ b/vllm/v1/worker/gpu/async_utils.py
@@ -7,6 +7,7 @@ import torch
 
 from vllm.v1.outputs import (
     AsyncModelRunnerOutput,
+    LogprobsTensors,
     ModelRunnerOutput,
     SamplerOutput,
 )
@@ -46,15 +47,18 @@ class AsyncOutput(AsyncModelRunnerOutput):
                 "cpu", non_blocking=True
             )
             if sampler_output.logprobs_tensors is not None:
-                self.logprobs_tensors = (
+                self.logprobs_tensors: LogprobsTensors | None = (
                     sampler_output.logprobs_tensors.to_cpu_nonblocking()
                 )
             else:
                 self.logprobs_tensors = None
-            self.prompt_logprobs_dict = {}
+            self.prompt_logprobs_dict: dict[str, LogprobsTensors | None] = {}
             if self.model_runner_output.prompt_logprobs_dict:
                 for k, v in self.model_runner_output.prompt_logprobs_dict.items():
-                    self.prompt_logprobs_dict[k] = v.to_cpu_nonblocking()
+                    if v is not None:
+                        self.prompt_logprobs_dict[k] = v.to_cpu_nonblocking()
+                    else:
+                        self.prompt_logprobs_dict[k] = None
             self.copy_event.record(self.copy_stream)
 
     def get_output(self) -> ModelRunnerOutput:
@@ -64,12 +68,10 @@ class AsyncOutput(AsyncModelRunnerOutput):
         # the existing model runner.
         # Going forward, we should keep the data structures as NumPy arrays
         # rather than Python lists.
-        sampled_token_ids_np = self.sampled_token_ids.numpy()
-        num_reqs = sampled_token_ids_np.shape[0]
-        sampled_token_ids: list[np.ndarray] = [
-            sampled_token_ids_np[i, : self.num_sampled_tokens[i]]
-            for i in range(num_reqs)
-        ]
+        sampled_token_ids: list[list[int]] = self.sampled_token_ids.tolist()
+        num_reqs = len(sampled_token_ids)
+        for i in range(num_reqs):
+            del sampled_token_ids[i][self.num_sampled_tokens[i] :]
         self.model_runner_output.sampled_token_ids = sampled_token_ids
 
         if self.logprobs_tensors is not None:
diff --git a/vllm/v1/worker/gpu/attn_utils.py b/vllm/v1/worker/gpu/attn_utils.py
index 8850c18092299..222db565dff17 100644
--- a/vllm/v1/worker/gpu/attn_utils.py
+++ b/vllm/v1/worker/gpu/attn_utils.py
@@ -1,7 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from collections.abc import Sequence
-from typing import Any
+from typing import Any, cast
 
 import torch
 
@@ -13,6 +13,7 @@ from vllm.v1.attention.backends.utils import (
     CommonAttentionMetadata,
 )
 from vllm.v1.kv_cache_interface import (
+    AttentionSpec,
     KVCacheConfig,
     KVCacheSpec,
 )
@@ -22,7 +23,8 @@ from vllm.v1.worker.utils import bind_kv_cache
 
 def get_kv_cache_spec(vllm_config: VllmConfig) -> dict[str, KVCacheSpec]:
     kv_cache_spec: dict[str, KVCacheSpec] = {}
-    attn_layers = get_layers_from_vllm_config(vllm_config, AttentionLayerBase)
+    layer_type = cast(type[Any], AttentionLayerBase)
+    attn_layers = get_layers_from_vllm_config(vllm_config, layer_type)
     for layer_name, attn_module in attn_layers.items():
         # Skip modules that don't need KV cache (eg encoder-only attention)
         if spec := attn_module.get_kv_cache_spec(vllm_config):
@@ -35,16 +37,15 @@ def init_attn_backend(
     vllm_config: VllmConfig,
     device: torch.device,
 ):
-    attn_backends: dict[str, AttentionBackend] = {}
+    attn_backends: dict[str, type[AttentionBackend]] = {}
     attn_metadata_builders: list[AttentionMetadataBuilder] = []
     flashinfer_workspace: torch.Tensor | None = None
     for kv_cache_group_spec in kv_cache_config.kv_cache_groups:
         layer_names = kv_cache_group_spec.layer_names
         any_layer_name = next(iter(layer_names))
 
-        attn_layers = get_layers_from_vllm_config(
-            vllm_config, AttentionLayerBase, layer_names
-        )
+        layer_type = cast(type[Any], AttentionLayerBase)
+        attn_layers = get_layers_from_vllm_config(vllm_config, layer_type, layer_names)
         attn_backend = attn_layers[any_layer_name].get_attn_backend()
         for layer_name in layer_names:
             attn_backends[layer_name] = attn_backend
@@ -93,6 +94,7 @@ def _reshape_kv_cache(
     kv_caches: dict[str, torch.Tensor] = {}
     for kv_cache_group_spec in kv_cache_config.kv_cache_groups:
         kv_cache_spec = kv_cache_group_spec.kv_cache_spec
+        assert isinstance(kv_cache_spec, AttentionSpec)
         for layer_name in kv_cache_group_spec.layer_names:
             raw_tensor = kv_cache_raw_tensors[layer_name]
             assert raw_tensor.numel() % kv_cache_spec.page_size_bytes == 0
diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
index 7fd1f76669f48..31a706475243c 100644
--- a/vllm/v1/worker/gpu/cudagraph_utils.py
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -34,8 +34,16 @@ class CudaGraphManager:
         self.compilation_config = vllm_config.compilation_config
         assert self.compilation_config is not None
 
-        self.cudagraph_mode = self.compilation_config.cudagraph_mode
-        self.cudagraph_sizes = sorted(self.compilation_config.cudagraph_capture_sizes)
+        if self.compilation_config.cudagraph_mode is None:
+            self.cudagraph_mode = CUDAGraphMode.NONE
+        else:
+            self.cudagraph_mode = self.compilation_config.cudagraph_mode
+        if self.compilation_config.cudagraph_capture_sizes is not None:
+            self.cudagraph_sizes = sorted(
+                self.compilation_config.cudagraph_capture_sizes
+            )
+        else:
+            self.cudagraph_sizes = []
         self.padded_sizes = self._init_padded_sizes()
 
         self.graphs: dict[int, torch.cuda.CUDAGraph] = {}
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
index 08aad9ddd06b3..9ca37ff282d82 100644
--- a/vllm/v1/worker/gpu/model_runner.py
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -329,8 +329,9 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             torch.cuda.synchronize()
 
     def update_states(self, scheduler_output: SchedulerOutput) -> None:
-        for req_id in scheduler_output.preempted_req_ids:
-            self.req_states.remove_request(req_id)
+        if scheduler_output.preempted_req_ids is not None:
+            for req_id in scheduler_output.preempted_req_ids:
+                self.req_states.remove_request(req_id)
         for req_id in scheduler_output.finished_req_ids:
             self.req_states.remove_request(req_id)
 
@@ -346,6 +347,9 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
 
         # Add new requests.
         for new_req_data in scheduler_output.scheduled_new_reqs:
+            assert new_req_data.prompt_token_ids is not None
+            assert new_req_data.prefill_token_ids is not None
+            assert new_req_data.sampling_params is not None
             req_id = new_req_data.req_id
             self.req_states.add_request(
                 req_id=req_id,
@@ -398,8 +402,8 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         # Decode first, then prefill.
         # batch_idx -> req_id
         req_ids = sorted(
-            scheduler_output.num_scheduled_tokens,
-            key=scheduler_output.num_scheduled_tokens.get,
+            scheduler_output.num_scheduled_tokens.keys(),
+            key=lambda k: scheduler_output.num_scheduled_tokens[k],
         )
         num_scheduled_tokens = np.array(
             [scheduler_output.num_scheduled_tokens[i] for i in req_ids], dtype=np.int32
@@ -637,9 +641,9 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         model_runner_output = ModelRunnerOutput(
             req_ids=input_batch.req_ids,
             req_id_to_index={req_id: i for i, req_id in enumerate(input_batch.req_ids)},
-            sampled_token_ids=None,
+            sampled_token_ids=None,  # type: ignore
             logprobs=None,
-            prompt_logprobs_dict=prompt_logprobs_dict,
+            prompt_logprobs_dict=prompt_logprobs_dict,  # type: ignore
             pooler_output=[],
             kv_connector_output=None,
             num_nans_in_logits=None,
diff --git a/vllm/v1/worker/gpu/sampler.py b/vllm/v1/worker/gpu/sampler.py
index e916aadb6b5a0..55f98ca6bb6a3 100644
--- a/vllm/v1/worker/gpu/sampler.py
+++ b/vllm/v1/worker/gpu/sampler.py
@@ -8,8 +8,8 @@ import triton.language as tl
 
 from vllm.config.model import LogprobsMode
 from vllm.v1.outputs import LogprobsTensors, SamplerOutput
-from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.sample.ops.topk_topp_sampler import apply_top_k_top_p
+from vllm.v1.worker.gpu.states import SamplingMetadata
 
 
 class Sampler:

From 1840c5cb1818ae036cb4d8276d37ce81142acbee Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Fri, 21 Nov 2025 14:41:52 -0500
Subject: [PATCH 24/83] [BugFix] Make sure to allocate worst case MoE workspace
 during profile run in the DP + EP case (#27426)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
---
 vllm/envs.py                                  |  4 +-
 .../layers/fused_moe/modular_kernel.py        | 41 +++++++++++++++++++
 2 files changed, 43 insertions(+), 2 deletions(-)

diff --git a/vllm/envs.py b/vllm/envs.py
index d2d6917403420..9b1ed1fc680b4 100755
--- a/vllm/envs.py
+++ b/vllm/envs.py
@@ -55,7 +55,7 @@ if TYPE_CHECKING:
     VLLM_CPU_SGL_KERNEL: bool = False
     VLLM_XLA_CACHE_PATH: str = os.path.join(VLLM_CACHE_ROOT, "xla_cache")
     VLLM_XLA_CHECK_RECOMPILATION: bool = False
-    VLLM_FUSED_MOE_CHUNK_SIZE: int = 64 * 1024
+    VLLM_FUSED_MOE_CHUNK_SIZE: int = 16 * 1024
     VLLM_ENABLE_FUSED_MOE_ACTIVATION_CHUNKING: bool = True
     VLLM_USE_RAY_COMPILED_DAG_CHANNEL_TYPE: Literal["auto", "nccl", "shm"] = "auto"
     VLLM_USE_RAY_COMPILED_DAG_OVERLAP_COMM: bool = False
@@ -785,7 +785,7 @@ environment_variables: dict[str, Callable[[], Any]] = {
     # Enable SPMD mode for TPU backend.
     "VLLM_XLA_USE_SPMD": lambda: bool(int(os.getenv("VLLM_XLA_USE_SPMD", "0"))),
     "VLLM_FUSED_MOE_CHUNK_SIZE": lambda: int(
-        os.getenv("VLLM_FUSED_MOE_CHUNK_SIZE", "32768")
+        os.getenv("VLLM_FUSED_MOE_CHUNK_SIZE", str(16 * 1024))
     ),
     # Control whether to use fused MoE activation chunking. Current chunking
     # logic is incompatible with torch.compile and causes IMA. See issue
diff --git a/vllm/model_executor/layers/fused_moe/modular_kernel.py b/vllm/model_executor/layers/fused_moe/modular_kernel.py
index 4af7af9257dfa..b2af58cdca887 100644
--- a/vllm/model_executor/layers/fused_moe/modular_kernel.py
+++ b/vllm/model_executor/layers/fused_moe/modular_kernel.py
@@ -10,6 +10,9 @@ from typing import final
 import torch
 
 import vllm.envs as envs
+from vllm.config import get_current_vllm_config
+from vllm.forward_context import get_forward_context, is_forward_context_available
+from vllm.logger import init_logger
 from vllm.model_executor.layers.fused_moe.config import FusedMoEQuantConfig
 from vllm.model_executor.layers.fused_moe.utils import (
     _resize_cache,
@@ -26,6 +29,8 @@ from vllm.v1.worker.ubatching import (
     dbo_yield,
 )
 
+logger = init_logger(__name__)
+
 #
 # This file defines a set of base classes used to make MoE kernels more modular.
 # The goal is to be able to utilize different communication mechanisms with
@@ -798,6 +803,42 @@ class FusedMoEModularKernel(torch.nn.Module):
         buffers = self.shared_buffers[ubatch_idx]
         workspace_dtype = self.fused_experts.workspace_dtype(out_dtype)
 
+        # Force worst-case allocation in profiling run for
+        # "mk.FusedMoEModularKernel.Standard" formats where this is only bounded
+        # by `VLLM_FUSED_MOE_CHUNK_SIZE` and may not be seen during profiling with
+        # DP+EP due to the random token routing.
+        is_profile_run = (
+            is_forward_context_available()
+            and get_forward_context().attn_metadata is None
+        )
+        if is_profile_run and self.fused_experts.supports_chunking():
+            parallel_config = get_current_vllm_config().parallel_config
+            is_dp_ep = (
+                parallel_config.data_parallel_size > 1
+                and parallel_config.enable_expert_parallel
+            )
+            if is_dp_ep:
+                max_workspace_13, max_workspace_2, max_fused_out_shape = (
+                    self.fused_experts.workspace_shapes(
+                        envs.VLLM_FUSED_MOE_CHUNK_SIZE,
+                        N,
+                        K,
+                        top_k,
+                        global_num_experts,
+                        local_num_experts,
+                        expert_tokens_meta,
+                    )
+                )
+                buffers.workspace13.get(
+                    max_workspace_13, device=device, dtype=workspace_dtype
+                )
+                buffers.workspace2.get(
+                    max_workspace_2, device=device, dtype=workspace_dtype
+                )
+                buffers.fused_out.get(
+                    max_fused_out_shape, device=device, dtype=workspace_dtype
+                )
+
         # Get intermediate workspace shapes based off the chunked M size.
         workspace13_shape, workspace2_shape, _ = self.fused_experts.workspace_shapes(
             M_chunk,

From 53a1ba6ec584ea93531a3195b3b9f8049786055b Mon Sep 17 00:00:00 2001
From: Ning Xie <andy.xning@gmail.com>
Date: Sat, 22 Nov 2025 05:06:09 +0800
Subject: [PATCH 25/83] [log] add weights loading time log to sharded_state
 loader (#28628)

Signed-off-by: Andy Xie <andy.xning@gmail.com>
---
 vllm/model_executor/model_loader/sharded_state_loader.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/vllm/model_executor/model_loader/sharded_state_loader.py b/vllm/model_executor/model_loader/sharded_state_loader.py
index d94dbd9f06e0b..1538f0c2af655 100644
--- a/vllm/model_executor/model_loader/sharded_state_loader.py
+++ b/vllm/model_executor/model_loader/sharded_state_loader.py
@@ -4,6 +4,7 @@
 import collections
 import glob
 import os
+import time
 from collections.abc import Generator
 from typing import Any
 
@@ -132,6 +133,7 @@ class ShardedStateLoader(BaseModelLoader):
                 f"pre-sharded checkpoints are currently supported!"
             )
         state_dict = self._filter_subtensors(model.state_dict())
+        counter_before_loading_weights = time.perf_counter()
         for key, tensor in self.iterate_over_files(filepaths):
             # If loading with LoRA enabled, additional padding may
             # be added to certain parameters. We only load into a
@@ -150,6 +152,12 @@ class ShardedStateLoader(BaseModelLoader):
                 )
             param_data.copy_(tensor)
             state_dict.pop(key)
+        counter_after_loading_weights = time.perf_counter()
+        logger.info_once(
+            "Loading weights took %.2f seconds",
+            counter_after_loading_weights - counter_before_loading_weights,
+            scope="local",
+        )
         if state_dict:
             raise ValueError(f"Missing keys {tuple(state_dict)} in loaded state!")
 

From c68c7b403dce632dbbbb6d2482ea86fe7bf53d51 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Fri, 21 Nov 2025 16:58:32 -0500
Subject: [PATCH 26/83] [BugFix] Fix missing symbol triggering FA2 fallback on
 Hopper (#29107)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
---
 cmake/external_projects/vllm_flash_attn.cmake | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/cmake/external_projects/vllm_flash_attn.cmake b/cmake/external_projects/vllm_flash_attn.cmake
index 6cc5cda14c525..ff687e0af7b44 100644
--- a/cmake/external_projects/vllm_flash_attn.cmake
+++ b/cmake/external_projects/vllm_flash_attn.cmake
@@ -38,7 +38,7 @@ else()
   FetchContent_Declare(
           vllm-flash-attn
           GIT_REPOSITORY https://github.com/vllm-project/flash-attention.git
-          GIT_TAG 71bb26f6295449be880344b93b51791cc009237d
+          GIT_TAG 86f8f157cf82aa2342743752b97788922dd7de43
           GIT_PROGRESS TRUE
           # Don't share the vllm-flash-attn build between build types
           BINARY_DIR ${CMAKE_BINARY_DIR}/vllm-flash-attn

From 57430fc95c8a94a7c68b3d525e3b8823b0f2433f Mon Sep 17 00:00:00 2001
From: Julien Denize <40604584+juliendenize@users.noreply.github.com>
Date: Fri, 21 Nov 2025 22:58:59 +0100
Subject: [PATCH 27/83] Default model load/config/tokenizer to `mistral` format
 if relevant files exist (#28659)

Signed-off-by: Julien Denize <julien.denize@mistral.ai>
Signed-off-by: Julien Denize <40604584+juliendenize@users.noreply.github.com>
Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: Michael Goin <mgoin64@gmail.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
---
 docs/features/tool_calling.md                 | 23 +++++--
 .../language/generation/test_mistral.py       |  2 +-
 tests/models/multimodal/test_mapping.py       | 14 ++++-
 .../models/quantization/test_bitsandbytes.py  |  3 +
 tests/tool_use/utils.py                       |  6 ++
 tests/transformers_utils/test_config.py       | 62 +++++++++++++++++++
 tests/transformers_utils/test_utils.py        |  6 +-
 .../llm/test_struct_output_generate.py        | 14 ++++-
 vllm/config/model.py                          |  9 +--
 vllm/model_executor/model_loader/__init__.py  |  2 +
 .../model_loader/default_loader.py            | 20 +++++-
 vllm/transformers_utils/config.py             | 46 +++++++++++++-
 vllm/transformers_utils/configs/mistral.py    |  2 +-
 vllm/transformers_utils/tokenizer.py          | 30 +++++----
 vllm/v1/engine/processor.py                   | 25 +++++++-
 15 files changed, 230 insertions(+), 34 deletions(-)
 create mode 100644 tests/transformers_utils/test_config.py

diff --git a/docs/features/tool_calling.md b/docs/features/tool_calling.md
index 7e6c69e717dba..dd79ba19b7247 100644
--- a/docs/features/tool_calling.md
+++ b/docs/features/tool_calling.md
@@ -142,7 +142,7 @@ Flags: `--tool-call-parser hermes`
 Supported models:
 
 * `mistralai/Mistral-7B-Instruct-v0.3` (confirmed)
-* Additional mistral function-calling models are compatible as well.
+* Additional Mistral function-calling models are compatible as well.
 
 Known issues:
 
@@ -158,12 +158,25 @@ Known issues:
 
 Recommended flags:
 
-1. To use [mistral-common](https://github.com/mistralai/mistral-common) the official Mistral tokenization backend:
+1. To use the official Mistral AI's format:
 
-    `--tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral`
+    `--tool-call-parser mistral`
 
-2. To use the default Transformers tokenization backend:
-    `--tool-call-parser mistral --chat-template examples/tool_chat_template_mistral_parallel.jinja`
+2. To use the Transformers format when available:
+
+    `--tokenizer_mode hf --config_format hf --load_format hf --tool-call-parser mistral --chat-template examples/tool_chat_template_mistral_parallel.jinja`
+
+!!! note
+    Models officially released by Mistral AI have two possible formats:
+
+    1. The official format that is used by default with `auto` or `mistral` arguments:
+
+        `--tokenizer_mode mistral --config_format mistral --load_format mistral`
+        This format uses [mistral-common](https://github.com/mistralai/mistral-common), the Mistral AI's tokenizer backend.
+
+    2. The Transformers format, when available, that is used with `hf` arguments:
+
+        `--tokenizer_mode hf --config_format hf --load_format hf --chat-template examples/tool_chat_template_mistral_parallel.jinja`
 
 ### Llama Models (`llama3_json`)
 
diff --git a/tests/models/language/generation/test_mistral.py b/tests/models/language/generation/test_mistral.py
index 0ae83ec16020a..80e337d570a36 100644
--- a/tests/models/language/generation/test_mistral.py
+++ b/tests/models/language/generation/test_mistral.py
@@ -208,7 +208,7 @@ def test_mistral_format(
     with vllm_runner(
         model,
         dtype=dtype,
-        tokenizer_mode="auto",
+        tokenizer_mode="hf",
         load_format="safetensors",
         config_format="hf",
     ) as hf_format_model:
diff --git a/tests/models/multimodal/test_mapping.py b/tests/models/multimodal/test_mapping.py
index 2f38dc450ef96..0d2eaca95504e 100644
--- a/tests/models/multimodal/test_mapping.py
+++ b/tests/models/multimodal/test_mapping.py
@@ -50,12 +50,24 @@ def test_hf_model_weights_mapper(model_arch: str):
     model_info.check_available_online(on_fail="skip")
     model_info.check_transformers_version(on_fail="skip")
 
+    is_mistral_model = model_arch in [
+        "Mistral3ForConditionalGeneration",
+        "PixtralForConditionalGeneration",
+        "VoxtralForConditionalGeneration",
+    ]
+
+    if not is_mistral_model or model_info.tokenizer_mode == "mistral":
+        tokenizer_mode = model_info.tokenizer_mode
+    else:
+        tokenizer_mode = "hf"
+
     model_id = model_info.default
 
     model_config = ModelConfig(
         model_id,
         tokenizer=model_info.tokenizer or model_id,
-        tokenizer_mode=model_info.tokenizer_mode,
+        tokenizer_mode=tokenizer_mode,
+        config_format="hf",
         revision=model_info.revision,
         trust_remote_code=model_info.trust_remote_code,
         hf_overrides=model_info.hf_overrides,
diff --git a/tests/models/quantization/test_bitsandbytes.py b/tests/models/quantization/test_bitsandbytes.py
index dc4b4546e451b..5b8aaa299fdc1 100644
--- a/tests/models/quantization/test_bitsandbytes.py
+++ b/tests/models/quantization/test_bitsandbytes.py
@@ -259,6 +259,9 @@ def validate_generated_texts(
         tensor_parallel_size=vllm_tp_size,
         enforce_eager=False,
         default_torch_num_threads=1,
+        tokenizer_mode="hf",
+        load_format="hf",
+        config_format="hf",
     ) as llm:
         vllm_outputs = llm.generate_greedy(prompts, max_tokens)
         vllm_logs = log_generated_texts(prompts, vllm_outputs, "VllmRunner")
diff --git a/tests/tool_use/utils.py b/tests/tool_use/utils.py
index d188b21863812..7584b903156b7 100644
--- a/tests/tool_use/utils.py
+++ b/tests/tool_use/utils.py
@@ -128,6 +128,12 @@ CONFIGS: dict[str, ServerConfig] = {
         "arguments": [
             "--enforce-eager",
             "--no-enable-prefix-caching",
+            "--tokenizer_mode",
+            "hf",
+            "--load_format",
+            "hf",
+            "--config_format",
+            "hf",
             "--tool-call-parser",
             "mistral",
             "--chat-template",
diff --git a/tests/transformers_utils/test_config.py b/tests/transformers_utils/test_config.py
new file mode 100644
index 0000000000000..de28ab5f99e8c
--- /dev/null
+++ b/tests/transformers_utils/test_config.py
@@ -0,0 +1,62 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+
+import tempfile
+from pathlib import Path
+from unittest.mock import MagicMock, call, patch
+
+import pytest
+
+from vllm.transformers_utils.config import list_filtered_repo_files
+
+
+@pytest.mark.parametrize(
+    "allow_patterns,expected_relative_files",
+    [
+        (
+            ["*.json", "correct*.txt"],
+            ["json_file.json", "subfolder/correct.txt", "correct_2.txt"],
+        ),
+    ],
+)
+def test_list_filtered_repo_files(
+    allow_patterns: list[str], expected_relative_files: list[str]
+):
+    with tempfile.TemporaryDirectory() as tmp_dir:
+        # Prep folder and files
+        path_tmp_dir = Path(tmp_dir)
+        subfolder = path_tmp_dir / "subfolder"
+        subfolder.mkdir()
+        (path_tmp_dir / "json_file.json").touch()
+        (path_tmp_dir / "correct_2.txt").touch()
+        (path_tmp_dir / "uncorrect.txt").touch()
+        (path_tmp_dir / "uncorrect.jpeg").touch()
+        (subfolder / "correct.txt").touch()
+        (subfolder / "uncorrect_sub.txt").touch()
+
+        def _glob_path() -> list[str]:
+            return [
+                str(file.relative_to(path_tmp_dir))
+                for file in path_tmp_dir.glob("**/*")
+                if file.is_file()
+            ]
+
+        # Patch list_repo_files called by fn
+        with patch(
+            "vllm.transformers_utils.config.list_repo_files",
+            MagicMock(return_value=_glob_path()),
+        ) as mock_list_repo_files:
+            out_files = sorted(
+                list_filtered_repo_files(
+                    tmp_dir, allow_patterns, "revision", "model", "token"
+                )
+            )
+        assert out_files == sorted(expected_relative_files)
+        assert mock_list_repo_files.call_count == 1
+        assert mock_list_repo_files.call_args_list[0] == call(
+            repo_id=tmp_dir,
+            revision="revision",
+            repo_type="model",
+            token="token",
+        )
diff --git a/tests/transformers_utils/test_utils.py b/tests/transformers_utils/test_utils.py
index beaef04d766bf..bfe1cec76c138 100644
--- a/tests/transformers_utils/test_utils.py
+++ b/tests/transformers_utils/test_utils.py
@@ -2,7 +2,11 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
 
-from vllm.transformers_utils.utils import is_cloud_storage, is_gcs, is_s3
+from vllm.transformers_utils.utils import (
+    is_cloud_storage,
+    is_gcs,
+    is_s3,
+)
 
 
 def test_is_gcs():
diff --git a/tests/v1/entrypoints/llm/test_struct_output_generate.py b/tests/v1/entrypoints/llm/test_struct_output_generate.py
index a00600b87eca1..d1b037b7956cf 100644
--- a/tests/v1/entrypoints/llm/test_struct_output_generate.py
+++ b/tests/v1/entrypoints/llm/test_struct_output_generate.py
@@ -46,11 +46,15 @@ EAGLE_SPEC_CONFIG = {
 
 PARAMS_MODELS_BACKENDS_TOKENIZER_MODE = [
     ("mistralai/Ministral-8B-Instruct-2410", "xgrammar", "auto", None),
-    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto", None),
+    # FIXME: Since "auto" will use Mistral tokenizer and these backends do not support
+    # it, we skip these tests for now.
+    # ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto", None),
+    # ("mistralai/Ministral-8B-Instruct-2410", "lm-format-enforcer", "auto", None),
+    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "hf", None),
     pytest.param(
         "mistralai/Ministral-8B-Instruct-2410",
         "lm-format-enforcer",
-        "auto",
+        "hf",
         None,
         marks=pytest.mark.skip(
             reason=(
@@ -80,7 +84,7 @@ PARAMS_MODELS_BACKENDS_TOKENIZER_MODE = [
     # ("mistralai/Ministral-8B-Instruct-2410", "outlines", "mistral", None),
     # ("Qwen/Qwen2.5-1.5B-Instruct", "guidance", "auto"),
     ("mistralai/Ministral-8B-Instruct-2410", "outlines", "auto", NGRAM_SPEC_CONFIG),
-    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "auto", NGRAM_SPEC_CONFIG),
+    ("mistralai/Ministral-8B-Instruct-2410", "guidance", "hf", NGRAM_SPEC_CONFIG),
     ("Qwen/Qwen2.5-1.5B-Instruct", "xgrammar", "auto", NGRAM_SPEC_CONFIG),
     ("meta-llama/Meta-Llama-3.1-8B-Instruct", "xgrammar", "auto", EAGLE_SPEC_CONFIG),
 ]
@@ -151,6 +155,8 @@ def test_structured_output(
         ),
         seed=120,
         tokenizer_mode=tokenizer_mode,
+        load_format="auto" if not model_name.startswith("mistralai/") else "hf",
+        config_format="auto" if not model_name.startswith("mistralai/") else "hf",
         speculative_config=speculative_config,
     )
 
@@ -720,6 +726,8 @@ def test_structured_output_auto_mode(
         max_model_len=1024,
         structured_outputs_config=dict(backend="auto"),
         tokenizer_mode=tokenizer_mode,
+        load_format="auto",
+        config_format="auto",
     )
 
     sampling_params = SamplingParams(
diff --git a/vllm/config/model.py b/vllm/config/model.py
index 8f59673f4e1c3..49688e17cf932 100644
--- a/vllm/config/model.py
+++ b/vllm/config/model.py
@@ -81,7 +81,7 @@ TaskOption = Literal[
     "transcription",
     "draft",
 ]
-TokenizerMode = Literal["auto", "slow", "mistral", "custom"]
+TokenizerMode = Literal["auto", "hf", "slow", "mistral", "custom"]
 ModelDType = Literal["auto", "half", "float16", "bfloat16", "float", "float32"]
 LogprobsMode = Literal[
     "raw_logits", "raw_logprobs", "processed_logits", "processed_logprobs"
@@ -130,7 +130,8 @@ class ModelConfig:
     name or path will be used."""
     tokenizer_mode: TokenizerMode = "auto"
     """Tokenizer mode:\n
-    - "auto" will use the fast tokenizer if available.\n
+    - "auto" will use "hf" tokenizer if Mistral's tokenizer is not available.\n
+    - "hf" will use the fast tokenizer if available.\n
     - "slow" will always use the slow tokenizer.\n
     - "mistral" will always use the tokenizer from `mistral_common`.\n
     - "custom" will use --tokenizer to select the preregistered tokenizer."""
@@ -241,8 +242,8 @@ class ModelConfig:
     first one."""
     config_format: str | ConfigFormat = "auto"
     """The format of the model config to load:\n
-    - "auto" will try to load the config in hf format if available else it
-    will try to load in mistral format.\n
+    - "auto" will try to load the config in hf format if available after trying
+    to load in mistral format.\n
     - "hf" will load the config in hf format.\n
     - "mistral" will load the config in mistral format."""
     hf_token: bool | str | None = None
diff --git a/vllm/model_executor/model_loader/__init__.py b/vllm/model_executor/model_loader/__init__.py
index 301f2d00bf404..052d2cfc1099e 100644
--- a/vllm/model_executor/model_loader/__init__.py
+++ b/vllm/model_executor/model_loader/__init__.py
@@ -30,6 +30,7 @@ logger = init_logger(__name__)
 # if a new load format is added here
 LoadFormats = Literal[
     "auto",
+    "hf",
     "bitsandbytes",
     "dummy",
     "fastsafetensors",
@@ -45,6 +46,7 @@ LoadFormats = Literal[
 ]
 _LOAD_FORMAT_TO_MODEL_LOADER: dict[str, type[BaseModelLoader]] = {
     "auto": DefaultModelLoader,
+    "hf": DefaultModelLoader,
     "bitsandbytes": BitsAndBytesModelLoader,
     "dummy": DummyModelLoader,
     "fastsafetensors": DefaultModelLoader,
diff --git a/vllm/model_executor/model_loader/default_loader.py b/vllm/model_executor/model_loader/default_loader.py
index 67aa584c6bda2..7401a7a0e2dbb 100644
--- a/vllm/model_executor/model_loader/default_loader.py
+++ b/vllm/model_executor/model_loader/default_loader.py
@@ -31,6 +31,7 @@ from vllm.model_executor.model_loader.weight_utils import (
     safetensors_weights_iterator,
 )
 from vllm.platforms import current_platform
+from vllm.transformers_utils.config import list_filtered_repo_files
 
 logger = init_logger(__name__)
 
@@ -96,8 +97,25 @@ class DefaultModelLoader(BaseModelLoader):
         load_format = self.load_config.load_format
         use_safetensors = False
         index_file = SAFE_WEIGHTS_INDEX_NAME
-        # Some quantized models use .pt files for storing the weights.
+
+        # First check for 'auto' format that mistral files format are present.
+        # This is to load mistral models with official format by default.
         if load_format == "auto":
+            load_format = (
+                "mistral"
+                if len(
+                    list_filtered_repo_files(
+                        model_name_or_path=model_name_or_path,
+                        allow_patterns=["consolidated*.safetensors"],
+                        revision=revision,
+                    )
+                )
+                > 0
+                else "hf"
+            )
+
+        # Some quantized models use .pt files for storing the weights.
+        if load_format == "hf":
             allow_patterns = ["*.safetensors", "*.bin"]
         elif load_format == "safetensors" or load_format == "fastsafetensors":
             use_safetensors = True
diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index df24738477e76..9eac7bb50afa6 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -1,6 +1,7 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import fnmatch
 import json
 import os
 import time
@@ -355,6 +356,41 @@ def list_repo_files(
     return with_retry(lookup_files, "Error retrieving file list")
 
 
+def list_filtered_repo_files(
+    model_name_or_path: str,
+    allow_patterns: list[str],
+    revision: str | None = None,
+    repo_type: str | None = None,
+    token: str | bool | None = None,
+) -> list[str]:
+    try:
+        all_files = list_repo_files(
+            repo_id=model_name_or_path,
+            revision=revision,
+            token=token,
+            repo_type=repo_type,
+        )
+    except Exception:
+        logger.error(
+            "Error retrieving file list. Please ensure your `model_name_or_path`"
+            "`repo_type`, `token` and `revision` arguments are correctly set. "
+            "Returning an empty list."
+        )
+        return []
+
+    file_list = []
+    # Filter patterns on filenames
+    for pattern in allow_patterns:
+        file_list.extend(
+            [
+                file
+                for file in all_files
+                if fnmatch.fnmatch(os.path.basename(file), pattern)
+            ]
+        )
+    return file_list
+
+
 def file_exists(
     repo_id: str,
     file_name: str,
@@ -619,10 +655,14 @@ def get_config(
 
     if config_format == "auto":
         try:
-            if is_gguf or file_or_path_exists(model, HF_CONFIG_NAME, revision=revision):
-                config_format = "hf"
-            elif file_or_path_exists(model, MISTRAL_CONFIG_NAME, revision=revision):
+            # First check for Mistral to avoid defaulting to
+            # Transformers implementation.
+            if file_or_path_exists(model, MISTRAL_CONFIG_NAME, revision=revision):
                 config_format = "mistral"
+            elif is_gguf or file_or_path_exists(
+                model, HF_CONFIG_NAME, revision=revision
+            ):
+                config_format = "hf"
             else:
                 raise ValueError(
                     "Could not detect config format for no config file found. "
diff --git a/vllm/transformers_utils/configs/mistral.py b/vllm/transformers_utils/configs/mistral.py
index fe202b2ed1568..8da4ab35c56c3 100644
--- a/vllm/transformers_utils/configs/mistral.py
+++ b/vllm/transformers_utils/configs/mistral.py
@@ -118,7 +118,7 @@ def _remap_general_mistral_args(config: dict) -> dict:
         "model_type": ("model_type", "transformer"),
         "hidden_act": ("activation", "silu"),
         "tie_word_embeddings": ("tied_embeddings", False),
-        "max_seq_len": ("max_seq_len", 128_000),
+        "max_seq_len": ("max_seq_len", config.get("max_position_embeddings", 128_000)),
         "max_position_embeddings": ("max_position_embeddings", 128_000),
     }
 
diff --git a/vllm/transformers_utils/tokenizer.py b/vllm/transformers_utils/tokenizer.py
index a393568909d27..233076741503d 100644
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@@ -3,8 +3,8 @@
 
 import contextlib
 import copy
+import importlib.util
 import os
-import warnings
 from functools import lru_cache
 from pathlib import Path
 from typing import TYPE_CHECKING, Any, TypeAlias
@@ -15,7 +15,10 @@ from typing_extensions import assert_never
 
 from vllm import envs
 from vllm.logger import init_logger
-from vllm.transformers_utils.config import get_sentence_transformer_tokenizer_config
+from vllm.transformers_utils.config import (
+    get_sentence_transformer_tokenizer_config,
+    list_filtered_repo_files,
+)
 from vllm.transformers_utils.tokenizers import MistralTokenizer
 from vllm.transformers_utils.utils import check_gguf_file
 
@@ -182,25 +185,29 @@ def get_tokenizer(
         kwargs["gguf_file"] = Path(tokenizer_name).name
         tokenizer_name = Path(tokenizer_name).parent
 
-    # if tokenizer is from official mistral org
-    is_from_mistral_org = str(tokenizer_name).split("/")[0] == "mistralai"
-    if is_from_mistral_org and tokenizer_mode != "mistral":
-        warnings.warn(
-            "It is strongly recommended to run mistral models with "
-            '`--tokenizer-mode "mistral"` to ensure correct '
-            "encoding and decoding.",
-            FutureWarning,
-            stacklevel=2,
+    # if `tokenizer_mode` == "auto", check if tokenizer can be loaded via Mistral format
+    # first to use official Mistral tokenizer if possible.
+    mistral_common_installed = importlib.util.find_spec("mistral_common") is not None
+    if tokenizer_mode == "auto" and mistral_common_installed:
+        allow_patterns = ["tekken.json", "tokenizer.model.v*"]
+        files_list = list_filtered_repo_files(
+            model_name_or_path=str(tokenizer_name),
+            allow_patterns=allow_patterns,
+            revision=revision,
         )
+        if len(files_list) > 0:
+            tokenizer_mode = "mistral"
 
     tokenizer: AnyTokenizer
     if tokenizer_mode == "mistral":
+        logger.debug_once(f"Loading MistralTokenizer from {tokenizer_name}")
         tokenizer = MistralTokenizer.from_pretrained(
             str(tokenizer_name), revision=revision
         )
     elif tokenizer_mode == "custom":
         from vllm.transformers_utils.tokenizer_base import TokenizerRegistry
 
+        logger.debug_once(f"Loading CustomTokenizer from {tokenizer_name}")
         tokenizer = TokenizerRegistry.get_tokenizer(
             str(tokenizer_name),
             *args,
@@ -210,6 +217,7 @@ def get_tokenizer(
         )
     else:
         try:
+            logger.debug_once(f"Loading AutoTokenizer from {tokenizer_name}")
             tokenizer = AutoTokenizer.from_pretrained(
                 tokenizer_name,
                 *args,
diff --git a/vllm/v1/engine/processor.py b/vllm/v1/engine/processor.py
index 905ad406b307e..af4f0e410e253 100644
--- a/vllm/v1/engine/processor.py
+++ b/vllm/v1/engine/processor.py
@@ -20,6 +20,7 @@ from vllm.multimodal.utils import argsort_mm_positions
 from vllm.pooling_params import PoolingParams
 from vllm.sampling_params import SamplingParams
 from vllm.transformers_utils.tokenizer import AnyTokenizer
+from vllm.transformers_utils.tokenizers.mistral import MistralTokenizer
 from vllm.utils import length_from_prompt_token_ids_or_embeds
 from vllm.v1.engine import EngineCoreRequest
 from vllm.v1.metrics.stats import MultiModalCacheStats
@@ -300,12 +301,24 @@ class Processor:
             # allows <|special_token|> and similar, see
             # https://github.com/guidance-ai/llguidance/blob/main/docs/syntax.md#special-tokens
             # Without tokenizer these are disallowed in grammars.
+            if isinstance(self.tokenizer, MistralTokenizer):
+                raise ValueError(
+                    "Mistral tokenizer is not supported for the 'guidance' "
+                    "structured output backend. Please use ['xgrammar', 'outlines'] "
+                    "backends or tokenizer_mode='hf' instead."
+                )
             validate_guidance_grammar(params, tokenizer=None)
         elif backend == "outlines":
             # outlines backend
             validate_structured_output_request_outlines(params)
         elif backend == "lm-format-enforcer":
             # lm format enforcer backend
+            if isinstance(self.tokenizer, MistralTokenizer):
+                raise ValueError(
+                    "Mistral tokenizer is not supported for the 'lm-format-enforcer' "
+                    "structured output backend. Please use ['xgrammar', 'outlines'] "
+                    "backends or tokenizer_mode='hf' instead."
+                )
             validate_structured_output_request_lm_format_enforcer(params)
         else:
             # NOTE: backend must be "auto" here, because we have
@@ -320,9 +333,15 @@ class Processor:
             except ValueError:
                 # The request either failed validation
                 # or includes some jsonschema feature(s) that
-                # are not supported in xgrammar. Fall back to guidance.
-                validate_guidance_grammar(params, tokenizer=None)
-                params.structured_outputs._backend = "guidance"
+                # are not supported in xgrammar.
+                if isinstance(self.tokenizer, MistralTokenizer):
+                    # Fall back to outlines if the tokenizer is Mistral
+                    validate_structured_output_request_outlines(params)
+                    params.structured_outputs._backend = "outlines"
+                else:
+                    # Fall back to guidance by default.
+                    validate_guidance_grammar(params, tokenizer=None)
+                    params.structured_outputs._backend = "guidance"
             # Remember that this backend was set automatically
             params.structured_outputs._backend_was_auto = True
 

From 3137991f55c9372d4743154a56933a37e47feca7 Mon Sep 17 00:00:00 2001
From: Varun Sundar Rabindranath <varunsundar08@gmail.com>
Date: Fri, 21 Nov 2025 17:28:17 -0500
Subject: [PATCH 28/83] [BugFix] EPLB + B200 + DeepGEMM : Handle column-major
 scales tensor (#29162)

Signed-off-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
Co-authored-by: Varun Sundar Rabindranath <vsundarr@redhat.com>
---
 tests/distributed/eplb_utils.py               |  49 +++
 tests/distributed/test_eplb_execute.py        |  40 +--
 .../distributed/test_eplb_fused_moe_layer.py  | 285 ++++++++++++++++++
 vllm/model_executor/layers/fused_moe/layer.py |  41 +++
 4 files changed, 376 insertions(+), 39 deletions(-)
 create mode 100644 tests/distributed/eplb_utils.py
 create mode 100644 tests/distributed/test_eplb_fused_moe_layer.py

diff --git a/tests/distributed/eplb_utils.py b/tests/distributed/eplb_utils.py
new file mode 100644
index 0000000000000..27a63e0215148
--- /dev/null
+++ b/tests/distributed/eplb_utils.py
@@ -0,0 +1,49 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+import os
+import random
+
+import torch
+import torch.multiprocessing as mp
+
+from vllm.distributed.parallel_state import (
+    init_distributed_environment,
+)
+from vllm.utils.system_utils import update_environment_variables
+
+mp.set_start_method("spawn", force=True)
+
+
+def distributed_run(fn, world_size, *args):
+    number_of_processes = world_size
+    processes: list[mp.Process] = []
+    for i in range(number_of_processes):
+        env: dict[str, str] = {}
+        env["RANK"] = str(i)
+        env["LOCAL_RANK"] = str(i)
+        env["WORLD_SIZE"] = str(number_of_processes)
+        env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
+        env["MASTER_ADDR"] = "localhost"
+        env["MASTER_PORT"] = "12345"
+        p = mp.Process(target=fn, args=(env, world_size, *args))
+        processes.append(p)
+        p.start()
+
+    for p in processes:
+        p.join()
+
+    for p in processes:
+        assert p.exitcode == 0
+
+
+def set_env_vars_and_device(env: dict[str, str]) -> None:
+    update_environment_variables(env)
+    local_rank = os.environ["LOCAL_RANK"]
+    device = torch.device(f"cuda:{local_rank}")
+    torch.cuda.set_device(device)
+    init_distributed_environment()
+
+    # Ensure each worker process has the same random seed
+    random.seed(42)
+    torch.manual_seed(42)
diff --git a/tests/distributed/test_eplb_execute.py b/tests/distributed/test_eplb_execute.py
index 0a97749ac318c..9498e75b279b7 100644
--- a/tests/distributed/test_eplb_execute.py
+++ b/tests/distributed/test_eplb_execute.py
@@ -1,57 +1,19 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import os
 import random
 
 import pytest
 import torch
 import torch.distributed
-import torch.multiprocessing as mp
 
 from vllm.distributed.eplb.rebalance_execute import rearrange_expert_weights_inplace
 from vllm.distributed.parallel_state import (
     ensure_model_parallel_initialized,
     get_tp_group,
-    init_distributed_environment,
 )
-from vllm.utils.system_utils import update_environment_variables
 
-mp.set_start_method("spawn", force=True)
-
-
-def distributed_run(fn, world_size, *args):
-    number_of_processes = world_size
-    processes: list[mp.Process] = []
-    for i in range(number_of_processes):
-        env: dict[str, str] = {}
-        env["RANK"] = str(i)
-        env["LOCAL_RANK"] = str(i)
-        env["WORLD_SIZE"] = str(number_of_processes)
-        env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
-        env["MASTER_ADDR"] = "localhost"
-        env["MASTER_PORT"] = "12345"
-        p = mp.Process(target=fn, args=(env, world_size, *args))
-        processes.append(p)
-        p.start()
-
-    for p in processes:
-        p.join()
-
-    for p in processes:
-        assert p.exitcode == 0
-
-
-def set_env_vars_and_device(env: dict[str, str]) -> None:
-    update_environment_variables(env)
-    local_rank = os.environ["LOCAL_RANK"]
-    device = torch.device(f"cuda:{local_rank}")
-    torch.cuda.set_device(device)
-    init_distributed_environment()
-
-    # Ensure each worker process has the same random seed
-    random.seed(42)
-    torch.manual_seed(42)
+from .eplb_utils import distributed_run, set_env_vars_and_device
 
 
 def create_expert_indices_with_redundancy(
diff --git a/tests/distributed/test_eplb_fused_moe_layer.py b/tests/distributed/test_eplb_fused_moe_layer.py
new file mode 100644
index 0000000000000..55f26519887a1
--- /dev/null
+++ b/tests/distributed/test_eplb_fused_moe_layer.py
@@ -0,0 +1,285 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+# Test that the interaction between EPLB and FusedMoE Layer is okay
+
+from dataclasses import dataclass
+
+import pytest
+import torch
+
+from vllm.config import VllmConfig, set_current_vllm_config
+from vllm.distributed.eplb.rebalance_execute import rearrange_expert_weights_inplace
+from vllm.distributed.parallel_state import (
+    ensure_model_parallel_initialized,
+    get_tp_group,
+)
+from vllm.model_executor.layers.fused_moe.layer import FusedMoE
+
+from .eplb_utils import distributed_run, set_env_vars_and_device
+
+
+@dataclass
+class TestConfig:
+    num_layers: int
+    num_experts: int
+    num_local_experts: int
+    num_topk: int
+    hidden_size: int
+    intermediate_size: int
+    weight_dtype: torch.dtype
+    weight_scale_dtype: torch.dtype | None
+    column_major_scales: bool
+
+
+def make_expert_weights(
+    layer_idx: int,
+    global_expert_idx: int,
+    global_num_experts: int,
+    tensor_shape: tuple[int, ...],
+    tensor_dtype: torch.dtype,
+    tensor_device: torch.device,
+    is_column_major: bool,
+) -> torch.Tensor:
+    assert len(tensor_shape) == 2
+
+    if is_column_major:
+        tensor_shape = (tensor_shape[1], tensor_shape[0])
+
+    x = torch.empty(tensor_shape, dtype=tensor_dtype, device=tensor_device)
+    value_offset = (layer_idx * global_num_experts + global_expert_idx) * x.numel()
+    x.view(-1).copy_(
+        torch.arange(
+            value_offset,
+            value_offset + x.numel(),
+            dtype=tensor_dtype,
+            device=tensor_device,
+        )
+    )
+
+    if is_column_major:
+        x = torch.transpose(x, 1, 0)
+        assert not x.is_contiguous()
+    return x
+
+
+def make_fused_moe_layer(
+    rank: int,
+    layer_idx: int,
+    test_config: TestConfig,
+) -> FusedMoE:
+    fml = FusedMoE(
+        num_experts=test_config.num_experts,
+        top_k=test_config.num_topk,
+        hidden_size=test_config.hidden_size,
+        intermediate_size=test_config.intermediate_size,
+        prefix=f"dummy_layer_{layer_idx}",
+        activation="silu",
+        is_act_and_mul=True,
+        params_dtype=test_config.weight_dtype,
+    )
+
+    device = torch.device(f"cuda:{rank}")
+
+    from functools import partial
+
+    _make_expert_weights = partial(
+        make_expert_weights,
+        layer_idx=layer_idx,
+        global_num_experts=test_config.num_experts,
+        tensor_device=device,
+    )
+
+    assert isinstance(fml.w13_weight.data, torch.Tensor)
+    assert isinstance(fml.w2_weight.data, torch.Tensor)
+    fml.w13_weight.data = fml.w13_weight.data.to(device=device)
+    fml.w2_weight.data = fml.w2_weight.data.to(device=device)
+    w13_weight = fml.w13_weight.data
+    w2_weight = fml.w2_weight.data
+    assert w13_weight.size(0) == test_config.num_local_experts
+    for i in range(test_config.num_local_experts):
+        g_i = rank * test_config.num_local_experts + i
+        w13_weight_e = w13_weight[i]
+        w2_weight_e = w2_weight[i]
+        w13_weight_e.copy_(
+            _make_expert_weights(
+                global_expert_idx=g_i,
+                tensor_shape=w13_weight_e.shape,
+                tensor_dtype=w13_weight_e.dtype,
+                is_column_major=False,
+            )
+        )
+        w2_weight_e.copy_(
+            _make_expert_weights(
+                global_expert_idx=g_i,
+                tensor_shape=w2_weight_e.shape,
+                tensor_dtype=w2_weight_e.dtype,
+                is_column_major=False,
+            )
+        )
+
+    block_size = 16
+
+    def block_quant_scales_shape(
+        shape: tuple[int, ...], is_column_major: bool
+    ) -> tuple[int, ...]:
+        assert len(shape) == 3
+        if not is_column_major:
+            return (shape[0], shape[1] // block_size, shape[2] // block_size)
+        else:
+            return (shape[0], shape[2] // block_size, shape[1] // block_size)
+
+    is_column_major = test_config.column_major_scales
+    w13_weight_scale_inv = torch.empty(
+        block_quant_scales_shape(w13_weight.shape, is_column_major),
+        dtype=test_config.weight_dtype,
+        device=device,
+    )
+    w2_weight_scale_inv = torch.empty(
+        block_quant_scales_shape(w2_weight.shape, is_column_major),
+        dtype=test_config.weight_dtype,
+        device=device,
+    )
+
+    for i in range(test_config.num_local_experts):
+        g_i = rank * test_config.num_local_experts + i
+        w13_s_e = w13_weight_scale_inv[i]
+        w2_s_e = w2_weight_scale_inv[i]
+        w13_s_e.copy_(
+            _make_expert_weights(
+                global_expert_idx=g_i,
+                tensor_shape=w13_s_e.shape,
+                tensor_dtype=w13_s_e.dtype,
+                # Fill data in row-major and then
+                # transpose if test_config requires col-major.
+                is_column_major=False,
+            )
+        )
+        w2_s_e.copy_(
+            _make_expert_weights(
+                global_expert_idx=g_i,
+                tensor_shape=w2_s_e.shape,
+                tensor_dtype=w2_s_e.dtype,
+                is_column_major=False,
+            )
+        )
+    if is_column_major:
+        w13_weight_scale_inv = torch.transpose(w13_weight_scale_inv, 1, 2)
+        w2_weight_scale_inv = torch.transpose(w2_weight_scale_inv, 1, 2)
+        assert not w13_weight_scale_inv.is_contiguous()
+        assert not w2_weight_scale_inv.is_contiguous()
+
+    # Add scales to the parameter list
+    fml.w13_weight_scale_inv = torch.nn.Parameter(
+        w13_weight_scale_inv, requires_grad=False
+    )
+    fml.w2_weight_scale_inv = torch.nn.Parameter(
+        w2_weight_scale_inv, requires_grad=False
+    )
+
+    return fml
+
+
+def _test_eplb_fml(env, world_size: int, test_config: TestConfig):
+    # Initialize model parallel (using tensor parallel as an entrypoint
+    # to expert parallel)
+    set_env_vars_and_device(env)
+
+    vllm_config = VllmConfig()
+    vllm_config.parallel_config.tensor_parallel_size = world_size
+    vllm_config.parallel_config.enable_expert_parallel = True
+
+    with set_current_vllm_config(vllm_config):
+        ensure_model_parallel_initialized(
+            tensor_model_parallel_size=world_size, pipeline_model_parallel_size=1
+        )
+
+        ep_group = get_tp_group().cpu_group
+        ep_rank = torch.distributed.get_rank()
+
+        fml_layers = [
+            make_fused_moe_layer(ep_rank, layer_idx, test_config)
+            for layer_idx in range(test_config.num_layers)
+        ]
+        rank_expert_weights = [fml.get_expert_weights() for fml in fml_layers]
+
+        indices = torch.zeros(
+            test_config.num_layers, test_config.num_experts, dtype=torch.long
+        )
+        for lidx in range(test_config.num_layers):
+            indices[lidx] = torch.Tensor(range(test_config.num_experts))
+
+        shuffled_indices = torch.zeros_like(indices)
+        for lidx in range(test_config.num_layers):
+            shuffled_indices[lidx] = torch.randperm(test_config.num_experts)
+
+        rearrange_expert_weights_inplace(
+            indices,
+            shuffled_indices,
+            rank_expert_weights,
+            ep_group,
+            is_profile=False,
+        )
+
+        num_local_experts = test_config.num_local_experts
+        num_global_experts = test_config.num_experts
+        for lidx, fml in enumerate(fml_layers):
+            for name, w in fml.named_parameters():
+                for e in range(num_local_experts):
+                    g_e = shuffled_indices[lidx][ep_rank * num_local_experts + e]
+                    ref = make_expert_weights(
+                        layer_idx=lidx,
+                        global_expert_idx=int(g_e.item()),
+                        global_num_experts=num_global_experts,
+                        tensor_shape=w[e].shape,
+                        tensor_dtype=w[e].dtype,
+                        tensor_device=w[e].device,
+                        is_column_major=not w[e].is_contiguous(),
+                    )
+                    assert w[e].shape == ref.shape and w[e].stride() == ref.stride(), (
+                        f"w[{e}] {w[e].size()} {w[e].stride()} vs "
+                        f"ref {ref.size()} {ref.stride()}"
+                    )
+                    torch.testing.assert_close(w[e], ref)
+
+
+@pytest.mark.parametrize("world_size", [2])
+@pytest.mark.parametrize("num_layers", [4])
+@pytest.mark.parametrize("num_experts", [16])
+@pytest.mark.parametrize("hidden_size", [256])
+@pytest.mark.parametrize("intermediate_size", [256])
+@pytest.mark.parametrize("column_major_scales", [True, False])
+def test_eplb_fml(
+    world_size: int,
+    num_layers: int,
+    num_experts: int,
+    hidden_size: int,
+    intermediate_size: int,
+    column_major_scales: bool,
+):
+    if torch.cuda.device_count() < world_size:
+        pytest.skip(f"Need at least {world_size} GPUs to run the test")
+
+    num_local_experts = num_experts // world_size
+    num_topk = 4
+    # The dtypes are fine as we are essentially just checking data-copies
+    weight_dtype = torch.bfloat16
+    weight_scale_dtype = torch.bfloat16
+
+    test_config = TestConfig(
+        num_layers=num_layers,
+        num_experts=num_experts,
+        num_local_experts=num_local_experts,
+        num_topk=num_topk,
+        hidden_size=hidden_size,
+        intermediate_size=intermediate_size,
+        weight_dtype=weight_dtype,
+        weight_scale_dtype=weight_scale_dtype,
+        column_major_scales=column_major_scales,
+    )
+
+    distributed_run(
+        _test_eplb_fml,
+        world_size,
+        test_config,
+    )
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
index b2f554efd8a6f..6619b64b2bbc0 100644
--- a/vllm/model_executor/layers/fused_moe/layer.py
+++ b/vllm/model_executor/layers/fused_moe/layer.py
@@ -1391,7 +1391,48 @@ class FusedMoE(CustomOp):
                     yield param_name
 
     def get_expert_weights(self) -> Iterable[torch.Tensor]:
+        def _maybe_make_contiguous(
+            name: str, p: torch.nn.Parameter
+        ) -> torch.nn.Parameter:
+            """
+            In some cases, the last 2 dimensions (the non-expert dimensions)
+            of the weight scale tensor are transposed. This function
+            transforms the tensor (view update) so the tensor is contiguous().
+            Example: A non-contiguous scale tensor,
+              `x` of shape (E, 32, 16) and stride (512, 1, 32) is transformed to
+              `x_` of shape (E, 16, 32) and stride (512, 32, 1).
+              Note that we specifically use torch.transpose() so `x_` refers
+              to the same underlying memory. The tensors `x` and `x_`, pointing
+              to the same underlying memory make this transformation safe in the
+              context of EPLB. i.e. It is the same memory and just the view
+              is different.
+            Note: This function handles the "weight_scale" tensors specifically.
+            This could however be generalized to handle similar tensors.
+            """
+            if p.ndim != 3:
+                return p
+            if p.is_contiguous():
+                # Already contiguous. do nothing.
+                return p
+            # p is non-contiguous. We only handle the case where the last 2
+            # dimensions of the scales tensor is transposed. We can handle
+            # other cases when they become relevant.
+            is_transposed_12 = p.stride(1) == 1 and p.stride(2) != 1
+            if "weight_scale" not in name or not is_transposed_12:
+                # do nothing.
+                return p
+
+            # Do not update the layer paramater as the layer's MoE operations would
+            # expect the parameter's tensor to the same shape / stride. Instead,
+            # make a new torch.nn.Parameter that is used just in the context of
+            # EPLB.
+            return torch.nn.Parameter(
+                torch.transpose(p.data, 1, 2), requires_grad=False
+            )
+
         weights = list(self.named_parameters())
+        weights = [(name, _maybe_make_contiguous(name, p)) for name, p in weights]
+
         assert all(
             weight.is_contiguous()
             for name, weight in weights

From c6fa3895e90f6daef4d223188f6b4156311f40c9 Mon Sep 17 00:00:00 2001
From: Mark McLoughlin <markmc@redhat.com>
Date: Fri, 21 Nov 2025 22:45:00 +0000
Subject: [PATCH 29/83] [KV Connector] Fix async connector prefix cache metrics
 (#28585)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Mark McLoughlin <markmc@redhat.com>
Co-authored-by: Nicolò Lucchesi <nlucches@redhat.com>
---
 tests/v1/core/test_scheduler.py | 17 +++++++++++++----
 vllm/v1/core/sched/scheduler.py | 16 ++++++++--------
 vllm/v1/request.py              |  3 +++
 3 files changed, 24 insertions(+), 12 deletions(-)

diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index 04e738293cd77..d9a69a77c9797 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -1057,7 +1057,8 @@ def test_kv_connector_basic(is_async: bool):
     )
 
 
-def test_external_prefix_cache_metrics():
+@pytest.mark.parametrize("is_async", [False, True])
+def test_external_prefix_cache_metrics(is_async: bool):
     """
     Verify connector prefix cache metrics are updated
     correctly when the scheduler processes requests with KV connector hits.
@@ -1067,7 +1068,9 @@ def test_external_prefix_cache_metrics():
     NUM_MATCHED_NEW_TOKENS = 4
     scheduler = create_scheduler(
         enable_prefix_caching=False,
-        use_kv_connector=mock_kv(matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=False),
+        use_kv_connector=mock_kv(
+            matched_tokens=NUM_MATCHED_NEW_TOKENS, is_async=is_async
+        ),
     )
 
     # --- Prepare simple requests ---
@@ -1079,9 +1082,15 @@ def test_external_prefix_cache_metrics():
         num_tokens=NUM_TOKENS,
         max_tokens=MAX_TOKENS,
     )
+    req_ids = []
+    req_to_index = {}
+    for i, request in enumerate(requests):
+        scheduler.add_request(request)
+        req_ids.append(request.request_id)
+        req_to_index[request.request_id] = i
 
-    for req in requests:
-        scheduler.add_request(req)
+    if is_async:
+        _step_until_kv_transfer_finished(scheduler, req_ids)
 
     # --- Trigger scheduling and simulate model output ---
     output = scheduler.schedule()
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 9195b112d8690..4cb5348cbacc3 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -470,6 +470,7 @@ class Scheduler(SchedulerInterface):
                             skipped_waiting_requests.prepend_request(request)
                             continue
 
+                        request.num_external_computed_tokens = ext_tokens
                         num_external_computed_tokens = ext_tokens
 
                     # Total computed tokens (local + external).
@@ -576,9 +577,6 @@ class Scheduler(SchedulerInterface):
                         new_computed_blocks + new_blocks,
                         num_external_computed_tokens,
                     )
-                    self._update_connector_prefix_cache_stats(
-                        request, num_external_computed_tokens
-                    )
 
                 # Request was already popped from self.waiting
                 # unless it was re-added above due to new_blocks being None.
@@ -590,6 +588,8 @@ class Scheduler(SchedulerInterface):
                     request.status = RequestStatus.WAITING_FOR_REMOTE_KVS
                     continue
 
+                self._update_connector_prefix_cache_stats(request)
+
                 req_index += 1
                 self.running.append(request)
                 if self.log_stats:
@@ -1380,15 +1380,13 @@ class Scheduler(SchedulerInterface):
     # KV Connector Related Methods
     ########################################################################
 
-    def _update_connector_prefix_cache_stats(
-        self, request: Request, num_external_tokens: int
-    ) -> None:
+    def _update_connector_prefix_cache_stats(self, request: Request) -> None:
         if self.connector_prefix_cache_stats is None:
             return
 
         self.connector_prefix_cache_stats.record(
             num_tokens=request.num_tokens,
-            num_hits=num_external_tokens,
+            num_hits=request.num_external_computed_tokens,
             preempted=request.num_preemptions > 0,
         )
 
@@ -1571,9 +1569,11 @@ class Scheduler(SchedulerInterface):
                 marked_invalid_block = True
                 # Truncate the computed tokens at the first failed block
                 request.num_computed_tokens = idx * self.block_size
-                total_affected_tokens += (
+                num_affected_tokens = (
                     req_num_computed_tokens - request.num_computed_tokens
                 )
+                total_affected_tokens += num_affected_tokens
+                request.num_external_computed_tokens -= num_affected_tokens
 
             if is_affected:
                 if not marked_invalid_block:
diff --git a/vllm/v1/request.py b/vllm/v1/request.py
index 3d92906fbf4b1..366cdadf5a583 100644
--- a/vllm/v1/request.py
+++ b/vllm/v1/request.py
@@ -121,6 +121,9 @@ class Request:
         # The number of requests being preempted by the scheduler
         self.num_preemptions = 0
 
+        # The number of tokens that have been computed remotely.
+        self.num_external_computed_tokens = 0
+
         self.block_hashes: list[BlockHash] = []
         self.get_hash_new_full_blocks: Callable[[], list[BlockHash]] | None = None
         if block_hasher is not None:

From e9af6ba62ac99683139ff8d6bac87677fecf0b0c Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Fri, 21 Nov 2025 15:52:28 -0800
Subject: [PATCH 30/83] [Model Runner V2] Optimize Gumbel Sampling Kernel
 (#29210)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/sampler.py | 93 ++++++++++++++++-------------------
 1 file changed, 43 insertions(+), 50 deletions(-)

diff --git a/vllm/v1/worker/gpu/sampler.py b/vllm/v1/worker/gpu/sampler.py
index 55f98ca6bb6a3..499e9d3b1538d 100644
--- a/vllm/v1/worker/gpu/sampler.py
+++ b/vllm/v1/worker/gpu/sampler.py
@@ -3,10 +3,9 @@
 from collections.abc import Callable
 
 import torch
-import triton
-import triton.language as tl
 
 from vllm.config.model import LogprobsMode
+from vllm.triton_utils import tl, triton
 from vllm.v1.outputs import LogprobsTensors, SamplerOutput
 from vllm.v1.sample.ops.topk_topp_sampler import apply_top_k_top_p
 from vllm.v1.worker.gpu.states import SamplingMetadata
@@ -78,7 +77,10 @@ class Sampler:
 
 @triton.jit
 def _gumbel_sample_kernel(
-    sampled_ptr,
+    local_argmax_ptr,
+    local_argmax_stride,
+    local_max_ptr,
+    local_max_stride,
     logits_ptr,
     logits_stride,
     seeds_ptr,
@@ -88,40 +90,21 @@ def _gumbel_sample_kernel(
     BLOCK_SIZE: tl.constexpr,
 ):
     req_idx = tl.program_id(0)
+    block_idx = tl.program_id(1)
+    block = block_idx * BLOCK_SIZE + tl.arange(0, BLOCK_SIZE)
+    mask = block < vocab_size
+    logits = tl.load(
+        logits_ptr + req_idx * logits_stride + block,
+        mask=mask,
+        other=float("-inf"),
+    )
+
     is_greedy = tl.load(is_greedy_ptr + req_idx)
-
-    if is_greedy:
-        # Greedy sampling. Don't apply gumbel noise.
-        max_val = float("-inf")
-        max_idx = 0
-        for i in range(0, vocab_size, BLOCK_SIZE):
-            block = i + tl.arange(0, BLOCK_SIZE)
-            mask = block < vocab_size
-            logits = tl.load(
-                logits_ptr + req_idx * logits_stride + block,
-                mask=mask,
-                other=float("-inf"),
-            )
-
-            idx = tl.argmax(logits, axis=0)
-            value = tl.max(logits, axis=0)
-            is_greater = value > max_val
-            max_val = tl.where(is_greater, value, max_val)
-            max_idx = tl.where(is_greater, i + idx, max_idx)
-        tl.store(sampled_ptr + req_idx, max_idx)
-        return
-
-    # Random sampling.
-    # Calculate gumbel seed.
-    seed = tl.load(seeds_ptr + req_idx)
-    pos = tl.load(pos_ptr + req_idx)
-    gumbel_seed = tl.randint(seed, pos)
-
-    max_val = float("-inf")
-    max_idx = 0
-    for i in range(0, vocab_size, BLOCK_SIZE):
-        block = i + tl.arange(0, BLOCK_SIZE)
-        mask = block < vocab_size
+    if not is_greedy:
+        # Calculate the seed for gumbel noise.
+        seed = tl.load(seeds_ptr + req_idx)
+        pos = tl.load(pos_ptr + req_idx)
+        gumbel_seed = tl.randint(seed, pos)
 
         # Generate gumbel noise.
         r = tl.rand(gumbel_seed, block).to(tl.float64)
@@ -129,16 +112,13 @@ def _gumbel_sample_kernel(
         gumbel_noise = gumbel_noise.to(tl.float32)
 
         # Apply gumbel noise.
-        logits = tl.load(logits_ptr + req_idx * logits_stride + block, mask=mask)
         logits = tl.where(mask, logits + gumbel_noise, float("-inf"))
 
-        # Argmax to get the sampled token.
-        idx = tl.argmax(logits, axis=0)
-        value = tl.max(logits, axis=0)
-        is_greater = value > max_val
-        max_val = tl.where(is_greater, value, max_val)
-        max_idx = tl.where(is_greater, i + idx, max_idx)
-    tl.store(sampled_ptr + req_idx, max_idx)
+    idx = tl.argmax(logits, axis=0)
+    token_id = block_idx * BLOCK_SIZE + idx
+    value = tl.max(logits, axis=0)
+    tl.store(local_argmax_ptr + req_idx * local_argmax_stride + block_idx, token_id)
+    tl.store(local_max_ptr + req_idx * local_max_stride + block_idx, value)
 
 
 def gumbel_sample(
@@ -148,23 +128,36 @@ def gumbel_sample(
     pos: torch.Tensor,  # [num_reqs]
 ) -> torch.Tensor:
     num_reqs, vocab_size = logits.shape
-    # NOTE(woosuk): Use int64 for later indexing.
-    sampled = torch.empty(
+    BLOCK_SIZE = 1024
+    num_blocks = triton.cdiv(vocab_size, BLOCK_SIZE)
+    local_argmax = torch.empty(
         num_reqs,
+        num_blocks,
         dtype=torch.int64,
         device=logits.device,
     )
-    _gumbel_sample_kernel[(num_reqs,)](
-        sampled,
+    local_max = torch.empty(
+        num_reqs,
+        num_blocks,
+        dtype=torch.float32,
+        device=logits.device,
+    )
+    _gumbel_sample_kernel[(num_reqs, num_blocks)](
+        local_argmax,
+        local_argmax.stride(0),
+        local_max,
+        local_max.stride(0),
         logits,
         logits.stride(0),
         seed,
         pos,
         is_greedy,
         vocab_size,
-        num_warps=8,
-        BLOCK_SIZE=16384,  # type: ignore
+        BLOCK_SIZE=BLOCK_SIZE,
     )
+    # NOTE(woosuk): Use int64 for later indexing.
+    max_block_idx = local_max.argmax(dim=-1, keepdim=True)
+    sampled = local_argmax.gather(dim=-1, index=max_block_idx).view(-1)
     return sampled
 
 

From 30d64662387aaa74abcee294f27b83043f2d1ae6 Mon Sep 17 00:00:00 2001
From: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Date: Fri, 21 Nov 2025 19:47:05 -0500
Subject: [PATCH 31/83] [BugFix] Fix Eagle `IndexError: list index out of
 range` for even `num_speculative_tokens` (#29102)

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
---
 tests/conftest.py            |  8 ++++++++
 vllm/config/compilation.py   | 16 ++++++++++------
 vllm/v1/spec_decode/eagle.py | 33 +++++++++++++++++++--------------
 3 files changed, 37 insertions(+), 20 deletions(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index b17081352edcf..5afdb225b8923 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -748,6 +748,14 @@ class VllmRunner:
             # being captured which can trigger edge cases that we don't handle yet.
             kwargs["compilation_config"] = {"cudagraph_capture_sizes": [4]}
 
+            # Make sure we have atleast one cudagraph large enough for a single decode.
+            if (speculative_config := kwargs.get("speculative_config")) and (
+                num_speculative_tokens := speculative_config["num_speculative_tokens"]
+            ):
+                kwargs["compilation_config"]["cudagraph_capture_sizes"].append(
+                    num_speculative_tokens + 1
+                )
+
         with init_ctx:
             self.llm = LLM(
                 model=model_name,
diff --git a/vllm/config/compilation.py b/vllm/config/compilation.py
index abdae49106120..9b5309598d0e2 100644
--- a/vllm/config/compilation.py
+++ b/vllm/config/compilation.py
@@ -950,14 +950,18 @@ class CompilationConfig:
             )
         )
 
+        if len(rounded_sizes) == 0 and multiple_of <= self.max_cudagraph_capture_size:
+            # if one valid but would be round_down use that
+            rounded_sizes = [multiple_of]
+
         if len(rounded_sizes) == 0:
-            logger.warning(
-                "No valid cudagraph sizes after rounding to multiple of "
-                " num_speculative_tokens + 1 (%d); please adjust num_speculative_tokens"
-                " or max_cudagraph_capture_size (or cudagraph_capture_sizes)",
-                multiple_of,
+            raise ValueError(
+                f"No valid cudagraph sizes after rounding to multiple of {multiple_of} "
+                f"(num_speculative_tokens + 1 or tp if sequence parallelism is enabled)"
+                f" please adjust num_speculative_tokens ({uniform_decode_query_len - 1}"
+                f") or max_cudagraph_capture_size ({self.max_cudagraph_capture_size})"
+                f" or cudagraph_capture_sizes ({self.cudagraph_capture_sizes})"
             )
-            return
 
         self.max_cudagraph_capture_size = rounded_sizes[-1]
         self.cudagraph_capture_sizes = rounded_sizes
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
index 0df9cd3214e53..3de418f1d13c8 100644
--- a/vllm/v1/spec_decode/eagle.py
+++ b/vllm/v1/spec_decode/eagle.py
@@ -86,9 +86,9 @@ class EagleProposer:
 
         self.use_cuda_graph = False
 
-        compilation_config = self.vllm_config.compilation_config
-        if compilation_config.mode == CompilationMode.VLLM_COMPILE:
-            cudagraph_mode = compilation_config.cudagraph_mode
+        self.compilation_config = self.vllm_config.compilation_config
+        if self.compilation_config.mode == CompilationMode.VLLM_COMPILE:
+            cudagraph_mode = self.compilation_config.cudagraph_mode
             if cudagraph_mode != CUDAGraphMode.NONE and not cudagraph_mode.has_mode(
                 CUDAGraphMode.PIECEWISE
             ):
@@ -103,13 +103,6 @@ class EagleProposer:
                 and not self.speculative_config.enforce_eager
             )
 
-        self.cudagraph_batch_sizes = (
-            (sorted(self.vllm_config.compilation_config.cudagraph_capture_sizes))
-            if self.use_cuda_graph
-            else []
-        )
-
-        self.use_cuda_graph = self.use_cuda_graph and bool(self.cudagraph_batch_sizes)
         # persistent buffers for cuda graph
         self.input_ids = torch.zeros(
             self.max_num_tokens, dtype=torch.int32, device=device
@@ -276,7 +269,10 @@ class EagleProposer:
             per_layer_attn_metadata[layer_name] = draft_indexer_metadata
 
         cudagraph_runtime_mode = CUDAGraphMode.NONE
-        if self.use_cuda_graph and num_tokens <= self.cudagraph_batch_sizes[-1]:
+        if (
+            self.use_cuda_graph
+            and num_tokens <= self.compilation_config.max_cudagraph_capture_size
+        ):
             num_input_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
             cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
         else:
@@ -366,7 +362,10 @@ class EagleProposer:
         # Generate the remaining draft tokens.
         draft_token_ids_list = [draft_token_ids]
 
-        if self.use_cuda_graph and batch_size <= self.cudagraph_batch_sizes[-1]:
+        if (
+            self.use_cuda_graph
+            and batch_size <= self.compilation_config.max_cudagraph_capture_size
+        ):
             input_batch_size = self.vllm_config.pad_for_cudagraph(batch_size)
             cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
         else:
@@ -777,7 +776,10 @@ class EagleProposer:
             self.positions[:num_tokens] = tree_positions.view(-1)
             self.hidden_states[:num_tokens] = tree_hidden_states.view(num_tokens, -1)
 
-            if self.use_cuda_graph and num_tokens <= self.cudagraph_batch_sizes[-1]:
+            if (
+                self.use_cuda_graph
+                and num_tokens <= self.compilation_config.max_cudagraph_capture_size
+            ):
                 num_input_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
                 cudagraph_runtime_mode = CUDAGraphMode.PIECEWISE
             else:
@@ -1114,7 +1116,10 @@ class EagleProposer:
     ) -> None:
         # Determine if CUDA graphs should be used for this run.
         cudagraphs_enabled = use_cudagraphs and self.use_cuda_graph
-        if cudagraphs_enabled and num_tokens <= self.cudagraph_batch_sizes[-1]:
+        if (
+            cudagraphs_enabled
+            and num_tokens <= self.compilation_config.max_cudagraph_capture_size
+        ):
             num_tokens = self.vllm_config.pad_for_cudagraph(num_tokens)
 
         with set_forward_context(

From d5dbdbfcb2cfc2e4d82a1e2605576f1e4e440ca7 Mon Sep 17 00:00:00 2001
From: Angela Yi <yiangela7@gmail.com>
Date: Fri, 21 Nov 2025 17:10:27 -0800
Subject: [PATCH 32/83] [docs] Fix cudagraph mode config (#29170)

Signed-off-by: angelayi <yiangela7@gmail.com>
---
 docs/design/debug_vllm_compile.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/design/debug_vllm_compile.md b/docs/design/debug_vllm_compile.md
index 3b454e851b54e..8912eb58f8ac7 100644
--- a/docs/design/debug_vllm_compile.md
+++ b/docs/design/debug_vllm_compile.md
@@ -9,7 +9,7 @@ TL;DR:
 |----------|----------|-------------|
 | --enforce-eager | enforce_eager=True |  Turn off torch.compile and CUDAGraphs |
 | -O.mode=0 | mode=CompilationMode.NONE |  Turn off torch.compile only |
-| -O.cudagraph_mode=NONE | compilation_config=CompilationConfig(mode=CompilationMode.NONE) |  Turn off CUDAGraphs only |
+| -O.cudagraph_mode=NONE | compilation_config=CompilationConfig(cudagraph_mode=CUDAGraphMode.NONE) |  Turn off CUDAGraphs only |
 | -O.backend=eager | compilation_config=CompilationConfig(backend='eager') |  Turn off TorchInductor |
 
 ## vLLM-torch.compile overview

From 9a3101b2ba6821488f4b7a9b93124e479edc4d3e Mon Sep 17 00:00:00 2001
From: Charlie Fu <charlifu@amd.com>
Date: Fri, 21 Nov 2025 19:11:02 -0600
Subject: [PATCH 33/83] [Rocm][CI] Fix DeekSeek V2-Lite Accuracy CI (#29135)

Signed-off-by: charlifu <charlifu@amd.com>
---
 .../deepseek_v2_lite_ep_eplb.sh                      | 12 +++++++++++-
 .../qwen30b_a3b_fp8_block_ep.sh                      | 11 ++++++++++-
 2 files changed, 21 insertions(+), 2 deletions(-)

diff --git a/.buildkite/scripts/scheduled_integration_test/deepseek_v2_lite_ep_eplb.sh b/.buildkite/scripts/scheduled_integration_test/deepseek_v2_lite_ep_eplb.sh
index 5302f524a0ae4..8106f50f18f66 100644
--- a/.buildkite/scripts/scheduled_integration_test/deepseek_v2_lite_ep_eplb.sh
+++ b/.buildkite/scripts/scheduled_integration_test/deepseek_v2_lite_ep_eplb.sh
@@ -17,7 +17,17 @@ wait_for_server() {
 }
 
 MODEL="deepseek-ai/DeepSeek-V2-lite"
-BACKENDS=("deepep_high_throughput" "deepep_low_latency")
+
+# Set BACKENDS based on platform
+if command -v rocm-smi &> /dev/null || [[ -d /opt/rocm ]] || [[ -n "${ROCM_PATH:-}" ]]; then
+  # ROCm platform
+  BACKENDS=("allgather_reducescatter")
+  # Disable MOE padding for ROCm since it is causing eplb to fail
+  export VLLM_ROCM_MOE_PADDING=0
+else
+  # Non-ROCm platform (CUDA/other)
+  BACKENDS=("deepep_high_throughput" "deepep_low_latency")
+fi
 
 cleanup() {
   if [[ -n "${SERVER_PID:-}" ]] && kill -0 "${SERVER_PID}" 2>/dev/null; then
diff --git a/.buildkite/scripts/scheduled_integration_test/qwen30b_a3b_fp8_block_ep.sh b/.buildkite/scripts/scheduled_integration_test/qwen30b_a3b_fp8_block_ep.sh
index a5135299297e2..0d06f53a183d0 100644
--- a/.buildkite/scripts/scheduled_integration_test/qwen30b_a3b_fp8_block_ep.sh
+++ b/.buildkite/scripts/scheduled_integration_test/qwen30b_a3b_fp8_block_ep.sh
@@ -17,7 +17,16 @@ wait_for_server() {
 }
 
 MODEL="QWen/Qwen3-30B-A3B-FP8"
-BACKENDS=("deepep_high_throughput" "deepep_low_latency")
+# Set BACKENDS based on platform
+if command -v rocm-smi &> /dev/null || [[ -d /opt/rocm ]] || [[ -n "${ROCM_PATH:-}" ]]; then
+  # ROCm platform
+  BACKENDS=("allgather_reducescatter")
+  # Disable MOE padding for ROCm since it is causing eplb to fail
+  export VLLM_ROCM_MOE_PADDING=0
+else
+  # Non-ROCm platform (CUDA/other)
+  BACKENDS=("deepep_high_throughput" "deepep_low_latency")
+fi
 
 cleanup() {
   if [[ -n "${SERVER_PID:-}" ]] && kill -0 "${SERVER_PID}" 2>/dev/null; then

From 1d34eb11e057f6b42af36bdb13852d2701f04245 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Fri, 21 Nov 2025 20:14:49 -0500
Subject: [PATCH 34/83] [CI] Bug: Fix triton import issue (#29202)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 vllm/v1/worker/gpu/block_table.py | 3 +--
 vllm/v1/worker/gpu/input_batch.py | 3 +--
 2 files changed, 2 insertions(+), 4 deletions(-)

diff --git a/vllm/v1/worker/gpu/block_table.py b/vllm/v1/worker/gpu/block_table.py
index ff24e88ede2c0..b31e9b179d26c 100644
--- a/vllm/v1/worker/gpu/block_table.py
+++ b/vllm/v1/worker/gpu/block_table.py
@@ -3,10 +3,9 @@
 from collections.abc import Iterable
 
 import torch
-import triton
-import triton.language as tl
 
 from vllm.attention.backends.utils import PAD_SLOT_ID
+from vllm.triton_utils import tl, triton
 from vllm.utils.math_utils import cdiv
 from vllm.v1.utils import CpuGpuBuffer
 
diff --git a/vllm/v1/worker/gpu/input_batch.py b/vllm/v1/worker/gpu/input_batch.py
index 89f375649146f..8313b32d29797 100644
--- a/vllm/v1/worker/gpu/input_batch.py
+++ b/vllm/v1/worker/gpu/input_batch.py
@@ -7,9 +7,8 @@ import numba
 import numba.types as types
 import numpy as np
 import torch
-import triton
-import triton.language as tl
 
+from vllm.triton_utils import tl, triton
 from vllm.utils import random_uuid
 from vllm.utils.math_utils import cdiv
 from vllm.v1.utils import CpuGpuBuffer

From d045e22dfeee61ece1a20ac4aec8cf483a42d406 Mon Sep 17 00:00:00 2001
From: Lukas Geiger <lukas.geiger94@gmail.com>
Date: Sat, 22 Nov 2025 01:30:55 +0000
Subject: [PATCH 35/83] [Model][Qwen3VL] Tune Triton w8a8 block fp8 kernel for
 L40s (#29217)

Signed-off-by: Lukas Geiger <lukas.geiger94@gmail.com>
---
 ...,dtype=fp8_w8a8,block_shape=[128,128].json | 146 ++++++++++++++++++
 ...,dtype=fp8_w8a8,block_shape=[128,128].json | 146 ++++++++++++++++++
 ...,dtype=fp8_w8a8,block_shape=[128,128].json | 146 ++++++++++++++++++
 ...,dtype=fp8_w8a8,block_shape=[128,128].json | 146 ++++++++++++++++++
 4 files changed, 584 insertions(+)
 create mode 100644 vllm/model_executor/layers/quantization/utils/configs/N=10240,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
 create mode 100644 vllm/model_executor/layers/quantization/utils/configs/N=5120,K=25600,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
 create mode 100644 vllm/model_executor/layers/quantization/utils/configs/N=5120,K=8192,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
 create mode 100644 vllm/model_executor/layers/quantization/utils/configs/N=51200,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json

diff --git a/vllm/model_executor/layers/quantization/utils/configs/N=10240,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json b/vllm/model_executor/layers/quantization/utils/configs/N=10240,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
new file mode 100644
index 0000000000000..6b2c1dc1312bf
--- /dev/null
+++ b/vllm/model_executor/layers/quantization/utils/configs/N=10240,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 5
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "24": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "32": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "48": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    }
+}
diff --git a/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=25600,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json b/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=25600,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
new file mode 100644
index 0000000000000..b0eaf02a541ad
--- /dev/null
+++ b/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=25600,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "48": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "64": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "96": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    }
+}
diff --git a/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=8192,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json b/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=8192,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
new file mode 100644
index 0000000000000..4cd357d5086ca
--- /dev/null
+++ b/vllm/model_executor/layers/quantization/utils/configs/N=5120,K=8192,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "24": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    }
+}
diff --git a/vllm/model_executor/layers/quantization/utils/configs/N=51200,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json b/vllm/model_executor/layers/quantization/utils/configs/N=51200,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
new file mode 100644
index 0000000000000..ca2179ddf3d2f
--- /dev/null
+++ b/vllm/model_executor/layers/quantization/utils/configs/N=51200,K=5120,device_name=NVIDIA_L40S,dtype=fp8_w8a8,block_shape=[128,128].json
@@ -0,0 +1,146 @@
+{
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 5
+    },
+    "8": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 5
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "256": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "512": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 4
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 3
+    }
+}

From ed8e6843cc7167113bb9a436818f2e242c841b9f Mon Sep 17 00:00:00 2001
From: Ryan Rock <ryan.rock@amd.com>
Date: Fri, 21 Nov 2025 19:31:22 -0600
Subject: [PATCH 36/83] [CI/Build] Add terratorch for AMD (#29205)

Signed-off-by: Ryan Rock <ryan.rock@amd.com>
---
 requirements/rocm-test.txt | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/requirements/rocm-test.txt b/requirements/rocm-test.txt
index 432e11977872d..eabb5065bfceb 100644
--- a/requirements/rocm-test.txt
+++ b/requirements/rocm-test.txt
@@ -39,3 +39,6 @@ mteb[bm25s]>=1.38.11, <2
 
 # Required for eval tests
 lm-eval[api] @ git+https://github.com/EleutherAI/lm-evaluation-harness.git@206b7722158f58c35b7ffcd53b035fdbdda5126d
+
+# Plugins test
+terratorch @ git+https://github.com/IBM/terratorch.git@07184fcf91a1324f831ff521dd238d97fe350e3e

From 5c8f2adf50e0cf2c5acf908ac796089cc45abdcf Mon Sep 17 00:00:00 2001
From: Jie Luo <65482183+Livinfly@users.noreply.github.com>
Date: Sat, 22 Nov 2025 09:34:28 +0800
Subject: [PATCH 37/83] [Bugfix] Fix block size in block_table with PCP
 (#29094)

Signed-off-by: Livinfly <luojie3m@gmail.com>
---
 vllm/v1/worker/block_table.py | 11 +++++++++--
 1 file changed, 9 insertions(+), 2 deletions(-)

diff --git a/vllm/v1/worker/block_table.py b/vllm/v1/worker/block_table.py
index 76e17f3797a1a..37ec0fb97e06b 100644
--- a/vllm/v1/worker/block_table.py
+++ b/vllm/v1/worker/block_table.py
@@ -84,7 +84,7 @@ class BlockTable:
             self.pcp_world_size = get_pcp_group().world_size
             self.pcp_rank = get_pcp_group().rank_in_group
         except AssertionError:
-            # DCP might not be initialized in testing
+            # PCP might not be initialized in testing
             self.pcp_world_size = 1
             self.pcp_rank = 0
         try:
@@ -268,6 +268,11 @@ class MultiGroupBlockTable:
         # (max_model_len//dcp_world_size) tokens in kvcache,
         # so the block_size which used for calc max_num_blocks_per_req
         # must be multiplied by dcp_world_size.
+        try:
+            pcp_world_size = get_pcp_group().world_size
+        except AssertionError:
+            # PCP might not be initialized in testing
+            pcp_world_size = 1
         try:
             dcp_world_size = get_dcp_group().world_size
         except AssertionError:
@@ -280,12 +285,14 @@ class MultiGroupBlockTable:
                 f"must match block_sizes length ({len(block_sizes)})"
             )
 
+        total_cp_world_size = dcp_world_size * pcp_world_size
+
         self.block_tables = [
             BlockTable(
                 block_size,
                 max_num_reqs,
                 max(
-                    cdiv(max_model_len, block_size * dcp_world_size),
+                    cdiv(max_model_len, block_size * total_cp_world_size),
                     1 + num_speculative_tokens,
                 ),
                 max_num_batched_tokens,

From 1ef9c9e29480f95340e124cc7d81a2876a60516d Mon Sep 17 00:00:00 2001
From: qli88 <qiang.li2@amd.com>
Date: Fri, 21 Nov 2025 19:36:19 -0600
Subject: [PATCH 38/83] [CI/Build] Disable test_gptoss_tp.py in 'LoRA TP Test'
 group for ROCm platform (#29204)

Signed-off-by: qli88 <qiang.li2@amd.com>
---
 .buildkite/test-amd.yaml | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/.buildkite/test-amd.yaml b/.buildkite/test-amd.yaml
index 4e2ff5c5a6bd5..4ee81fdabf665 100644
--- a/.buildkite/test-amd.yaml
+++ b/.buildkite/test-amd.yaml
@@ -1319,7 +1319,10 @@ steps:
     - pytest -v -s -x lora/test_llama_tp.py
     - pytest -v -s -x lora/test_llm_with_multi_loras.py
     - pytest -v -s -x lora/test_olmoe_tp.py
-    - pytest -v -s -x lora/test_gptoss_tp.py
+
+    # Disabled for now because MXFP4 backend on non-cuda platform 
+    # doesn't support LoRA yet
+    #- pytest -v -s -x lora/test_gptoss_tp.py
 
 
 - label: Weight Loading Multiple GPU Test  # 33min

From 052950e5b3c48b1189df62f833ed9cff4aabb0bd Mon Sep 17 00:00:00 2001
From: FlintyLemming <muchenran@hotmail.com>
Date: Sat, 22 Nov 2025 09:37:51 +0800
Subject: [PATCH 39/83] Add fused MoE config for H200 E160 N192 fp8 (#29182)

Signed-off-by: FlintyLemming <admin@flinty.moe>
---
 ...evice_name=NVIDIA_H200,dtype=fp8_w8a8.json | 147 ++++++++++++++++++
 1 file changed, 147 insertions(+)
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=160,N=192,device_name=NVIDIA_H200,dtype=fp8_w8a8.json

diff --git a/vllm/model_executor/layers/fused_moe/configs/E=160,N=192,device_name=NVIDIA_H200,dtype=fp8_w8a8.json b/vllm/model_executor/layers/fused_moe/configs/E=160,N=192,device_name=NVIDIA_H200,dtype=fp8_w8a8.json
new file mode 100644
index 0000000000000..54fe5374cb95d
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=160,N=192,device_name=NVIDIA_H200,dtype=fp8_w8a8.json
@@ -0,0 +1,147 @@
+{
+    "triton_version": "3.5.0",
+    "1": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "4": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    }
+}

From 6f403501a085f4917e49e1714bdf44d2aabd06f9 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 21 Nov 2025 20:13:18 -0600
Subject: [PATCH 40/83] [CI/Build][AMD] Enable Entrypoints Integration Test
 (Pooling) to run without error on ROCm (#29212)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/entrypoints/pooling/correctness/test_mteb_embed.py    | 6 ++++++
 tests/entrypoints/pooling/correctness/test_mteb_score.py    | 6 ++++++
 tests/entrypoints/pooling/llm/test_embedding.py             | 6 ++++++
 tests/entrypoints/pooling/llm/test_encode.py                | 6 ++++++
 tests/entrypoints/pooling/llm/test_score.py                 | 6 ++++++
 tests/entrypoints/pooling/openai/test_embedding.py          | 6 ++++++
 .../entrypoints/pooling/openai/test_embedding_dimensions.py | 6 ++++++
 .../entrypoints/pooling/openai/test_embedding_long_text.py  | 6 ++++++
 tests/entrypoints/pooling/openai/test_rerank.py             | 6 ++++++
 tests/entrypoints/pooling/openai/test_score.py              | 6 ++++++
 tests/entrypoints/pooling/openai/test_truncation.py         | 6 ++++++
 11 files changed, 66 insertions(+)

diff --git a/tests/entrypoints/pooling/correctness/test_mteb_embed.py b/tests/entrypoints/pooling/correctness/test_mteb_embed.py
index 7f16638e51e2c..64673534fd32a 100644
--- a/tests/entrypoints/pooling/correctness/test_mteb_embed.py
+++ b/tests/entrypoints/pooling/correctness/test_mteb_embed.py
@@ -11,6 +11,12 @@ from tests.models.language.pooling_mteb_test.mteb_utils import (
     run_mteb_embed_task,
 )
 from tests.utils import RemoteOpenAIServer
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
 
diff --git a/tests/entrypoints/pooling/correctness/test_mteb_score.py b/tests/entrypoints/pooling/correctness/test_mteb_score.py
index 1afe68b189db8..81ad0097187b0 100644
--- a/tests/entrypoints/pooling/correctness/test_mteb_score.py
+++ b/tests/entrypoints/pooling/correctness/test_mteb_score.py
@@ -13,6 +13,12 @@ from tests.models.language.pooling_mteb_test.mteb_utils import (
     run_mteb_rerank,
 )
 from tests.utils import RemoteOpenAIServer
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
 
diff --git a/tests/entrypoints/pooling/llm/test_embedding.py b/tests/entrypoints/pooling/llm/test_embedding.py
index 5455b5f91fc09..f5eab4c29ae18 100644
--- a/tests/entrypoints/pooling/llm/test_embedding.py
+++ b/tests/entrypoints/pooling/llm/test_embedding.py
@@ -9,6 +9,12 @@ import torch.nn.functional as F
 
 from vllm import LLM, PoolingParams
 from vllm.distributed import cleanup_dist_env_and_memory
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODEL_NAME = "intfloat/multilingual-e5-small"
 
diff --git a/tests/entrypoints/pooling/llm/test_encode.py b/tests/entrypoints/pooling/llm/test_encode.py
index ca85d2758fce4..f86ecef2e4744 100644
--- a/tests/entrypoints/pooling/llm/test_encode.py
+++ b/tests/entrypoints/pooling/llm/test_encode.py
@@ -7,6 +7,12 @@ import pytest
 
 from vllm import LLM, PoolingParams
 from vllm.distributed import cleanup_dist_env_and_memory
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODEL_NAME = "intfloat/multilingual-e5-small"
 
diff --git a/tests/entrypoints/pooling/llm/test_score.py b/tests/entrypoints/pooling/llm/test_score.py
index b69c6a47c1913..ce36d61cb8476 100644
--- a/tests/entrypoints/pooling/llm/test_score.py
+++ b/tests/entrypoints/pooling/llm/test_score.py
@@ -9,6 +9,12 @@ import torch
 from tests.models.utils import softmax
 from vllm import LLM, PoolingParams
 from vllm.distributed import cleanup_dist_env_and_memory
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODEL_NAME = "tomaarsen/Qwen3-Reranker-0.6B-seq-cls"
 
diff --git a/tests/entrypoints/pooling/openai/test_embedding.py b/tests/entrypoints/pooling/openai/test_embedding.py
index e971b23e8f1a0..0c88d800e2f99 100644
--- a/tests/entrypoints/pooling/openai/test_embedding.py
+++ b/tests/entrypoints/pooling/openai/test_embedding.py
@@ -19,6 +19,7 @@ from vllm.entrypoints.openai.protocol import (
     EmbeddingResponse,
     PoolingResponse,
 )
+from vllm.platforms import current_platform
 from vllm.transformers_utils.tokenizer import get_tokenizer
 from vllm.utils.serial_utils import (
     EMBED_DTYPE_TO_TORCH_DTYPE,
@@ -28,6 +29,11 @@ from vllm.utils.serial_utils import (
     decode_pooling_output,
 )
 
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
+
 MODEL_NAME = "intfloat/multilingual-e5-small"
 DUMMY_CHAT_TEMPLATE = """{% for message in messages %}{{message['role'] + ': ' + message['content'] + '\\n'}}{% endfor %}"""  # noqa: E501
 DTYPE = "bfloat16"
diff --git a/tests/entrypoints/pooling/openai/test_embedding_dimensions.py b/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
index ba9fb64262772..8018dac2d3ffe 100644
--- a/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
+++ b/tests/entrypoints/pooling/openai/test_embedding_dimensions.py
@@ -12,6 +12,12 @@ from tests.models.language.pooling.embed_utils import run_embedding_correctness_
 from tests.models.utils import EmbedModelInfo
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import EmbeddingResponse
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODELS = [
     EmbedModelInfo("intfloat/multilingual-e5-small", is_matryoshka=False),
diff --git a/tests/entrypoints/pooling/openai/test_embedding_long_text.py b/tests/entrypoints/pooling/openai/test_embedding_long_text.py
index f977c81a9084e..a9ade09dad0b5 100644
--- a/tests/entrypoints/pooling/openai/test_embedding_long_text.py
+++ b/tests/entrypoints/pooling/openai/test_embedding_long_text.py
@@ -16,6 +16,12 @@ import pytest_asyncio
 
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import EmbeddingResponse
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 
 def _generate_random_text(word_count: int) -> str:
diff --git a/tests/entrypoints/pooling/openai/test_rerank.py b/tests/entrypoints/pooling/openai/test_rerank.py
index 1d85190c12a19..5a772e22a7414 100644
--- a/tests/entrypoints/pooling/openai/test_rerank.py
+++ b/tests/entrypoints/pooling/openai/test_rerank.py
@@ -8,6 +8,12 @@ import torch.nn.functional as F
 
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import PoolingResponse, RerankResponse
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODEL_NAME = "BAAI/bge-reranker-base"
 DTYPE = "bfloat16"
diff --git a/tests/entrypoints/pooling/openai/test_score.py b/tests/entrypoints/pooling/openai/test_score.py
index b8f796d47efaa..ceff9d0181825 100644
--- a/tests/entrypoints/pooling/openai/test_score.py
+++ b/tests/entrypoints/pooling/openai/test_score.py
@@ -10,6 +10,12 @@ from torch import tensor
 
 from tests.utils import RemoteOpenAIServer
 from vllm.entrypoints.openai.protocol import ScoreResponse
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODELS = [
     {"name": "BAAI/bge-reranker-v2-m3", "is_cross_encoder": True},
diff --git a/tests/entrypoints/pooling/openai/test_truncation.py b/tests/entrypoints/pooling/openai/test_truncation.py
index 6889628dc9145..0d2d385840402 100644
--- a/tests/entrypoints/pooling/openai/test_truncation.py
+++ b/tests/entrypoints/pooling/openai/test_truncation.py
@@ -7,6 +7,12 @@ import pytest
 import pytest_asyncio
 
 from tests.utils import RemoteOpenAIServer
+from vllm.platforms import current_platform
+
+if current_platform.is_rocm():
+    pytest.skip(
+        "Encoder self-attention is not implemented on ROCm.", allow_module_level=True
+    )
 
 MODEL_NAME = "sentence-transformers/all-MiniLM-L12-v2"
 max_model_len = 128

From 77e1c035d039ec546bb01b4915eed6b5735156c2 Mon Sep 17 00:00:00 2001
From: Yihua Cheng <yihua98@uchicago.edu>
Date: Fri, 21 Nov 2025 19:18:00 -0800
Subject: [PATCH 41/83] [chore][LMCache connector] Remove useless logs from
 lmcache connector (#29069)

Signed-off-by: ApostaC <yihua98@uchicago.edu>
---
 .../v1/lmcache_integration/multi_process_adapter.py            | 1 -
 .../kv_transfer/kv_connector/v1/lmcache_mp_connector.py        | 3 ---
 2 files changed, 4 deletions(-)

diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
index ab2eeed9f6b8a..6acfb73997f25 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_integration/multi_process_adapter.py
@@ -310,7 +310,6 @@ class LMCacheMPWorkerAdapter:
                     request_id,
                     result,
                 )
-            logger.info("Retrieve request for request_id=%s finished", request_id)
 
         # Remove the finished requests from the tracking dicts
         for request_id in finished_stores:
diff --git a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py
index 22ddabbf1e352..d1d3e475cc889 100644
--- a/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py
+++ b/vllm/distributed/kv_transfer/kv_connector/v1/lmcache_mp_connector.py
@@ -469,9 +469,6 @@ class LMCacheMPConnector(KVConnectorBase_V1):
             ops.append(meta.op)
 
         if len(request_ids) > 0:
-            logger.info(
-                "HERE! SUBMITTING THE BATCHED RETRIEVE REQUESTS %s", request_ids
-            )
             self.worker_adapter.batched_submit_retrieve_requests(
                 request_ids, ops, event
             )

From fd65015a14be5f2ce663cd959dff6970285c54b4 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Fri, 21 Nov 2025 21:34:33 -0600
Subject: [PATCH 42/83] [CI/Build] Only use supported types and features on
 ROCm in MoE kernel tests (#29149)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/kernels/moe/test_batched_moe.py                  | 9 +++++++--
 tests/kernels/moe/test_block_fp8.py                    | 5 +++++
 tests/kernels/moe/test_gpt_oss_triton_kernels.py       | 5 +++++
 tests/kernels/moe/test_modular_kernel_combinations.py  | 6 ++++++
 tests/kernels/moe/test_moe_permute_unpermute.py        | 6 ++++++
 tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py | 6 ++++++
 tests/kernels/moe/test_triton_moe_ptpc_fp8.py          | 6 ++++++
 7 files changed, 41 insertions(+), 2 deletions(-)

diff --git a/tests/kernels/moe/test_batched_moe.py b/tests/kernels/moe/test_batched_moe.py
index 2285709fa7d60..dab1207d78031 100644
--- a/tests/kernels/moe/test_batched_moe.py
+++ b/tests/kernels/moe/test_batched_moe.py
@@ -39,6 +39,11 @@ MNK_FACTORS = [
 NUM_EXPERTS = [8, 64]
 TOP_KS = [1, 2, 6]
 
+DTYPES = [torch.bfloat16]
+
+if not current_platform.is_fp8_fnuz():
+    DTYPES.append(torch.float8_e4m3fn)
+
 vllm_config = VllmConfig()
 
 
@@ -96,7 +101,7 @@ class BatchedMMTensors:
 @pytest.mark.parametrize("max_tokens_per_expert", [32, 224, 512])
 @pytest.mark.parametrize("K", [128, 1024])
 @pytest.mark.parametrize("N", [128, 1024])
-@pytest.mark.parametrize("dtype", [torch.float8_e4m3fn, torch.bfloat16])
+@pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("block_shape", [None, [128, 128]])
 @pytest.mark.parametrize("per_act_token_quant", [False, True])
 def test_batched_mm(
@@ -229,7 +234,7 @@ def test_batched_mm(
 @pytest.mark.parametrize(("m", "n", "k"), MNK_FACTORS)
 @pytest.mark.parametrize("e", NUM_EXPERTS)
 @pytest.mark.parametrize("topk", TOP_KS)
-@pytest.mark.parametrize("dtype", [torch.float8_e4m3fn, torch.bfloat16])
+@pytest.mark.parametrize("dtype", DTYPES)
 @pytest.mark.parametrize("per_act_token_quant", [False, True])
 @pytest.mark.parametrize("block_shape", [None, [128, 128]])
 @pytest.mark.parametrize("input_scales", [False])
diff --git a/tests/kernels/moe/test_block_fp8.py b/tests/kernels/moe/test_block_fp8.py
index 88db4b3e537c2..b0ff1e64e3219 100644
--- a/tests/kernels/moe/test_block_fp8.py
+++ b/tests/kernels/moe/test_block_fp8.py
@@ -31,6 +31,11 @@ dg_available = has_deep_gemm()
 
 if current_platform.get_device_capability() < (9, 0):
     pytest.skip("FP8 Triton requires CUDA 9.0 or higher", allow_module_level=True)
+if current_platform.is_fp8_fnuz():
+    pytest.skip(
+        "Tests in this file require float8_e4m3fn and platform does not support",
+        allow_module_level=True,
+    )
 
 vllm_config = VllmConfig()
 
diff --git a/tests/kernels/moe/test_gpt_oss_triton_kernels.py b/tests/kernels/moe/test_gpt_oss_triton_kernels.py
index af33fd4e3fc3b..98e80ec029777 100644
--- a/tests/kernels/moe/test_gpt_oss_triton_kernels.py
+++ b/tests/kernels/moe/test_gpt_oss_triton_kernels.py
@@ -270,6 +270,11 @@ class Case:
 @pytest.mark.parametrize("num_token", [2])
 @pytest.mark.parametrize("tp", [1, 2, 4, 8])
 def test_equiv(num_token, a_dtype, w_dtype, tp):
+    from triton_kernels.tensor_details import layout
+
+    if not hasattr(layout, "make_default_matmul_mxfp4_w_layout"):
+        pytest.skip("make_default_matmul_mxfp4_w_layout not available")
+
     M = num_token
     E = ModelConfig.num_experts
     K = ModelConfig.hidden_size
diff --git a/tests/kernels/moe/test_modular_kernel_combinations.py b/tests/kernels/moe/test_modular_kernel_combinations.py
index e3b8621b452fa..2a30ef2355529 100644
--- a/tests/kernels/moe/test_modular_kernel_combinations.py
+++ b/tests/kernels/moe/test_modular_kernel_combinations.py
@@ -46,6 +46,12 @@ meets_multi_gpu_requirements = pytest.mark.skipif(
     reason="Requires deep_ep or deep_gemm or pplx or flashinfer packages",
 )
 
+if current_platform.is_fp8_fnuz():
+    pytest.skip(
+        "Tests in this file require float8_e4m3fn and platform does not support",
+        allow_module_level=True,
+    )
+
 
 def format_result(verbose, msg, ex=None):
     if ex is not None:
diff --git a/tests/kernels/moe/test_moe_permute_unpermute.py b/tests/kernels/moe/test_moe_permute_unpermute.py
index ba1f657b3ecda..12dd322dccc52 100644
--- a/tests/kernels/moe/test_moe_permute_unpermute.py
+++ b/tests/kernels/moe/test_moe_permute_unpermute.py
@@ -23,6 +23,12 @@ TOP_KS = [2, 6, 8]
 EP_SIZE = [1, 4, 16]
 current_platform.seed_everything(0)
 
+if current_platform.is_rocm():
+    pytest.skip(
+        "moe_permute_unpermute_supported is not defined for ROCm",
+        allow_module_level=True,
+    )
+
 
 def torch_permute(
     hidden_states: torch.Tensor,
diff --git a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
index d6b78dd2c2323..b220205759e2d 100644
--- a/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
+++ b/tests/kernels/moe/test_silu_mul_fp8_quant_deep_gemm.py
@@ -14,6 +14,12 @@ from vllm.platforms import current_platform
 from vllm.utils.deep_gemm import DeepGemmQuantScaleFMT, has_deep_gemm
 from vllm.utils.math_utils import cdiv, round_up
 
+if current_platform.is_fp8_fnuz():
+    pytest.skip(
+        "Tests in this file require float8_e4m3fn and platform does not support",
+        allow_module_level=True,
+    )
+
 fp8_dtype = torch.float8_e4m3fn
 
 CASES = [
diff --git a/tests/kernels/moe/test_triton_moe_ptpc_fp8.py b/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
index 7a467e160b784..0ab025dceca40 100644
--- a/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
+++ b/tests/kernels/moe/test_triton_moe_ptpc_fp8.py
@@ -19,6 +19,12 @@ if current_platform.get_device_capability() < (9, 0):
 
 vllm_config = VllmConfig()
 
+if current_platform.is_fp8_fnuz():
+    pytest.skip(
+        "Tests in this file require float8_e4m3fn and platform does not support",
+        allow_module_level=True,
+    )
+
 
 def native_w8a8_per_token_matmul(A, B, As, Bs, output_dtype=torch.float16):
     """Matrix multiplication function that supports per-token input

From 933f67ecd81231ebfa5e2434d3ae3819b6c28068 Mon Sep 17 00:00:00 2001
From: Yanan Cao <gmagogsfm@users.noreply.github.com>
Date: Fri, 21 Nov 2025 19:59:07 -0800
Subject: [PATCH 43/83] [Bugfix]Fix a conditional to not check zero value
 (#28754)

Signed-off-by: Yanan Cao <gmagogsfm@gmail.com>
---
 vllm/compilation/caching.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/compilation/caching.py b/vllm/compilation/caching.py
index 63b7ad7279e37..6297d9f995aa4 100644
--- a/vllm/compilation/caching.py
+++ b/vllm/compilation/caching.py
@@ -116,7 +116,8 @@ class VllmSerializableFunction(SerializableCallable):
             the AOT compiled path.
             """
             compile_inputs = [
-                inp or example_inputs[i] for i, inp in enumerate(fn.example_inputs)
+                inp if inp is not None else example_inputs[i]
+                for i, inp in enumerate(fn.example_inputs)
             ]
             with tracing(TracingContext(fake_mode)):
                 fn.optimized_call = vllm_backend(

From 1489902b531bb649f8110c94572b2d8b753a72cc Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Sat, 22 Nov 2025 12:01:30 +0800
Subject: [PATCH 44/83] [LoRA] Cleanup FusedMoEWithLoRA (#29187)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
---
 vllm/lora/layers/fused_moe.py           | 193 ++++++++++++------------
 vllm/lora/punica_wrapper/punica_base.py |   4 +-
 vllm/lora/punica_wrapper/punica_gpu.py  |   4 +-
 3 files changed, 98 insertions(+), 103 deletions(-)

diff --git a/vllm/lora/layers/fused_moe.py b/vllm/lora/layers/fused_moe.py
index adf30855cafc3..5aeaca8de5e53 100644
--- a/vllm/lora/layers/fused_moe.py
+++ b/vllm/lora/layers/fused_moe.py
@@ -42,6 +42,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         self.tp_size = get_tensor_model_parallel_world_size()
         self.tp_rank = get_tensor_model_parallel_rank()
         self.device = base_layer.w2_weight.device
+        self.w13_slices = 2
         self._inject_lora_into_fused_moe()
 
     def _normalize_keys(self, config: dict[str, int | None]) -> dict[str, int | None]:
@@ -60,8 +61,8 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
     def _get_lora_moe_configs(
         self,
         op_prefix: str,
-        lora_a_stacked: torch.Tensor,
-        lora_b_stacked: torch.Tensor,
+        num_loras: int,
+        rank: int,
         num_slices: int,
         M: int,
         layer: FusedMoE,
@@ -69,23 +70,25 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         config_dtype: str,
     ):
         if envs.VLLM_TUNED_CONFIG_FOLDER:
+            hidden_size = layer.hidden_size
+            intermediate_size = layer.intermediate_size_per_partition
             shrink_config = get_lora_op_configs(
                 op_type=f"fused_moe_lora_{op_prefix}_shrink",
-                max_loras=lora_a_stacked.shape[0],
+                max_loras=num_loras,
                 batch=M,
-                hidden_size=lora_a_stacked.shape[-1],
-                rank=lora_a_stacked.shape[-2],
+                hidden_size=hidden_size,
+                rank=rank,
                 num_slices=num_slices,
-                moe_intermediate_size=lora_b_stacked.shape[-2],
+                moe_intermediate_size=intermediate_size,
             )
             expand_config = get_lora_op_configs(
                 op_type=f"fused_moe_lora_{op_prefix}_expand",
-                max_loras=lora_a_stacked.shape[0],
+                max_loras=num_loras,
                 batch=M,
-                hidden_size=lora_a_stacked.shape[-1],
-                rank=lora_a_stacked.shape[-2],
+                hidden_size=hidden_size,  # lora_a_stacked.shape[-1],
+                rank=rank,
                 num_slices=num_slices,
-                moe_intermediate_size=lora_b_stacked.shape[-2],
+                moe_intermediate_size=intermediate_size,  # lora_b_stacked.shape[-2],
             )
         else:  # fall back to the default config
             get_config_func = functools.partial(
@@ -152,12 +155,12 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
                 num_tokens = hidden_states.size(0)
                 M = min(num_tokens, CHUNK_SIZE)
-
+                max_lora_rank = self.w13_lora_a_stacked[0].shape[-2]
                 shrink_config, expand_config = self._get_lora_moe_configs(
                     op_prefix="w13",
-                    lora_a_stacked=self.w1_lora_a_stacked,
-                    lora_b_stacked=self.w1_lora_b_stacked,
-                    num_slices=2,
+                    num_loras=self.max_loras,
+                    rank=max_lora_rank,
+                    num_slices=self.w13_slices,
                     M=M,
                     layer=layer,
                     top_k=top_k,
@@ -165,7 +168,6 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 )
 
                 # get the block size of m from customized config or default config
-                max_loras = self.w1_lora_a_stacked.shape[0]
                 (
                     sorted_token_ids_lora,
                     expert_ids_lora,
@@ -175,7 +177,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                     num_tokens,
                     shrink_config["BLOCK_SIZE_M"],
                     self.base_layer.local_num_experts,
-                    max_loras,
+                    self.max_loras,
                     self.adapter_enabled,
                     expert_map,
                 )
@@ -186,17 +188,15 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                     num_tokens_post_padded_lora
                 )
 
-                w13_lora_a_stacked = [self.w1_lora_a_stacked, self.w3_lora_a_stacked]
-                w13_lora_b_stacked = [self.w1_lora_b_stacked, self.w3_lora_b_stacked]
-                max_lora_rank = self.w1_lora_a_stacked.shape[-2]
-                expert_ids_lora = expert_ids_lora.view(max_loras, -1)
-                sorted_token_ids_lora = sorted_token_ids_lora.view(max_loras, -1)
+                expert_ids_lora = expert_ids_lora.view(self.max_loras, -1)
+                sorted_token_ids_lora = sorted_token_ids_lora.view(self.max_loras, -1)
+                #
 
                 self.punica_wrapper.add_lora_fused_moe(
                     input.view(-1, top_k, input.shape[-1]),
                     hidden_states,
-                    w13_lora_a_stacked,
-                    w13_lora_b_stacked,
+                    self.w13_lora_a_stacked,
+                    self.w13_lora_b_stacked,
                     topk_weights,
                     sorted_token_ids_lora,
                     expert_ids_lora,
@@ -230,11 +230,11 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
                 num_tokens = hidden_states.size(0)
                 M = min(num_tokens, CHUNK_SIZE)
-
+                max_lora_rank = self.w2_lora_a_stacked.shape[-2]
                 shrink_config, expand_config = self._get_lora_moe_configs(
                     op_prefix="w2",
-                    lora_a_stacked=self.w2_lora_a_stacked,
-                    lora_b_stacked=self.w2_lora_b_stacked,
+                    num_loras=self.max_loras,
+                    rank=max_lora_rank,
                     num_slices=1,
                     M=M,
                     layer=layer,
@@ -247,20 +247,19 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 num_tokens_post_padded_lora = moe_state_dict[
                     "num_tokens_post_padded_lora"
                 ]
-                max_loras = self.w1_lora_a_stacked.shape[0]
-                expert_ids_lora = expert_ids_lora.view(max_loras, -1)
-                sorted_token_ids_lora = sorted_token_ids_lora.view(max_loras, -1)
+
+                expert_ids_lora = expert_ids_lora.view(self.max_loras, -1)
+                sorted_token_ids_lora = sorted_token_ids_lora.view(self.max_loras, -1)
                 intermediate_cache2 = moe_state_dict["intermediate_cache2"]
                 intermediate_cache3 = args[0]
-                max_lora_rank = self.w2_lora_a_stacked.shape[-2]
 
                 shard_size_w2 = divide(self.base_layer.hidden_size, self.tp_size)
 
                 self.punica_wrapper.add_lora_fused_moe(
                     intermediate_cache3,
                     intermediate_cache2,
-                    [self.w2_lora_a_stacked],
-                    [self.w2_lora_b_stacked],
+                    (self.w2_lora_a_stacked,),
+                    (self.w2_lora_b_stacked,),
                     topk_weights,
                     sorted_token_ids_lora,
                     expert_ids_lora,
@@ -289,7 +288,6 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         fused_experts.moe_sum = moe_sum_decorator(
             self.base_layer, fused_experts.moe_sum
         )
-
         self.base_layer.quant_method = FusedMoEModularMethod(
             self.base_layer.quant_method, m_fused_moe_fn
         )
@@ -301,33 +299,42 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         model_config: PretrainedConfig | None = None,
     ) -> None:
         """Initializes lora matrices."""
+        assert self.w13_slices == 2
+        self.max_loras = lora_config.max_loras
         self.fully_sharded = lora_config.fully_sharded_loras
 
         self.adapter_enabled = torch.tensor(
             [0] * (max_loras + 1), dtype=torch.int, device=self.device
         )
 
-        self.w1_lora_a_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                lora_config.max_lora_rank
-                if not self.fully_sharded
-                else divide(lora_config.max_lora_rank, self.tp_size),
-                self.base_layer.hidden_size,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
+        self.w13_lora_a_stacked = tuple(
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    lora_config.max_lora_rank
+                    if not self.fully_sharded
+                    else divide(lora_config.max_lora_rank, self.tp_size),
+                    self.base_layer.hidden_size,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            )
+            for _ in range(self.w13_slices)
         )
-        self.w1_lora_b_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                self.base_layer.intermediate_size_per_partition,
-                lora_config.max_lora_rank,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
+
+        self.w13_lora_b_stacked = tuple(
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    self.base_layer.intermediate_size_per_partition,
+                    lora_config.max_lora_rank,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            )
+            for _ in range(self.w13_slices)
         )
 
         self.w2_lora_a_stacked = torch.zeros(
@@ -353,29 +360,6 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
             device=self.device,
         )
 
-        self.w3_lora_a_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                lora_config.max_lora_rank
-                if not self.fully_sharded
-                else divide(lora_config.max_lora_rank, self.tp_size),
-                self.base_layer.hidden_size,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
-        )
-        self.w3_lora_b_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                self.base_layer.intermediate_size_per_partition,
-                lora_config.max_lora_rank,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
-        )
-
         # They will be used by 'LoRALayerWeights.create_dummy_lora_weights'
         # to create a dummy LoRA weights.
         self.lora_a_stacked = []
@@ -383,20 +367,28 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         for lora_id in range(max_loras):
             for experts_id in range(self.base_layer.local_num_experts):
                 # gate_proj,down_proj,up_proj
-                self.lora_a_stacked.append(self.w1_lora_a_stacked[lora_id][experts_id])
+                self.lora_a_stacked.append(
+                    self.w13_lora_a_stacked[0][lora_id][experts_id]
+                )
                 self.lora_a_stacked.append(self.w2_lora_a_stacked[lora_id][experts_id])
-                self.lora_a_stacked.append(self.w3_lora_a_stacked[lora_id][experts_id])
+                self.lora_a_stacked.append(
+                    self.w13_lora_a_stacked[1][lora_id][experts_id]
+                )
 
-                self.lora_b_stacked.append(self.w1_lora_b_stacked[lora_id][experts_id])
+                self.lora_b_stacked.append(
+                    self.w13_lora_b_stacked[0][lora_id][experts_id]
+                )
                 self.lora_b_stacked.append(self.w2_lora_b_stacked[lora_id][experts_id])
-                self.lora_b_stacked.append(self.w3_lora_b_stacked[lora_id][experts_id])
+                self.lora_b_stacked.append(
+                    self.w13_lora_b_stacked[1][lora_id][experts_id]
+                )
 
     def reset_lora(self, index: int):
         """Resets the lora weights at index back to 0."""
-        self.w1_lora_a_stacked[index] = 0
-        self.w1_lora_b_stacked[index] = 0
-        self.w3_lora_a_stacked[index] = 0
-        self.w3_lora_b_stacked[index] = 0
+        for pos in range(self.w13_slices):
+            self.w13_lora_a_stacked[pos][index] = 0
+            self.w13_lora_b_stacked[pos][index] = 0
+
         self.w2_lora_a_stacked[index] = 0
         self.w2_lora_b_stacked[index] = 0
         self.adapter_enabled[index] = 0
@@ -434,7 +426,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 if self.fully_sharded:
                     # Based on S-LoRA, we slice W1 and W3 A along the rank dim,
                     # and W2 B along the hidden_size dim.
-                    w13_shard_size = self.w1_lora_a_stacked[index, eid].shape[0]
+                    w13_shard_size = self.w13_lora_a_stacked[0][index, eid].shape[0]
                     w13_start_idx = self.tp_rank * w13_shard_size
                     w13_end_idx = (self.tp_rank + 1) * w13_shard_size
                     w1_lora_a = w1_lora_a[w13_start_idx:w13_end_idx, :]
@@ -444,29 +436,32 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                     w2_start_idx = self.tp_rank * w2_shard_size
                     w2_end_idx = (self.tp_rank + 1) * w2_shard_size
                     w2_lora_b = w2_lora_b[w2_start_idx:w2_end_idx, :]
-
-            self.w1_lora_a_stacked[
+            # w1 lora_a
+            self.w13_lora_a_stacked[0][
                 index, eid, : w1_lora_a.shape[0], : w1_lora_a.shape[1]
             ].copy_(w1_lora_a, non_blocking=True)
-
-            self.w3_lora_a_stacked[
+            # w3 lora_a
+            self.w13_lora_a_stacked[1][
                 index, eid, : w3_lora_a.shape[0], : w3_lora_a.shape[1]
             ].copy_(w3_lora_a, non_blocking=True)
 
+            # w1 lora_b
+            self.w13_lora_b_stacked[0][
+                index, eid, : w1_lora_b.shape[0], : w1_lora_b.shape[1]
+            ].copy_(w1_lora_b, non_blocking=True)
+            # w3 lora_b
+            self.w13_lora_b_stacked[1][
+                index, eid, : w3_lora_b.shape[0], : w3_lora_b.shape[1]
+            ].copy_(w3_lora_b, non_blocking=True)
+
+            self.w2_lora_a_stacked[
+                index, eid, : w2_lora_a.shape[0], : w2_lora_a.shape[1]
+            ].copy_(w2_lora_a, non_blocking=True)
+
             self.w2_lora_b_stacked[
                 index, eid, : w2_lora_b.shape[0], : w2_lora_b.shape[1]
             ].copy_(w2_lora_b, non_blocking=True)
 
-            self.w1_lora_b_stacked[
-                index, eid, : w1_lora_b.shape[0], : w1_lora_b.shape[1]
-            ].copy_(w1_lora_b, non_blocking=True)
-            self.w3_lora_b_stacked[
-                index, eid, : w3_lora_b.shape[0], : w3_lora_b.shape[1]
-            ].copy_(w3_lora_b, non_blocking=True)
-            self.w2_lora_a_stacked[
-                index, eid, : w2_lora_a.shape[0], : w2_lora_a.shape[1]
-            ].copy_(w2_lora_a, non_blocking=True)
-
     @classmethod
     def can_replace_layer(
         cls,
diff --git a/vllm/lora/punica_wrapper/punica_base.py b/vllm/lora/punica_wrapper/punica_base.py
index 7c0fc8167711d..ce38751e4b6a7 100644
--- a/vllm/lora/punica_wrapper/punica_base.py
+++ b/vllm/lora/punica_wrapper/punica_base.py
@@ -470,8 +470,8 @@ class PunicaWrapperBase(PunicaWrapperABC):
         self,
         y: torch.Tensor,
         x: torch.Tensor,
-        lora_a_stacked: list[torch.Tensor],
-        lora_b_stacked: list[torch.Tensor],
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
         topk_weights: torch.Tensor,
         sorted_token_ids: torch.Tensor,
         expert_ids: torch.Tensor,
diff --git a/vllm/lora/punica_wrapper/punica_gpu.py b/vllm/lora/punica_wrapper/punica_gpu.py
index 52138ef0cc3b0..ef4b4ab7c3497 100644
--- a/vllm/lora/punica_wrapper/punica_gpu.py
+++ b/vllm/lora/punica_wrapper/punica_gpu.py
@@ -360,8 +360,8 @@ class PunicaWrapperGPU(PunicaWrapperBase):
         self,
         y: torch.Tensor,
         x: torch.Tensor,
-        lora_a_stacked: list[torch.Tensor],
-        lora_b_stacked: list[torch.Tensor],
+        lora_a_stacked: tuple[torch.Tensor, ...],
+        lora_b_stacked: tuple[torch.Tensor, ...],
         topk_weights: torch.Tensor,
         sorted_token_ids: torch.Tensor,
         expert_ids: torch.Tensor,

From e9056056fbacecbac4318bd0323745fdd7fe55b6 Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Fri, 21 Nov 2025 20:21:35 -0800
Subject: [PATCH 45/83] [Model Runner V2] Limit cudagraph size to max decode
 batch size (#29221)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/cudagraph_utils.py | 13 +++++++++----
 1 file changed, 9 insertions(+), 4 deletions(-)

diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
index 31a706475243c..763bd61834625 100644
--- a/vllm/v1/worker/gpu/cudagraph_utils.py
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -27,9 +27,11 @@ class CudaGraphManager:
         device: torch.device,
     ):
         self.vllm_config = vllm_config
+        self.scheduler_config = vllm_config.scheduler_config
         self.device = device
 
         self.max_model_len = vllm_config.model_config.max_model_len
+        self.max_num_reqs = self.scheduler_config.max_num_seqs
         self.dp_size = vllm_config.parallel_config.data_parallel_size
         self.compilation_config = vllm_config.compilation_config
         assert self.compilation_config is not None
@@ -39,9 +41,11 @@ class CudaGraphManager:
         else:
             self.cudagraph_mode = self.compilation_config.cudagraph_mode
         if self.compilation_config.cudagraph_capture_sizes is not None:
-            self.cudagraph_sizes = sorted(
-                self.compilation_config.cudagraph_capture_sizes
-            )
+            cudagraph_sizes = sorted(self.compilation_config.cudagraph_capture_sizes)
+            # Limit the cudagraph sizes to the max decode batch size.
+            self.cudagraph_sizes = [
+                x for x in cudagraph_sizes if x <= self.max_num_reqs
+            ]
         else:
             self.cudagraph_sizes = []
         self.padded_sizes = self._init_padded_sizes()
@@ -54,9 +58,10 @@ class CudaGraphManager:
         if not self.cudagraph_mode.has_full_cudagraphs():
             # Full cuda graphs are not used.
             return {}
+        if not self.cudagraph_sizes:
+            return {}
 
         padded_sizes: dict[int, int] = {}
-        assert len(self.cudagraph_sizes) > 0
         for i in range(1, self.cudagraph_sizes[-1] + 1):
             for x in self.cudagraph_sizes:
                 if i <= x:

From 742e9ff6b39ad0433bac0d7417a41bbdc74854a3 Mon Sep 17 00:00:00 2001
From: Andrew Xia <axia@meta.com>
Date: Fri, 21 Nov 2025 23:42:11 -0800
Subject: [PATCH 46/83] [responsesAPI] parse reasoning item input (#28248)

Signed-off-by: Andrew Xia <axia@fb.com>
Co-authored-by: Andrew Xia <axia@fb.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
---
 .../online_serving/openai_responses_client.py | 44 ++++++++++++
 .../openai/test_response_api_simple.py        | 71 +++++++++++++++++++
 .../openai/test_response_api_with_harmony.py  | 27 ++++++-
 tests/entrypoints/test_responses_utils.py     | 58 +++++++++++++++
 vllm/entrypoints/responses_utils.py           | 13 ++++
 5 files changed, 212 insertions(+), 1 deletion(-)
 create mode 100644 examples/online_serving/openai_responses_client.py
 create mode 100644 tests/entrypoints/openai/test_response_api_simple.py

diff --git a/examples/online_serving/openai_responses_client.py b/examples/online_serving/openai_responses_client.py
new file mode 100644
index 0000000000000..b4eb24671507a
--- /dev/null
+++ b/examples/online_serving/openai_responses_client.py
@@ -0,0 +1,44 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+"""
+Set up this example by starting a vLLM OpenAI-compatible server.
+Reasoning models can be used through the Responses API as seen here
+https://platform.openai.com/docs/api-reference/responses
+For example:
+vllm serve Qwen/Qwen3-8B --reasoning-parser qwen3
+
+"""
+
+from openai import OpenAI
+
+input_messages = [{"role": "user", "content": "What model are you?"}]
+
+
+def main():
+    base_url = "http://localhost:8000/v1"
+    client = OpenAI(base_url=base_url, api_key="empty")
+    model = "Qwen/Qwen3-8B"  # get_first_model(client)
+    response = client.responses.create(
+        model=model,
+        input=input_messages,
+    )
+
+    for message in response.output:
+        if message.type == "reasoning":
+            # append reasoning message
+            input_messages.append(message)
+
+    response_2 = client.responses.create(
+        model=model,
+        input=input_messages,
+    )
+    print(response_2.output_text)
+    # I am Qwen, a large language model developed by Alibaba Cloud.
+    # I am designed to assist with a wide range of tasks, including
+    # answering questions, creating content, coding, and engaging in
+    # conversations. I can help with various topics and provide
+    # information or support in multiple languages. How can I assist you today?
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/entrypoints/openai/test_response_api_simple.py b/tests/entrypoints/openai/test_response_api_simple.py
new file mode 100644
index 0000000000000..425b8199a0fd0
--- /dev/null
+++ b/tests/entrypoints/openai/test_response_api_simple.py
@@ -0,0 +1,71 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+
+
+import pytest
+import pytest_asyncio
+from openai import OpenAI
+
+from ...utils import RemoteOpenAIServer
+
+MODEL_NAME = "Qwen/Qwen3-8B"
+
+
+@pytest.fixture(scope="module")
+def server():
+    args = ["--reasoning-parser", "qwen3", "--max_model_len", "5000"]
+    env_dict = dict(
+        VLLM_ENABLE_RESPONSES_API_STORE="1",
+        # uncomment for tool calling
+        # PYTHON_EXECUTION_BACKEND="dangerously_use_uv",
+    )
+
+    with RemoteOpenAIServer(MODEL_NAME, args, env_dict=env_dict) as remote_server:
+        yield remote_server
+
+
+@pytest_asyncio.fixture
+async def client(server):
+    async with server.get_async_client() as async_client:
+        yield async_client
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize("model_name", [MODEL_NAME])
+async def test_basic(client: OpenAI, model_name: str):
+    response = await client.responses.create(
+        model=model_name,
+        input="What is 13 * 24?",
+    )
+    assert response is not None
+    print("response: ", response)
+    assert response.status == "completed"
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize("model_name", [MODEL_NAME])
+async def test_reasoning_item(client: OpenAI, model_name: str):
+    response = await client.responses.create(
+        model=model_name,
+        input=[
+            {"type": "message", "content": "Hello.", "role": "user"},
+            {
+                "type": "reasoning",
+                "id": "lol",
+                "content": [
+                    {
+                        "type": "reasoning_text",
+                        "text": "We need to respond: greeting.",
+                    }
+                ],
+                "summary": [],
+            },
+        ],
+        temperature=0.0,
+    )
+    assert response is not None
+    assert response.status == "completed"
+    # make sure we get a reasoning and text output
+    assert response.output[0].type == "reasoning"
+    assert response.output[1].type == "message"
+    assert type(response.output[1].content[0].text) is str
diff --git a/tests/entrypoints/openai/test_response_api_with_harmony.py b/tests/entrypoints/openai/test_response_api_with_harmony.py
index dea8d2d28f61a..6251e1776c30a 100644
--- a/tests/entrypoints/openai/test_response_api_with_harmony.py
+++ b/tests/entrypoints/openai/test_response_api_with_harmony.py
@@ -35,7 +35,7 @@ GET_WEATHER_SCHEMA = {
 
 @pytest.fixture(scope="module")
 def server():
-    args = ["--enforce-eager", "--tool-server", "demo"]
+    args = ["--enforce-eager", "--tool-server", "demo", "--max_model_len", "5000"]
     env_dict = dict(
         VLLM_ENABLE_RESPONSES_API_STORE="1",
         PYTHON_EXECUTION_BACKEND="dangerously_use_uv",
@@ -550,6 +550,31 @@ def call_function(name, args):
         raise ValueError(f"Unknown function: {name}")
 
 
+@pytest.mark.asyncio
+@pytest.mark.parametrize("model_name", [MODEL_NAME])
+async def test_reasoning_item(client: OpenAI, model_name: str):
+    response = await client.responses.create(
+        model=model_name,
+        input=[
+            {"type": "message", "content": "Hello.", "role": "user"},
+            {
+                "type": "reasoning",
+                "id": "lol",
+                "content": [
+                    {
+                        "type": "reasoning_text",
+                        "text": "We need to respond: greeting.",
+                    }
+                ],
+                "summary": [],
+            },
+        ],
+        temperature=0.0,
+    )
+    assert response is not None
+    assert response.status == "completed"
+
+
 @pytest.mark.asyncio
 @pytest.mark.parametrize("model_name", [MODEL_NAME])
 async def test_function_calling(client: OpenAI, model_name: str):
diff --git a/tests/entrypoints/test_responses_utils.py b/tests/entrypoints/test_responses_utils.py
index 48bf06088bc05..91c818374e3fd 100644
--- a/tests/entrypoints/test_responses_utils.py
+++ b/tests/entrypoints/test_responses_utils.py
@@ -1,7 +1,15 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import pytest
+from openai.types.responses.response_reasoning_item import (
+    Content,
+    ResponseReasoningItem,
+    Summary,
+)
+
 from vllm.entrypoints.responses_utils import (
+    construct_chat_message_with_tool_call,
     convert_tool_responses_to_completions_format,
 )
 
@@ -28,3 +36,53 @@ class TestResponsesUtils:
         result = convert_tool_responses_to_completions_format(input_tool)
 
         assert result == {"type": "function", "function": input_tool}
+
+    def test_construct_chat_message_with_tool_call(self):
+        item = ResponseReasoningItem(
+            id="lol",
+            summary=[],
+            type="reasoning",
+            content=[
+                Content(
+                    text="Leroy Jenkins",
+                    type="reasoning_text",
+                )
+            ],
+            encrypted_content=None,
+            status=None,
+        )
+        formatted_item = construct_chat_message_with_tool_call(item)
+        assert formatted_item["role"] == "assistant"
+        assert formatted_item["reasoning"] == "Leroy Jenkins"
+
+        item = ResponseReasoningItem(
+            id="lol",
+            summary=[
+                Summary(
+                    text='Hmm, the user has just started with a simple "Hello,"',
+                    type="summary_text",
+                )
+            ],
+            type="reasoning",
+            content=None,
+            encrypted_content=None,
+            status=None,
+        )
+
+        formatted_item = construct_chat_message_with_tool_call(item)
+        assert formatted_item["role"] == "assistant"
+        assert (
+            formatted_item["reasoning"]
+            == 'Hmm, the user has just started with a simple "Hello,"'
+        )
+
+        item = ResponseReasoningItem(
+            id="lol",
+            summary=[],
+            type="reasoning",
+            content=None,
+            encrypted_content="TOP_SECRET_MESSAGE",
+            status=None,
+        )
+        with pytest.raises(ValueError):
+            construct_chat_message_with_tool_call(item)
diff --git a/vllm/entrypoints/responses_utils.py b/vllm/entrypoints/responses_utils.py
index d966f58804b67..912e8a690573d 100644
--- a/vllm/entrypoints/responses_utils.py
+++ b/vllm/entrypoints/responses_utils.py
@@ -10,6 +10,7 @@ from openai.types.chat.chat_completion_message_tool_call_param import (
     Function as FunctionCallTool,
 )
 from openai.types.responses import ResponseFunctionToolCall
+from openai.types.responses.response_reasoning_item import ResponseReasoningItem
 from openai.types.responses.tool import Tool
 
 from vllm import envs
@@ -37,6 +38,18 @@ def construct_chat_message_with_tool_call(
                 )
             ],
         )
+    elif isinstance(item, ResponseReasoningItem):
+        reasoning_content = ""
+        if item.encrypted_content:
+            raise ValueError("Encrypted content is not supported.")
+        if len(item.summary) == 1:
+            reasoning_content = item.summary[0].text
+        elif item.content and len(item.content) == 1:
+            reasoning_content = item.content[0].text
+        return {
+            "role": "assistant",
+            "reasoning": reasoning_content,
+        }
     elif item.get("type") == "function_call_output":
         # Append the function call output as a tool message.
         return ChatCompletionToolMessageParam(

From ea38474ac564efdc09762ad066139b75cf68f924 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Mads=20Kildeg=C3=A5rd?= <mkildegaard99@gmail.com>
Date: Sat, 22 Nov 2025 10:58:22 +0100
Subject: [PATCH 47/83] [Frontend][Responses API] Multi-turn (with type:
 "output_text") support for non-harmony requests (#29175)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Signed-off-by: Mads Kildegård <mkildegaard99@gmail.com>
---
 vllm/entrypoints/chat_utils.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/vllm/entrypoints/chat_utils.py b/vllm/entrypoints/chat_utils.py
index aaf8a3ae9d2dd..bf80856c1bbfc 100644
--- a/vllm/entrypoints/chat_utils.py
+++ b/vllm/entrypoints/chat_utils.py
@@ -1283,6 +1283,7 @@ MM_PARSER_MAP: dict[
     "text": lambda part: _TextParser(part).get("text", None),
     "thinking": lambda part: _ThinkParser(part).get("thinking", None),
     "input_text": lambda part: _TextParser(part).get("text", None),
+    "output_text": lambda part: _TextParser(part).get("text", None),
     "input_image": lambda part: _ResponsesInputImageParser(part).get("image_url", None),
     "image_url": lambda part: _ImageParser(part).get("image_url", {}).get("url", None),
     "image_embeds": lambda part: _ImageEmbedsParser(part).get("image_embeds", None),
@@ -1463,7 +1464,7 @@ def _parse_chat_message_content_part(
         )
         return None
 
-    if part_type in ("text", "input_text", "refusal", "thinking"):
+    if part_type in ("text", "input_text", "output_text", "refusal", "thinking"):
         str_content = cast(str, content)
         if wrap_dicts:
             return {"type": "text", "text": str_content}

From 988ee66b0d54ec08a24135f7a947affe69e9dd52 Mon Sep 17 00:00:00 2001
From: jinghanhu <hujinghan.hjh@alibaba-inc.com>
Date: Sat, 22 Nov 2025 18:07:50 +0800
Subject: [PATCH 48/83] Handle triton kernel import exception  (#29062)

---
 vllm/model_executor/layers/fused_moe/config.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/vllm/model_executor/layers/fused_moe/config.py b/vllm/model_executor/layers/fused_moe/config.py
index 21eb4d590a7d1..1826fafa8c4f5 100644
--- a/vllm/model_executor/layers/fused_moe/config.py
+++ b/vllm/model_executor/layers/fused_moe/config.py
@@ -28,10 +28,11 @@ logger = init_logger(__name__)
 if has_triton_kernels():
     try:
         from triton_kernels.matmul_ogs import PrecisionConfig
-    except ImportError:
+    except (ImportError, AttributeError) as e:
         logger.error(
             "Failed to import Triton kernels. Please make sure your triton "
-            "version is compatible."
+            "version is compatible. Error: %s",
+            e,
         )
 
 

From e6309acdba3a26e803d1ea7f66804f4ad30c2b9a Mon Sep 17 00:00:00 2001
From: "Jane (Yuan) Xu" <31798555+janeyx99@users.noreply.github.com>
Date: Sat, 22 Nov 2025 05:35:32 -0500
Subject: [PATCH 49/83] Simplify `from_blob` usage in
 `get_cuda_view_from_cpu_tensor` (#29027)

Signed-off-by: Jane Xu <janeyx@meta.com>
---
 csrc/cuda_view.cu | 11 +++--------
 1 file changed, 3 insertions(+), 8 deletions(-)

diff --git a/csrc/cuda_view.cu b/csrc/cuda_view.cu
index 938bd4ab7fc62..9853fc942bab7 100644
--- a/csrc/cuda_view.cu
+++ b/csrc/cuda_view.cu
@@ -22,15 +22,10 @@ torch::Tensor get_cuda_view_from_cpu_tensor(torch::Tensor& cpu_tensor) {
   auto strides = cpu_tensor.strides();
   auto options = cpu_tensor.options().device(torch::kCUDA);
 
-  // from_blob signature: from_blob(void *data, IntArrayRef sizes, ..., Deleter,
-  // const TensorOptions &) Provide a no-op deleter. The CPU tensor holds the
-  // memory, so we don't free it here.
-  auto deleter = [](void*) {
-    // no-op, since the memory is owned by the original CPU tensor
-  };
-
+  // use default no-op deleter, since the memory is owned by the original CPU
+  // tensor
   torch::Tensor cuda_tensor =
-      torch::from_blob(device_ptr, sizes, strides, deleter, options);
+      torch::from_blob(device_ptr, sizes, strides, options);
 
   TORCH_CHECK(cuda_tensor.device().is_cuda(),
               "Resulting tensor is not on CUDA device");

From a4fdf2405c737843d1e95e406959f3e2e6bcf899 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Sat, 22 Nov 2025 04:59:39 -0600
Subject: [PATCH 50/83] [CI/Build] Skip tests that require libcudart in
 test_lmcache_integration.py (#29228)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 .../kv_connector/unit/test_lmcache_integration.py | 15 +++++++++++++++
 1 file changed, 15 insertions(+)

diff --git a/tests/v1/kv_connector/unit/test_lmcache_integration.py b/tests/v1/kv_connector/unit/test_lmcache_integration.py
index 11507d7cd4e7b..33418edc325af 100644
--- a/tests/v1/kv_connector/unit/test_lmcache_integration.py
+++ b/tests/v1/kv_connector/unit/test_lmcache_integration.py
@@ -9,6 +9,12 @@
 # Assumption vs. Correctness Tests:
 # these unit tests do *not* test correctness of LMCache-side or vLLM-side logic
 # it is to ensure that assumptions LMCache makes about vLLM's interface are stable
+
+import pytest
+
+from vllm.platforms import current_platform
+
+
 def assumes(obj, attr, is_callable=False, is_instance_of=None):
     import inspect
     from dataclasses import is_dataclass
@@ -48,6 +54,9 @@ def assumes(obj, attr, is_callable=False, is_instance_of=None):
                 assert isinstance(attr_value, is_instance_of), assumption_msg
 
 
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Requires libcudart.so, not available on ROCm"
+)
 def test_multimodal_interface():
     # protect against interface changes
     from vllm.multimodal.inputs import PlaceholderRange
@@ -72,6 +81,9 @@ def test_multimodal_interface():
     assert token_ids.tolist() == [0, 0, 0, 0, 4, 4369, 4369, 4369, 4369, 9]
 
 
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Requires libcudart.so, not available on ROCm"
+)
 def test_config_interface():
     # protect against interface changes
     from vllm.config import VllmConfig
@@ -146,6 +158,9 @@ def test_config_interface():
     )
 
 
+@pytest.mark.skipif(
+    current_platform.is_rocm(), reason="Requires libcudart.so, not available on ROCm"
+)
 def test_request_interface():
     # protect against interface changes
     from types import NoneType

From 8e22da1d7fcd43efd8fec18c0c0bf6a8e7cf61a6 Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Sat, 22 Nov 2025 05:00:54 -0600
Subject: [PATCH 51/83] [CI/Build Don't add FLASHINFER backend in
 test_cpu_offloading.py (#29229)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/v1/kv_offload/test_cpu_offloading.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/tests/v1/kv_offload/test_cpu_offloading.py b/tests/v1/kv_offload/test_cpu_offloading.py
index 3ee41c40859dc..406d4c0b4c1fd 100644
--- a/tests/v1/kv_offload/test_cpu_offloading.py
+++ b/tests/v1/kv_offload/test_cpu_offloading.py
@@ -12,10 +12,14 @@ from tqdm import tqdm
 from vllm import LLM, SamplingParams, TokensPrompt
 from vllm.config import KVEventsConfig, KVTransferConfig
 from vllm.distributed.kv_events import BlockStored, KVEventBatch
+from vllm.platforms import current_platform
 from vllm.utils.system_utils import set_env_var
 
 CPU_BLOCK_SIZES = [48]
-ATTN_BACKENDS = ["FLASH_ATTN", "FLASHINFER"]
+ATTN_BACKENDS = ["FLASH_ATTN"]
+
+if current_platform.is_cuda():
+    ATTN_BACKENDS.append("FLASHINFER")
 
 
 class MockSubscriber:

From 5a4802588ed8f7918468986fce130c19ee721674 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 22 Nov 2025 19:34:15 +0800
Subject: [PATCH 52/83] [Misc] Further clean up chunked prefill and prefix
 caching init (#29186)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 tests/engine/test_arg_utils.py  |  2 +-
 tests/v1/core/test_scheduler.py | 19 +++++++------------
 tests/v1/core/utils.py          | 11 +++--------
 vllm/config/cache.py            |  4 ++--
 vllm/engine/arg_utils.py        | 24 +++++++++++++++++++-----
 vllm/v1/core/sched/scheduler.py |  2 +-
 6 files changed, 33 insertions(+), 29 deletions(-)

diff --git a/tests/engine/test_arg_utils.py b/tests/engine/test_arg_utils.py
index 472b1487ef440..10827e3b4b9cd 100644
--- a/tests/engine/test_arg_utils.py
+++ b/tests/engine/test_arg_utils.py
@@ -279,7 +279,7 @@ def test_prefix_cache_default():
     args = parser.parse_args([])
 
     engine_args = EngineArgs.from_cli_args(args=args)
-    assert not engine_args.enable_prefix_caching, "prefix caching defaults to off."
+    assert engine_args.enable_prefix_caching, "prefix caching should default to on."
 
     # with flag to turn it on.
     args = parser.parse_args(["--enable-prefix-caching"])
diff --git a/tests/v1/core/test_scheduler.py b/tests/v1/core/test_scheduler.py
index d9a69a77c9797..09acde6e08faa 100644
--- a/tests/v1/core/test_scheduler.py
+++ b/tests/v1/core/test_scheduler.py
@@ -76,11 +76,11 @@ def test_get_num_unfinished_requests():
 @pytest.mark.parametrize(
     "enable_prefix_caching, prompt_logprobs",
     [
-        (None, None),
+        (False, None),
         (True, 5),
     ],
 )
-def test_schedule(enable_prefix_caching: bool | None, prompt_logprobs: int | None):
+def test_schedule(enable_prefix_caching: bool, prompt_logprobs: int | None):
     """Test scheduling.
     Two cases: default APC/no prompt logprobs; APC=True + prompt logprobs
     """
@@ -582,12 +582,12 @@ def test_check_stop_min_tokens():
 @pytest.mark.parametrize(
     "enable_prefix_caching, prompt_logprobs",
     [
-        (None, None),
+        (False, None),
         (True, 5),
     ],
 )
 def test_schedule_concurrent_batches(
-    enable_prefix_caching: bool | None, prompt_logprobs: int | None
+    enable_prefix_caching: bool, prompt_logprobs: int | None
 ):
     scheduler = create_scheduler(
         max_num_batched_tokens=1024,
@@ -1425,7 +1425,7 @@ def create_scheduler_with_priority(
     model: str = "facebook/opt-125m",
     max_num_seqs: int = 16,
     max_num_batched_tokens: int = 8192,
-    enable_prefix_caching: bool | None = None,
+    enable_prefix_caching: bool = False,
     long_prefill_token_threshold: int = 0,
     disable_chunked_mm_input: bool = False,
     use_kv_connector: bool = False,
@@ -1444,7 +1444,7 @@ def create_scheduler_with_priority(
       max_num_batch_tokens: max num tokens to batch
       enable_prefix_caching: optionally force APC config
                              (True/False) or use default
-                             (None)
+                             (False)
 
     Returns:
       {class}`Scheduler` instance with priority scheduling
@@ -1467,17 +1467,12 @@ def create_scheduler_with_priority(
         seed=42,
     )
     # Cache config, optionally force APC
-    kwargs_cache = (
-        {}
-        if enable_prefix_caching is None
-        else {"enable_prefix_caching": enable_prefix_caching}
-    )
     cache_config = CacheConfig(
         block_size=block_size,
         gpu_memory_utilization=0.9,
         swap_space=0,
         cache_dtype="auto",
-        **kwargs_cache,
+        enable_prefix_caching=enable_prefix_caching,
     )
     kv_transfer_config = (
         KVTransferConfig(
diff --git a/tests/v1/core/utils.py b/tests/v1/core/utils.py
index 65511c17473b2..6830f68736453 100644
--- a/tests/v1/core/utils.py
+++ b/tests/v1/core/utils.py
@@ -42,7 +42,7 @@ def create_scheduler(
     model: str = "facebook/opt-125m",
     max_num_seqs: int = 16,
     max_num_batched_tokens: int = 8192,
-    enable_prefix_caching: bool | None = None,
+    enable_prefix_caching: bool = False,
     long_prefill_token_threshold: int = 0,
     disable_chunked_mm_input: bool = False,
     use_kv_connector: None | bool | MockKVConfig = None,
@@ -63,7 +63,7 @@ def create_scheduler(
       max_num_batch_tokens: max num tokens to batch
       enable_prefix_caching: optionally force APC config
                              (True/False) or use default
-                             (None)
+                             (False)
 
     Returns:
       {class}`Scheduler` instance
@@ -87,17 +87,12 @@ def create_scheduler(
         skip_tokenizer_init=skip_tokenizer_init,
     )
     # Cache config, optionally force APC
-    kwargs_cache = (
-        {}
-        if enable_prefix_caching is None
-        else {"enable_prefix_caching": enable_prefix_caching}
-    )
     cache_config = CacheConfig(
         block_size=block_size,
         gpu_memory_utilization=0.9,
         swap_space=0,
         cache_dtype="auto",
-        **kwargs_cache,
+        enable_prefix_caching=enable_prefix_caching,
     )
     kv_transfer_config = None
     if isinstance(use_kv_connector, MockKVConfig):
diff --git a/vllm/config/cache.py b/vllm/config/cache.py
index 2652c7c06ad0f..ef6928d8ebd5c 100644
--- a/vllm/config/cache.py
+++ b/vllm/config/cache.py
@@ -73,8 +73,8 @@ class CacheConfig:
     sliding_window: int | None = None
     """Sliding window size for the KV cache. This is primarily set in
     `ModelConfig` and that value should be manually duplicated here."""
-    enable_prefix_caching: bool | None = None
-    """Whether to enable prefix caching. Enabled by default for V1."""
+    enable_prefix_caching: bool = True
+    """Whether to enable prefix caching."""
     prefix_caching_hash_algo: PrefixCachingHashAlgo = "sha256"
     """Set the hash algorithm for prefix caching:\n
     - "sha256" uses Pickle for object serialization before hashing.\n
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 888f57b1ac1df..611bf1b375849 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -425,7 +425,7 @@ class EngineArgs:
         ParallelConfig.max_parallel_loading_workers
     )
     block_size: BlockSize | None = CacheConfig.block_size
-    enable_prefix_caching: bool | None = CacheConfig.enable_prefix_caching
+    enable_prefix_caching: bool | None = None
     prefix_caching_hash_algo: PrefixCachingHashAlgo = (
         CacheConfig.prefix_caching_hash_algo
     )
@@ -1975,10 +1975,11 @@ class EngineArgs:
         if self.prefill_context_parallel_size > 1:
             default_chunked_prefill = False
             default_prefix_caching = False
-            logger.warning(
+            logger.warning_once(
                 "--prefill-context-parallel-size > 1 is not compatible with "
                 "chunked prefill and prefix caching now. Chunked prefill "
-                "and prefix caching have been disabled by default."
+                "and prefix caching have been disabled by default.",
+                scope="local",
             )
 
         if self.enable_chunked_prefill is None:
@@ -1988,15 +1989,27 @@ class EngineArgs:
                 "%s chunked prefill by default",
                 "Enabling" if default_chunked_prefill else "Disabling",
             )
+        elif (
+            model_config.runner_type == "generate"
+            and not self.enable_chunked_prefill
+            and default_chunked_prefill
+        ):
+            logger.warning_once(
+                "This model does not officially support disabling chunked prefill. "
+                "Disabling this manually may cause the engine to crash "
+                "or produce incorrect outputs.",
+                scope="local",
+            )
         elif (
             model_config.runner_type == "pooling"
             and self.enable_chunked_prefill
             and not default_chunked_prefill
         ):
-            logger.warning(
+            logger.warning_once(
                 "This model does not officially support chunked prefill. "
                 "Enabling this manually may cause the engine to crash "
                 "or produce incorrect outputs.",
+                scope="local",
             )
 
         if self.enable_prefix_caching is None:
@@ -2011,10 +2024,11 @@ class EngineArgs:
             and self.enable_prefix_caching
             and not default_prefix_caching
         ):
-            logger.warning(
+            logger.warning_once(
                 "This model does not officially support prefix caching. "
                 "Enabling this manually may cause the engine to crash "
                 "or produce incorrect outputs.",
+                scope="local",
             )
 
         world_size = self.pipeline_parallel_size * self.tensor_parallel_size
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
index 4cb5348cbacc3..a7ec0de372631 100644
--- a/vllm/v1/core/sched/scheduler.py
+++ b/vllm/v1/core/sched/scheduler.py
@@ -180,7 +180,7 @@ class Scheduler(SchedulerInterface):
         self.kv_cache_manager = KVCacheManager(
             kv_cache_config=kv_cache_config,
             max_model_len=self.max_model_len,
-            enable_caching=bool(self.cache_config.enable_prefix_caching),
+            enable_caching=self.cache_config.enable_prefix_caching,
             use_eagle=self.use_eagle,
             log_stats=self.log_stats,
             enable_kv_cache_events=self.enable_kv_cache_events,

From 6965a392a4cd38ee65ac6a9c2730e0a7c62a658d Mon Sep 17 00:00:00 2001
From: Nandan Vallamdasu <nandan.vallamdasu@outlook.com>
Date: Sat, 22 Nov 2025 18:28:22 +0530
Subject: [PATCH 53/83] Fix: Resolve circular import in model_loader/utils.py
 (#29189)

Signed-off-by: nandan2003 <nandan.vallamdasu@outlook.com>
Signed-off-by: Nandan Vallamdasu  <nandan.vallamdasu@outlook.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
---
 vllm/model_executor/model_loader/utils.py | 13 +++++++------
 1 file changed, 7 insertions(+), 6 deletions(-)

diff --git a/vllm/model_executor/model_loader/utils.py b/vllm/model_executor/model_loader/utils.py
index e74434e9d12cb..1db6337f4c9f9 100644
--- a/vllm/model_executor/model_loader/utils.py
+++ b/vllm/model_executor/model_loader/utils.py
@@ -19,12 +19,7 @@ from vllm.model_executor.layers.quantization.base_config import (
     QuantizationConfig,
     QuantizeMethodBase,
 )
-from vllm.model_executor.models.adapters import (
-    as_embedding_model,
-    as_reward_model,
-    as_seq_cls_model,
-    try_create_mm_pooling_model_cls,
-)
+
 from vllm.model_executor.models.interfaces import SupportsQuant, supports_multimodal
 from vllm.utils.platform_utils import is_pin_memory_available
 
@@ -172,6 +167,12 @@ _MODEL_ARCH_BY_HASH = dict[int, tuple[type[nn.Module], str]]()
 
 
 def _get_model_architecture(model_config: ModelConfig) -> tuple[type[nn.Module], str]:
+    from vllm.model_executor.models.adapters import (
+        as_embedding_model,
+        as_reward_model,
+        as_seq_cls_model,
+        try_create_mm_pooling_model_cls,
+    )
     architectures = getattr(model_config.hf_config, "architectures", [])
 
     model_cls, arch = model_config.registry.resolve_model_cls(

From 2d4978a57e0addf55cde6113e9615ed064b72fb7 Mon Sep 17 00:00:00 2001
From: yihong <zouzou0208@gmail.com>
Date: Sat, 22 Nov 2025 21:00:04 +0800
Subject: [PATCH 54/83] fix: clean up function never use in setup.py (#29061)

Signed-off-by: yihong0618 <zouzou0208@gmail.com>
---
 setup.py | 34 ----------------------------------
 1 file changed, 34 deletions(-)

diff --git a/setup.py b/setup.py
index 5591bcb132447..8871b04d8fc46 100644
--- a/setup.py
+++ b/setup.py
@@ -74,18 +74,6 @@ def is_ninja_available() -> bool:
     return which("ninja") is not None
 
 
-def is_url_available(url: str) -> bool:
-    from urllib.request import urlopen
-
-    status = None
-    try:
-        with urlopen(url) as f:
-            status = f.status
-    except Exception:
-        return False
-    return status == 200
-
-
 class CMakeExtension(Extension):
     def __init__(self, name: str, cmake_lists_dir: str = ".", **kwa) -> None:
         super().__init__(name, sources=[], py_limited_api=True, **kwa)
@@ -533,28 +521,6 @@ def get_nvcc_cuda_version() -> Version:
     return nvcc_cuda_version
 
 
-def get_gaudi_sw_version():
-    """
-    Returns the driver version.
-    """
-    # Enable console printing for `hl-smi` check
-    output = subprocess.run(
-        "hl-smi",
-        shell=True,
-        text=True,
-        capture_output=True,
-        env={"ENABLE_CONSOLE": "true"},
-    )
-    if output.returncode == 0 and output.stdout:
-        return (
-            output.stdout.split("\n")[2]
-            .replace(" ", "")
-            .split(":")[1][:-1]
-            .split("-")[0]
-        )
-    return "0.0.0"  # when hl-smi is not available
-
-
 def get_vllm_version() -> str:
     # Allow overriding the version. This is useful to build platform-specific
     # wheels (e.g. CPU, TPU) without modifying the source.

From 5f7209a793ec553889f8ba9972a0034393a6b196 Mon Sep 17 00:00:00 2001
From: Bram Wasti <bwasti@fb.com>
Date: Sat, 22 Nov 2025 08:00:50 -0500
Subject: [PATCH 55/83] [tiny] Remove unsupported TRITON_MLA backend from batch
 invariance (#28832)

Signed-off-by: Bram Wasti <bwasti@meta.com>
Signed-off-by: Bram Wasti <bwasti@fb.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
---
 vllm/model_executor/layers/batch_invariant.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/layers/batch_invariant.py b/vllm/model_executor/layers/batch_invariant.py
index bec7af0286345..8b33727f05fbc 100644
--- a/vllm/model_executor/layers/batch_invariant.py
+++ b/vllm/model_executor/layers/batch_invariant.py
@@ -805,11 +805,11 @@ def override_envs_for_invariance():
         "FLASH_ATTN",  # best supported backend
         "FLASHINFER",
         "FLASH_ATTN_MLA",
-        "TRITON_MLA",
         # Not yet supported MLA backends
         # "FLASHMLA",
         # "FLEX_ATTENTION", # IMA issue even if we disable batch invariance
         # "FLASHINFER_MLA", https://github.com/vllm-project/vllm/pull/28967
+        # "TRITON_MLA",
     ]
     if curr_attn_backend not in supported_backends:
         warning = (

From 066209a045216c87bd582be97830eae728a29369 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Nicol=C3=B2=20Lucchesi?= <nlucches@redhat.com>
Date: Sat, 22 Nov 2025 15:38:44 +0100
Subject: [PATCH 56/83] [Attention] Refactor FA `block_size` limitations to
 hybrid models only  (#29084)

Signed-off-by: NickLucche <nlucches@redhat.com>
---
 tests/v1/attention/test_mla_backends.py       |  2 +-
 tests/v1/worker/test_gpu_model_runner.py      |  4 ++-
 vllm/attention/backends/abstract.py           | 10 ++++---
 vllm/v1/attention/backends/flash_attn.py      | 27 ++++++++++++++-----
 vllm/v1/attention/backends/flashinfer.py      | 12 ++++-----
 vllm/v1/attention/backends/mla/cutlass_mla.py |  5 +++-
 .../attention/backends/mla/flashattn_mla.py   |  5 +++-
 .../attention/backends/mla/flashinfer_mla.py  |  5 +++-
 vllm/v1/attention/backends/mla/flashmla.py    |  5 +++-
 .../attention/backends/mla/flashmla_sparse.py |  5 +++-
 vllm/v1/attention/backends/mla/indexer.py     |  6 ++---
 .../attention/backends/mla/rocm_aiter_mla.py  |  4 ++-
 vllm/v1/attention/backends/rocm_aiter_fa.py   |  5 +++-
 vllm/v1/attention/backends/tree_attn.py       |  5 +++-
 vllm/v1/attention/backends/triton_attn.py     |  5 +++-
 vllm/v1/attention/backends/xformers.py        |  5 +++-
 vllm/v1/worker/gpu_model_runner.py            |  4 +--
 17 files changed, 82 insertions(+), 32 deletions(-)

diff --git a/tests/v1/attention/test_mla_backends.py b/tests/v1/attention/test_mla_backends.py
index 1bd05e6183dc2..783e02ce89bdb 100644
--- a/tests/v1/attention/test_mla_backends.py
+++ b/tests/v1/attention/test_mla_backends.py
@@ -61,7 +61,7 @@ for backend in BACKENDS_TO_TEST:
 
 BACKEND_BLOCK_SIZES = {}
 for backend in BACKENDS_TO_TEST:
-    supported_sizes = backend.get_class().supported_kernel_block_sizes
+    supported_sizes = backend.get_class().get_supported_kernel_block_sizes()
     if supported_sizes:
         default_size = supported_sizes[0]
         block_size = (
diff --git a/tests/v1/worker/test_gpu_model_runner.py b/tests/v1/worker/test_gpu_model_runner.py
index 01c1364f7ee62..d0f1b703fcb92 100644
--- a/tests/v1/worker/test_gpu_model_runner.py
+++ b/tests/v1/worker/test_gpu_model_runner.py
@@ -185,7 +185,9 @@ def _make_mock_backend_for_kernel_block_size(
     supported_sizes: list[int | MultipleOf],
 ):
     class _MockBackend:
-        supported_kernel_block_sizes = supported_sizes
+        @staticmethod
+        def get_supported_kernel_block_sizes():
+            return supported_sizes
 
     return _MockBackend()
 
diff --git a/vllm/attention/backends/abstract.py b/vllm/attention/backends/abstract.py
index 67ded88475243..bd7e81b15bfc3 100644
--- a/vllm/attention/backends/abstract.py
+++ b/vllm/attention/backends/abstract.py
@@ -46,9 +46,12 @@ class AttentionBackend(ABC):
     # makes sure the output tensor is allocated inside the cudagraph.
     accept_output_buffer: bool = False
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(1)]
     supported_kv_cache_dtypes: ClassVar[list["CacheDType"]] = ["auto"]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(1)]
+
     @staticmethod
     @abstractmethod
     def get_name() -> str:
@@ -142,10 +145,11 @@ class AttentionBackend(ABC):
         if block_size not in valid_sizes:
             return False
 
-        if not cls.supported_kernel_block_sizes:
+        supported_kernel_block_sizes = cls.get_supported_kernel_block_sizes()
+        if not supported_kernel_block_sizes:
             return True
 
-        for supported_size in cls.supported_kernel_block_sizes:
+        for supported_size in supported_kernel_block_sizes:
             if isinstance(supported_size, MultipleOf):
                 supported_size = supported_size.base
             # With hybrid_blocks feature, the framework-level block size
diff --git a/vllm/v1/attention/backends/flash_attn.py b/vllm/v1/attention/backends/flash_attn.py
index 9fa6b1dfd19dd..a9a4af5ac1183 100755
--- a/vllm/v1/attention/backends/flash_attn.py
+++ b/vllm/v1/attention/backends/flash_attn.py
@@ -32,7 +32,7 @@ if is_flash_attn_varlen_func_available():
         get_scheduler_metadata,
         reshape_and_cache_flash,
     )
-from vllm.config import VllmConfig, get_layers_from_vllm_config
+from vllm.config import VllmConfig, get_current_vllm_config, get_layers_from_vllm_config
 from vllm.config.cache import CacheDType
 from vllm.distributed.parallel_state import get_dcp_group
 from vllm.logger import init_logger
@@ -56,11 +56,26 @@ logger = init_logger(__name__)
 class FlashAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    # NOTE(tdoublep): while in principle, FA supports
-    # MultipleOf(16), these are the block sizes that do not
-    # suffer from the NaN propagation problem described here:
-    # https://github.com/Dao-AILab/flash-attention/issues/1974
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [16, 32, 64]
+
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        vllm_config = get_current_vllm_config()
+        model_config = vllm_config.model_config
+        cache_config = vllm_config.cache_config
+        if (
+            model_config
+            and model_config.is_hybrid
+            and (
+                cache_config.mamba_ssm_cache_dtype == "float32"
+                or cache_config.mamba_cache_dtype == "float32"
+            )
+        ):
+            # NOTE(tdoublep): while in principle, FA supports
+            # MultipleOf(16), these are the block sizes that do not
+            # suffer from the NaN propagation problem described here:
+            # https://github.com/Dao-AILab/flash-attention/issues/1974
+            return [16, 32, 64]
+        return [MultipleOf(16)]
 
     @staticmethod
     def get_name() -> str:
diff --git a/vllm/v1/attention/backends/flashinfer.py b/vllm/v1/attention/backends/flashinfer.py
index e3f499216d7f1..8159f4096107f 100755
--- a/vllm/v1/attention/backends/flashinfer.py
+++ b/vllm/v1/attention/backends/flashinfer.py
@@ -16,7 +16,6 @@ from flashinfer import (
 from flashinfer.decode import _get_range_buf, trtllm_batch_decode_with_kv_cache
 from flashinfer.prefill import trtllm_batch_context_with_kv_cache
 from flashinfer.utils import FP4Tensor
-from typing_extensions import override
 
 from vllm import envs
 from vllm.attention.backends.abstract import (
@@ -275,10 +274,6 @@ class BatchDCPPrefillWrapper:
 class FlashInferBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    # Note: Not sure for all platforms,
-    # but on Blackwell, only support a page size of
-    # 16, 32, 64
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [16, 32, 64]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
         "auto",
         "fp8",
@@ -286,6 +281,12 @@ class FlashInferBackend(AttentionBackend):
         "fp8_e5m2",
     ]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        # Note: Not sure for all platforms, but on Blackwell,
+        # only support a page size of 16, 32, 64.
+        return [16, 32, 64]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHINFER"
@@ -566,7 +567,6 @@ class FlashInferMetadataBuilder(AttentionMetadataBuilder[FlashInferMetadata]):
             )
 
     @classmethod
-    @override
     def get_cudagraph_support(
         cls: type["FlashInferMetadataBuilder"],
         vllm_config: VllmConfig,
diff --git a/vllm/v1/attention/backends/mla/cutlass_mla.py b/vllm/v1/attention/backends/mla/cutlass_mla.py
index 60cb5022a55eb..5e3fbc0abf083 100644
--- a/vllm/v1/attention/backends/mla/cutlass_mla.py
+++ b/vllm/v1/attention/backends/mla/cutlass_mla.py
@@ -36,13 +36,16 @@ class CutlassMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
 
 class CutlassMLABackend(MLACommonBackend):
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [128]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
         "auto",
         "fp8",
         "fp8_e4m3",
     ]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [128]
+
     @staticmethod
     def get_name() -> str:
         return "CUTLASS_MLA"
diff --git a/vllm/v1/attention/backends/mla/flashattn_mla.py b/vllm/v1/attention/backends/mla/flashattn_mla.py
index 12639edc8b9a1..d369814c10b6f 100644
--- a/vllm/v1/attention/backends/mla/flashattn_mla.py
+++ b/vllm/v1/attention/backends/mla/flashattn_mla.py
@@ -41,9 +41,12 @@ logger = init_logger(__name__)
 
 class FlashAttnMLABackend(MLACommonBackend):
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto"]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(16)]
+
     @staticmethod
     def get_name() -> str:
         return "FLASH_ATTN_MLA"
diff --git a/vllm/v1/attention/backends/mla/flashinfer_mla.py b/vllm/v1/attention/backends/mla/flashinfer_mla.py
index 52bb19e039e45..f02a4bb1ef35a 100644
--- a/vllm/v1/attention/backends/mla/flashinfer_mla.py
+++ b/vllm/v1/attention/backends/mla/flashinfer_mla.py
@@ -35,13 +35,16 @@ class FlashInferMLAMetadataBuilder(MLACommonMetadataBuilder[MLACommonMetadata]):
 
 class FlashInferMLABackend(MLACommonBackend):
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [32, 64]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
         "auto",
         "fp8",
         "fp8_e4m3",
     ]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [32, 64]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHINFER_MLA"
diff --git a/vllm/v1/attention/backends/mla/flashmla.py b/vllm/v1/attention/backends/mla/flashmla.py
index 3aab1f9bb7fb6..74a4cd8430250 100644
--- a/vllm/v1/attention/backends/mla/flashmla.py
+++ b/vllm/v1/attention/backends/mla/flashmla.py
@@ -39,13 +39,16 @@ logger = init_logger(__name__)
 
 class FlashMLABackend(MLACommonBackend):
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [64]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
         "auto",
         "fp8",
         "fp8_e4m3",
     ]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [64]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHMLA"
diff --git a/vllm/v1/attention/backends/mla/flashmla_sparse.py b/vllm/v1/attention/backends/mla/flashmla_sparse.py
index 3f2cc8c38327e..1eee1d225293b 100644
--- a/vllm/v1/attention/backends/mla/flashmla_sparse.py
+++ b/vllm/v1/attention/backends/mla/flashmla_sparse.py
@@ -55,9 +55,12 @@ structured as:
 class FlashMLASparseBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [64]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = ["auto", "fp8_ds_mla"]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [64]
+
     @staticmethod
     def get_name() -> str:
         return "FLASHMLA_SPARSE"
diff --git a/vllm/v1/attention/backends/mla/indexer.py b/vllm/v1/attention/backends/mla/indexer.py
index d38361e0fcbf8..77f1ba00d5b04 100644
--- a/vllm/v1/attention/backends/mla/indexer.py
+++ b/vllm/v1/attention/backends/mla/indexer.py
@@ -24,9 +24,9 @@ logger = init_logger(__name__)
 
 
 class DeepseekV32IndexerBackend(AttentionBackend):
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [
-        1 if current_platform.is_rocm() else 64
-    ]
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [1 if current_platform.is_rocm() else 64]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
diff --git a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
index 6ccc1a341d56c..56f9c7a281e7f 100644
--- a/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
+++ b/vllm/v1/attention/backends/mla/rocm_aiter_mla.py
@@ -21,7 +21,9 @@ from vllm.v1.kv_cache_interface import AttentionSpec
 
 
 class AiterMLABackend(MLACommonBackend):
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [1]
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [1]
 
     @staticmethod
     def get_name() -> str:
diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index ea611848b0e81..c8742e9835203 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -447,7 +447,10 @@ class AiterFlashAttentionMetadataBuilder(
 class AiterFlashAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
+
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
diff --git a/vllm/v1/attention/backends/tree_attn.py b/vllm/v1/attention/backends/tree_attn.py
index 1bf38ed225a4c..523f759e05a21 100644
--- a/vllm/v1/attention/backends/tree_attn.py
+++ b/vllm/v1/attention/backends/tree_attn.py
@@ -31,7 +31,10 @@ logger = init_logger(__name__)
 class TreeAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
+
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
diff --git a/vllm/v1/attention/backends/triton_attn.py b/vllm/v1/attention/backends/triton_attn.py
index 09c36043c8c86..d051a89f03bb4 100644
--- a/vllm/v1/attention/backends/triton_attn.py
+++ b/vllm/v1/attention/backends/triton_attn.py
@@ -154,7 +154,6 @@ class TritonAttentionBackend(AttentionBackend):
         torch.bfloat16,
         torch.float32,
     ]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
     supported_kv_cache_dtypes: ClassVar[list[CacheDType]] = [
         "auto",
         "fp8",
@@ -162,6 +161,10 @@ class TritonAttentionBackend(AttentionBackend):
         "fp8_e5m2",
     ]
 
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(16)]
+
     @staticmethod
     def get_name() -> str:
         return "TRITON_ATTN"
diff --git a/vllm/v1/attention/backends/xformers.py b/vllm/v1/attention/backends/xformers.py
index d15d79417cc61..5039c44b9c3e6 100644
--- a/vllm/v1/attention/backends/xformers.py
+++ b/vllm/v1/attention/backends/xformers.py
@@ -42,7 +42,10 @@ logger = init_logger(__name__)
 class XFormersAttentionBackend(AttentionBackend):
     accept_output_buffer: bool = True
     supported_dtypes: ClassVar[list[torch.dtype]] = [torch.float16, torch.bfloat16]
-    supported_kernel_block_sizes: ClassVar[list[int | MultipleOf]] = [MultipleOf(16)]
+
+    @staticmethod
+    def get_supported_kernel_block_sizes() -> list[int | MultipleOf]:
+        return [MultipleOf(16)]
 
     @classmethod
     def get_supported_head_sizes(cls) -> list[int]:
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index e786cd8bc7c97..298bb1ef5f6fd 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -4618,7 +4618,7 @@ class GPUModelRunner(
             """
             for backend in backends:
                 is_supported = False
-                for supported_size in backend.supported_kernel_block_sizes:
+                for supported_size in backend.get_supported_kernel_block_sizes():
                     if isinstance(supported_size, int):
                         if block_size == supported_size:
                             is_supported = True
@@ -4649,7 +4649,7 @@ class GPUModelRunner(
         all_int_supported_sizes = set(
             supported_size
             for backend in backends
-            for supported_size in backend.supported_kernel_block_sizes
+            for supported_size in backend.get_supported_kernel_block_sizes()
             if isinstance(supported_size, int)
         )
 

From d44a63c6d6e1a545aff270b3b85cf231ef779dab Mon Sep 17 00:00:00 2001
From: Nick Hill <nhill@redhat.com>
Date: Sat, 22 Nov 2025 06:41:25 -0800
Subject: [PATCH 57/83] [BugFix] Fix returned logprobs with spec decode +
 prefill chunking (#29216)

Signed-off-by: Nick Hill <nhill@redhat.com>
---
 tests/v1/sample/test_logprobs.py   | 13 +++++++++----
 vllm/v1/sample/sampler.py          |  5 ++++-
 vllm/v1/worker/gpu_model_runner.py | 19 +++++++++----------
 3 files changed, 22 insertions(+), 15 deletions(-)

diff --git a/tests/v1/sample/test_logprobs.py b/tests/v1/sample/test_logprobs.py
index 42584938bc06f..c0b0e1ea226ed 100644
--- a/tests/v1/sample/test_logprobs.py
+++ b/tests/v1/sample/test_logprobs.py
@@ -521,8 +521,8 @@ def test_logprobs_mode(logprobs_mode: LogprobsMode):
         pytest.param(
             (
                 "eagle",
-                "meta-llama/Llama-3.1-8B-Instruct",
-                "yuhuili/EAGLE-LLaMA3.1-Instruct-8B",
+                "meta-llama/Llama-3.2-1B-Instruct",
+                "nm-testing/Llama3_2_1B_speculator.eagle3",
             ),
             marks=large_gpu_mark(min_gb=32),
         ),
@@ -541,7 +541,7 @@ def test_spec_decode_logprobs(
     """
     from vllm import LLM
 
-    prompt = "Hello world"
+    prompt = "Hello world " * 50
     sampling_params = SamplingParams(
         temperature=0, logprobs=3, max_tokens=10, ignore_eos=False
     )
@@ -582,6 +582,9 @@ def test_spec_decode_logprobs(
         seed=42,
         logprobs_mode=logprobs_mode,
         gpu_memory_utilization=0.4,
+        # Force prefill chunking
+        enable_chunked_prefill=True,
+        max_num_batched_tokens=32,
     )
     spec_results = spec_llm.generate([prompt], sampling_params)
     # Collect logprobs outputs from spec decode LLM.
@@ -597,6 +600,8 @@ def test_spec_decode_logprobs(
     # Per-token logprobs are expected to be the same.
     assert len(ref_logprobs) == len(spec_logprobs)
     for ref_logprob, spec_logprob in zip(ref_logprobs, spec_logprobs):
-        assert math.isclose(ref_logprob.logprob, spec_logprob.logprob, abs_tol=1e-3)
+        assert math.isclose(
+            ref_logprob.logprob, spec_logprob.logprob, rel_tol=5e-2, abs_tol=1e-1
+        )
         assert ref_logprob.rank == spec_logprob.rank
         assert ref_logprob.decoded_token == spec_logprob.decoded_token
diff --git a/vllm/v1/sample/sampler.py b/vllm/v1/sample/sampler.py
index 39c63fe31ad2c..c75b4f0543c0d 100644
--- a/vllm/v1/sample/sampler.py
+++ b/vllm/v1/sample/sampler.py
@@ -81,7 +81,10 @@ class Sampler(nn.Module):
             if logprobs_mode == "raw_logprobs":
                 raw_logprobs = self.compute_logprobs(logits)
             elif logprobs_mode == "raw_logits":
-                raw_logprobs = logits.clone()
+                if logits.dtype == torch.float32:
+                    raw_logprobs = logits.clone()
+                else:
+                    raw_logprobs = logits.to(torch.float32)
 
         # Use float32 for the logits.
         logits = logits.to(torch.float32)
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 298bb1ef5f6fd..979f977587038 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -2466,7 +2466,9 @@ class GPUModelRunner(
 
         num_sampled_tokens = sampler_output.sampled_token_ids.shape[0]
         sampled_token_ids = sampler_output.sampled_token_ids
+        logprobs_tensors = sampler_output.logprobs_tensors
         invalid_req_indices = []
+        cu_num_new_tokens: list[int] | None = None
         if not self.use_async_scheduling:
             # Get the valid generated tokens.
             max_gen_len = sampled_token_ids.shape[-1]
@@ -2479,6 +2481,12 @@ class GPUModelRunner(
                     sampled_token_ids,
                     self.input_batch.vocab_size,
                 )
+                if logprobs_tensors:
+                    # Needed for extracting logprobs when spec decoding.
+                    # This must be done prior to discarding sampled tokens.
+                    cu_num_new_tokens = [0]
+                    for toks in valid_sampled_token_ids:
+                        cu_num_new_tokens.append(cu_num_new_tokens[-1] + len(toks))
             # Mask out the sampled tokens that should not be sampled.
             for i in discard_sampled_tokens_req_indices:
                 valid_sampled_token_ids[int(i)].clear()
@@ -2506,10 +2514,6 @@ class GPUModelRunner(
         # the sampled tokens back, because there's no direct communication
         # between the first-stage worker and the last-stage worker.
         req_ids = self.input_batch.req_ids
-        logprobs_tensors = sampler_output.logprobs_tensors
-        cu_num_accepted_tokens = (
-            [0] if spec_decode_metadata and logprobs_tensors else None
-        )
         for req_idx in range(num_sampled_tokens):
             if self.use_async_scheduling:
                 sampled_ids = [-1] if req_idx not in invalid_req_indices_set else None
@@ -2518,11 +2522,6 @@ class GPUModelRunner(
 
             num_sampled_ids: int = len(sampled_ids) if sampled_ids else 0
 
-            if cu_num_accepted_tokens is not None:
-                cu_num_accepted_tokens.append(
-                    cu_num_accepted_tokens[-1] + num_sampled_ids
-                )
-
             if not sampled_ids:
                 continue
 
@@ -2544,7 +2543,7 @@ class GPUModelRunner(
             req_state.output_token_ids.extend(sampled_ids)
 
         logprobs_lists = (
-            logprobs_tensors.tolists(cu_num_accepted_tokens)
+            logprobs_tensors.tolists(cu_num_new_tokens)
             if not self.use_async_scheduling and logprobs_tensors is not None
             else None
         )

From ae66818379fc2403e43c47154a98170aa7cab192 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sat, 22 Nov 2025 22:48:01 +0800
Subject: [PATCH 58/83] [Misc] Fix pre-commit (#29238)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 vllm/model_executor/model_loader/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vllm/model_executor/model_loader/utils.py b/vllm/model_executor/model_loader/utils.py
index 1db6337f4c9f9..2021b68b8a60b 100644
--- a/vllm/model_executor/model_loader/utils.py
+++ b/vllm/model_executor/model_loader/utils.py
@@ -19,7 +19,6 @@ from vllm.model_executor.layers.quantization.base_config import (
     QuantizationConfig,
     QuantizeMethodBase,
 )
-
 from vllm.model_executor.models.interfaces import SupportsQuant, supports_multimodal
 from vllm.utils.platform_utils import is_pin_memory_available
 
@@ -173,6 +172,7 @@ def _get_model_architecture(model_config: ModelConfig) -> tuple[type[nn.Module],
         as_seq_cls_model,
         try_create_mm_pooling_model_cls,
     )
+
     architectures = getattr(model_config.hf_config, "architectures", [])
 
     model_cls, arch = model_config.registry.resolve_model_cls(

From d84d8f4429a5246a9d9f179b47fac7e13801710d Mon Sep 17 00:00:00 2001
From: ZiTian Zhao <zitian.zhao@tencentmusic.com>
Date: Sat, 22 Nov 2025 22:48:59 +0800
Subject: [PATCH 59/83] Fix EVS crash when using `video_embeds` inputs in
 Qwen2.5-VL (#29232)

Signed-off-by: zitian.zhao <zitian.zhao@tencentmusic.com>
Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
---
 vllm/model_executor/models/qwen2_5_vl.py | 17 ++++++++++++++++-
 1 file changed, 16 insertions(+), 1 deletion(-)

diff --git a/vllm/model_executor/models/qwen2_5_vl.py b/vllm/model_executor/models/qwen2_5_vl.py
index 8e3c0e84dfe51..1500a437613cc 100644
--- a/vllm/model_executor/models/qwen2_5_vl.py
+++ b/vllm/model_executor/models/qwen2_5_vl.py
@@ -230,6 +230,9 @@ class Qwen2_5_VLVideoEmbeddingInputs(TensorSchema):
         - hidden_size must match the hidden size of language model backbone.
         - video_grid_thw shape: (num_videos, 3) in (grid_t, grid_h, grid_w)
           format
+        - second_per_grid_ts: The video time interval (in seconds) for each
+          grid along the temporal dimension in the 3D position IDs. Returned
+          when `videos` is not `None`.
     """
 
     type: Literal["video_embeds"]
@@ -244,6 +247,11 @@ class Qwen2_5_VLVideoEmbeddingInputs(TensorSchema):
         TensorShape("nv", 3),
     ]
 
+    second_per_grid_ts: Annotated[
+        torch.Tensor | None,
+        TensorShape("nv"),
+    ] = None
+
 
 Qwen2_5_VLVideoInputs: TypeAlias = (
     Qwen2_5_VLVideoPixelInputs | Qwen2_5_VLVideoEmbeddingInputs
@@ -1311,6 +1319,7 @@ class Qwen2_5_VLForConditionalGeneration(
                 type="video_embeds",
                 video_embeds=video_embeds,
                 video_grid_thw=video_grid_thw,
+                second_per_grid_ts=second_per_grid_ts,
             )
 
     def _process_image_input(
@@ -1422,7 +1431,13 @@ class Qwen2_5_VLForConditionalGeneration(
 
         # Cast to long to match the original code
         # https://github.com/huggingface/transformers/blob/41980ce93e775f6c88500c51c8db7946fc6a2add/src/transformers/models/qwen2_5_vl/modular_qwen2_5_vl.py#L491 # noqa
-        second_per_grid_ts = video_input["second_per_grid_ts"].long()
+        second_per_grid_ts = video_input.get("second_per_grid_ts")
+        if second_per_grid_ts is None:
+            raise ValueError(
+                "second_per_grid_ts is required when video_pruning_rate > 0 "
+                "is enabled for video inputs, including the video_embeds path."
+            )
+        second_per_grid_ts = second_per_grid_ts.long()
         tokens_per_second = self.config.vision_config.tokens_per_second
 
         video_embeds_out = []

From f55c76c2b3270bb45072c05d6d53460c373b2172 Mon Sep 17 00:00:00 2001
From: Federico <65908512+coval3nte@users.noreply.github.com>
Date: Sat, 22 Nov 2025 17:42:48 +0100
Subject: [PATCH 60/83] chore: add RTX_PRO_6000 GLM4.6-FP8 kernel tuning
 (#29240)

---
 ...ackwell_Server_Edition,dtype=fp8_w8a8.json | 147 ++++++++++++++++++
 1 file changed, 147 insertions(+)
 create mode 100644 vllm/model_executor/layers/fused_moe/configs/E=20,N=1536,device_name=NVIDIA_RTX_PRO_6000_Blackwell_Server_Edition,dtype=fp8_w8a8.json

diff --git a/vllm/model_executor/layers/fused_moe/configs/E=20,N=1536,device_name=NVIDIA_RTX_PRO_6000_Blackwell_Server_Edition,dtype=fp8_w8a8.json b/vllm/model_executor/layers/fused_moe/configs/E=20,N=1536,device_name=NVIDIA_RTX_PRO_6000_Blackwell_Server_Edition,dtype=fp8_w8a8.json
new file mode 100644
index 0000000000000..8b78f87e7f73b
--- /dev/null
+++ b/vllm/model_executor/layers/fused_moe/configs/E=20,N=1536,device_name=NVIDIA_RTX_PRO_6000_Blackwell_Server_Edition,dtype=fp8_w8a8.json
@@ -0,0 +1,147 @@
+{
+    "triton_version": "3.5.0",
+    "1": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 2
+    },
+    "2": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 2
+    },
+    "8": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 5
+    },
+    "16": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "24": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "32": {
+        "BLOCK_SIZE_M": 16,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "48": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "64": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 64,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "96": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "128": {
+        "BLOCK_SIZE_M": 32,
+        "BLOCK_SIZE_N": 32,
+        "BLOCK_SIZE_K": 256,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "256": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 64,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 4,
+        "num_stages": 3
+    },
+    "512": {
+        "BLOCK_SIZE_M": 64,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 16,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "1024": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "1536": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 128,
+        "BLOCK_SIZE_K": 64,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 4,
+        "num_stages": 4
+    },
+    "2048": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "3072": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 32,
+        "num_warps": 8,
+        "num_stages": 3
+    },
+    "4096": {
+        "BLOCK_SIZE_M": 128,
+        "BLOCK_SIZE_N": 256,
+        "BLOCK_SIZE_K": 128,
+        "GROUP_SIZE_M": 1,
+        "num_warps": 8,
+        "num_stages": 3
+    }
+}

From 730bd35378bf2a5b56b6d3a45be28b3092d26519 Mon Sep 17 00:00:00 2001
From: Fadi Arafeh <115173828+fadara01@users.noreply.github.com>
Date: Sat, 22 Nov 2025 17:04:36 +0000
Subject: [PATCH 61/83] [perf][cpu] Accelerate paged attention GEMMs (QK, PV)
 on Arm CPUs with NEON (#29193)

Signed-off-by: Fadi Arafeh <fadi.arafeh@arm.com>
---
 csrc/cpu/cpu_attn.cpp                  |  17 ++
 csrc/cpu/cpu_attn_impl.hpp             |   8 +-
 csrc/cpu/cpu_attn_neon.hpp             | 386 +++++++++++++++++++++++++
 vllm/engine/arg_utils.py               |   3 +-
 vllm/v1/attention/backends/cpu_attn.py |   7 +-
 5 files changed, 416 insertions(+), 5 deletions(-)
 create mode 100644 csrc/cpu/cpu_attn_neon.hpp

diff --git a/csrc/cpu/cpu_attn.cpp b/csrc/cpu/cpu_attn.cpp
index 50f17c758c148..92f8bee5a47a0 100644
--- a/csrc/cpu/cpu_attn.cpp
+++ b/csrc/cpu/cpu_attn.cpp
@@ -13,6 +13,18 @@
   #define AMX_DISPATCH(...) case cpu_attention::ISA::AMX:
 #endif
 
+#ifdef __aarch64__
+  #include "cpu_attn_neon.hpp"
+  #define NEON_DISPATCH(...)                                                   \
+    case cpu_attention::ISA::NEON: {                                           \
+      using attn_impl = cpu_attention::AttentionImpl<cpu_attention::ISA::NEON, \
+                                                     scalar_t, head_dim>;      \
+      return __VA_ARGS__();                                                    \
+    }
+#else
+  #define NEON_DISPATCH(...) case cpu_attention::ISA::NEON:
+#endif  // #ifdef __aarch64__
+
 #define CPU_ATTN_DISPATCH_CASE(HEAD_DIM, ...) \
   case HEAD_DIM: {                            \
     constexpr size_t head_dim = HEAD_DIM;     \
@@ -41,6 +53,7 @@
   [&] {                                                                       \
     switch (ISA_TYPE) {                                                       \
       AMX_DISPATCH(__VA_ARGS__)                                               \
+      NEON_DISPATCH(__VA_ARGS__)                                              \
       case cpu_attention::ISA::VEC: {                                         \
         using attn_impl =                                                     \
             cpu_attention::AttentionImpl<cpu_attention::ISA::VEC, scalar_t,   \
@@ -73,6 +86,8 @@ torch::Tensor get_scheduler_metadata(
     isa = cpu_attention::ISA::VEC;
   } else if (isa_hint == "vec16") {
     isa = cpu_attention::ISA::VEC16;
+  } else if (isa_hint == "neon") {
+    isa = cpu_attention::ISA::NEON;
   } else {
     TORCH_CHECK(false, "Unsupported CPU attention ISA hint: " + isa_hint);
   }
@@ -158,6 +173,8 @@ void cpu_attn_reshape_and_cache(
       return cpu_attention::ISA::VEC;
     } else if (isa == "vec16") {
       return cpu_attention::ISA::VEC16;
+    } else if (isa == "neon") {
+      return cpu_attention::ISA::NEON;
     } else {
       TORCH_CHECK(false, "Invalid ISA type: " + isa);
     }
diff --git a/csrc/cpu/cpu_attn_impl.hpp b/csrc/cpu/cpu_attn_impl.hpp
index 294b4f714a769..12c6f5d3015cc 100644
--- a/csrc/cpu/cpu_attn_impl.hpp
+++ b/csrc/cpu/cpu_attn_impl.hpp
@@ -14,7 +14,7 @@
 #include "utils.hpp"
 
 namespace cpu_attention {
-enum class ISA { AMX, VEC, VEC16 };
+enum class ISA { AMX, VEC, VEC16, NEON };
 
 template <ISA isa, typename scalar_t, int64_t head_dim>
 class AttentionImpl {};
@@ -143,6 +143,12 @@ struct AttentionMetadata {
       case ISA::VEC:
         ss << "VEC, ";
         break;
+      case ISA::VEC16:
+        ss << "VEC16, ";
+        break;
+      case ISA::NEON:
+        ss << "NEON, ";
+        break;
     }
     ss << "workitem_group_num: " << workitem_group_num
        << ", reduction_item_num: " << reduction_item_num
diff --git a/csrc/cpu/cpu_attn_neon.hpp b/csrc/cpu/cpu_attn_neon.hpp
new file mode 100644
index 0000000000000..827f0cfbc718e
--- /dev/null
+++ b/csrc/cpu/cpu_attn_neon.hpp
@@ -0,0 +1,386 @@
+#ifndef CPU_ATTN_NEON_HPP
+#define CPU_ATTN_NEON_HPP
+
+#include "cpu_attn_impl.hpp"
+#include <arm_neon.h>
+#include <type_traits>
+namespace cpu_attention {
+
+namespace {
+
+#define BLOCK_SIZE_ALIGNMENT 32
+#define HEAD_SIZE_ALIGNMENT 32
+#define MAX_Q_HEAD_NUM_PER_ITER 16
+
+// These do not use vectorized class for loading / converting
+// because csrc/cpu/cpu_types_arm.hpp does not have fallback options
+// for vec_op::BF16Vec* / vec_op::BF16Vec* on Arm HW that
+// doesn't support BF16.
+// We don't use vec_op::FP32Vec* or vec_op::FP16Vec* for consistency.
+template <typename kv_cache_t>
+FORCE_INLINE void load_row8_B_as_f32(const kv_cache_t* p, float32x4_t& b0,
+                                     float32x4_t& b1);
+
+template <>
+FORCE_INLINE void load_row8_B_as_f32<float>(const float* p, float32x4_t& b0,
+                                            float32x4_t& b1) {
+  b0 = vld1q_f32(p + 0);
+  b1 = vld1q_f32(p + 4);
+}
+
+template <>
+FORCE_INLINE void load_row8_B_as_f32<c10::Half>(const c10::Half* p,
+                                                float32x4_t& b0,
+                                                float32x4_t& b1) {
+  const float16_t* h = reinterpret_cast<const float16_t*>(p);
+  float16x8_t v = vld1q_f16(h);
+  b0 = vcvt_f32_f16(vget_low_f16(v));
+  b1 = vcvt_f32_f16(vget_high_f16(v));
+}
+
+template <>
+FORCE_INLINE void load_row8_B_as_f32<c10::BFloat16>(const c10::BFloat16* p,
+                                                    float32x4_t& b0,
+                                                    float32x4_t& b1) {
+  const uint16_t* u = reinterpret_cast<const uint16_t*>(p);
+#ifdef ARM_BF16_SUPPORT
+  uint16x8_t u0 = vld1q_u16(u);
+  bfloat16x8_t bf0 = vreinterpretq_bf16_u16(u0);
+  b0 = vcvtq_low_f32_bf16(bf0);
+  b1 = vcvtq_high_f32_bf16(bf0);
+#else
+  uint16x8_t x0 = vld1q_u16(u);
+  uint32x4_t lo = vshlq_n_u32(vmovl_u16(vget_low_u16(x0)), 16);
+  uint32x4_t hi = vshlq_n_u32(vmovl_u16(vget_high_u16(x0)), 16);
+  b0 = vreinterpretq_f32_u32(lo);
+  b1 = vreinterpretq_f32_u32(hi);
+#endif
+}
+
+// Mx8, with 1 <= M <= 8 , K streamed, unroll-by-4 with NEON FMLAs
+// #Loads = (K // 4) * (M + 4 * sizeof(kv_cache_t) / 2)
+// #FMLAs = (K // 4) * (4 * 2 * M)
+// We have (4 * 2 * M) FMLAs for (M + 4 * sizeof(kv_cache_t) / 2) loads
+template <int32_t M, typename kv_cache_t>
+FORCE_INLINE void gemm_micro_neon_fmla_Mx8_Ku4(
+    const float* __restrict A,       // [M x K],
+    const kv_cache_t* __restrict B,  // [K x 8],
+    float* __restrict C,             // [M x 8],
+    int64_t lda, int64_t ldb, int64_t ldc, int32_t K, bool accumulate) {
+  // kernel supports max M of 8, as it'd spill for larger M
+  static_assert(1 <= M && M <= 8, "M must be in [1,8]");
+
+// helpers for per-M codegen
+#define ROWS_APPLY(OP) OP(0) OP(1) OP(2) OP(3) OP(4) OP(5) OP(6) OP(7)
+#define IF_M(i) if constexpr (M > (i))
+
+  // A row base pointers
+#define DECL_A(i) const float* a##i = A + (i) * lda;
+  ROWS_APPLY(DECL_A)
+#undef DECL_A
+
+  // declare 2 accumulators per row of M
+#define DECL_ACC(i) float32x4_t acc##i##_0, acc##i##_1;
+  ROWS_APPLY(DECL_ACC)
+#undef DECL_ACC
+
+  // initialize accumulators
+#define INIT_ACC(i)                              \
+  IF_M(i) {                                      \
+    if (accumulate) {                            \
+      acc##i##_0 = vld1q_f32(C + (i) * ldc + 0); \
+      acc##i##_1 = vld1q_f32(C + (i) * ldc + 4); \
+    } else {                                     \
+      acc##i##_0 = vdupq_n_f32(0.f);             \
+      acc##i##_1 = vdupq_n_f32(0.f);             \
+    }                                            \
+  }
+  ROWS_APPLY(INIT_ACC)
+#undef INIT_ACC
+
+  int32_t k = 0;
+
+  // K unrolled by 4
+  for (; k + 3 < K; k += 4) {
+    // load A[k..k+3] for each active row (M)
+#define LOAD_A4(i)     \
+  float32x4_t a##i##v; \
+  IF_M(i) a##i##v = vld1q_f32(a##i + k);
+    ROWS_APPLY(LOAD_A4)
+#undef LOAD_A4
+
+    // helper: FMA lane L from aiv
+#define FMAS_LANE(i, aiv, L)                              \
+  IF_M(i) {                                               \
+    acc##i##_0 = vfmaq_laneq_f32(acc##i##_0, b0, aiv, L); \
+    acc##i##_1 = vfmaq_laneq_f32(acc##i##_1, b1, aiv, L); \
+  }
+
+    // k + 0
+    {
+      float32x4_t b0, b1;
+      load_row8_B_as_f32<kv_cache_t>(B + (int64_t)(k + 0) * ldb, b0, b1);
+#define STEP_K0(i) FMAS_LANE(i, a##i##v, 0)
+      ROWS_APPLY(STEP_K0)
+#undef STEP_K0
+    }
+    // k + 1
+    {
+      float32x4_t b0, b1;
+      load_row8_B_as_f32<kv_cache_t>(B + (int64_t)(k + 1) * ldb, b0, b1);
+#define STEP_K1(i) FMAS_LANE(i, a##i##v, 1)
+      ROWS_APPLY(STEP_K1)
+#undef STEP_K1
+    }
+    // k + 2
+    {
+      float32x4_t b0, b1;
+      load_row8_B_as_f32<kv_cache_t>(B + (int64_t)(k + 2) * ldb, b0, b1);
+#define STEP_K2(i) FMAS_LANE(i, a##i##v, 2)
+      ROWS_APPLY(STEP_K2)
+#undef STEP_K2
+    }
+    // k + 3
+    {
+      float32x4_t b0, b1;
+      load_row8_B_as_f32<kv_cache_t>(B + (int64_t)(k + 3) * ldb, b0, b1);
+#define STEP_K3(i) FMAS_LANE(i, a##i##v, 3)
+      ROWS_APPLY(STEP_K3)
+#undef STEP_K3
+    }
+#undef FMAS_LANE
+  }
+
+  // K tail
+  for (; k < K; ++k) {
+    float32x4_t b0, b1;
+    load_row8_B_as_f32<kv_cache_t>(B + (int64_t)k * ldb, b0, b1);
+#define TAIL_ROW(i)                             \
+  IF_M(i) {                                     \
+    float32x4_t ai = vdupq_n_f32(*(a##i + k));  \
+    acc##i##_0 = vfmaq_f32(acc##i##_0, b0, ai); \
+    acc##i##_1 = vfmaq_f32(acc##i##_1, b1, ai); \
+  }
+    ROWS_APPLY(TAIL_ROW)
+#undef TAIL_ROW
+  }
+
+  // store accumulators to C
+#define STORE_ROW(i)                          \
+  IF_M(i) {                                   \
+    vst1q_f32(C + (i) * ldc + 0, acc##i##_0); \
+    vst1q_f32(C + (i) * ldc + 4, acc##i##_1); \
+  }
+  ROWS_APPLY(STORE_ROW)
+#undef STORE_ROW
+
+#undef ROWS_APPLY
+#undef IF_M
+}
+
+template <int32_t N, typename kv_cache_t>
+FORCE_INLINE void gemm_macro_neon_fmla_Mx8_Ku4(const float* __restrict A,
+                                               const kv_cache_t* __restrict B,
+                                               float* __restrict C, int32_t M,
+                                               int32_t K, int64_t lda,
+                                               int64_t ldb, int64_t ldc,
+                                               bool accumulate) {
+  // micro kernel is Mx8
+  static_assert(N % 8 == 0, "N must be a multiple of 8");
+  for (int32_t m = 0; m < M;) {
+    int32_t mb = (M - m >= 8) ? 8 : (M - m >= 4) ? 4 : (M - m >= 2) ? 2 : 1;
+    const float* Ab = A + m * lda;
+    float* Cb = C + m * ldc;
+
+    for (int32_t n = 0; n < N; n += 8) {
+      const kv_cache_t* Bn = B + n;
+      float* Cn = Cb + n;
+      switch (mb) {
+        case 8:
+          gemm_micro_neon_fmla_Mx8_Ku4<8, kv_cache_t>(Ab, Bn, Cn, lda, ldb, ldc,
+                                                      K, accumulate);
+          break;
+        case 4:
+          gemm_micro_neon_fmla_Mx8_Ku4<4, kv_cache_t>(Ab, Bn, Cn, lda, ldb, ldc,
+                                                      K, accumulate);
+          break;
+        case 2:
+          gemm_micro_neon_fmla_Mx8_Ku4<2, kv_cache_t>(Ab, Bn, Cn, lda, ldb, ldc,
+                                                      K, accumulate);
+          break;
+        default:
+          gemm_micro_neon_fmla_Mx8_Ku4<1, kv_cache_t>(Ab, Bn, Cn, lda, ldb, ldc,
+                                                      K, accumulate);
+          break;
+      }
+    }
+    // no tail loop for N as it's guaranteed to be a multiple of 8
+    m += mb;
+  }
+}
+
+template <typename kv_cache_t>
+class TileGemmNeonFMLA {
+ public:
+  template <AttentionGemmPhase phase, int32_t k_size>
+  FORCE_INLINE static void gemm(const int32_t m_size,
+                                float* __restrict__ a_tile,
+                                kv_cache_t* __restrict__ b_tile,
+                                float* __restrict__ c_tile, const int64_t lda,
+                                const int64_t ldb, const int64_t ldc,
+                                const int32_t block_size,
+                                const int32_t dynamic_k_size,
+                                const bool accum_c) {
+    if constexpr (phase == AttentionGemmPhase::QK) {
+      gemm_macro_neon_fmla_Mx8_Ku4<BLOCK_SIZE_ALIGNMENT, kv_cache_t>(
+          a_tile, b_tile, c_tile, m_size, k_size, lda, ldb, ldc, accum_c);
+    } else {
+      gemm_macro_neon_fmla_Mx8_Ku4<HEAD_SIZE_ALIGNMENT, kv_cache_t>(
+          a_tile, b_tile, c_tile, m_size, dynamic_k_size, lda, ldb, ldc,
+          accum_c);
+    }
+  }
+};
+
+}  // namespace
+
+// this is similar to "ISA::VEC" at the moment
+template <typename scalar_t, int64_t head_dim>
+class AttentionImpl<ISA::NEON, scalar_t, head_dim> {
+ public:
+  using query_t = scalar_t;
+  using q_buffer_t = float;
+  using kv_cache_t = scalar_t;
+  using logits_buffer_t = float;
+  using partial_output_buffer_t = float;
+  using prob_buffer_t = float;
+
+  constexpr static int64_t BlockSizeAlignment =
+      BLOCK_SIZE_ALIGNMENT;  // KV token num unit of QK and PV phases
+  constexpr static int64_t HeadDimAlignment =
+      HEAD_SIZE_ALIGNMENT;  // headdim num unit of PV phase
+  constexpr static int64_t MaxQHeadNumPerIteration = MAX_Q_HEAD_NUM_PER_ITER;
+  constexpr static int64_t HeadDim = head_dim;
+  constexpr static ISA ISAType = ISA::NEON;
+  constexpr static bool scale_on_logits = false;  // apply scale on q_buffer
+
+  static_assert(HeadDim % HeadDimAlignment == 0);
+  // the gemm micro kernel is Mx8
+  static_assert(HeadDimAlignment % 8 == 0);
+  static_assert(BlockSizeAlignment % 8 == 0);
+
+ public:
+  template <template <typename tile_gemm_t> typename attention>
+  FORCE_INLINE void execute_attention(DEFINE_CPU_ATTENTION_PARAMS) {
+    attention<TileGemmNeonFMLA<kv_cache_t>> attention_iteration;
+    attention_iteration(CPU_ATTENTION_PARAMS);
+  }
+
+  // k_cache_token_group_stride: stride of K cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t k_cache_token_group_stride(
+      const int32_t block_size) {
+    return BlockSizeAlignment;  // layout of k_cache block is [head_dim,
+                                // block_size], row-major
+  }
+
+  // v_cache_token_group_stride: stride of V cache when move to next
+  // BlockSizeAlignment tokens in a block
+  constexpr static int64_t v_cache_token_group_stride(
+      const int32_t block_size) {
+    return head_dim * BlockSizeAlignment;  // layout of v_cache is [block_size,
+                                           // head_dim], row-major
+  }
+
+  // v_cache_head_group_stride: stride of V cache when move to next
+  // HeadDimAlignment head dims in a block
+  constexpr static int64_t v_cache_head_group_stride(const int32_t block_size) {
+    return HeadDimAlignment;  // layout of v_cache is [block_size, head_dim],
+                              // row-major
+  }
+
+  // Copy q to q_buffer and cast it to fp32
+  static void copy_q_heads_tile(
+      scalar_t* __restrict__ src,  // [q_num, q_heads_per_kv, head_size]
+      float* __restrict__ q_buffer, const int32_t q_num,
+      const int32_t q_heads_per_kv, const int64_t q_num_stride,
+      const int64_t q_head_stride, float scale) {
+    static_assert(head_dim % 16 == 0);
+    constexpr int32_t unroll_size = head_dim / 16;
+    using load_vec_t = typename VecTypeTrait<scalar_t>::vec_t;
+
+    vec_op::FP32Vec16 scale_vec(scale);
+    for (int32_t q_num_idx = 0; q_num_idx < q_num; ++q_num_idx) {
+      for (int32_t q_head_idx = 0; q_head_idx < q_heads_per_kv; ++q_head_idx) {
+        scalar_t* __restrict__ curr_q =
+            src + q_num_idx * q_num_stride + q_head_idx * q_head_stride;
+        float* __restrict__ curr_q_buffer =
+            q_buffer + q_num_idx * q_heads_per_kv * head_dim +
+            q_head_idx * head_dim;
+
+        vec_op::unroll_loop<int32_t, unroll_size>([&](int32_t i) {
+          load_vec_t vec(curr_q);
+          vec_op::FP32Vec16 fp32_vec(vec);
+          fp32_vec = fp32_vec * scale_vec;
+          fp32_vec.save(curr_q_buffer);
+
+          curr_q += 16;
+          curr_q_buffer += 16;
+        });
+      }
+    }
+  }
+
+  // reshape K as column-major and V as row-major
+  static void reshape_and_cache(
+      const scalar_t* __restrict__ key, const scalar_t* __restrict__ value,
+      scalar_t* __restrict__ key_cache, scalar_t* __restrict__ value_cache,
+      const int64_t* __restrict__ slot_mapping, const int64_t token_num,
+      const int64_t key_token_num_stride, const int64_t value_token_num_stride,
+      const int64_t head_num, const int64_t key_head_num_stride,
+      const int64_t value_head_num_stride, const int64_t num_blocks,
+      const int64_t num_blocks_stride, const int64_t cache_head_num_stride,
+      const int64_t block_size, const int64_t block_size_stride) {
+#pragma omp parallel for collapse(2)
+    for (int64_t token_idx = 0; token_idx < token_num; ++token_idx) {
+      for (int64_t head_idx = 0; head_idx < head_num; ++head_idx) {
+        const int64_t pos = slot_mapping[token_idx];
+        if (pos < 0) {
+          // skip
+          continue;
+        }
+
+        const int64_t block_idx = pos / block_size;
+        const int64_t block_offset = pos % block_size;
+        {
+          // Write Key
+          const scalar_t* key_start_ptr = key +
+                                          token_idx * key_token_num_stride +
+                                          head_idx * key_head_num_stride;
+          scalar_t* key_cache_start_ptr =
+              key_cache + block_idx * num_blocks_stride +
+              head_idx * cache_head_num_stride + block_offset;
+
+#pragma GCC unroll 8
+          for (int64_t i = 0, j = 0; i < head_dim; ++i, j += block_size) {
+            key_cache_start_ptr[j] = key_start_ptr[i];
+          }
+        }
+        {
+          // Write Value
+          const scalar_t* value_start_ptr = value +
+                                            token_idx * value_token_num_stride +
+                                            head_idx * value_head_num_stride;
+          scalar_t* value_cache_start_ptr =
+              value_cache + block_idx * num_blocks_stride +
+              head_idx * cache_head_num_stride + block_offset * head_dim;
+          std::memcpy(value_cache_start_ptr, value_start_ptr,
+                      sizeof(scalar_t) * head_dim);
+        }
+      }
+    }
+  }
+};
+}  // namespace cpu_attention
+
+#endif  // #ifndef CPU_ATTN_NEON_HPP
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
index 611bf1b375849..b7c8f56e18c52 100644
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -1392,11 +1392,10 @@ class EngineArgs:
         # Set default arguments for V1 Engine.
         self._set_default_args(usage_context, model_config)
         # Disable chunked prefill and prefix caching for:
-        # POWER (ppc64le)/ARM/s390x/RISCV CPUs in V1
+        # POWER (ppc64le)/s390x/RISCV CPUs in V1
         if current_platform.is_cpu() and current_platform.get_cpu_architecture() in (
             CpuArchEnum.POWERPC,
             CpuArchEnum.S390X,
-            CpuArchEnum.ARM,
             CpuArchEnum.RISCV,
         ):
             logger.info(
diff --git a/vllm/v1/attention/backends/cpu_attn.py b/vllm/v1/attention/backends/cpu_attn.py
index f1254352c0585..590bf91b0d057 100644
--- a/vllm/v1/attention/backends/cpu_attn.py
+++ b/vllm/v1/attention/backends/cpu_attn.py
@@ -25,7 +25,7 @@ from vllm.v1.kv_cache_interface import AttentionSpec
 
 logger = init_logger(__name__)
 
-_CPU_ARCH_PREFER_MIXED_BATCH = (CpuArchEnum.X86,)
+_CPU_ARCH_PREFER_MIXED_BATCH = (CpuArchEnum.X86, CpuArchEnum.ARM)
 
 
 class CPUAttentionBackend(AttentionBackend):
@@ -491,6 +491,9 @@ def _get_attn_isa(dtype: torch.dtype, block_size: int) -> str:
     if supports_amx and dtype in (torch.bfloat16,) and block_size % 32 == 0:
         return "amx"
     elif block_size % 32 == 0:
-        return "vec"
+        if current_platform.get_cpu_architecture() == CpuArchEnum.ARM:
+            return "neon"
+        else:
+            return "vec"
     else:
         return "vec16"

From d1cf8214e523ce664797b3f65a26ffdc6e81f032 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 23 Nov 2025 02:22:48 +0800
Subject: [PATCH 62/83] [Bugfix] Use HF config fields as fallback when loading
 Mistral config (#29239)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 .buildkite/test-amd.yaml                   |  1 +
 .buildkite/test-pipeline.yaml              |  1 +
 vllm/transformers_utils/config.py          | 14 +++++++++++++-
 vllm/transformers_utils/configs/mistral.py | 13 ++++++++++---
 4 files changed, 25 insertions(+), 4 deletions(-)

diff --git a/.buildkite/test-amd.yaml b/.buildkite/test-amd.yaml
index 4ee81fdabf665..f098e23866eb3 100644
--- a/.buildkite/test-amd.yaml
+++ b/.buildkite/test-amd.yaml
@@ -754,6 +754,7 @@ steps:
   torch_nightly: true
   source_file_dependencies:
   - vllm/model_executor/models/
+  - vllm/transformers_utils/
   - tests/models/test_initialization.py
   commands:
     # Only when vLLM model source is modified - test initialization of a large
diff --git a/.buildkite/test-pipeline.yaml b/.buildkite/test-pipeline.yaml
index a5719d438eece..7a46e919f93bf 100644
--- a/.buildkite/test-pipeline.yaml
+++ b/.buildkite/test-pipeline.yaml
@@ -691,6 +691,7 @@ steps:
   torch_nightly: true
   source_file_dependencies:
   - vllm/model_executor/models/
+  - vllm/transformers_utils/
   - tests/models/test_initialization.py
   commands:
     # Only when vLLM model source is modified - test initialization of a large
diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index 9eac7bb50afa6..db7bf228f411d 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -204,7 +204,19 @@ class MistralConfigParser(ConfigParserBase):
 
         from vllm.transformers_utils.configs.mistral import adapt_config_dict
 
-        config = adapt_config_dict(config_dict)
+        # Get missing fields from HF config if available
+        try:
+            hf_config_dict, _ = PretrainedConfig.get_config_dict(
+                model,
+                revision=revision,
+                code_revision=code_revision,
+                token=_get_hf_token(),
+                **kwargs,
+            )
+        except OSError:  # Not found
+            hf_config_dict = {}
+
+        config = adapt_config_dict(config_dict, defaults=hf_config_dict)
 
         # Mistral configs may define sliding_window as list[int]. Convert it
         # to int and add the layer_types list[str] to make it HF compatible
diff --git a/vllm/transformers_utils/configs/mistral.py b/vllm/transformers_utils/configs/mistral.py
index 8da4ab35c56c3..966737aad0867 100644
--- a/vllm/transformers_utils/configs/mistral.py
+++ b/vllm/transformers_utils/configs/mistral.py
@@ -9,14 +9,18 @@ from vllm.logger import init_logger
 logger = init_logger(__name__)
 
 
-def adapt_config_dict(config_dict: dict[str, Any], **kwargs) -> PretrainedConfig:
-    config_dict.update(kwargs)
+def adapt_config_dict(
+    config_dict: dict[str, Any],
+    defaults: dict[str, Any],
+) -> PretrainedConfig:
     config_dict = _remap_general_mistral_args(config_dict)
 
     if bool(config_dict.get("quantization")):
         config_dict = _remap_mistral_quantization_args(config_dict)
 
-    if bool(config_dict.get("moe")):
+    if config_dict.get("model_type") == "mamba":
+        config_dict["architectures"] = ["Mamba2ForCausalLM"]
+    elif bool(config_dict.get("moe")):
         config_dict["architectures"] = ["MixtralForCausalLM"]
     else:
         config_dict["architectures"] = ["MistralForCausalLM"]
@@ -52,6 +56,9 @@ def adapt_config_dict(config_dict: dict[str, Any], **kwargs) -> PretrainedConfig
     if is_audio:
         config_dict = _remap_mistral_audio_args(config_dict)
 
+    for k, v in defaults.items():
+        config_dict.setdefault(k, v)
+
     config = PretrainedConfig.from_dict(config_dict)
 
     logger.debug("Initialized config %s", config)

From eb5352a7707dea349f77fcfcd6f8842cca92b34a Mon Sep 17 00:00:00 2001
From: Benjamin Bartels <benjamin@bartels.dev>
Date: Sat, 22 Nov 2025 18:23:09 +0000
Subject: [PATCH 63/83] [CI/build] Removes source compilation from runtime
 image (#26966)

Signed-off-by: bbartels <benjamin@bartels.dev>
---
 docker/Dockerfile                             |  70 +++++---
 .../dockerfile-stages-dependency.png          | Bin 121695 -> 134558 bytes
 tools/ep_kernels/install_python_libraries.sh  | 156 ++++++++++--------
 tools/install_deepgemm.sh                     |  44 +++--
 4 files changed, 157 insertions(+), 113 deletions(-)

diff --git a/docker/Dockerfile b/docker/Dockerfile
index 709b79e84fbbc..1b937bbc1225e 100644
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -85,7 +85,7 @@ ARG GET_PIP_URL
 RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
     && echo 'tzdata tzdata/Zones/America select Los_Angeles' | debconf-set-selections \
     && apt-get update -y \
-    && apt-get install -y ccache software-properties-common git curl sudo python3-pip \
+    && apt-get install -y ccache software-properties-common git curl sudo python3-pip libibverbs-dev \
     && curl -LsSf https://astral.sh/uv/install.sh | sh \
     && $HOME/.local/bin/uv venv /opt/venv --python ${PYTHON_VERSION} \
     && rm -f /usr/bin/python3 /usr/bin/python3-config /usr/bin/pip \
@@ -224,6 +224,22 @@ RUN --mount=type=cache,target=/root/.cache/ccache \
         python3 setup.py bdist_wheel --dist-dir=dist --py-limited-api=cp38; \
     fi
 
+# Install DeepGEMM from source
+ARG DEEPGEMM_GIT_REF
+COPY tools/install_deepgemm.sh /tmp/install_deepgemm.sh
+RUN --mount=type=cache,target=/root/.cache/uv \
+    VLLM_DOCKER_BUILD_CONTEXT=1 TORCH_CUDA_ARCH_LIST="9.0a 10.0a" /tmp/install_deepgemm.sh --cuda-version "${CUDA_VERSION}" ${DEEPGEMM_GIT_REF:+--ref "$DEEPGEMM_GIT_REF"} --wheel-dir /tmp/deepgemm/dist
+
+# Ensure the wheel dir exists so later-stage COPY won't fail when DeepGEMM is skipped
+RUN mkdir -p /tmp/deepgemm/dist && touch /tmp/deepgemm/dist/.deepgemm_skipped
+
+COPY tools/ep_kernels/install_python_libraries.sh /tmp/install_python_libraries.sh
+# Install EP kernels(pplx-kernels and DeepEP)
+RUN --mount=type=cache,target=/root/.cache/uv \
+    export TORCH_CUDA_ARCH_LIST='9.0a 10.0a' && \
+    /tmp/install_python_libraries.sh /tmp/ep_kernels_workspace wheel && \
+    find /tmp/ep_kernels_workspace/nvshmem -name '*.a' -delete
+
 # Check the size of the wheel if RUN_WHEEL_CHECK is true
 COPY .buildkite/check-wheel-size.py check-wheel-size.py
 # sync the default value with .buildkite/check-wheel-size.py
@@ -289,7 +305,7 @@ RUN PYTHON_VERSION_STR=$(echo ${PYTHON_VERSION} | sed 's/\.//g') && \
 RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
     && echo 'tzdata tzdata/Zones/America select Los_Angeles' | debconf-set-selections \
     && apt-get update -y \
-    && apt-get install -y ccache software-properties-common git curl wget sudo vim python3-pip \
+    && apt-get install -y software-properties-common curl sudo python3-pip \
     && apt-get install -y ffmpeg libsm6 libxext6 libgl1 \
     && if [ ! -z ${DEADSNAKES_MIRROR_URL} ] ; then \
         if [ ! -z "${DEADSNAKES_GPGKEY_URL}" ] ; then \
@@ -356,36 +372,32 @@ RUN --mount=type=cache,target=/root/.cache/uv \
 . /etc/environment && \
 uv pip list
 
-# Even when we build Flashinfer with AOT mode, there's still
-# some issues w.r.t. JIT compilation. Therefore we need to
-# install build dependencies for JIT compilation.
-# TODO: Remove this once FlashInfer AOT wheel is fixed
-COPY requirements/build.txt requirements/build.txt
+# Install deepgemm wheel that has been built in the `build` stage
 RUN --mount=type=cache,target=/root/.cache/uv \
-    uv pip install --system -r requirements/build.txt \
+    --mount=type=bind,from=build,source=/tmp/deepgemm/dist,target=/tmp/deepgemm/dist,ro \
+    sh -c 'if ls /tmp/deepgemm/dist/*.whl >/dev/null 2>&1; then \
+              uv pip install --system /tmp/deepgemm/dist/*.whl; \
+           else \
+              echo "No DeepGEMM wheels to install; skipping."; \
+           fi'
+
+# Pytorch now installs NVSHMEM, setting LD_LIBRARY_PATH (https://github.com/pytorch/pytorch/blob/d38164a545b4a4e4e0cf73ce67173f70574890b6/.ci/manywheel/build_cuda.sh#L141C14-L141C36)
+ENV LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
+
+# Install EP kernels wheels (pplx-kernels and DeepEP) that have been built in the `build` stage
+RUN --mount=type=bind,from=build,src=/tmp/ep_kernels_workspace/dist,target=/vllm-workspace/ep_kernels/dist \
+    --mount=type=cache,target=/root/.cache/uv \
+    uv pip install --system ep_kernels/dist/*.whl --verbose \
         --extra-index-url ${PYTORCH_CUDA_INDEX_BASE_URL}/cu$(echo $CUDA_VERSION | cut -d. -f1,2 | tr -d '.')
 
-# Install DeepGEMM from source
-ARG DEEPGEMM_GIT_REF
-COPY tools/install_deepgemm.sh /tmp/install_deepgemm.sh
-RUN --mount=type=cache,target=/root/.cache/uv \
-    VLLM_DOCKER_BUILD_CONTEXT=1 TORCH_CUDA_ARCH_LIST="9.0a 10.0a" /tmp/install_deepgemm.sh --cuda-version "${CUDA_VERSION}" ${DEEPGEMM_GIT_REF:+--ref "$DEEPGEMM_GIT_REF"}
-
-COPY tools/install_gdrcopy.sh install_gdrcopy.sh
-RUN set -eux; \
+RUN --mount=type=bind,source=tools/install_gdrcopy.sh,target=/tmp/install_gdrcopy.sh,ro \
+    set -eux; \
     case "${TARGETPLATFORM}" in \
       linux/arm64) UUARCH="aarch64" ;; \
       linux/amd64) UUARCH="x64" ;; \
       *) echo "Unsupported TARGETPLATFORM: ${TARGETPLATFORM}" >&2; exit 1 ;; \
     esac; \
-    ./install_gdrcopy.sh "${GDRCOPY_OS_VERSION}" "${GDRCOPY_CUDA_VERSION}" "${UUARCH}"; \
-    rm ./install_gdrcopy.sh
-
-# Install EP kernels(pplx-kernels and DeepEP)
-COPY tools/ep_kernels/install_python_libraries.sh install_python_libraries.sh
-ENV CUDA_HOME=/usr/local/cuda
-RUN export TORCH_CUDA_ARCH_LIST="${TORCH_CUDA_ARCH_LIST:-9.0a 10.0a+PTX}" \
-    && bash install_python_libraries.sh
+    /tmp/install_gdrcopy.sh "${GDRCOPY_OS_VERSION}" "${GDRCOPY_CUDA_VERSION}" "${UUARCH}"
 
 # CUDA image changed from /usr/local/nvidia to /usr/local/cuda in 12.8 but will
 # return to /usr/local/nvidia in 13.0 to allow container providers to mount drivers
@@ -415,6 +427,11 @@ ENV UV_INDEX_STRATEGY="unsafe-best-match"
 # Use copy mode to avoid hardlink failures with Docker cache mounts
 ENV UV_LINK_MODE=copy
 
+RUN echo 'tzdata tzdata/Areas select America' | debconf-set-selections \
+    && echo 'tzdata tzdata/Zones/America select Los_Angeles' | debconf-set-selections \
+    && apt-get update -y \
+    && apt-get install -y git
+
 # install development dependencies (for testing)
 RUN --mount=type=cache,target=/root/.cache/uv \
     CUDA_MAJOR="${CUDA_VERSION%%.*}"; \
@@ -455,12 +472,11 @@ ARG PIP_EXTRA_INDEX_URL UV_EXTRA_INDEX_URL
 # Reference: https://github.com/astral-sh/uv/pull/1694
 ENV UV_HTTP_TIMEOUT=500
 
-COPY requirements/kv_connectors.txt requirements/kv_connectors.txt
-
 # install additional dependencies for openai api server
 RUN --mount=type=cache,target=/root/.cache/uv \
+    --mount=type=bind,source=requirements/kv_connectors.txt,target=/tmp/kv_connectors.txt,ro \
     if [ "$INSTALL_KV_CONNECTORS" = "true" ]; then \
-        uv pip install --system -r requirements/kv_connectors.txt; \
+        uv pip install --system -r /tmp/kv_connectors.txt; \
     fi; \
     if [ "$TARGETPLATFORM" = "linux/arm64" ]; then \
         BITSANDBYTES_VERSION="0.42.0"; \
diff --git a/docs/assets/contributing/dockerfile-stages-dependency.png b/docs/assets/contributing/dockerfile-stages-dependency.png
index f8c104ba14259e820a5b4ddf4d872b8696d82b33..57a33524a5169c8b56c7de309cdeb243ab3fa918 100644
GIT binary patch
literal 134558
zcmb5W2RxT;*gt$VgchYzvL!-P$es-up{U48q9}XIx=|`wA=wHc$<C%tDnd$jAtNIr
zd%WMP)P29t`~Khe|Mxtf`+1PxbzSFq9LIMY$9Y{>S5;WInqf6T5bG3=96U}C>pci!
z#RaP6_=(W1>vQ-&tIjGb93&RW|A{Y64j~9uLh+!Src?AltFzOIhPxsiZntEg(QZ6^
zY}GP~9qcRBM^>|Yv&wsMcc-mrJiRHG{erJTTHdL$(|PR;4?G_~ORE03A&ha89Bt@b
zPs76$VRD-`T%&y@D_=cXQ797bcj5Xf2dd%OPfZsGOREDXoK@AnIDWkT;%pXf<<FPs
za%w}$Ki?39XXn+4-T!{exNA`7-|s|^H|78PomFD4<+8uub{sKnC!h59*OTD7GKxRn
z5S|=KZfpL2M=0>@8u<HN#gSvjYVRM78XX(Uw`?zS9B#|(Boy?*cuv&S*Vot8^?%BU
z3r*yukp29loO|i7WDiYD_r#S?e~TLHsWEtb>2p;W@8n=Jy#qVz%3Zs5ZQHiZyeYS@
zG0P}U+KoZPg3*DU2rvrP;@je|YUvX^_dRx>pP{DPS+X$m{Y|(4jl>%Dp<L7Y`yPu6
z2d=I?_MD=F^8Mc@;0eudcfUN)m}Ob|^W#4&DA&iTDJhwK&NlYjvb+C7sz$=$b>(t2
zTweF?-J6@6D=8^Ck#;g&zqBYNrMIKu#fukZZnNuIq)X1%#2Rw0>~Ko_yBM0Z!=;mL
zOpYyk&sRs^ioib&V3L>^Y|h6&#Um)Hs;=M5O#8^o%ggx9?W0lqcQg3&Yh}h46cn86
z^IF4SFxhrl!f}Z4tRxY@@po&USX<7|{1j=mtM7UpqHKZ%khJT4&vxMIhYSOm7iVOr
z#~V%=9KEy0aBgZO&SSy(^|^BQ`Bwo<%_+wcXuX$N>HhoR0Y)!hz6_L}>BTK(UHtTD
zO6Bn3SNLcA#RJ*6S*x67-7Q!T{mX-S9*dJ6i$9*zbPA@XrcSmxw)=~;-3bb!wb)No
z3H}YD4yT_#KN%P}cZUs^&05T5A4@pwF;gG+sHmT(RHvhoNz|(2^ZB^>`C*U6m-GfN
z&by5Fj?9hKd`ded&~k<d)%njuntpk91zVw8?(RmrGWbZ>%=e7Nz{ROR24ORwm^GsO
zgN<38kBWyFBpfbTTU*nvT*n~f)Rz=qEweb6X}e6F`QLD@h)a%hpDFtOh?kFVtyjF^
z^Q$#dle*#jde7EVFix6OM?3#)IAz&Vu$RgUfu@F)dmk@n=({|=MUhJ4Paw<o-Ne>4
zUCi)5Whqed<Jpxp^bgvW8{fmKDc|NR?7ipb#oAczu_*jWckIau8Xu<Bo;C`zTbBM@
zG`7WUvQ?zr)pjoVi^9#Vd);QnXMTS7Wm=sg+W#?q_M?vFIu>b3DlaX*iRShNhYu;o
z$Qy7~ESViDeqR0OCaey=y1C7Eb}+x9BEQw4*_%fCPEbeh-uRoGJ9dos)h8>3@eG%Y
zsnV_#JYTJH^r+P0+}QJK3R&k3*I%ABJpboYrar~Gj=naS`%0gs#kcYL&256;?nhay
zme`>F)PI|x$%|_n<Y*7F2Xn=_jz(U5L@lv_==S<sG^`l!h}oLd#7g<yxZ%Z0MySVR
zar>1RDp9t%J~fXSY%R-5xg@2q`)YCSPbuhqVyHZS{JR(3t*`vIOW5^hA{SYyERb*I
zbKL@lT+3Bi^IL4*a0E(jT>11hS6s=3+I!>z;je@K^Vg@39Xpn9(TeLct&|&XE9Fv)
zjYbeUaCfY<>3H&wGJoN@rd(4wTD!hFV=UG6>({Z2tSZts|CFxorWG`jv>9#tEn21`
z&c_}rr3lDEq|@s=-Bk?PDMwp^2cnUgvueCfP(|eYsehiM-$T@-O`9JNwv}F{qoeD2
z8&RKSRFO%yj4P$kw#T8buKUS9D^L~m%3PguOx`_HT`7CPb^F?-73VI$x}K>BrSI1h
zpKQ=!J=lZHd?(V*xbkVN)Mbl;FIQ0&X?LFgTVlI4g&5vdSFiVq$3mfiWt>bu-FV%T
zt_lAfPdJ7wqLABTTovjkP$oKXknnl_`A_MVb>8Ina^Z)s%!>*dsqvux-LypyPNcPY
zEY6RN#5lI~wH)xIyZv`R)tO62t9bqB1=f3YwAj`Re#$Utv?jb*saCDs`u^?#Usfs`
zTU!GZ0P+Uc|4sCGNd_qwJ69`Y5<<o5Iq~8Ud$7!WpW2A^>*h@aSLC&^nkDe?9R2p3
zMn-b%t)Mq+Wo4ySp^Y)Fun?Y8Eq?Lkjm>hj54Ez`7fdLgP`~{584AZ5jRId%lELx(
z=<*-tpA0<QT=%%oO<9Eyw5$KKPRe{+E;eR<K~$k8&!F-(q#WbGf-Js4omG>b?m}@r
z?9Y&HP%gdkIvI>cRsUXPI@@XFtN(V9RdQCfhv-w=mUpYWxVTIXwR*EQW*R=vHh%Lg
zV8xTH`+p01sDNeJw27<LYtC?=sFfYX<Acp2(sv}CZ3+|#(TTr!={agV)KWM?Mksmr
zdP;5aN^RMMsP)0KSz3+T{v_gpg7>O*h(xVohrx86{Hrk(9TE+x8e9Sb87Q1&?QYa2
zMDIucdwC9LXXouA7N}z8&5sSwFPoCa->vsL^Ze>M{02YhxbrVCR|VHd&+<uMXn1e}
zw^wFx`0!!ZOozcHETPrS|0GrAWAo;(-s1NC<Ri_7l^hK#v0i57^)F0R1q1e`Sa<K<
z-Livd&*(BYo1GZ^vU6F-*80B~S{1BU?C_GZA?*~62=$Z6G(3Q7rfpC4|Gd}{6l+)7
z>j$4<UFMbA?klww5TbGy{sull{I9u%?45hH7rM&d#Y#yGh$@`>^hl30Vz{s;7NJR0
zg#Ha_Ebspbui?DH^k+i|_xL2`@Up3|ekh~WSJ!PH9UZN!t5X&4OH_>!H$HzJEJS4E
z^|?0{ac&cz#caQ!j&e;;PrrWs`sepgGP46Y#rEI#pLychly{LON``{4a<%^Vw%DBT
zuQ`H`?AZ9ax|%<tq{C|s`=ZYGkLfhCPWt+7@p9hyGskwf$=$jIR`vIfUb%8bC*MM^
z(5Ab<x-&Z`r$($Nx}~LM*yU&G<;jJ)9vRC|k6KaA_E@%+APlx_*)r6W_q|?C#_h`$
zdfdDNE@xo<ax++r_*AO>_m3|%lJ4KXt<q-yNiW#)bCLb`zy&obf;;(d+!CVI5A}*C
zfXE(0g*}MX)*}0go7-~0rQBvG%v%aZz{_eXE2+F#MMUxeeYi`Bf%V}A?$a7-Qk(r=
zo_>63dc0n(f<=Ivd#X1faHxE7AvZVo*|TT#2CiABGW07Z)K(FUl>c6l>S>L~!Wg)l
z-%A@C8>OA?s8fxLkI%lmae%oc=e*j<lOOvV(!5zOd`PLKWO3c&I`sp&e(I6#bXSO4
z8A_MTREPIaYcZu<ChiAh#RAnJh-s&4v?!`0E0wBPcPK6p=S@iyAQKxM?fPol`4)#}
z^ELGR4>gjj^94mr>vqJN^;E}jhIq_%vKY17G*&G0ydn1&yFEK!o9DMqeDP&@RYA8?
z<pNfLO++*GcsKAPRln4Qb|oU<xi5`O*Hu(0De20pDkU|w#R+90%eJ}6@<q38J*x<w
z)qhJT5wJaKzd3`9yQ^yp3M>jb^TcBf+-DVU#?3%m8yjiFk@u<cxzRUMtTHl-#ri2&
zIAdCRBIVkxXX}5*s=CR<P^*r*dL{^MYq4X+`AB@^^@9PfzK8^V?d-0O2-Lq%DExdH
z%ZVQxl0QFaAZh&qDc5fOA?2uV^O|!c)`D-#<%!Sd7w6j-OV6ctl{5nacWY<w5ELA1
z4$L=e;Mw9ArfosQFRxun^C~~U<M8*4^0vq3I);W{9_ba6?8VPu?w+Q^+!q=Tr;dNX
zo<HYX8gy5M1-kk=k9|X840l9;SJ-|3I9TZj)~<l4>2wSD@Zm#ZVj|d>p2z%8g|Y**
zD-Rtyq^P*SL`ih)0V~tqH}oO3ezN5=%G0fpXffOM`c>7{v7**zX;)sJ92#sX9J{uG
z1IXHxs2Gy%znak0T=@7~0B{R}Hn-sK@V{k{5iURbW1PQ5B)QC0OAJR#U3PeFjFPL=
zTy|7dRr=gFV0Ti}mkJiklj`a}fXc38??gBSQBadw$+bX6rK6nrGYCVnTn1z9ky)Hp
zSha#k*}7%-Y0Z5WZ6(u_EzWg{TwyoKX!H(WMZ-K-rz`+=qa#N<&{jHI1{$}xFpGLT
zAni7z>pJqXC-$<%*|TT0DJcn_Kd>5qNi*%FIk**PxJZlDbA!d1Psaz<ab<4-V3JPL
z+TA*jOS*0;KRA`aT&|*~rgr2Acf)#;+#*07e!NXhjy?T=X+5Lp`-j>&5Gyefj;rJ{
zk-3(RUW-Xg5)K2+`Ic{P<5MnC{~{JitzQtt(*rp**v89v0F>|H#1K_d`<RL>Be*Tk
zW;H%FFc<F*)d=|U6ze(IUS8gHYQsi4x^|~d|I4TnPbpbiN-sOQ_J9%dqi}(`3Sa!l
z2&R8jr1b-o-@Zi-g4pc2R0nAxPv1p}pkz(I5h$Mnt1qAFPeU5zK^<yFCEmZ!+)~zx
z@G>>hMO>iLsj8|z!t#SsLMs|HF=25foqlxGN!w@Mym@nWxO}l<zzU_#1EDNq0>T1*
zqydr$nT3yZs|aB79lsU$A}ynA=GAt~P~H6(-gkgCO$DbCggmLl>J|#*t|M)jTRx_1
zrq)6K91dWdMiDF@uTutu?f&eHK<Y%<5wU1Nm4=pzx_$fPs@i3qs}C-f3965e^e#7<
zCNoKfL`Um3O_(RE#z6931onatMhahy1z;rk*FquGNgqFUD52I{z(e-s4)+Td*Abmz
z4!+tsCf(n@eatXe{Gg#mmRhjj=+LgX+k|J(iS*OLyLP3fq;R`~ZdTuFmzpv(Yj_}x
zV)*5`Z%=nOJ`WVu5Kqn-S4Li{`%QRFgkbXNJTsa7;)MD?Q@k606^@h(Wms;MWK;&`
zX^wVj;|VMb&)|3R$4PEJ9HDpaXf-L|Stn8IEfEKZ7nG}+Wt7wk3AL2WPVrs)cI`4n
zEpg!@WDD4Xj|?{Dl|yAubq89u-%bI1)VNRN#LW+!-@gBn(+`A)+jy;0g=1e`5-A&{
zCR;RiW-KQ(*Dh&2tCm?H28-*Dr}m5K@$sw-{wQ3Nm5wQ=^ZM1?M?-M0D2_>p5GXuR
zu*g9DGXehy)<}*iEQA9XUwI3poyvIRvW5ty#Fl$}PtX6_39yR+HX9dvAbXhIr@jCo
z3|#t>Mk0Vi$FOIjcb4LjaT0}eHots+up=Vx;-}jVAwaXjfsMyDkSOu_^JfFMpAAqV
zkd<RRCmw`4_>v3#_Rd~%Q{h7NCC9bhJLHFZCNb$kA_bw!h=MF&+Wzg^w}s~N`R2)%
z5}WR-kLfy;a(gbkk3S#leE*!Zpr9=lgcQkOF*LJhAkm8)2E}c^z3rfMD*|5ZU&0G+
z(*L*>85w!&mQ7cn5Wq@01zI3v=TTJrCPZVx#sE4+>=3C6j2yJeT&G*e7>Uu@H%78y
z#FK);3W6sRDu<(d8iKCy`=jF3t5<umI!$+n`_iy1NQuZyw%Cq5^<1{1taN6ig2m(1
z?0zaQ)QMNk`M&cMp2v-GLw9^KSNsa0C)bCNKIG13VBf1_B=7{q*q*U(?|2*5!yO>^
z^4q&8M+637JUTl14g3V|q$?cxC?MVf7eA!j#cna4G&3`M?SyJaDUf%emVM*(T%_x{
z`}ic0HYX$3IUvo^IO+M~$Md6a1jry_rHT}>jE#wzAKb3*^ySL1VjePUij_pGv=a|B
z6_u34FMR`|9!5~^xD^+-C^fr+s1R5Z3$m4@=8I~d`_>Tw%OeHUDyb>)fbV)^hSgP1
zi~^-5!prB3$z8?sl)Bi@c@`bl&b?5J0uvV;T#I}GrDFCEB4nN4W5aJ*EA|Led7+j*
z1mIG6LCt*cm?iBVKpmf6kr0)aocF3y)cy0(*00zuy8~0^XD8bMe>*mAlX4k1415rS
zLP=iujlsfbvoaYBiW!rrh%%Q3fI0J>filuNY-v}bu7dC*(oIcG+ef%o5doIfzX91Z
zD8~BLHaxAgMN5G-mQoE&)rvz-TTxN*b!BC5bN+C8e%nlO`~0KaK%}pZMPU-S1dt32
zWf<s+Jq|dmO0eqw>~E0hiMIXPS(~6Ba60z_lneA!(YMHptJkdYW-UN<ped8#<mBYy
zN=9<Y(OzoGO~v9lwpdqued!0ZEd&!G^;WO~vuSJ5PjEHbl~1u8&Bczx!!CVM7DatG
zcpu%_Z+;qF7d#C@<R^(8$TFBAyZHGbV<6$7h{OkSID7gIC)9$DAciiY^1`2+y~U|q
z7PE~=Il>OxV&J#7R^KqtUhV-E2?0BVTSr<b{Tu+Ww7~2WtQJi`ZB^i6Vhn#&@bv~s
zLA$b1HvxpA15fP<%^i!=af{nz%<N#5ebRH(YqS<U3~!+|=X}j`=G%auPl4M-hMLFl
z2U9;YJmz1}sgb~zdHG|iMh_meu>V0?S?M@ZX0d#6axvCpVH#-bb}A7@%=|Zz^65^N
z#VI`&na38bF4bZ^FVuRZ4x)0x42+13oY9NY*y~ijT-5Nd0tv80%`8C7&<p63MFRnY
zqG9;Vhcs)Fn$BT;$fs!^f;vH-xXq1J@Sb`!2civ|G66}o`2;ebe)s8dGL}C+)HZM(
zIb>*Pn0`8sloo?|pBBcGWuyi;gv~x|m2sc5^q6fX%NhO}Q4g|z@%ZuMr7l1B2@1}R
z_u0POe9HCI;?J9c)l;+Wiwki7%12&pN1P5J0Z5euS%@bE#-$-9p#Mq{CfkM0#-$>@
ze@G39ikf|YfaYkd<aADrbTc>tf~-cg^X9S@t6D&@;N%+rh+9Lb^NTHksCy`wL7ZKk
zB4rJ{pxtmU)U}-Bm&3Mu2)>=l?2PonL)9b4Q35$R#qO-?nCjqD>~Q)rzq-SxJ7epw
z0@b0AiXew17BO$K1KrOhGrHITkGDo*lcq{idfO_wA0X!Q;7hB$;_(EiOTZ;t7MI?;
zK0ZDPK_tl*J+>rDpDbo0wBZbf_Xopc6EXXcf<IB%weg2H0Q(gsxad3>VWD~R{sz)a
z?@(Bh;2j4~X=xR}$Rg`8Xg+cT8N(!OrkU!1pT0a+wQBB&(W{%<1y+U@7UY^r&yUxS
zRZ9rKznHs-v>u=$k~;m@bR10hZ2>%?PKP&)x&j8bD?&T-jNCP6&+G=^79Q|b1#}2#
z?P}rmghC?1eB>!mkMtkr9fn%Av1n%KOF_Rg8Z7~D^!tq)H=fS7m>()0ekE`b3yX}m
z;#j7jc>33uY23`9rH2l97i#<>kW9zStiP6O)e|<*;7)JsJ+!@R`K|oaTO#~~D(#<-
z?VXt%ZijmU#cbdIVHXDn2OAsPz(HB(W15=dQ=NeofkMi#*TE%&*bZ2fjJ$$ft7*k)
zaJ#Y0?eZ_9;&t-}nyK6LM1}AY2&&p~9KJ~<v0Pm>T`TKe*C!vCkFcc#3cGIMhNG#-
zCIHJr{ZjEIf8qfs+<*Ovc=kr5G)VD%)tDkEj#K*1oCBh=6u}V@z(9jCs2cp<eQ|#B
z)I+UWaL&vF%QRirZQl<y?0|Ab8bQ^|f4JS|*JD^Ihnloq=mM?779t?^2;Y`962EbA
z&WglC=o?VVQa~9i6?<?ca1g0L=fEGoeCAt}<#7!S-V+ZtIna9E$iSw78m{&_0|x**
zxL#uY6T?fNvq`1{1M~Ywa~PP06>xNv{<zR{+$0%+(c9V3%t{3g-swxTEVK|LFYK|4
zj+T~|y1G^9D4}@<m0Z>J2ei&FlS&1R1!->QH_JO-++B*Jk#uB;9IX%%1V$H_aX*j%
zX8Z;RZqLPi;1VbolYRB)$9ro*uE<-nPEd=J9(jtE!!Jh*MvUuw@N3fE894N>tJR?Z
z9((kc1-i^?D|T(Gpoz+BV{n6HwYWC21HrM3ksg?WhmMMiGXPBnt-d|cYwej}zPK<C
zwb%~w4;Y3-hz<?iMD})eEkU?di$*C$6^fY|Q%l~vni@;^^w*q;0D5$jZm@X3d-+Hz
z@BvZ6H&WF4E5x4{D=;vlfA<sW$|ct?lpbzs97H5^0Wz1#VT)&WE=uh#jr%1~ipen!
zO(2!9{j6N?>@_+Z$Sj4=fP%xSKMz>(qug$=$sVa9NBcHXI88a6pWGp>B^!+O+?p+X
zcW~tw*Xd;7Pq0$)L&cvma1$O-CkP*S9C>C9NX!$#N6vv+lh&QYh9@4{k1uJPn3&9&
z_roV$E3uwnJMw48xr#1klup1Qu`O}gzVa!0QEOJOe&)ZDknKfq33yDuVWomZV}acZ
z6KpQ9c&Lci{j1@e`D#zPpe2UORtzV>oAro_%D~6;=HA)_nVH^%(9lrCcqsjd$g4~Z
z!pErh{au9nTCa}0Px?_Z9`3(A;4OSwK_MY@D^YRQU0u6vqXQ%HY{PXAn%@EcEF0)L
z+3rzpQ0|VUUnj9fb~@X2dK6rArQCbiOKIr)JV<*a4)5XldI~EQsfDRd2wNz9DAQQs
zizns1G+ue`*-TIG*#Ds~ZgK8B?aI!I!1AG@@1%n+`o|@Tk1hfxD)=*;u-SI~AZ((U
ziNWn>cX%2-%*@QhmB|qG>Zny<`N=UXTR`raO;;r=)xLfEkg$=zgXq~(=o3Wu2M~dg
ze#joI3o5h!%d>FqTOk@jNE-{0)DeQ`9fsSaw)nwIHUhZ-UqW}p%Ih?GQHWa*+pwUZ
zJ*b!{jAV!6{Ss2Zlo@Vk@jooMZ(lWVE;EPF<o^CC1FWD21c^j1SiGz&flN@6y0j~M
zV8^2<@tk^u7G{T!hL%<%Vgk0}N;#|gqayxH68lMOU-36QdhW|aoI*Z)yUrEcSmHbe
z?FVy?4jDr51fU$heft)RfwsWe7uOV+op%fzd_vuWq7xuu5hZ-_@wwL<WfTZ2ucct^
zsOYatdINTAU_%yuWZ_OOF5j)xgy-s=F!!)96ciM4w33Kpnc2@Z*pO)1g@ws-nr-`b
zP<cTLy@kF+c|`Aq_1vExb4P(A0QUtYupPZS(j7&&<T)9y6eMcjV$s^V?_4F)<N3Q4
z(W2N%EX5X<KqiTkKeu?Iq><brQ}7pxTe+q|OG1pef|*H;yr6@FXMwDd_o`<hp5^07
z;iPCj(k+BSEu&wiNkIHT?$6Fmj~QiYsj5~}(Cb?DrzT%TkF5hjp#jqS7oYl(W-#AB
z(QHXWHn!w<Z1KAiv(%~JCR;y0z?f0w!Gh3TEZS~Sa2H^LF4EL7BpMJa*6HhYR;mYR
zHo)Qe2|sv1UG~am|6hI1q0c#7R9>Xh09iPpr$K!E6~fnl=Ft9`1;De#pPeB)W%%<j
z-JP7A>3YSFfk|wKmrsqLFv6hwopS)*oho<s!0JGzZhjAg)xOpK)8@^aDdgT~7?hJ`
z1<Q=e5=vj@zw`u~>q%z=w0bR*xDePnl^4HWQA*qL&9daDsYW}20<Mx%*V1x&C;VwG
z@GUcQ&w#G%OF*+7+KObKXQY4d#3{X>FeCAIR(t-G-V_8Fq&SL&x(O0o2(1{~YO!QA
zwa|6o-i|&p*}p@{{2C5M`9)@7BoHk#u@+5PicClsUJ&s4$@V~l07kLVyS~gf4zho_
zzdXKV$yw|u-$YNZ7Axrtz=4*9jU3^jyOM~HCM_2@awTA3tW@9~i?F>7K+L5pmdmKX
zzWf$(-u-8qL3ejIg<Mc{G=972+*KKD*t0xda*2kqHUeEe7J57an5A5R-6Ii>ZO+LG
zfy}r8!qdZaVQw0++LCE_U@jX!CA)t}^5;h>7#(j57)Ya(z>^no{|s0FZ|IJ;t)>>)
zOmv@=Z~VRJRPAd7N~~Zz+}5<L5&!=1>({R!C1_*xqC*YQ@~H4z<Wx8C116FLb`zq{
zXZu=FePq4~04yRRVx-@E$HwXD8jmukk+a~CWxh+DM=Hbvgy1+zGZw}Oomp*dZTCm?
z7~^=;Y+3I1e4PlXKHVcw&SPT8Z*}cz4^dNB?_9C|gs!e6fE>n#W$lGrSVz*IaYf|Q
z+&w@3)gs%8?zkm@kfU8`Sw8Oorvw%A+4|+O&em^s=SRErr=n7&0d3KR3OFJs_Y_*y
z0qqI%)}p*~*$`(KLwHkFg)*XyOujbaIeG>O2<*RcH~~V8td_4`!McYFIs>*_meg*i
zAQa@6s6HY30sZAVC<m-PV66uo=pxvqm<T~v-s+&kK;vHU5%TWQT<Cr}h87D-pULmw
z&<4#NC%^2<r-{uvd|R54_^@EcMn@qG^1!0Pcux&M{dQbtfC+_lLCc+8SXlUBG{NZj
z2Ua`}pu##JS`fS=Z$MUI|1bXFef#8CwnZ!1GetoRH>@qk+HrB6heWJTR)gB~&^BMA
zxfK^EL(?Djb7WXp*qu9DfsFxzOB|SZV(2>c#TVGPNG1ZTSZok!{)TF(QcG-7->XOZ
z7p0T>uDZxe{0^=IE_Mp{4x1T|3Ks=5K^Zb$S=p~WC^i<I3tjvco_SYS7e*jp6z>)j
z6O)pX;^f3f@Nh;A!}fuW3qea<#$y3J6L4ht8I9#%NU{yJ;oKAR2^<XUQfy$0CyUCT
zjhIp;g+3TCyvm=@Ygb|@QZkug;lL>oF)lt2Er8vHbOXx9-nw-hVFFT1j$t4=kSNUy
z?TmhFHtWFfuV2)`zE`8wi<?BzQs1xyjGD4A0Z9Ewwy-k2(c>$B4DJBV$=nc*eu>N1
z>s+{ZTTKHB!jtacpUmP`&e9qHKbMB<H~aHD>D7|0z9;1$p_LLok?uXLJzuV)k%`d0
zvf4|<Bt;a~Q7NiZ&*EI%BH6scXbmPCb^=TZtAjA}9EBd6V@ZIaaC$*00$wc;MD(4d
zz~H%twgtIEg@uJ9Z%Feh`wjmZ5g4e9cLxRr_O;vo=y;0Xp_cHD0XsyW{)Yf_Z<o3}
z;R<9Y88lRQ5@<d+B4(uQq26(AOJt9VgYwa%ZUb2rtJX1S?kq;JU|VYPs$0)hc+6Em
zZBNojPssumtsr^W2dJJ{@7%jL3mn`y`vgQJ)Xxb_Cy2WIx#s|&Ke*z4wx{j$%W3bU
ziIIb+21xvb1rPDUsD=)rN7s5#Pm~d$yLnrQbHqVZz~`ePnZFR1kd4^I$2ZrI;f_uo
z>1807KnwVRkW8yZrQwCK@7mQzDWeZ_9j+cIMj{A_@g0oBl^y*PPTYdj)YO0iWvD+)
z#2_yr1^G+I>ktp!r_lU`(uEBSi~2li2V#WEcd#C;hg11Bn(6tMI<Xjrhg|D7{k|n`
z9aPQY`HAL=Ko%Cim&_h>Bj6ENW2m?dU?2%YVB$_*hj78E?yk6mRI(#U6&jov{V?84
zgFE|E<p?WH71)UYW_QpMv|$^yJ#7pjOf>GRTtA$EzWz7JWg2~@BS$X43jurhQOOa=
z=p1qv@KqzT=nAP4Ag@IbQ>uTmoOp7Klnxh!B11w1!SD{8UJWKm&WJcTIKa_GzXG!`
zCMMrdAp_4fBa$vX^Pxulm*ly-jOZx-<NJ6HkD~?iNWXMuaiM*2y93AqcMRqhKIfe8
z>FO%M)DdhU(Q|pY5optDlw2gEjm_v&WmMqV@WEzO5D+;Jlrm#R27(B<xr8582{2U1
zMhzX8s>+cgcck51;1oPpT}cp&qz#ABALMo${s9UhV|HY4aBxgaOjsC(5R#AVuxVu4
z!msOu9*=vCa;{lJ{}p=u3+UZNTv<hU9=G|89<qgF7>ZiQBo4)zE=Nnkc*MR#hz8Hm
zOHgsBQMDKBzP*h=Z;w(SDKXJ*s6~vI_u>=JWdOCgaGe-L0*w7Bc)T>l;($l8<YN_g
zN3{^d4{y=maTO0)@kW4zLM#iKy0AIR7k*}h>p5sQ-i76&PPv}(j)<kc5JL<sas?JQ
zyGk<zAU_NOWGpr$8I5nV9?&cV^ia@i)Y||S8F$=;437{&gi`!A8a!=C#mk`(F!vg*
zhfn1Tc`z}4W$$7Z#3G#Cg9){8r#sQLl0KIQ00$nUM*tdpRB7g)@`~;LhjVgrXkz=|
zt=iT|If8#KJb6zL>i3uOv?>M@UYPd!*;mgsz=|g{Kx07UcNk;QhuX^*JCb14lP-{i
zL@{U&9Ok)^j64u6Ak@Gwf(ehReSXN192KA$8eNXO{X2(Ibp<`SWTXb^p*PBTE*{s_
zEy0irvgCqL5nQJOt5+caO8{Nj+1V&Z;jyv$j|Eymj>+dj?+>t_%nx%fyOoh3+;_CE
z{Vn#0XCkm^i$T!QEk%`g!HfY$BOnX79+5#AA;`tW)f09~pX5nwX{bGe2w!yXG3Td?
z5r%|NHVKK#q(v<=Z-=lAtW!oMr};LpG=IwK3Sc3DZ7xorv;3?F=5g$M-+w_DE(5FE
z*w^8c38J6h=EBS1Uk0K81|aUVi;e9re*1e95Q3ts4AI%R6%xV`T)Ec?bFSRG|FqrX
zb$@Z+bqu*c5pOO!SYK$YV2BIbly6iKa6ZQVB!Kjp64mB9czp@A7a$=35I6k%X!IW(
zPf~)aL<PkcX>w<7#Hu?lxpIgfde}#0nCB?#xe8^3Muv3T3k)b4VW9#}2&Jf_CreIg
zTo9T;vS4&{Ca3}Ur-wc;q6h1mic-r>y^M&L{C6jVvEN<Y-J}M^Xeyiqt;{n|!6%_H
zJsP9FH>A<aY!Ts?lA7O|e5LaZ3cesd2>T3T*4@*?@;|eAqmn#KP5!@=Hr+??L?&<V
zY*_geriosLekm&zC{#Xz#fi=lq!?}GK0}t92iXyU1CWYnN4Trd9VpC)nEDk?;!wbt
z?C=hUX)NwI6de|34>t||DEC7j0Ilm19E%>t6ph)ZM@$Z@3GQK%txJu+KY&p?RCTDV
znF(@qX$*tDKicsR*B9PRe7uG$8?=xQqX>v85CD=o&}c&_IiL@ogSed>HbA(jV;7!`
z@cx-L=JFxoj=p^AB@~zo0ti%wsLBH{PMtxs&DXpgP1<5WDAwt^0f_=53_~!q$hn;<
zZ@{*s$v<~>5w$fS>j|~J7%PC%K_vmDMY3S`5p<EEiF*J|GC?%;zYt2H^#FY8?*@zF
zTm0s`xMW_xdnYxRTaUaTx=)d9V{afE<LmjQo;O-@t-!=M=$H}8JWH`!SC|7pAaK42
zTnxWjudk${B8mAUTo0s&9O3vCZHMmt_U^1Uy*!%*Ns46QaTmj^5rm;|%Mn7o+W6c#
ztk*Ew-gw$1m(0Y+I!%;crt<y^QCfTsKaRtNf;)2?iU9+&vGCh5whY<7%cio&^4CLE
zy&tQQ@xWAUMFlQ2^PFXY)`A(q11H_$^({_dD>@=%gLZ>727?#CN};UdFk!)a@}cMh
zYPN&04zP^Xcqq7Guv@GvQB`7HMqbjNH#R229`t!VCmTU%IxV%bL~lGQ8LcAwJQ(P@
zJYK8d3ugeFT2%U+i3vH-g0jN`wuiw-Hy^bV(ER`j_-}f7W+&w2<dl@Ej;*7vXhbz7
z$2TqriDUW)E)z4E279eKo&W|A-3si%zk=raf#0~&!3`k_%ZX**xg+F2aP@Mc!XLij
zD@qLYij7W~)2@U*!)12!@SMirBA8czs<`NVIDjEA#{3VXm7@*q{Np$*NaSm1SeP&_
zhK4oguN+vuq(McCVDdZ!Nlm&H5wVR0{lQ#K8fM+*hO+J{k{5z-qJ>WmIfC~4KEzYx
zqu`@9gzMTUf_ooOq#_6|(Z9va_4V7g$jmIQOW2Miw>{F_=H~QO-XK(^Kn{Q|z7Pj8
z=Y(OuOGrrY@_t7p#k>d=x#+aXe<lh;1^W8>0EzlwD<CN_PIhb*dqznkJv)(-<h}1P
zfCTfW-CbQOKvUSWlmeVPcg8|LleY%&#b_BSCW!H0UB~U%1i}W+jm3YYo%1cXURB~*
zGE7g@u>?SV=;Oz0DzvPvN6<CItP^}>5JI*zgk(SZcfgCJaQ(>Jx3`ehs^jv%)k+mK
z3JK}Os+E22b#T6ACk+O@3}NDeUz>k?`1#lxDw!7m`gZ7?UxbY8eluk^LGwO*_z=4f
zk)DY%es>4RPk_&o^d)dA0DT*2ts=WVw7&!9o}yZyxJ`LC<%iN?OeJ=ov62vj8=AM+
z54Ru3F|q@zw#2R(ER;-3B55ft0Rj@Flz)n4RQ}oVG_MtO@8L}&In#%_h5Ov!VqD4A
z2*WhW{||<El6+F%KO<H|RSXFGM-+WL8@ihO4c?rC&14O^qWeQ&)22;tG5v_D2%okY
z%$hBYBs3T}IC=6UN;shJSE$T61s^Covvlr5of+fM-Ed!MyyAf~pn8&Mc42b21*Z{E
z5@#>R^6>Mks;RXX+MWkuk)tdRpV{1d^X5$yEO6i;)H{$e;J`^Zn<NNkXCu}(T|X#K
zhGi(*5_w`tDJT%#c)eE*yx0aS23v2Uc?^8pMR8j`YInP|Y%YWcW*n{`WJi`Bb#a;5
zOZ|r0?EjZ1uH{A4S_v&h!<;MvuxGUU4G_vS4|RzFk3J7OZ8wRKUKFH1WH_7()<L@J
zD&(W)Bf+42FfN1E|Ak-k@tEOX6KHP6QwF4Y8zmyZ;IA4f)Rzz_Eq;z<ePrT+#iI|d
zp`r0>O&QIXc)!d+ED6Gt!S5vulPv=JB)`Edxa=YHd5fk2WpOedxDO;p6LhbkWg3Vg
zb`#b;#@e>6d`gZ(!&Wk42)%I;fF@}2_S)eDvUvnyO{0xy*2Zq);^68bw{HDfWJW>h
z@n1wNv<ajQJ%OgFzEv<rWBPX!jOIrp!Fm&4!&IzirMhwB26j0tiu{s5eR}CfkFN?#
zfKhYkE)AvF(?xcsqSmRh{~OHn_reb>HE84Qz^+K7kBUMw0xLkW8O(h{+C90>D<k89
zBO4<|)_DF!oB|2wgYRZhd+!jNNoT<X5S%<&0XN<E?Wc#@W4Dy~`!LRh^@Zgl{~B|9
zKFYspvM1eXSWU=*-zSFjwX|TZ1kjLdWH7%yHZHCmg#^)vXA~Yd7%C6b9u@`0wm~YN
zL+4WB`IV%323m_n21FTyaasq2?Hp<-I_0|H8yF72SQWjT*l}`Z1VePn%4r7W3+V2D
zM*#}w6NYI9iU>|g&I`mz6P`9NdmKb-8RrV69xhh=E}c)P&jVvg+<x~?4?L0#a+Gld
z0oxH}<%{+A-)WzZX}~No?3RXy+Ja>JlboIXU!G|Kn$KVi3e9sna3~rEp%k==;W`rw
zzBPlgwEu6%o?PGRpI%zAL#UxX)O7c1d*P=8#6kt&9Fa#10GgCE%mb4NUwrcZzYau+
z-Cm5QAzY(s2A@od-i~X|`*rdmr33zB90WxL^W{s}TVK8t7<+w-*()#{kblO@)LhqK
zyn$|l+&aSnf(Dd0mj}!6l%9P9rZdrAW;!g+$_RgP0(7|D<$L-8)ffNsbd`Um`<soT
zx3O{9^Cb@t^cc38_bK!b;Ot3Y(hVK-t6{W+s+M&A3eKwMJr2Li4i9O#lFy1Z_5x(I
z(#|vt@c}?l_K}XlmTi)I_wIe+BU^wEC&x2?Ylugu^B$a&W@GyTqni=q5T?m7Th2;$
zY;}SyHw42HU6|0fJ9h4b5t)T%F4*BENZ;Q+r`6_7oA}Uz$H*1LEixSjBBwIi4Zr4H
z(Cw$~L_**WJ1+bDEY$nGNjFT<|0l;fpO(vh0(zjPj$j~$9Ok<A)N|AnnGq<nFonep
ziHl>2OT|NAfO5P-W+4k}@x^3Cz*Vw2YFB?079W3vDJBHT^BHTm9S3&fT-Rb;>1@Eo
z{u#*HXUywq^VwMg9%w!+ICLn9f7ACT;+Z^O+tS?`^8(ED8j7sGd@OR*%lmlcvft_R
zCp1^md)>HHIUG1U-DV)Yl0DmEPeu=mv?{>Farsq8i?&I(aSbP@DRKltz+j>4HQlt5
zrRA`vCvo}mWr`Imh>o$tZR<Nix=h+se=Z#^loqM2t;OJuPVR+Z*MM2FE$ckm1=h*4
zeJe3PiK#_QD5^mu!pW!;4hRUqm?7juMD{<+Di5Qrf!c|tzOJ2JuH8|@6->>RM|u*G
zUst?`?dgod2uGs?9M<kAlnQK3=`&9VP#t3<+>PLYw)L#_He8m;GfU^M;=*8FVkbv%
z-MW_$|J9MgZ=OFtP#aHl?Zu4(m12N&Dk?Ya-gP|n#_=8_6O;Rw&Jfu{sGfR7c47_#
zckF80+7>Vz*azFMy?sSx0ZdL9ylyat@7}#zCk)BkT3~I2f)}=KE#X<S%2~qm;hVma
znEoY+>ne@uPSQY5JzZT_XM-*=oQAG=Nzb=vdmO_q;t(O9o}H~N-0b3ngoJx?%PMby
z0?bTJNxIKzQQbYBIy2rk2Jc}Dx4LX!0nw$1@;M7fYx(l!iBcl4f%DK7L$vH-q9+Jv
zX57G~P+Mn-hNYuHQ;Zn6h7*1kAzSwn5Pqqpp!W4^#m^~3m%Uk@%k*eBJY7FOKRWqM
zyHDGJ?;$bN#rcVdEQ?lg50AwcFAlODMBx*;)c79#k|gitK|M?|?j@L|!<3Ocm7rh_
zi2cmW3=b3hJLj#qf#@JQ=i*}yE0<1Ya_<ro``q4cz+VcfIeeXti@TH}$et(c0dfpg
z*WSTli+qXeblvmkodCq+xON;LD{DNa73xk+p-2`vjj$VhSy8!#nVA_;Fg8BENq)zU
z9j+KHh2S_T&P@=bJfjYT*bc5yhfYXg;{z9dNgBda9^)=e`IhDO-%qmnq^9;kSiK5l
zvAlHYp`9)v&4P_4R}=7kKwciR6>uj{f|cIb%*(?>?|G9%SoF@5*0DhY6j^s3c1WiP
z@_(3~4o%3gZJYC#XB2EN5MC#E!hC&w>#Ua%K@~yyD=LqDj?LFtqT8O5e4LywKYen<
zoy$|%+KwS)?EC5t^~DpeSNV4DF1G8lAtyKUEih&WKR*XN<oE$y!o>o`7lT5<uM!jj
zV+GF#1aF8su)NX)2YS#G$j;53gZp=d7BYrp9>BQJfHj1tq<0CEEPrL&zX8}~xMI~>
z95za)eb&@8gX*#SbgsHMI}x{=jxJ<9lei>0E?^hXqL(KIOi|IVZ{);BdGaGOx9vIO
zNh_apoMPq5o7+WH`>qkL)h(^9g98KWnI*Y>L|vycp@`Db((2^!=#=E6AN?GbpO$FS
z`g{FlV+HZ45U$j0;MkZ12n5^VW!m6bV*vjE^k{P6GlviNv3oBNLO19I9@(iAbq+`_
z#DVy(U5ZqD0nEUC9;OY1_Ya`>O%@q_Dnm0f7ucTg(Yf(+!o|OY$&)?%zf0bSZZrBP
z07NVo+KF>${e}fldEUL|=XVj$sIDGFdk@B-LI5Lh;us<*6$fu%?@M_s=u+)PFCCin
zD4us~5VjW!Y+&^W^I<F~GO}{oZ<|w>&PK?#(J?av?(O>u=77aJ)nXso9VFJi!2m#O
zOG~VzGrJFZ6)YGpOvld`6!6ffk7_aEoId0**uwm*|IM4B>sNa&!?9pAy1Q|;E3{Bd
z*p-y5tSoX};~guTmvQs@IZIf=h$g=(FXPd7gtd`I1-xY?-xW_fHo>$7*~9#?{561)
zQv0Um?^%!?w-=0V@6s><PjbCN!y3MA`*xuA=i1t1R2w#J!eJH3Bo4S*EW!CJ)K6|1
zb8uNYlf@c{6Bs&hzkO&ql|td}U4=(nw_({Hb(rVd_n!5k{fee@0jv?tn`>mPG5qCd
zZ}0E#FT8(0oEFT><dMt$4`!QHP+brt=>X=If@7F^`E|iS#L9cRi0WoBqu<X&I4f#u
zen6`|aRkR~ca>7a#{=lVR!>n`BRwEUcQLK^T<nLyMe@>Ohc@7WWaYr|LZnMzo{kT<
z8}wNb#Cw6RL1O&i{r^0Rz&4CM;@knd580h18S#2b&%4E!CoPccAQH&J;r4Qa2b#NZ
zZ)-`b1|ZMjV`XE5oWGivmq$MM1q2FYoZF9%e`vp=HE^k|q!2$R;_0zHy<u;=2gm;e
zMeGQ?dWtn$sK}s)ah9a#8iu3tzuyaBCrYsLz%jAvkYzh~>Cymfr?B;ud+bn(v6ppD
zAPnS#Swjs#BLuwyJ>V$C;eJ~3vDCheIy_i9pc-_ZY;C}Uk-vsGg8s(>5man1K)Iks
z1boP;aJU@ghhM;|mAm|WKzk3wqphtC5ktsR)!scoDIy}m_5!Gk@s=dq8NnThTw<;|
z_%EoBUhVDe#e-9`q3%`qZ%@WQ`(c1{9}5e!!&hk0_<>V$LY(nQyrR_T6<UpC)f1_j
zRX8ZKF-(c%-A9b3&Cx760Jb1YW6W-ODl32KB?6;9Po6v>2`U>#dx|f8-k0=zndjm#
z2oE@PKwzK%4whWFkb<nlI$!NYEP%XkkjMDPG??EpaYkZ_h3pf<WxGO)$+6J3hXk=l
zg<Pl4T>sgQHr7)uO2P$1yv%BP{uay|vb{ilLfWU>iF*EXy2L3<Xsf7Ie0DJ5`53`_
z#2f3uyPcXKs@N?l<7=dMStd^|F`Q9P96W~S&2|v-755j9#RzIbfdW#n`}`Og`CMe5
zR`-QirI3CS){;0M-`lDx9!bd(*?*QRDXb(GIe2&;9K5~}EwPD-i9i+^lW=pw(~!JQ
z&;R{8*jMEhsl_{p-Y9ZhhF@2U${O=pK0Yh4N^7gZpq@W_=0l4jM@9?H=f=h(T>X+T
zIZ?~W?e*M8hGn5z)xWih879>-)A!lN%ElbaJcUpS@-NiNQ;on$z^);B&R8AUO!UeK
z2nd+6#_3QIo_E=BV~hL#TUk5MjgY?vM;eiIqECxpH6L~Kt<%}!*@A}8HdEGyrz<>}
zZ?(sF<?|85+I7wn#C-V3zi8B348T%2e0Vh*4mE1>gkh~@n{c#=e_f+0L#5l(r%&an
zU|lIFC?pvz^UMv~t@E+ES~Z9Vp9Ny^KR!!hnw8$)a#?Q<Yyll@ZE7VmPhI*A8#Zj&
zveU=P-u{I67UDfv`XQ<jB-yoVRQO1OH6Nv}l6T*ozW`0RO``o{s-AkB6YD}S-Sqe8
z)l6aaL0jsdx-8=Ap#?RC2ZU@5>_=^e$~bGp7$ahA^v2q6gPKd_QntMmZDj@&VXe<c
z2w9Ona~_lnaq-hwp%ojqZQHeuTv@Scb0zmq*w<DhQvQ#7m>ASCRmX5Ic@M3ZE?r8L
z)6@(_Os=}3xlC4{t^8;(xd^miS0(J;|I)knjy7vvqfxeNJ9ReujvWV+UV`HG73@m{
zv1)n>T_8!P{1c_|aw_<)v16tBVQ}Z9r?Zp8Vg4)ka3`*Ic?K|;wbXqe2Eeb46~ti^
z&ad<5wmExwT2QRs6tpT4*}Gy~tb1^q%0)%iyALJZBu{E@`xgT}%QVs&>O7y<6XVgr
zwH|>*$%%>F+o{i}cP(1uZ^xtO_8)qHMU(xXi$+wgg9hkdtjFQ)r00seIXR6Xr%^W_
z9!q!yC-Hb|k;yxTU869ej7R>#R3Fc7do<zs_%Sb_kGd1Q@akx^=-yH>=(NzWe_C$t
z);ZTj4SVhh?YTYaod5V_kIy*`ocH`g#R*y*5Y&Z}2!Dp(piJ^yB`tDk34VG7{?t`M
z7KZwp&cwtW6xfRAq0!Nj9t(4LxdJy6j4ymWsW|q>N+s^$<`xzfK%y}-(~mJUlw06G
z#@0{~_PI`3IXX_F#JNrVkOQ0e^<{VWk3u1Qva&`HyO0MgjEuT4waNQA5Pa*_#;sd>
z`}-L-ZQ9|Zp4RZsKmVWrOId&QsY45y{7Uru`%tLa9T-WBd}k389nHtb=R-@wA`O+=
zR~gJ<WMmW;0EUDw)^&ekmHg(E;%-YE$+4ao&}Q=q4nBqv9=r>~8rY6vvziSe5OS#V
z>sNU?-Cutl@0+p&ZbUpu{6WeeK=2>Bu_-Gv)5^{cdbtxf(O{NWch|TL=VH;aufRmy
z1NFP|0J7@pYVbJB@hQv8d*K;8Z{alGd+4UZ?)03TG17wBtz%+t4r1ww86Z<WAE&7w
zcfYB~Qf;88&v%`+!7AcZ5v<nF&CTT4D9-<VjD}5?4Gsr@-OR7s`1UPcDR358fWcHZ
zB_*Zxhkjydq3H33lyZ2XU`8-hFTpXx90?p<X_t1e26Qne00wv#Sa0|5-^YIeGJOqc
zVC%(L2EmQ8R#rb?K9Sw`#3LIZcCg7%#AQG|><g;RHrFkr-2z_=?ErYriRX`DxCWS@
zU*;<2%}Xx#WoX3b?d|1whTFGqBdbzilEao`=im_TL1Py~c>|zR7;LS?N24Q2&fRX@
zcuQ|DZV}_?kKqeJ5Wk6&DNju`%{u!MBz$o!ZV~5WcXCt=$;->bW9;khHnz01#Caie
zbEsESHMJVdNXR&k?(jB*1SF@-;m59DzaD4C!Rb<P5E?%DzStqN)igA55E#kH$==@H
zNl8im{znneZmzB;AL&K}GwL@#^`<N>EoEY41fRLFY1h}jzCxJ$$dGqppoo|S^TV$r
zBDC+yU%}5w)W__eG{<*^Lx<9J3$w9Qn|U<3)#E)23!QQI_&36r8Z&Xk=^T5<Lr`*^
z925V*z`$`{Lu2Faj*gDLKC&3SfB#;EZz~<$7^dE^`Wdi!;q9U!jQ3Tvqi>!qH9C;I
zBr(TzpyQH^v_S(j#kZUbM5jzqrXK&r^a0N8J#TCjeYfHc!q#Q9OYuRmL5b6`%j6Cm
zKN^LW#Y8ULg!_>vv(6qGG)1G!^sqa^(776$XeU{L$zY|~<clzLzd?$T%E!QVV&Jpd
zWs18QILc$Etg3pO_u|XNyb}L_fRC}$2u`J=R-Cv|Dfc-imp7<2x{;4jqoda@=5!AX
zM1N!9V|xLG^FYiN8qZX<7%cN!E_88~NS~9gb2Y?^Ml1PZpFssNcwiuL2&hPtwWxC{
zN=nDm8t|;7iixy^t1$t|@UZ-BYAieqN+eL7>p=yD3OFT+`Kn;lct)_E=x=VEn|V)`
z*!A5CID_Da=7X_Nr}Ol~hjFZKsq1uhz#&BZ$z)X~CPSq22sluL`%Bi&`PIak%JDD5
z9pDx9%1+>b8b?(HE51WWJ}@0U+GLupqHvXwnfcK?H;CJ*v<5i+d-o|N<eR_~={}$c
zrHn3WU96FzVHPMCUzx61-VBDALGe_F57EhsiiyF&XDt<)#Z!Y+)dxRh*uFiGQEVR@
zo1EiTIOS=meUZGI__VB0rOfhhVzQ|zzs%()Ps4GDR++`QoVhGb9jI0u^-E!T4ih<-
zYY|El@(CcKYMY7y15886r=J8cLB{gG69eqvV0K18&qBx36&@ZQQ03#xx5#7MMahMg
zNhq-5eo-o_TwgjVjx|GY<iWzyGOo>a%^E+9<0!Jc6Y86iDt8{c9}=PwnT9zEgUOI8
zv2Cv9_x=z?g7Y1c6Ojj(ej0sM6eT7)I$OxFU=9VPp9Ng1(La9taKaEkouPXqeug<!
zar9%T$l8I<PPyy!zWw_rP*dSI7s9<ji>9s2EzRx@5tL?^Thb7#LZ^EH<0&yP9#9ss
z_X+pzNds_Z#!aVryD;vd5-W*@VBsOZEvRKW=vF`#proVq%z{TYtwzU07>_sL-w$>K
z>-2G6o*st0pc%h*cES$9>;Y?o8LAUG19sw~{%16^JTT*oLYJn=BO_A|NJN_JpEiWr
z<LBp>zXn_-k1~TH_EEftib5;kK|?>xlt()GLnECPBO@aqzF5sz_-?SHVDsi*`do)9
zG=6dl4i~CgO^gH=$=zC!dPsSQGfc<GprIjuWi>V1W6O53X$cB>exw^fFT09-YX%8E
zI6&aBh?gt4UbxT;-`T{}beE6Q^k`CeI9@ZAfhI8NzC!uwmpJX+xf3RY2=+JZhA|d|
z>}|Z98^lb2zP>(8JvavBc|>@>nwpx&kJkYnXc$FVjqhM|f<fG_7Zy^TE;%2Lj#K#Q
zbO#$7phpAzSyXIn(Phj%VK<`g+yRZi=nKiM#V1k=JQmBaRUf`IynQ=B4&=hUK5JxT
zfHUxp!}|2};RtKvOf@qwKUm*fDtC}0lo}fKxDLRBWB>mB?Cf9hGi=lrc^_Y22sV2d
zgWFugT;1Hzbld4hTn`K+eJ(h7Nl};p@9OO2@WDx(x7ZJS9_zdiIRt@aR-(wm;Vg6n
zRT?-?!FO)Q4q?m3y5CG9QrnB{c@cTQaPlzDUZbma{OxEckgt3|30V6o8dCh|_r|OQ
zyOhUh1IWqA!No)2gW4QLQ8=oif=xpbl4BQBQ&TtjwlXs>pfe=nGS2P0qGoTQ=Gx!K
zIEiyxN_WV}*xXe??y9J$V5;_kR1caLHV0Z@XTlA;SX0{)d9-*kU1jJ5YhAw^Z`3~H
z8<M+uOD!=V&Rt{r=~2wYaYzO%4jTW#$+fc+IZtOd2i?D!U(#?pcxS=P`vczv<3Fz=
z8|Fn^v(wYmY*6+g-_o^*-FPLOM-wFhPc}nCLx{{sI&4Sz)YmnpUP(#h%U1w&qcHz8
zzr)Qq5ovVx>}c(Mb(W;*m4kzWXnCZ~&oXY@c)Y~P+B6_N-CRrSPJsRKpIdLgc=<99
zE@GrQh$be42gNWo5yW-y@L@Bx0>|Olakr9~7`@1vZb;bRs3hbmA9AO`2NWWd=Y&$E
zI`V(qX2&_&;ZqRJ_hmdNHI5&z3KtNd(11VDx=r=Sk!v43_m{p~x$o9TlRXD4a3ohK
z8T<w`tLfcEc&58E1R?Y`aw^@#ut-BRMmj5C;YJFA?lRF#9vdyA!)S|=?K3oz6RCm0
zDz;vBX#jo)n$vlw-ALT)Nr54nTqy7AItS}}*SozUA~N><nh&T^Z_CQc0BrL(Nt0-b
zEK(cZ_OrM4K%@~YIlPZ<kQ#hA%m60=U|QIBdEW+WQ65`yZBADH8psHe;=-cPiWMum
z$yGTroR!#_0!Rn=ek>Cf63PWfsbfbqQMTNWSKXF>3m<cUXLtceZR?}sr@x1Pvz$d)
z>1r<p#7dVQ>1rQCNTQzTQ`G`b;^X5}etm(|Rh8QJ{UzyrAUGLXSzl2Y?z?HA=>RvE
z$G;|8EJ0f?t){KqL%`Sk{P}!`!PC?6IS;{3(3Sm;gtn2wTNFGU-srr$|Cr?vU5jpK
zXQu{8pef+wER!G#?taTQJ|CC|XDkj*crZ)57Qn?26cl{NyPJ=X^yvJ-z>{J48dq%s
zC~HpQ9B8P}5hbN2yyRy8VUnPtlW(>tEg>q3-jWIflrecAu`itr1E7MLfu)57u&&>W
zV$Etc%w5%8;(83<$`mK9E^gnxeUKVB4Uy;SLX&<n4OTKdY!08ytSs$v_tJ^0kFiyH
z+2^hcm05jx23xIOXC2sRhI*=|jbj}IVqY~4TnfBp;5c9!47W$gPM&H514IAd;O@M$
z4da;E-Hex=FyLTv<A)D+nAT4H2K(jnn>We~Z@4ZRKSPxOyXN<Ib91YY76fMl!*#Pu
z1<^i|?348M%a;)hJt;7tRU;)PrhT~@m<Sh;%^&qh9fe$z4lnaqzG4Li^DqeeKmu>u
za{%2v$$&|7o_DQmIJtQm?_o4;L4-6mYPDX3<y3C!PSn2r0RV;3r7#$GKQ1mV*XU~H
z6E!n*`e6swmzCk*Fou$XUg4>VfYL+ubqM)Lpg_gTmtY&Rv*AiqBV<b}<P;EDcukct
zO8=;JEsRr;cI`>;HVj3;b;SH#BUB3DVD;}wJa|yapOmy|{t7@@MI3hwYCe>>4-;@<
zN}T>Z@1nx}<c!-8nB979m|254zaW&1`%->nwcNAj1f<ECGiNaI<L%}30-SN(`t=_N
zjH5QB4yBw-OEOlA77gaG-p*rdYnz&oPWu%v<%m3bUPBumGdfi{IkwPfw!GqOKIFR$
zkX?BhI1u@d<bDwmwVZuV8X8V4B)H<omu^;7R4B|AJ6zAt&u<BLgf$FkGgS>Kl1h60
z@go@+bxuHvCOULjcdi3&MYXY;p4@x{!w<VpX^!K~GmpBCBq4NdYzrXCdmA_5oHc7k
zZ$n!6hi@9al9PPkXFMz4cGK1P(2fp?M`9<1l=pxF#P)XyU5{q-y>g`#eH+_lm8tiS
z$TSNH3Wi8LxStFo44zeAE05*zk-2Hx!L#q6P0&>|y<}*(_grO=5Peo|Zm6HMeNcYs
zJ`oX?y=M<b+Tydjq5$1&F%BsQTv%jvb#;Ym0+h#+O)p*2#oMw>=W1zoiAxI$;k9aQ
z4xPY|qECwT;1$T6q~odkFEs|W`AMFyX6(zAVtaw}N?k^eQ`fRc>-KL(+R*c9#m`!E
zu(Jclljg4>BX5iJzPC+{;{T<6K{G7OfO#$=VQ5sq_QI$Gy*$WJ4|xV=jJh<>@cAm|
zhn=Y~)Gj+ar)%fz6glg)5r@CGGc)rW*xB39C%RljY3-`q@a`fb6Vn^K*i>;Zh|3oc
zz0pJ4w@0bXv)F;@BFd}i(Mu{3JF^On2+0%8VYsEu-0G~Iyf0q8ij{UdJr)VDuF|13
zQO6g=v}+bdHvu4Vx$@AdpgLWCP?$}F4t8s(si$!kML5G0BU6#>x9)TC@Q|l=B0u#`
z4>y1rV{Pm)m)(by-AuxUN6sB;2z8u>!Y_v~v5T?pNiYszIeL`33(Gfae*(z@Z9MTH
z9rMLmCMVKV(oYKL6=_CBx6wZmO9VGI)gSKYU=2hih%nJH4pZvx?d2AJSLf<cEzaaI
zbcL22R<rF1pk+rx7m=Lm(t-gTjIk&deR6bgxV_5MokhSSVG#sL7cDD1eUmL_YZE^<
z(rSl%)6d7a@B0mhQNiKY3;0k`Q;VU&tZ)%lBYY;HFmjfB6dzF#TP!Y$K#CMDX%4-f
zo0Ee>*%}sC&tJL}ZL*(#L1gx*zyYwgTNPiveA#BImUcA9$*wANSNY<?<;dwpoKqoR
z!qUdx$9XRsXThsFF-!6R=X1tB0^`svQZ%BW2^_Dsp_j)r*-49psQVz;l$4apouusi
z?02f}-k~+lB^XCQgQ!nye<=;CJQXFSFHRQS9ZTM|m}uvEM9h7zAb{9`Wk-*RKF<BY
z-P7sJVm4hQg*7)X#f8RIGokrzE#y#<{=0p&uPM6lU%#@)bdskbpFEKr926G9YeaQt
zm5hu!OR`(n{b~FXn>2t^<3$e@Nq_Z3`)W3n--Moqe2^WR@bw%V2|~PQ&Ouzg3yY7x
z32JyjzXgmPGsPhz#ax`6Zg>+$<fofBKZi5vahsmwwKGC~!Z?&LmFh2#*G(iAJ}<zL
zC6jd*4>L-+<f0r!ej>-tLl!tdbdz0nkq3$OIc|>wHxzR|t3ibbujv*%i_IRL7?Qt+
zHI;_P8gjA`{~vNvD8m`nB$wL?7t~};fh%nb`VjA=se@k6aRWwl`k`C;-jt}h@R`4Q
z^$MEl5*Q%PlOq*yFap>D4xLnNM!T)2w-+C(oLbQj0R^ppcV35V7(y;-Yiac^Y!v6x
zOi^ch_g%Q$Tg?)|Xi(-_*8#`<^VTplGXr#l^SPwax!U<LKQl9E6+9lZJn<7R58xac
zUaGLm=bFF2y`v+GxZMRP()#Z&qm&>MU`Qlp!2^MYwO9G*8c8||q|xWPiX;N`oA^<`
z@O(|SxB0ZuDi|9J$;oc{($Nv5|L*MJYy+{Mo3$(5F~#z=tBX92!1e-_pGC?=$YuNj
z40*bc0X|V79A?|UAFsyRB7Y(FCr_;;)2Dauj#h|+1LS9C--^mHtAA+N;3jPjA7)^1
zFexV(EsCJf(8SJN-=_$6MBJQE&i4a1=4Mmp8T#>yuAZKJ_jwnbIl#kXe<VsH;6L5w
zcz7c1HnujvSWizcslOSopTPO~iw+l6Uw-%?l;M%R=eYP%X(X<up`B60bz#48sN>;}
zI;diPfq~(#K*v6|Hr+k<`c~n_O+*)t{E)LvuiIUk8XH{^SlR-mVJN3xVHJf6NTb#X
z2?-T%@hwTPke7dk5|_($q<PdGr&D3b6*5H7K7RbzR3Dwcxmq!Ks>0^n@dkH?+L*WJ
zc7$BNc1;T;oTPM`DQ7NTyomN--4DD<N3s6aty{Tj|KK41WmJr$5xn*Y@2AyAR->*!
zm-j&!6~*=8(J^<Cl!gBc@vMF)KA`DV0GD-?8@;jVm5E3RGkObBc0wj&W&xwmg^W=F
zx%)XjXM8)%8&U0!7VgQ1T5RF=fYOO5%d%akb5k-hhQR=YYpmztv#Fw?`?j?eaQGF)
z`N1NmLdrZx(Ef~|$|(6n#iZk5{CcM=R=&HRiH-cklo>t$>cxweB75bEw>Re!_l>e0
zYWnA(FC2TEl_ljow9acdfjGDG?IO3OT|&ZwD9$3@fx3NUP_9pvg*gSLq<r?AjM%Bh
z^OSgZk6P2FBQ&+YhoA8_@UucX)`^O?zB3SbT~?ynn>TD=3k20kxjd>6Co!6f^}1+r
zcB<BL=kdM!_Awy0zX?b5Qq;lx0v1%!3s1(pWyK5~FE8)(y>B9}+caS=XsRXR@#1p5
zU>-i$Z0A_4SPw(0d$k~&&rsP1Qyc||`L;9h%IeKCA2yRG7W=Qenh8HBEp>aad3<7$
z^ogMe$OG<Z0h5c3E;9>D9A+Ufd$4KO@h%OPy(m+7HKI)6q!kDmaM&Jm0wlM#Ha>!v
z7ooNM89Th14SW(O<P)Yn7BSV2l;6y7sHkuk$NZ~(tsxKbfi}hSns48|gYvH{P8gEu
zEfU<8cUlUFg||VRv(h;+=yn;6Yz!s{;)D+T<0F144gHwNLH=5gcD+U<N=r-Q4wP~_
z%S?10;tENHfmV@;Qs#&n=@pnP4Sj6q1Q8D_{rI2}M~u@><H|xttyT3+Z;i_#$C6!F
zg+IniW!^~S1NyoUR^;DkbmKj_2oxBja!JP<pq@d{@ye+88(v{*2Ct$>`26f7<)GbU
z$of1}2a1pPBj!==5S@><Q7clBT#9MCR(G%Orq^ipVj;>PX9hnh=p6n=#Ri|bw4?-#
zgjX*bv&|qg_KXv?u0OF<_!1oD{%RD*1m|I2K|tHRKivt>vo~)_XG?{{5SFZNbGv8j
zW#ZhfK=bhbBJ51Sdd}On|Fb7s#+C>fLRmst+9zYHLDHs@EK%7LsVvPXdt^yOL`92a
zODb7MQfOzi5f#;lQlhB$^9?iieILhrJdWp`=XuS@|Nr}azt?qM=XGA^we+-aSGQzz
zei5eO2g(wtLeh?m{(1N4j{USJ>{i`?Jj}ymsl6bA?N4W$%^?<DYBWK&p}SjED0b#H
zb0>52XCguxwtLj%kxjP1kT_I3JX2;N666+AT|@EA=bfSu8C#bQlSefsNQBT6`rIJM
z&At<zL-_5|o~M)fa>2A%rhDgdKZFY<`M$)OhQeV2TxqE}V`U`^vq!}r>|Jnl&&``n
z@HZhBckfQ6Kf=>SSw8*I$Io0+zr5#X9#G}*j*%?n!2p2vDH4Ak-(@!<jT;JewY8mO
zWTu%#`<6W{hwMC>@H4mRMj4)z%#RNU92|q&!lUv$XwDV9#Gx)Pk2Z!e_5)I!$<3uz
zL3~IyGhc~}<C_-X-XX|Pfg~RXHXszG7Rx;|qtDxhw(Z*CQ2ML88*GX&)*+gr!vm)p
zf5;w%Y^O${W^?ALaRtXF7H9lj2hahtQYA*XWTd8wDLWKg7cO7U+IRz~?c9*J52)vt
zkkBCXkx@~hb3SnkGyqOe5EBy<iqj*PIynWz+1K8m+IhwI!7tB0U_(kSR(9@LuRqp6
zaYnUtOJB&tc(#H#vnqt{F>(4M@|nhvt-y*oKs7;=hsILqB=FZkoJ>5ZG(^-9jSH=v
z>IP%fW_59)x7w%rt+P)5eDE1B+QwbD)6*P)LAZ+|?Q+eySF$}+)By#Q@?1Co{2Ah1
zK$DgziUq1FzYzJ%UnIT21!S7kUl}=)+>`IzF@PNMy2ca8mo=5S$Z2@<#({#HATg|a
zU_Zz7AfeEwVa^rM!pe#NPwIFe97K(9hzhSHQ&dyzP7jS$@pFP*hZZ@<<TJ4>$#q_G
z(xepu&-h)Bu_wMRxo)&_ru_Jo$8FrT7^H#$V~`1I{WsU}iz}f|Q9GK06DncoSFIW~
zPxxKFnGkLEA*TTy(3r+@d;WaC$v+g6(mjX6At7a4@ahTOtP_nW-^aS%pM~l0kbTe#
zF0&rL=$9q=KK=aZQ~q_gIV;@~7+gTu9j>%;3KhZL-eb>T(_(V_B$O3%oy<uhEjco$
zYaeZz=>7ZmcNAukTbjOFD7-_!sI8q(>Bj?4ne0CYWaMAiD=GeF>C?c6Z;}_|YC342
zs9xhvTdyGN5_%@^CJ6e(G370)bSRM*xI8*)GWYtgO|DdfQnC`#GT+_5Xr$>_!!pR7
zhUM;GaBWzcW5#Lkz0MCtFG>n=o$6<3Mw19NytkLv-{{+zOv<c9?LsS;6c%t$I6!=@
zU*`y7DWEm?n^%C(_T1`)ANzC@M3sW0O~|zUa7Rm@rf_|@EK9>pLZSMH243|)aNuP{
z#WCB+-0PppOZKL{Eg%AmU;6!i>e}^`#~(ITKYKB;<P>48VQr6MFeG-zk|LwMWSc+o
zhrcI1#P43GTc6+J#pV5F%Ga)3H`|q8U>;>|WZ&*(lT%lB^l*-j;g*Z*r`Gj%Q9SyP
ziyHDfRR(nLB^@;nj|NH@2L2}9SOUHX=q6aY*bD9u@a_p;VW&419uEw}ghkm0S)sC7
z{}YTwapgvj9a~Y55PLeKY#4~07>?Pq@PEqGps3MX{lc@f@1rSqz$Xv#TREOd$M`f|
zXKwlBV<#YJQeXM{`aZmOFqKR{(!YB`Lc+15N9|KDtz5a1+VAk=thKJLC)FJfxO|1i
zFE&pPFTQ6n%GLM>6Q(~J4m-2J|0TpzwWV&*sLRya9acY2^zbhnNSsMC*mLq0ja05$
z=7hn6OGq!8%FnO6jkWlrrL?JP`i#|%ZjtBEkS5QMX3j?$o>-77`}$jin{pJ4$Bo+*
z+|b3{{U~(qo{fk1R#rB~?_Nj)=Zs0X%kr)jFsDUDN<P5a5VwODFRmfthg_`r`AHS@
zAQwFxL5LxfYla151pw>$IsfvfPaB5i?4POqp{gol`DaH5=!qzk@Z!ZL$Kv8XWA|6Q
zJN(j&M^=`Ky`!^Nk59CQtRJ;cW6rV_94*wTn#vC5QiZLd3_W#|bC#nyi)Vi8T`+d7
zY1{desxHpz6kd!X`NK<seQ~d)pm}Q2tQ)(J9kZrA5n4spG4#Wtb?AEb>uPPhvP3gF
z_}}b^mJgaRx@P4jnt?><kSb;elzLrFfvs4+Vnyi1y*E0*j?e9+eiw?qqzcae)S@L3
zdk08%GGqQ~?SDA7UjO_h@i)?r2(52Lzn0gcs^DKZal`wdz1Bh+*$FWUtlq%+tL*Iu
zyPg+ueDA7g!Q*GhlQe^0na3?D$j#NvnL!}(yH9k^`Z|=XCTDOYAi&+jV~hGAQj~TG
zr6P^r%nitRc`DFiKPi~SZ5zHd{7ibvxROch4R#Q2Lt^i6YFq~0MP|$QIh@3ceY&PH
zvGR(I3~h)`pF7?~*Dz)3)QTftgaZ^AKqiBRM?q?7SjQXN1}-|Okhy5_;u<)*RBzEL
zy}_%Dm`JI%dGqGXPdrRWyY!28ix-E~yrRd0?)R~aom<O)3f4oS7a8g*h@0ZdUT}-E
z*6yVqQ=hP<abrN#7+Pczab;^~eyFWQ!y2XzlAr7TTox4n`trN4l2n$F(fm|{!9=tK
zGDW$?dFYkhKg6E6ocZz3TyERougV>iXcQrw4t0y%Xq5qFmAT9o7$XL+_a$9$`>;eY
zmQI?ng7DkOnSpX)zmXhjYm=PY%b4wnzT&!?<kKmx6|>TxhO?OF!P3FRHaPgfqeo{z
z!FlvjZdLR0UI#_35s+UzVU4uY{%O;*&NTE@<I2;CGJHjA1X?X*;tbl7&n{~C(fu{t
z3W_IAhK@(>{+a2LpA7g7p$!O5Ej^BYF*85kMgbeMm*fk&#_qLFJ-duOJaqO#@$EV<
zLJ|XW^W^-@Mp8}jnK)X8nHO{6JVFy63(JgizxoaNk5IsSAub2dQu#Q8NqS2}`|9Um
zPdHtfHosKf_$cVPSG82XBFZ0IT-<WmvI@b}ec`+^5<U{ee$H`_CUefdo%c!|k7l=a
z1zI8v?Ai3Rbu1?ma>38KFg_uH#1MEm*6`w`OAP#NSLZBlZul4l`X^N$@-gg^$fIY>
z+-TagY3shy%qwZU4bBD^&CoanoT?@f-3~}dq0Tm;nyx{Du`g-$%Rk$PPrP^)l0<Q$
z^REiamd+u0^8sjH^fI85I77urNPTKsOyoo${gc68&z^-Iy-I8;UWaI>`bq1|eul?4
zDEEQD|Mgd|kF~V^0h))CP%Ak6b>UQL6gL5;)Gvuq1cXC7Kg!Z=im#a9Eyv;XuW;x2
zx#M>DcB1G%a@fJTE~82y&;92@dC${qqwdGN0M?g~eZR<zh9X8gSg@=#j9wYV#dHPH
zv;?o^Zu*04A7Z1kn?gpZS1K)u`3-e9p|O#eWKI}5^bL1v*5xjD==X;hI-rK3JXoTm
zrZe?lAR%NfP+geSe-idz^eS<U!eov3LL-4#z+c@#i7`id7RwhO`gr>xImd7KToVQQ
zVsvueQIYWdVakLn5-bKS42YkD9<!#)P>G?@F?vM;&W^NLMP0(FfJP!W9l=-~Sp^`x
z<lPYImK|9BGv}k)`~*?vK)j#z+_~b1)7*!Zo};cmX*|N$@P_>%bPY`nmXRKx&@Dxa
zbdd*55F$%!yHzhn7eP+TEWLnOMfhG)d_`yxXD`!z%=|>sA)3rbuHoR|0QbVorfBhk
zCi!ieOp6EY0Tzjm0)NRzrEkT+2k@F=)`iYW$f`G}TZqar?<{#|e64Al_JTv^BE9kS
z^aL=CA33s8yyH>x`(aPO{em85wuo6jmDlq?7$*+`Ro1^r|K)}lKLqv-liz0>x2fT3
zWMl=s8sJ|adb;%g6cj*&Vmt%VW4^%-UOW@+<8rpQp|{I7#uC=B7q?GXRdU?Xi7Dyo
zHiFI2H3+o;ZATZqcm@~vexaKN(Wd3bXyU^~kw-HFgN?7uc+$P#+#geSG(oqcS8oIJ
zHX!FRHe(#JaPT@ZcW4s&PBg+u=WD4O`DP=%F!u1#?VG^B=eFzHllTc3Ctc&kKnx5T
zJlK2NHYTpCnX8xW-1+f~vuz9bFGM-zcpZezw+anNCr^kHxt${=j5V{Ulo;E#Zy%zp
zOc%Y8Pe!TC%`==neVE1heExXHmmh*LD-plaS2-`bz?)N1>@emX$1C^#5GLWeD=J0>
zcQpVR^wZmX&O?Y6&c?QKW+I&<proii%buf=S+MTik{dwb7^@NEn~bt(WnKvm(DAq$
z8fqW#!N^Z#9c&-D%IUc}=G)7+l<Yr-P-o24m4B#up~&ObH4Z75xA`QzpIhh24i}26
zjd>mK->)t>h{(z1OB_Tft$i*?%-)IT&!5jUaa^Bd7-JeR&&s}f{!*OsYD$SEn=&K!
zmv%Fa%s~lpNGmk-<%<`q;UsE$Zft5y%uh8uW*AzYbvBI&udq!AzicVy9r7>^#0Jke
z$Qz}7g@VmRJBC+DKil&DKp|%4f$El(7zFTnCHXNrO<EfeEKU5}d(7e;l@Cy0jy<3h
znN!}}W*Zha$}xb8m*Z4RZL;p+{x073#`J6{74aJlSu{iGSK3VL2JM22IH*_QcsVw<
zi>z$s`3x)}ts~Zn*8`LbiQ9n+QAnXoOkin7%**0{D5j|b{}|vB)3xrir+;3HXedI9
zHj(xH3g7)*2K4^oSa@yCqz`K-iz>>?0}2<bsz#C=K5soHY<n}sj7Vm}D#TtP6LTAO
zI@U9Qq4Db3%`G=8yV;9@NSY|iZdPk<PV<&SaF<avCv_A0nUrl2KQ>k+tCMcvLq0V$
ztU}F58iOL=w{zz(xHbZgxK$9AkIs8IQqVskBerVU5^dH7J`jR+2F)#~6G&(Lo3z7)
zU5+w~s)t9%X1X0vX<NR0S_9#MMhRxK39~tucZCH>Nu>z;O$Vt->66H$bSkTeAD{^x
zcCFRa2mV}#Y0VpW1A`sB%4M#ryo>dkKJSZ-t>e=$N>f98;_7sVh-B!TUWMqE#l)<0
zcYWwT>NyPsWPQRuljGvGZCld)`+3OHCQd{Pm!6gu%^!h<$f-)lsPZ1)i6|Ni1w?wI
zKp3p9E}W83C_<q*GfDscJ%adSiHV7oXW!$t0t2r;bf^Qj5YW~Iozk8?S1w(mbz({+
z7tC6Ond;UzHYo2q9-(T8j9j*Q^#!?w<Q~KA!P>N}A=Z%e(BcrAD`*wdRX;q=m6B%u
z(J}Uv%mBRxO2jwQy2B))$+-!?18s$9^ye{S04CSzFcY!4|Lmh#=6?2K=u5<$C{*~=
zNK30Yl%$r2bVJc%i2gccY5cWoGD?)Zp%2OeyNsG0ZVIJe^WlS_UZ|5k^DdYQ8^i1v
zRV!7a7<$hLzCZQD>wHt9Hg&9M?eISYc7crLPQxNHNA$6#hCyIg;)F2mTvmmwD*{+0
zo&q-?bU;Ty3<b7qBRfG$OX!2(@HET!>FKG&SVg&fSEqQ61S0S}x*Je=Uj{7-RejmZ
zud>E}!cX(XeijoJaW`+?6dLyUZ}+va^T4Tmf=W`F!457Zssn>E)ZX^*zwVl|{d;x#
zE&NIPC%X5?DZFZtqs=LUHuhV8FADlmTzvm8nDwKJFq8HVy@2uN<K*Q#|07bClKVNu
zSSf^=svsEeDBJW(DxSy&Cluma8hs~nguD$y;~_-$PK3)i)Rw#$%`-UvXPd1-4L<*<
zhu>&Hm^*UF+cnG1Ps4-%0<&{SNW&47WO|ym@I2u`G*cg7CQ0%Gs@E^R2el)()9b?q
z46p+S8_2-F!Tpr3wE3iMulDc!W&Pu%q$vv5H#L|GNqj7AFUJ8l*R)7(gDAXO_VbEe
zrY$5p&*Z%QJ;0FEvyJc!G@E!RCyyNY1jIwe0c^o~6!8jbEEs3|SAV`%+Uk}t{e0{1
zJk?@bQK<cH!w#7G>F&oE%|Crg(f1f?`{Ewed569vp%pJ0uxe^g?hr$G;~yO}WN{x%
zH3z5EdD<tN|Ng{<g|-U$39hrmCvHb_Nt^*UpPRfR>a}M+LcHFN`eG8`!KyjcO9B5K
z+qr3tc@2L{Fw;XLPVByO_bz=Ze(7!e<je1Y5}5423{ilW2GWo@nkE}{|7-Zb0@=6Y
zYVxUg1Bzl~Oe5*r@WQPNhxp6c8Z~g>AL2c9K)Nd+EHYz5<_e_b6~%9p`_jCD=7N$i
zEYr8s=SQ!t*7<gRYWU72fEF(~T03(zdrH&%U2JS+s_@oPL7(qQ7u`z^oa(b<hq3s#
zd7Kd>CSFNp-n?rC1}f`Ez535d11bj25xs9pCggnLLO3#{eL+18qE3t|Ol#ayM`b96
zXF|5~dZqvU8Og0MU>eqmiXmwEAj$Uxy_XJ3knw<;2$$iWxA%`%@@pK@(z72kn<v%Z
zS67>i!-4OR0kcC*_S&l~!gI=x@B8j>k$eE9Fju?15}<j_`xn0;p7+e=AXS!^t9UtJ
z4?>~Eq?g(RU@b~@H<nou6JP<^lE`!#<9G<Cu_WPbtyr-FEa13s;c3S7q@kV+L7iv_
zxgJ>feTX)>72dDq#l?ff%%c$G3YotNqRLQphrFv%eD`fo$EHrfwRC+%<C#&c5K+G*
zCr?xI^7ro*$`9H)nXi$y$>cv~t0X_eoCMcZO86UBQ~Zmc+BlV=Fn)@+985PlZsweB
z>3?o$FxtxT;=M@@2cHKJeu8;`($L*}Qe8gjyioJVwG;Y%d+`JMFtKp`x1(eD;-otd
zwDj0jGDLN2OPjWB(Yw!*DSG{S$oSiBd{eWX)&Y9KtC1$*;@Q1?DIUT5`KUaj5gpfz
zBhQWyV+s1x#bDKwv!(yexfL1{NXdILN?@~#s6@pZXu>?}nC7|&^?nSGUb-!9`z_R@
zQ{M^3GN;TVk^P8?srOA--p?|z7+&_zWZ0@rPK7hyeV>^w?oG|NZp|7v<4Z9yVB%9W
zWcc`=N64I{-)0#>L83>jn6w%(a^!hXHR=|F9XxOvC)P|_=u>f>g62jq3><;lioJ5h
zl&M##`;R%ae`mV(5YN|FJeeWWl|dcXfYwqQ^w7>c;^xpsS7<1sQEwQnU~+hr4_Nx>
zfdi+PYfHWd4vbm;ms<GXCwSB_(k$tVp+>!<ssD~#*$(Xgnf)b&yt?L@!#=tjH&AKH
z-Ff=74rbVt8MZs5e#ET?J4pT`&{8nNC?8J|!gpz}gn^LQht~Z3=Zl}N%1<{liTkch
z@wGr<ER4boWGpP666lW{Jvxk$*jB=z36R%83GMer+9?Ak?-HZ3N?sFCq{9pF)_-r=
zh8<R@38KZsYBpzjo{bF&fNmyh)QT!A&x@<@rYl$2ePEWGR^pGb!~1*sPRxXYm+1;4
zOi9a!vkNkqG|2<arjS2PEgKP}r>(8soFX^WRnDVIMjCsFc~B)>t_1jG!oL}N94c%n
z`N}fawaM4-KQ5aG)vY;PI?ggme^NA{&}|;871JZzx8H}i^_D9vEEJQ)ywavuKn#E`
zf|sraSRlJV`!H*F>qSRQs|O6wml2&oKwL@M$@yXiCtZt!+};1b{zBl^)zw7?%|bJB
z{?I;Mq)B5pytfOl;m=;8Hz=kJ!+W4X2TN0u8tf2bN_<K&B77K{WBU9eYb&dj&u;`~
za)>j3<)+X5&pF`}#qZudZ@%d+E-sYh40;EP=Y9{J%@t0Yl9#vlJ)R7Kh|r|3z;s;k
z+I4KDL@hJZ{#6UR32ZFNV<f<_ubkX_T#knE5vBS)Tz`}QoP7SxoexOmBObWy0EX!4
zIvMQXG9$DeqpofmK24I}3j|^W*-U1^;>A~B*y(dK_v$-x%a$ho>-J*$2R$G1G+x=Q
z*P?W17<z??$pN{S&=7SWKFkppsYa1ew0!>&ZV84_=1X1ezJ(q&8Gs{I<0ZK}fVOkn
zkf9#J(v5nB$~3i19!&HUc*irAQR>^bFTul<8sYe6W2x;jgwudszrB%Z=t}EZm!QjF
z86ZHEVRCm;Qk*!*RJw-k+Pt_d7Kb5{8AqWhlL6=?O7-rY(S-^4eLt^i=X>mu>c2qb
z=%E7#7A{@dt49yN(kMFkWPdaia8UeW5}^84X6Beaclq7PRGCCVRj;8YA<1Z-fxY{E
zDq4BU4P-P85ehwW-;s@YYGFxv@RCxC<RHd#_zIv+3o(=)4@hO0QdP0LXIeTa`0LlN
zp_OwvsX$M)Z)4_Cbw@5#+|PYJ{5!|%20_w<E?c+OmS~+dJjt(d9XI6a)yFpS3~M`L
zqs1HZmgC%U#cS&7((+BDpb-NHiYNj|?rsof8UX^^%Z8saTm}9>Q3qN#47}nc2MI^d
zQcXj{Y@CX8(uaRT;!X?DFsiRk<W6w1i)LW#Ig8XZV5+^xzo}`=DyETz*UkAHV#v9<
zeyVF$uV#ej*3@?md`I9D^|?*FK-9EFtSl`TTP&A4KEY4{W`%z>+>38K7xh|!tLOEh
zJU<#y0*Q_s=aen{L^&76;v@ae&=YjWNo_Zi_zCpB`C$=Y+TfPbfPIX``c85l_#baF
z_FG(g{bmvZo&`c`Q}N{Mn}?98!Xv!;#(R`hP-dcelJQ>Jn1mFaCY@Nk%;2ojulom1
zrgQYBtSlV&hcTnn)K(|^DrIhQLW0Nh`&gE>ec(jtXs~%C7lw}G^Qpi7$_)3TN6a5g
zB+`ez;!~xG^X20_@;^RR9qAgNSDLP*Oy$Mo0_<CEe!ljrIxA+;P+7v_c*$|{09%6B
z;lw)+G>}eS<f3+l-er6{b26kJiZd>Y3C<jg3wYx^NF;wM^TaS8bS7}^kdLhXiM2Qg
za8HGPKi=}pZ%2uKcq`4}Pf4Gai^0;K69Z!V*rzfsDt@W`1|ds7@9|DQ$d=9gVSEZU
znv_M!ou=%ez9Z}3kYhTgUE8*rT3TXqhJDKuyAJV8OM?;=f&^;E@R}!g?kt2&LLL}e
z)AN&dHWp$Waok7)U8=~*uq5D~E#zw9=Aw!g`b|ZJHFiy9sv7}0&|9EO6XDoAPQ2F1
zalWxxKNKl*>Eb2um6qFFKujd2-uFc<rR+&z%$U7<4UJzt$^s||TnPXi0RF0HU6no4
zX4u%Uyw6%xf6Os{PJtO7KL5sbVvTIuwga~J)pQBtzh=}Sb22@1%o4B&c+UR$<Q<I~
zk_kTBVz`P{F#BEo4;>mbkChzHpyb@#-BtSZf#Ms@O+7hi{D0ik!JJ@zti#pe_6rw|
zL1hm(=#D(ox+e&vgm#qJ71O`}sQJisYxxVWtSrbSQ-+$@r?zU5oPf6x(L!uI1NS2J
zPC3@??WG@DfTtD_rj9&dxVcw8EkEsHaCro<iYyAT+qmWL0!MvQ`&V^UyVqGRo@1&u
zK3QLFwnDG&f6kk|)MiYs`sH)OM?@u<8O@oqHZ|KuWvul%^$`b;+N^HxH`%-EJyYXW
z*$Zd?BG>iM(IU4sC-h>+??2UXZQD<qZ38F14ygEYe0kq(&*Ns^d(6ESV$V<$@9o>4
zzg74mm7nC)Q18!=%$YKIa-iOp8w<B^eW^<uF<+~i0x(?hYOR*%mcgm7*XMqR%VGOD
zlwH^~Q2Jr0UkVg&c2a>AHPTH;0w^8Rb6Zu{tX<0x$s(kC@Wc%MV3+Y*PJJ7@i#6_>
zerf)Ny%lX=Xeq+OQZ@ON{j-P-n0>AT@6g_HE@^EylfuTD+eELV9<r+7#{5&pP&G<J
zhbA*^iKK+l4t}Xu|6U(;{klzkn6JOTKd_p$dZ;||qD#6NFmq51e}XIq+`8LlVhhQ^
z^HYB3pg+7fuKeMc=$SCb+?+r3Q=dMOS!FJo1!(=8CY(Z1L1||TX=gPe9<rTf@2*gI
z_9iAjJ>S{llNK}~Z8I^V%v^TmaA|SS(+UlRN8B39W)EO>+$-tA1bhJKuV6gh%T%R@
z{~K(B6`6A-LCJdGdGzR!>DuZz#an?#KdjaIVFdXlfuas<6u#!zp+lx+1FJoj*xPHs
zZXml?U-snTpl;?<*RTJ`fMGnLh&~)676EUsOT&GGgBPKbqejJNlLac64Qs`9YvDVe
z3-97m!yj-bN`tZA)Vhn`2X*sn1}~_eTk(FrG{Mud5>%Kyn6#`*tNO}YxHihLqM}pA
zL+LHp%$wIk)|&^3UmznTn9-@<DkzwD${3<0;o7yK-DNE-ES4@^>TLkPtmF^Ad1E<x
z;>o-grWayjYCn7c!}W$XLu&eP{XyA(j+4RW&5cEQ7`eryED(W)5hWEBO>S?&3E=Z8
zz#oq=Y|URD?B4nWMp=sAXrjAW{2adwheM;gl<%UfMS*zk+;GSRO0vo&mfI(2YSNhU
z*s$Rm@3EnQ#m0MMDx~~h939K}rj+U(8oQ(}%W2P)mj!PFXuupJR$%=$)yyt@J9`H2
zt+MGX^b-;N1K~MjlHjKx#tcIh@JDIi>wPOJs9ytX+OSyel=Zl*wDgSeP-YR?mHIO>
zVE{XeHSOqW(Df)@tChamv_8M^)TDOa1`8VHf2=DQ;3emts5@fBjI&wOm*qqMnLnEp
z17BNLXF;z#bPQF=gb9D;=DKqy;h8torlGk0gx55}xEY66{plHy`ryHA6+fKq40e#?
z5WrZAH>mE?ymxmx$03(@Nd{8YO{s5az%o1KSf_PQsc4{AtsO_`Aaek;F;i|6WghF8
zHRb$rNwU1bPlA|zT0YEFMJ&o>CBd@V;ga#-AFr&F1vh5q*@Fr~Z4A2|=6uB8--1xB
zq7X|{&95y6uUK4}eh5+VD`#hjBQ)NO1FbIQfhX|ftZ`4oc4bO1haoI~rzAO8c5FKd
z)4zLXpV3fL8P(4NAAL@vL*s_9@r;hdFHP&`!}34}yb4tmJ9X>`DNnwIK7I1!$tB!B
zZyf+J@*JbaEioV3oiNUYmyI3NazL+tKCxI*?(BRidp7dkN6E>2Vg|K{Pgsy-UwfN=
z>h8_QNK^t39$fo+G&lV@2?;wC*HIZQQZEA@ahNlb$)J#+aAQh6H4y&{_ez*l*e$xr
z?`gsjIrQdfD|<PB=m1LIax^zij$0AXd+h1LG4dVh-!e|fgV-|PIF3G7v+md(gaX}t
zKv=l;e8ZX=D@yGLXSplTq>CVNA1rO_S^mS6+Bhxr?AiNCNrpaoKvOzDW)mOg<!KEc
z{+m<&`m)S>w{I7ne>?^oO3v-qtl8GqV*4}jbKmnx!MejnjoN|-FRmnw$Y%+&vnwZX
z*Czpn^!OvNDeQ6K|JcuvyUO-w&z^}#%0PTr*tFcSh*D8O$tZ2+x*QJM{(#T1OkE+$
z92HOS(~4Dk#c$rw3yTm7{fhUq*lE^zFV4{p5D@*MW9uJd6zqg{Y~v#t{q;W%fB7-)
zEwgI`I%F@LpAt2iYN$ZN*Yx@6r%du~!0{Sr{o`2N`)!8;j^Y2YgYts%hgOHnh_j+B
zwuswGOw~)ocp87Xh-zO3Vobsh={~yZm?c)R^hn*W(tQ`hxWJbVO5E}5iHVQ=<vTru
z$7SC1e2x<)|8r+Io|luCm+##>+&q$vfl4cPb&?#8bZono0aO0N-^Lt6QAnGaUi7j9
z&!nJjKTK@1-J0(&EX7QxeBfMs%Das;9=?42s;Vj5qD2eN=b4lXKmx9yMeZ}c6G9jr
z_>nJXdV}8T1`HgykSv#Zl~_gE5bMqa$4<pzqs``Ou@s0Kv1=*&PpZFxAt&G>e8b{o
zpKWKaTu~o4&OA8d3q=cz`qI!~KuK@y4HpPf{FC;<a16+OQ+eNCX@X>L>=$bCSvZxx
zztu|Pq^$JYAKyK5^#gG^4$UeHNqQ?f!G?wreU(SFSJqfb5nfhYY-;3&kt0PvPoyTD
za76JywZz)=H6sFr0Y&YJ*jQJ>DBJ^>oV7xYn`c<eo}D55cR5rIk9lqHp$>Z)bi_4X
zQ!{ttnifi4a`fG^onjPxly!A)WJbTjgNpJt(mZnN9{CK~RB@Q`+RdatymQZ<a}PSg
zSV!Y0P46deM;p({KbC(PkGDZk4A?Mv^^wsa{DjOplb>*AmF?8YPa&3(#wAAb-MhOW
zC{X$pwgSdBD|l*`%YmX(Svw2x%*pYRBggzjtbE>%%?o1HlCtud%*~7!WtDl!iA@re
z08V<tjAMu{=-lQ6XNXpc=;HLhbnzmWdv;_FE#)pUGQPsub_w*+X;YP2_pgaMiQIOS
zD*eYTKjJv2h5n;wDT@5f;+NT2`Hm>@H3K<4{TPm0X#dQR0}6>5lC*+zLAE^_Y#7hf
z)rk|0Y`Vr0D$si<f6#amjUfMVP$ysNg6-|?(L-&CE|gW;GbQ*+1_{o}sNI(Y4$Ms)
zaYtc`OY(wYh|F<9h(MO}l54wFiMb-$;H=iDs;$M;2`&v@j;G;_>%y(pd!{TRToQCK
z{ji^1cZM@evEX|?xus-u_eWIi8Nzi%D8eZ`n|1I0{nxKwTTFbIlM@3nF?n^BYJv~G
z<ni24o(vR4HLJi5YRT~V%eTU?u*7hNOcf5Wcou*BIH~Q{1z<ny+|E_+1YpjZF{6jU
z7e)f%eAFhH1_e~wOm<?rgqKZLq9$Q_!5*_>{TaM}9n5&R2MD%A$@9Pzd5PFNhG>%8
z_!~<@e%t;1sCynyNlBsL>(;B+5RH{W$5HZBgZ~^6lVPZdQ-0gFZLQ|cJ*p=xq3p)Z
z(ysE#j-D}ny6ETLYsAc6Y{C)?xy}v|B?qjBtoP}#upNHCF1W}pt5AhXZaN#3R_ZNY
zwu}X-b;!QA_uqUC63H1y_MiYpw{c9K8D*Y8@y=z*>oV8c8o*Fjp0kW9BWG23%*uj#
zP)?Uloua%iNOog>#LI^xR8@`6W|^t4G{WDuZ|U2&QKl-Y3bBwJOCIBAB_$7q64KD9
zeK%OFig<<Zas1tGIJ2dsrlK-Cz!va^(Z2_zq@_VsMNbLdxoejSYgk>>)zplclQWG-
zPd6TUr?q5x2$c-oC!Z<Z`uCq7{(EV0v2d$EMUVdg!zxO@(uX9C*akYXzmHF=$)uE3
z`%coC?+)xz&=c^oA_Rg{K9H%2BFwDw+Vu?A#9hw5)~QPue2b&p7NMb(4xbJQVWj$=
zof?${^u?~PEM#h;nHxFwE{=PZ7j#G3{SG*Q8Z?gt7*+ssR1~pOe#ZC#opHtqz+8ij
z3?#|W$cS-V5IDykHNRz<1F;lc2Zsf~*<JSD+wIt>d=~qO-JBWJ5(h9)Gw07!ErQmk
zf49F;)7g64Hy|KFM8Xvu{|tw7&LPp!tG<DRZynjAkQX9Z(^jMSG}wW8y-*ovKBl<D
z!+BZGap8zeq%vGl(#mP>J*Phi4t|@D!wj<6_~w-XD+xEnIIKGubDZcjpUrTfE)!~h
z!>N&%O+4tu!;V(2-UUs}y=~j3&C%iNQudf1m+p*M=t4!Sv6Amgn2YF(`OTA<WftU3
z1%+I2!`RoY2keGpBs!%AvJOb|6{Hr*veR-4IbzU0T@B7byHO<NoGc<{QqD$1ZS;(@
zK`=pz1E%m#aKX*5zVx?2A>53}9R5L8_jDhwqcaaI7L$wqCDC?EgAxyuopXMM!f%2$
zcw>bryW415aT{+&XxC@YnY9UH3DU!v2c4uPzkKHfUi71D!3Y>aXYdU4IADf!nU*%H
z8P9MJ8?$8Pr1D6x)E4w@R56GfotNUtxAF)gBGR$99KHT7UAi<OKOi19%^H8`6TbM7
za1rrwaXCw-+&afRE|*MQ;SnjYrmp<JzI|zYVKbE+&QIJ~St&^Q$LaFfwM!EPbZ9Uk
zYtpukgmVxY5z<xT101O+0}Qovw6%pSf$yon!kmdej?J|W0C4c7$*XZ}Q{t(cb^h@2
zqq&M-4<Bp1&UhVm6JZBfOf}cmwz9Yw7@*8Fu`4`lxhFn2$YA-@q)h~Y#0$gJsIT4l
zjp}OW`SYJMB_DisQcGts3(1d;u@Wg-^=s1eXV2mY%0zyGtE;Q4KWQiEF-x}#X|8cu
zkn+>94-F>&Wja;BkzI_5NsOK2fR(e=riK&zwM5AC6cTmv3esY+-beg;F%x#4VtAm&
z$}R+6R9!0DMNz~1;oE6zA8$x)6=rN>^Myr9A`QwcShPq?U*mUSTWJjDQ)kOYY3X`8
zo)ly3M`MPxDa(FU(_#uE!H$i%*J}8E=r3VOnBhQ2g5_E38kFGZ@ZKZFFb>F_NW~S}
zu81;?v8{JsW<4O>L$@y5e4a8LB`ry!d0<iu-$QbGurbH;?;n`#OP563lZOwVX}-i%
z6@GQG|I}1`hvtGR_lskT?DkwUceV}QU?fz@i?V>k$xA5iOjo%ChmdnMtL)L6Amf2N
zc(;BV9ri?wWn$zyT`*o^c|lGxUM267R9w8+XUd$CG369KU<jt~V=nHg=K~`Pe?sLb
z>TdLnX9D|55BK~?LM%wjEOX)0=<3>9c^19H(wub#CK=ai-@jK|J5yR`;pX;P>)rLs
z_=qw#CiX80v~GC?5)rcrS;4Lo@ZK%h23!PUWoE~DYTmL_Ltn?mq!=cQT4<Kzw1h82
zjFn>7u0>3h5+*%u{<#rcRq(KiVr^AbZwwNDV8%@&>@9gPG-d!jeMXInw$f}P9qII)
zo=BHNb%@r`$Om=HUudD5O9gg=ASdG*Lx3HbIK<N(?f5vZaV3_)mhtRZdKjn`t2}lw
z9SI)FuWLNxRR|(hPt_p!qn|$CoP7JX690LqiBCVBc;cu?l}B###a;jY>l6_E@4wcd
zmiv(^jVgjw{S3!?4I44SY-o32;gSixr0j9u<73dNX|rbS^YH=t(IDlUL^vM-o#Nm@
zorjkd#KqCIB7}DmxKRutdTe$l-jUH}Mz#_h5<L!GmOfEL!J(UJD#*(-yKkmq=HM_C
zA%=b;b7Ip;m>CYVVfIXU^>#Z`-vpv)bMRFR^@mOS7D4BK)NJKZ|3{TGhw#9sF{XLl
zfxFsvYf<3|U5XM`K|Q^)-_w0k^iwg5N>_=3k0HZ_p}{cYeY7{MUc9)tIkR~Sl&`Ts
zO`gwl#p*5jkGZBfWnneCd?YA<^1uHc&Z`fb_5Fr;*7GyZhK7=Nr~BlIlkz!dJ5&&2
z7fL6E*l%@9=`2i5rJw`wKEw(ZGkTnW#O;J<@#qDEf^I}ub{j2Vd)i|HJ1>W34soci
zy83{KLjf4GQ_t{>h<iBBt18<2td+tBf5$TV1&9B)-uMP*LX%b?KgH_q;qh+#?YC~a
zv-=HUlIg+cc0zeXMW?){b+!joLvGyKvxGSm>gc83ZfEp~H_LdvRTP0&93azSKN1yu
ztiPXM!N12$=ga%MBq;GwvseB2Op48l%=>$JCP<&eY}v$z$TNlx9ZF|Sr2skT?S~ME
zl9ca9P0i+mQ`|G<gMGp6M8`9`TC39t8BE2rzvrKi9zQ<slKm9cw@7sMFu6QTLA>=g
zZbqXyS_no&!qd!!h(T-_ZW;l95Fa0(azIW}==|d#cmC%fb3CaOnzKsh4jrIfuzKU@
ze}jE5P6#O@$=qNEPiiAu_*fcGc{YKVKX1kXKR+bP^R!z0zU_{KIvXjCDu$K2#2Zc}
zhUVYgvW2w0@J|`Y%-r2wd-Pbxa5C4GtDRjqR|=X*GcO5#D8_09Zb`i8(BK}urXh*B
z|Ky1|-zZ)BvE$@$SaT&X-6<d8+yAEw5E%8A7h)$1TiZq~&gn;VpkjGNH;b*Tl;V*e
zTu6H`(w9_**cl+bM~U*pK^<`~*Es$wjO7gcahRdUX9Zu72eZDixL_kYjrgX|P>Dj(
zF0KCD;#T#%YpWLkQWboba0qG8U;k=+@7Q|~8!AEpy*l;&9?tB#LP)b~!p7!!_B9>S
zzu$8!__q4bpNIJwf~Vx=9jLAvuSj-nVG4T<ZYAkYf-N?;cO8et0e0{Fa^37s+l3tm
zPD2#Z(_tppafB5FU&U${(|^MUzZ(@5wQRE{8S?GhP0SN0d7VA`8h(w~^5|?EPt77+
zsyM#E8GqitZ&AND`&))*n2PQsM^0pT{U4ZP3}p-{q=!!)TN_liyLou1`lakjiXveW
z-aJ1~o;p=9Q&c)6AWhfYHd4^Ja}PmRsFY-i{{EYOlTC>lO<{yBmz7&7^aJ_&`Ud4V
zk+we8HN6TLw?cs_D*{Nz-kC_RJ#>wl{kI(MP2wHV85wSK&G?jY{)gj|-GhIyH~mUs
zePyo6q~kGUa#R)kGY`UylWpAo$5YpZo)iVFLM(C9|H*~VT1$l?ixyc0ss=P1FkV?o
zW<!|~y#gwFgB|DzMJH=qWidS_#cJ3LZCDh89fYJ!^zwwL5}n6mth^m95h^1=8ZcEq
z=y$_evz|JrTSbXZa&w}|$QaFS4mHuKPX4)Wwb6D;b40K~nU7(s0o&Ej<n=ev=k=oi
zT^5szOtfc@9?dD>Uvj8YYAYSy_C1q_O{S8j{|bTYlLr(C&af<*25O_03SX1Q9>Bw^
zrF7r2+IrXzu}h`x)?Z|bK!A*s2uHv`VyxRCfB$xE+I*$dHE3qcyuI5i)wq8pKZ{-G
zlx?G(xt8!C`$r5-_dI%Cr>DHU=p5aA=j!4@B<ljH;q*tkG~i^pO`=@y-p_ER5Zp;)
zj~~x_A#@&Y>EMlV<E}D&nX&+ANDLuIqK?NkbEh~n-dc25K2^P94~UnXc%oEb#VkGZ
z)E3}%kGztw<d{BfT9^y8(|VpaFZ=RsyCaM_LyQ(D%e-hB`yen&^cbmT3W|pB)2>b?
zXw&|g(M>^mc;^Q`p^Y-RenHcE(3?=FMdpCF9qGo4Jm%{C<H?4DPT*p21`1!}LF){p
z(R?$7IfqXk-WV(W+e)tHCMIKuxeyM_>TRw2P14`mLqS2b>AcdNVn|q#&TKVb%ENrZ
zkz^TJ-t{u+OYnb{xJO_7{dYd2#oyp3Alt(IC1(#Wlv=G>g&ao=sct}KD0imFT@R1R
zLvv8)ihrnEC(D#IX&){4v&&~;wZ(U+`*Aw1_4>aG15bBQ8{syYI!$sD1tOG$!44Ra
zetMgar_T0_e*-SSu_fC<ooINzri~cE{}u&N8|mwNUb##afE{s@Ceh_BV>ViNThu#A
z!;Pm*NrFk#P?$mY2bj20&$Q}^Smh_C>^UAzJAORr!{8h$v1vYeq;QmSaVZNRrFrBB
zo6Gg4hL+<9-IBsyl)cLsh9q|-zV3~q8y%?5N`H!_mBj~V1&maXdP4~=0yA^tR8&+j
zC&-*VfBt+r#9%5`cwV8k6|lCmyxI$l6skUc9JkI=y0&ae@M!F#L`i8CIMbrcfoLk=
zlu0;euBfzBS-{rzKN5{uRz)pyo6VFN4HE^Qq?=tX|7e*s!}}wHn?>f_D%MPX6r0BJ
zv7Zu*0J%=>0s07F0&B2nzY`l5A&{*;E-eN;F?_+JBF&KwIxVHDct+0=;Jo0#a%pue
zsF_|)aE=rI4IEi$aAs(me;6~-g2-<BJ#D|Z$+>mW49vcU>FG_}8vO45FS_Sh9{!sO
zLC~2b{*dhu36KPJYH8hOX$yk~r9Zh)$}<8Mr|gi1PjPpTzcRBJUMccs@ruFUX;7Ny
z4p&>K9YZJ09x~7u>ZHVL*FJrm#2qJY9X5>pUa(tzukAeBM$uN}Nt2_Kl9nu9Z2BMg
zh6chv_$IptrU0N{`jb5jEa%Q;tJqpt&+FTleT3qo4y$z+E5WJG6crVhDGir895{Kh
zzoMd${XK`HDO~a<H>N@?T_-Xh8z(R2i<OL-V??va&q=h~{ueLa(!MrPpiMyeOx8Z(
z@sWLv;rK6SpF5J+@S5VnL!3>RFoEiV|H?C-ilJz07hTa<<pNUMXMuqV^0eVrGAn8g
zcF;-oD<6?AhiBAZSy>-WM8+EIpl7nZpZgow@J%eI{!PB)|H&COBkR)p-`{NZ7D5jR
zpHs#QqcTca06##6;y0K+CY1<478XYX1@eV-ma5oVN)PJolhmn??evYfWPkGo7^nTY
z_~6y6b=TyLSFSw2Z{Mux(|0mhL{Tgv<uN%=`v4|4NM}yEX>5XwLBvIR44Bm>NQr}s
z;Qr*4VD>lU;STX{H%vucJv$}EP{7RI-|tFLKOO~lrJ0%d2x>Fi+{%s##dq(bO;teJ
z1P=n%=d6~}Zw?H$AOm}g-Vif-;K>MA6ws9!q69@br}U?=k+r+slAg9&H`3dlJsl7J
zmIH7jXRa^LelX~A3kPEkhlYZWd8E(Io%_vSMw3wyH8C4JWnaGn{CY&p8Q$W1N-Ez;
zyEbqp6f85#Rt%?<sNrs0(u6m2FV$%+NWviHP!mUW1#dZGkvnA?;dtH3oK8~MS||z;
z%>VeKrMCh6$L-od`mNRg#(<#RX40@0E90o;16I$JYW;58F?L8QfImXk04mSQT1(dr
z&mSaK%vgyhX0&!+th<2rl5{BnK#s_VRtOp~c5+AdU4ps{D5s#HqOp<`X;*q&k}kLJ
z*wF^-R3_G;;D9E&6h@~{4|FWjht%<<Y1FfOcNwJ<Zl%2=V)gF=t?hH$!`rgWGzXT4
zK92?`^UA?iVf`T&(5RfvaoWO~Fs`$iW_d*gdR<hU3~Mf5F>G!Nsj=O%Z(j7q{vpjR
zz;YtYOjo*fqJ$Ud@7pEe$*6Rf6%}Rj8)h=NrS<I3;y`j5p9)yet%bC@7jO*;AWf1L
z%a_k&%fzi#U6KQ3Jdc7hUSaYXGkPtGZCH^8P}h^BVyXNz&d_)+zz8cUZh}_L6B`Ne
zj>S5K_(fy6nXmc$y}q=|p!b630vsxk5n|o%F3JH^azkk-)x0SxD{~Z&&}c0f2F{n>
zpkd_z%Bn!*=VDAxrs~gbvo;btobR`=QwIJq53Hu(6Qh2U1cxSrSC4(xJfpLc@er}I
z3j*mT6i(<@7#NU5?{6wx)Ct3%Nzyu_0?Y0?Y*!?Wy4D_ICk5m0W?Q}p-UN}A#aU$N
zP6hF`^K?oWLW1;+Zrp&Hfy0}i*(Tbow#v$^|9}0jlf7+Kvu6Wf=``TV;RGp(r%Z=i
z&KnRL#KmbiX8wssf93Exga0YA-O8v@qo`Y&i)?gkL~>DNU$CU$=9lwX+Oh2@A;owH
z-_&SSqG{f16;)Mhdcr~>Sx$dA;%!!o3w=c%j@s-N`Lse0{6~injBj<ynE#_YGQ#fN
zflb+k(_2`|z&=6^A^{~@LDu9&#xk-;b!!@KN^kaRY^?w2L9m9Smo<z76#x#&AUlVg
zxE47C<WR?Y;2V)=H*zcqayk8R;!?xREkW}hVZzqqZA^l@&~R~iBlK=SjuDw|M$UQv
zzYk12zN1Ak2J=omtzfi-8Go@~i;tKPW#1}nJpC>)yMy|Ni^mS_si%yS1K;$g>?(7K
z-<7n207eE)OhgX>fdj~5-OM)v$HABxu8TlT7-F%V5M5wzit*jMjiOFe0fbT?KJ0FQ
zOgMy|eT@4^spnuk@=kW9eUCEcAH51>7J3za@yg%4fxG-y$HDJIt@E4wD-_elLsd>#
z8XI4raRW}m1r1qaHE6N)3-3e@xha$a*O8%x9MNQ5|F>nR$uQTUlKwpVy&qR>-h2bP
z0=c)7Q$&Wta_~jLRUx|eEaz+k@V+qD%Xcv|HXcCitxiSj`1mos9a|>1anYxh%DnDa
z=i+HX))TxFNRFtRf(deCe!NR~$^!m#k@pp1`7UH{ja9#ic-HAD%(w91+jY_$Qik#n
zAUn@vsk(eecJH3LLeX23tJPKNpuXUa7wE`h?&+up1)Hg)njQ=}`GpnjjP<L{vy|4E
zp`B?KXZK<c24Xs*KaBQ7{#ZidYqIj`t9h~X0^t?D(9@$lRatM#2fJ_~{n4YS`VXz!
zw$&v~yRIvTE-uK~060w0xmQrw!CFQ*LngRC(aD!N_B5h?LsZ1R|N39ihixN?KA|Sh
zpi2@SwOY&MQ@Id@VX9-aJ2?L_Q#nJ2hQS+B)x;!fc91&Ern-gkV;wR_jTu0Tzw=3$
z{0|3-F$Fbdkm+QtJ%cXeNB<RSq$%rdcLL+2Nt4KqP!89gizdA^mpE?_QD|jtEhur?
z$1#Z$#I!5;@n^3$tao5cIqF0Q&ro^>X98E#w?zP*e{s?F+jiGB5woHo*0}Z<@MCun
zg*&l)NBy4ei7W(A<3o%X@s<L`J<&GzBr%hr1Lz8>+C(0`Fpe5Ognq|G74EN(8-*Eb
zQ57+6d_H#WTv(pzu1SBVpK8^A0Xn@vm`j$psd2Q$ZbyJPS}Nxu2KLZ=Jc0Qb7874p
z*N<Zb2&w~YBN?i&iSDSrn&J@jDW>*d-dW(Q@{uD3<y-=Gu6h4HEax(Qfgmu-lr2_=
z^LU%o3$%C9-`G?OeF60qgFgrb2D!>fo}uz+4<I(Uf$%4mgs@Sgm`trlaqBHdp+Zyi
z{M)fD!=fqD)i`~56|z89^cghB|DrjAG`+j5_ns;#ITC>b+G02ytEi8HQ6IHGo!$;W
ziEQ^kzKdkM{RsRY1sRG6(Oq0v3cIvVe)K|`4I*j0jpOw><%wz1b8~-Q!JWVU>E&)9
z1C6HYGX~yh%te8K2H3A3uNOh^^_om0atP*A`^Wc@jOM^p0ewXO>gJbfqkD>0h#B?R
zIEk?4XnA5HAclZV`y2HKQ!yzE=p<+MhyW0(sa;TxHAb2=i1sT^nZzhjQuF6X)<Qls
zKrhjD)z!i4xJhD#jMp2CF5U)Cl)`SH8zK#Uru>NdD~r!g%b82oe#wpYKY3~@X=!<o
z@OT4>0JD3KnRJXskWYVk3|pD9+bgepP9*@l6xw6iXY9JD(LabUbouhwqPaYcho#^G
zu}_<d7*cKU+xD`u0ZfRqpyB#$1f1S{%r)?hnUjzYiA#nSszk4o=N7-fKw)u*-1E@k
z!-gJ=gmBRN$jPl<)eV6nhl~?KHix}~H_gkl4mUMdUrB-Ru8L6xeTwr%_rVsSD^Q#X
zgLHCPdHSiX*TV@>Q=xOgGjc)-!)W*ct<IjBNe=4l^K=3tkdysC5<L*NdGKD(WlJv}
zcWiqXn)^AU{JZXT=dSCL2K{Z_clL0TBv-pjA6LK$Gp-A+8luDY#bdZ?z+t^9Xi5Ka
z!1(cXm(z5!9Mm(H4&l@AoHv1doL@U#!#qKoM-7fEEBbk#Hdj%bwCFacMVK`Pj}zb-
z@aZsdUu7}0J7us3yU!y(*C0<9hgYb;itchL&GxQYw~lV^GH@qHm#V$++}yDTL)%F~
zJwrl6A@Wus=j+j{KVqt<)Vc@9_mF~qPj^r!sq`{%sd)01p9AzUz7Gej3l`##9;>;)
z8>R=~!HWB`f|g;rTW>>nZmTQwcn9Zp=p*9iCPV|TJ?2Tb^hVEU_$cIp6;ZLo@liT`
znUiNXX$EX=KpF$Eb`!-u0(uO)tkc9u4G)>@Rei?E0ouvqT_TI429~Wo$K*3-g)Ffk
zZf%RONcyNJSR4yqSXKl8&~5m8EM>`-O=4BtCw91-<vRXTTxhJM%ATvxLNb2Mm%vPD
z2`WxBm2kTJ(|JfsNnM8ULqTXD15=9U&)!x+Bd6mlgcn=6EXYVOiAa4Ad6YbE6Esuo
zg&_U0vZT2r5DGoMA-)Q;_-xYf{f@b@c&vXx2E~<SM3B{V5Ao5--Z+yp-$Bge0LdHS
z$};cLRwq?}(|#>9?R1|aN&vz&H@$^M4d!p-ZrPx1AY^)rZ1r$1YgbIs=zuVZ7kBf+
z<>nO#m(ygG{;Q~;>Oh=%Mll2#`^VO;C7oMJYQ2Lq<P{a)mXze+Y87|cw5Ot?4ns%Z
z<P-gLoP_7kKxthPmaHFGXiYbqS;wo(Kl9a)XQwL4>Ie4f){WlT5u%KeS7PE<VgZ7A
zRUn1uJ>Idoj94Sf@k3J<<B)M@P&YUv%X5%ZB$U@gLW3R5jsi+{?bBc4d-9|n0~na5
zv{yn50UCxiRN+U}-X|@dU==eyYf4^JqX-qy1Xrr*vSFSsIi)VDve6b(c#zVyUR+Tz
z!Hw{RA)_9>dw&KbrUZsvg0}@x$|@1g#$aknp%^CK)<m4;9XF-WLtsoC|2iX@#N|85
zM|#x2+^4RBU?5b#@fly}tJPh)b?L~tO-KuC-F0G>m;&xZw=)U*0#=lJi*;!5G8~%y
zTBe)mAmt!YAVnzs%6)>D;j)!<ZWDB4B1wf%!`QpG96$Om2D5m5{44PdG{#V<kuD7V
z_jgdDFoMMxQEpgGO$MI9Ub1D&%}rljp@k@w!ukMJG$2SFJ#Y@DG^3BafBa9L?r_OB
zk$RBk5A|d3Yz3*!fBa9<t<y*TzHh;wjX)_MRD`kA+}M?Y(b3UzFS$sB4(FLO_vW8!
zZV7UEr|0C+u=zVLc3=4j&s;fv;prxpLeU*oP_w&5p8N5k7p_<_!fX{<p0=I)UZZ;i
z>P%HE-$Gl}BA2_^Hpg1ZsR6H<n&N@b@RrW$oWwSE&SayL8>=5+SrW2c)Pl&Bi+x&4
z7ltZZi++Dl3j{#NwcVV7q;f)P4PE+W+pS_MQcO#Z`1%g;a(H^47Fz?6c(6DtbCGJ(
za}>dP;D7<_^J>LAao*li3hE5&t4B^5#|WZ;y*;H{TkMxC(XC0JM2y3{1dixr{u&hu
zXk$u#FF8So^Y;RekN{`55QQ;O+1l22rM-PEUxfuHbI~%F$BA9vJbnWi`VK6east_i
z0Aks?nU>KoF*bhB^<kD4U%JVhR_FWStH`;`{j$%5U4BqPxE;dx(bx}aOyEw_AP5;8
zd-v{LPE6`3&lb`r3o(|`bClRM!nS5{=XmoE6lEn8+Vqc1hjw>98<tDNMKe0m%aX=1
zJb4K*tMiVXJ4N^0HoBLAus>h{1s^Vb0PE-3I$hXJOmx4+4-Tse@u8FV3C>l21{Q!&
z3awkWPF4)*X9YA9#<E`AAttW2kbO&LwhlTajIk^&|H3R`nAayF+uct07y`1OHQ|4L
z-u?+%TCYn>>7k{{w?`|%Sf8JvJ#K}R=X9EcJt5KM@JKXc;igEqnBt{k<KU+R%ILSM
zX2XM6TqILOCyGtQ;7~ygEKUmCPf6mGl9zX^e8md3SbAPr`8(QuhWEn?TdJK!^Y#Un
zFSFd36n^oF%y>e=R(u_V=`Z4k3zshaB!)B(vBLhvV<!H7j_Ov!5^s~lHt(a!EsOT)
zD4VT9lqFn}`FNdDA%)eOcV#ltz`tFhCNDY;zP+32j$1#8<tX?g5$fd(u0u$0h!1FW
z_1xyby+myKlYy{UrEbsH?L#5Op7sVrN1WZiVDsZH)2m;oCJ(6f4-C{<nLi=!@{wEc
zLYnLUhP{V4a1#dU<x}|zh{2{+XfV)YbvBC$A@Pj1vO5KytT~Dp9Ukt+H{`8IzTKJ`
zEX&hkBuzX7xzjNAh<9VImY(S(6<7VWXx~@vg29d<Ts<)GL9Nb&9nZG+>Ansc#Js6J
z(F({-vY=u+-%j<OE}L^9Tz)dZ4f~~^h3$U+gpn(BGZW5!q5<+361jEn3g>Yh6vBx2
zSlMj7{i3*7NLr!So8R0w?Oo3yRA9`b)R(^GfC54eil<dUGlMjL&ADWk+(JSjcyK=@
zAD?Pl3E3tPCxf>h47&Jt{dr2V-~B-#Er6Y!nmohJC-(0z!sT6@rSsn!4F)?<7cOG5
z9*mM6BqVQOp>E%my;ee|^6Y|_JU@N-W1#a2HF+;NlJP0`4*Is@tsQ>JI_TOb)-dvg
z+Atm#7Gw#Q-{lXJZvA9t(>ly}C}m|FDVok<YM=1Z(#L_Sn?8R){%S0a(G{yG(?m2Y
zM>Uome&{HvZy>iPa5TK-1k%FUC!ZaTmlk|`ONU8@NREwVs^GYeYpzS7Z_QI20D5KH
zhqoM(R(9y@5q~6XJJE|T6Rm?f8uD5=%3u^^fe&)rq!yl&snRL9`xBReXArd|dl$8&
zXW2nUCcUCoj3g!}uU@l8JlEakwzlU@Rp2QmCt7~#qyO~+U#8hAz$6^&#Nu|Ah|42#
zZZL+xT+E7`2*2JfxphImSKxnw4&O^o{OyF(kq`lL20MP_rb<{Y(j8uQ;*A?WXHQUn
zO0Aa*C~P@{Z?WcIG)U4P(VNabjV@KMBfMC&W?-vZnJWsff6kcNzeh8`Bs-esOO}5i
zK!h=bOH}$(=;Qdx&6P>3it>(D3F}uNFhRh?e_@{YJMS~yS2(dn6rxC+{yeOu=ioQk
zACV2b<k$ze-8|Ayob=js@)54K^VhuF4MZmmdAbWLZobl1xjRtt_){Df0N;)VVrCNj
zX?S7F3vwVn-s8cms)c7r`j2kLt|CY)G*1^WUim3rs6k?!I6s+5Bmt)t^P-IINw>6#
zX&R2N$QuX8qb{h;M5%|dB2QlYH4&x}Lr!ck;C<UIbWda%*w%N~KRkx9Dt<ihEa_){
z^wSPXh3*w2uv`_xS}q`>T|PcN3@A3JO^rFq@8<(*How2!u32ixw!IK>RK{GOq`moJ
zhsZ`CMl_%&+?F7~STY@m;kgYdL=cdS!Vp3dUA|zf$Z;=jqIGE1McenpiIpo>Y$EoM
z?!}wr?DY|1V%|9A0;crFGDQ^?qDo3uH0;NRDrX;4h656uhsntf^hx<)mht}cH@g9<
z4R!!*O)MlkN1T&JgSM3ZBp%|Atjyu@jQiT)EN*-^0kh!IBR+oMuL~;5Ww{Dn2f3Hw
zXHT4V?{F*A(%M>&HjjZ!aK<OB3z8MvNs{TuXw?}g#(>_n2uO``td;%*lQ3gh;xot}
zDyWYSohl9(so|3anooL+J;cg4o!aa<1P9L)FzAqi$wCoOy3~ZxyT;H>$AAF=0V-ba
z>*`kFBRh9s^U1Fl?$165r7a5wNyeeOB282aqj{Fz#4JOCK4V!KR2eUUt>OnaA<b0s
za$ppK!*+w&kK@Ptia<E&!3#P~ME0%*8{FIysr5x2)s9tNOYQC3E4A$?{{r_A9!!`p
zY{$0HU<cOUXF@{6_qAKulzGEv_wIw|^*eRyq+x{JhG)G%T2PT>|5ntTTm>&VNG77n
zAr8CgDX2gW(oMOSAR&-(bFBXq&A(>xlsyNUDrO_09aM=nO9%^_o+DYt6bYIIwnGh$
z5aXM;ZVwibEHk4OpS!(QtaNW3q$zO53b@N(c^>a)k$#m|Tv*&nQrG7*MqL{tNW7T-
zY)1^ToyednUz(2TNj8MK9@cyT`X{D#H4p=_D33VC#u{b*I(!W@075`3HTkg@3>3d>
zJM5PT%A>nT`H%1210IZg@}#NSI<EdLR|(2vx7?k)yaw-Hw!Ylic--r3bA5YuZ6|dw
zt!islb-0b>Frl&Jwb-B9EXbre_~-yfC#VtG6lN-`;S6DRiyxb`>x&*d*I31`TDgU%
z)`mBywukuaas>?8wWraE93qs`<k8WwLs+VeZp!LnKk2u@IyzqgMs6&%;|H@faG>k)
z_@&UGnRjA^coi~}>zLgs^XVu8Fhgch`G}UBP|@-K?HU`k3X%1M<?mKMbWlHY_G|}H
zT|L-$n+xDt@q4>|zT?Pqs;drY7V%Xxr*O}TXS9@DjjQ^ZRh{P|4@VLzY6{W{&7F>k
zwxc*WwNp`)GV^_zw#!GLdo*W$%#?_=-y9j)`wscLHce*;|LM9(wzel~3RA}?NyGE$
zRk9<lk<(UMQZjvpjYP-lY|JWDLv)tC<Y47XQz&<gw|uIvH|&G(!2kO6^44YXsO@Rf
zU7s$!=&Vv03{dFec93(abs;7(>rOYbOb2zgps){R=%aa(A6HQsqVVM@YDG!_`-gLS
zv8V7dv#~M^$-8(PC^dhqd#<B4F6wye4sJ1qeW=KJBhry)fj9mbuA*{a90b>+pPEnB
z?4jM^p9y2lC)-GIb#1ws<K3*RIh@JW?f6&V7kHl@@2q&?n}ukUO43WT>tx%vhqiex
za!=<rw+1qd2?&e5eqEb^M%HCRUgeLjKL5rgp5NuQ#IF2GmnucEoqphLo>uv;U9rP%
zsJHdpRyy--9+NXhefXJUjKCD0^+}vkXr`B^mGfyz{4RGVH#eZmNon|TCaBh|xmY9K
zT={kq8=`7QvD1zsGj7eRwr{P2ZV<KEq!Ax^7Mve^_>OvOAo__b@83c!F#9Lq{Ntg+
zhaVaz>^a0yFs~YS&p$~@PtOnE<nb!0lOsOn4~8!&4<QOdtEKs^7n&rbCzp!D{poUU
z!kZ+o?ytN&i;aCc=SQ{uG~Nl`(JJa{=3}9RW^wv~sSA&WO9v0?PDMtWsu<GQcjQ;+
z_3NqA4r_Jz?dP#$v+mzNoB5b>nXPWgUE8VkCO0Xyt_Wx)8K*IDqy<xogCwbpu~NKN
zj*$wE{Klje?3(BZo<*DPfc}DVV}xtiwt-4YLI-ECgY?2~Oc4so4`{|({slM`e6OL_
z78<MYB&OQMs&kIa07$5QooOSZG_OmmgKO8V^BZTmx1FRApcS(UmgdTuSPSXy7#%1n
zsNWt2=d5GTBL$(}I!Wu7=IUm0n$n-dXoAuFudiA3pu>m7Q4EKL2Pr8BHv6;NhP^qv
zkqHaGyTd9wd7x0j{F62x$BZcv;qOKnM!y5P!`!2(;c0P9%heW4EeZcWy1bYTu*T~%
zuNEqa20XleCt2BDJ9c0^@u=W2GI`Xw9{dbmBkdT7`a*a@G6sDSq#MdjKYtq-a;Hop
zJHIA>!XOGCAEGK{ITJ1M%42aQbOhsOuBX<cN?*L|debD81J&!MteY17(@E_Xmb!&`
zEu^q5C|YRNlXA~8&fY;u?1Aah^n}bfQn~f;IS`w43FcH?7<c359lfIy*Pgjj)mVCA
zqs<R3K*PJs??-qh7|d&-KW}!`II}7&%^U_)X5UyL0}oM$`zAvfpD)7bLpCD!#<M}p
zEXj23-(QcROsy{C6nrRfMLwtS6U;Psu<&m0cQcsKHBDSWu^edaUk8zUV4N<L%gy<t
z945liRI_ytuh0+YPnZ#<aAX5~pb9Cktv8%XP~sOhK}b=ONdDBZ9$j=l1%<a<x_B`~
zt{(oy9|O^R^NZ63y}pe9^&H|b_tS3oRndOo*?u=?D>JN4vvx^)B?e=OuqAsxG|gQS
zQC|!yM9~Qgs!JCpbP~u6n8532lGYZ`$>}8v2J+g>m*&#t;;!*q4Icw(JF!&j4xIfH
zz9S?Ewpqvi-ly~@eR{Iz+6Eu1kh&xeWE74H$V)L~KOOZpabpNa5B|ch>_E$~a~zf)
ze%_pTq*n7q{UPaV;I3BQ?}T9KU>Ioi!S@ZFFyR_q!^{JprNzBi-kos+VYjQZGyNiN
zAWW$YY$z4l&&>o0B8|ZURLm132FjDcUa$gXv_t(CeM;$`Ls=QmdqV{YQ}2wHvrcW&
zk|k%Zj20rJ%S(@q=}TF!*C}z67Wbs4#zpB*ICzFU_T}1k{U{V`m+W`Ty+pskiyrgZ
z#|MIEykjuOVE8RNXCx_9S8=f?_X_J8+6!jd9WlN^pdl*@RdUfbx(VzCD89_gq&Ih*
zRwHC>AV<+KG{UWva?-WX?HgOj;I8n6fkOef3Yp#X>GUinFIiGbc;O}0@l=`1dGck?
zfq?7gQe_HJoj0$#0vq5?c$mIPKZUCzZ6~q<UxfiPaW0u;K)b{e)2j$saG}&nn+s(_
zz_%5)$r-$8l#q<OGe*SK7Nj^#E`kF9!xw1A8SAz_Mt`>%gpk?4X#doHy>a=a;`~-0
ze8Am-p0^NSXlSgXxUPHOZ~(+%xQe-8eq|fe3E*-v<zr~L%Oz3lKy9LLm>Sr@Q_dhP
z$BEfB-uJX{Q+m+*V^%#{BH%?55bE9AdYTCeLC23D=kqCaY}>qAjuz@%J&<9l%h~=e
z;$u0QJ@xdI)|QNp&9m6#ubYq^kvD6>wyc86j~}BZrsc^EQdTAceBg^1>;UK#my{HI
zFik^J#g$O4G_+&i7jo&>uX|y+jO7L>8odzL9{jqFudI9&E&m7RoA5A^QDOrGjIP+a
zrdVB5vuDSSH)L62536>eS4R^N@ZaE1<`nPwsoM>6eZ@=g4g6L!HUmE`Y?O$Auo>+c
zF8u3Nd3mlteDmU2<l#ZQn-VPcy;I0=IoG?oHl1~&i))MQCfq#_60qrhVPHFh+OPXw
z=_M(I%H?*?xG^<%y5ldZ;nO^#Pn#vy3>;ySl6k|S%4tYw=B`5{mQ6NP>0!HL@$=Y=
zKJWU!uG78QaI|FMo=|t)M$Jb$Yb)bo*Svllm-a!MIeC0Ll8%u=*-PQT6gZfR79A})
zFuK6$BmQ=S3FAGkenwOLp$^S5?5rOkPz6OBo0`^?=cw|>z-r?o#U`k$sarsy&A&XK
zn~+qf*;zyBv}{?GYD=5DvYvW2GiJ;{xxhXudZVnU8qVI}%F4oXJ&~dlajVVC`@I-E
za9~Tl<501lJ9kd^a1}rClRc}feEUAAt*s5AlOlQU-8Qma1YwG9#;H?9tNLydECfmh
z?vB_#OB#ww)S5T10Gl3=9@58KDJc;#u2VU*DCK|l0?Tl-o-S$l`Zgy=Ebd!L*#M2l
zSJ8tN*}uQ*^C(9Lha<<19Za{5;3DNcdsZ}N_dQU<$_I+;Cr#R#n5fe^(a+a+wTsK3
zQ?Xu0j{HSW5R4>ez%?9H@3ZO;9Sg~G$=rnXBQ$CbJ8`~o47p}wYU)ySr%k|mA@nG^
z+s?~($Btwem+5atTok5c_V!-J%)zpfvO~h7#bY=;f4qLcwb(xPZS1aHDQIU_3n2ye
zd}TiHkj%a-D21FqUwCJ8<3u_jO18bfJ$`A!Y%?>eDrl75J9pv>Gj{y=*R_j|Pr<Ib
zePJ6(PFY!5s7~=;4-72eTO+DyIeO?#FWST}?-1GtREbgCbQg*$ZFV_dzrK;1&wVHJ
z7Z&P>K_1D~B_nprA4E)c6K&tNZ6$?3r}g*k)EK?!)3fJ#>R(LSuiWm(=~nBTs7~6k
zG@kBB5^!Nmt>^C0=;$pN*<l}X_{tQ$4;~B|M?^$iJ01`a;Ol#<ZZD21H#aqGOGTN;
z7`#m+`DCQk6&Zh)D?zY4tn0TwD2*0g876N`(KxDL(>Gea>G{`NG;(oIzGkipTi{$G
zJCdt>nIho$x?g|&l{v!QspLUg7^OF#%h1wQ)zj-QI{3F@_ENzx=r-~sLAuO`&f+y7
zysa&!`fo>+756V8B|=5v!GU9Q16V6BLF@a&PVc&N_wHp54qvFJ$(Ih5UTJ&_+|oIY
zouB|gG~i*!qEXAF&3%?nTu3nkM9PgE8?=)e6;`aP0puW7Nprs+_j{I>mUQqqF=B8z
zv7z~SpJ=Rklc(3(_E|fnkl^5~8#<rACa0$I;tnk9oLs6fc1g!gZOS+3%+z~u^2G}~
z6Jdf7PE*Fk<YQG;k;lFxQuE_NY74@fGUpe#pUIQk_@iy4g{gNw2M9IW#N-e0ysukj
zWn?IoT>$~4&f3@2K!!cSOs(|y=Z-VyINw%d`cj0uV6@yrNk}&!{ks~Fq3H$`B^=yx
zh6MpU#3kH9x;_($Ef|-3)QJgn@oRH89t)c)P(gC%(Ie|3uR+G;;VLWrlJe*gW{Dfw
z_p<i+1b7uJ#5t#&uq|KfV?cdC?5K=M1N0fNy3+>1#F)?hzx`B#MBpvWQ8#ZAJQ<Po
z^5q}>cL%mmfGns*Y_?!{_<;kNpo3#3bEserP1l{Kd)=dM?;&{WX>-<M+Kh4OhECB)
z)sW~{=}b}fT?;5YOauV|T^Od(qkH#h>F9|>CuTwgWYx<*IM_3)Prw)Z$d4YVsi~k;
z13X3!I(_<sC9aC6Nb(e4Hczs%Ln!#eF{{~@%B};rtuw3QE?js|IUsWitme3E*`)VF
zpM!1q#pJy5tP{%_M_#@>pWFCRO!GDW`f^9UV-lP)x8h@Mg@y9LofE1zjhj4gp5pL#
zoizhMF8`0NH-XBz?b^66b3`(fA=5=gDr2S0QkhDl(jZfj1`R|-3T2KcQHm0gBt(hI
z7&4@ZR7epGqCq6#`~A6}cYSMp>$}#wp7(j~o9p@y=ef^gAN$zHzJB8dUNd1wj*JMf
zv$sbf8S(rM5QMbh_2i5WiPV~UJ{#J9`ew~vcYwnGKDUw*W_Q1f^!PO+X(mseJY&XE
z6O+qu&IqzO@86BJJ=2V@%=9g7n!|?=N9IDq6udk7ry?k+ygW3PGA*A8<%1Aw(tLXS
zxUH4dXrcrqUT*aOeEY3i(bXeI4j+CpF0Qi}X|QI*#tiO(Tv=FPj~^?msvbsybNKLJ
zN*@SLr~$vgD&qE_MJstAh#B1`vB^23S$@;e=>Ur~5~3*kbne)ZSIEqa_-ogWqBvc!
zfOsdIW@LohCJ&+uVC$6v9nEgCPTBn@t9u;zEiEJs9KQMaCILp|Z+Mu_+xFyx<GXdb
z5;c7SrO(C3GcVIyN9P{Oc^c?yYisT8>{`FoO+lXkJTO`rYi*6B?B-2B_7OW}`SKWe
z;(hy`z(kFN{-A2vwd-z;+Ih9SaKx$@3mPt1@c7xYBf-HKmluH=SWa}Xy~KiTQRc;n
zy*}RMtwH9C7RkuT?R`uD<c`%6nLRpaP8kb_p#TvPx;LuN7W=|R>6r=|S~?p!2PI-K
z`J<I1FZB~vAy!r;NGpYfn>YT}j;s}wvia~9eZlC&dKNK#!|OJEmuwpdCkCS?D=i%y
z9&TxFE<9?OH#QpVDT<`Lo2l2Xkxfq-H*TDUhHP1+;1CBGU_cy6k(O`a^cT6g^%(WA
z3bO9qv$L~9^S`k=Uw7WTHNaRN3ZJh<llNuYy-8d506Rt2ik6lZ*Gzsxx#}n-g!uS1
zsB9yA#{64^Gaa}ulo7KeE-gNP<;oSn0CKSyOVvVV$AQOK!E9?jv^TJv*RCBQlCYUI
z>o%2v>=}}hl1)ub%X@!u-IuijsbZHSj6@O(=a&RNug}=Mz>uB94(=K|$47i6^l{<H
zha{(<X8x0_0|J<vnp&e_Cd=t~Lw*@C0yPzXA6Rne*fC|K=F!pPAP=!+GBq`Ay*faP
zsMxVnCxV_5`8JorgXI!QV3q)%n2ls=MM?S2FC2G?YA_G@qzwgWMQW|19?{|z`5mPN
ze_HSXICV<L+<XJBiflQ|*K}jc))F3p^-xr-c&Z$u*d$?Lc(w10i~GRS2ffj<kKkQG
zkh5dAMOex7`*Zxr5u}xqP(0uuj%rBFC#<7~1BV$^&RzTVG4^(}l2WgJ{T}p`KyiTX
z1NCZzM_-b1G{U{4-r`quBqXGk5(D&%>{wg<khwzKmOihsC)2l~0)?z<>0X$m*RV_^
z#Q+o&YwNvBRa8}lQJ!SUSWgHYS70&Yvdbin3{rP{okhxGaencv-`<?~a4R{Ec#g8z
z)qa(GN(h~T47HY8nT0BV4;5meefItPd$mDF4;~aYX|e6*rVl+nMs?Yn)%g88=Z+6J
zrn#9=1T+u=L6<JXrQc*3t*xzJr)0rY?3N^$*(d|_pvH}xVulBxF5!ckkCV=wvxzW*
zsj6UFN94yjjf-F9^q!P~NE(;f2*V7jF<Hu8J>#EvH7B1t_Xz0l?Ad|V6+lHtN9Ir%
zl88C2Tv_mt@0Z3|_BCQZ68zac6lY6}4}Ss|f{qp4g@A5Bm^W>DOE?yOf@NuOIu#eU
zWAi@pJ-KOJfyA1vvSQS^_cnfYDeY4@vKz+a#9S{tRhzRAOz`2GATlGu!^4jqGxc-m
zTH~YZ8<@3%*2iYB?4m`B-e-Y2*kim^Y9Ydwhj3feG;^_)m7b1{(NfxNGz$-5Wwb`~
zaHmVC^$Ei2_Wj@@!3uO(yg$s}M@j=Y^6~O=E=>uVXt_<aN#X2Rm4I9@A(8lO(#6Fp
zM2i$h(isvuKWS}328s;3QY6`za3!fxMw@_mby>oPj~|N;NxRil>KYgXC2RA>q+E3+
z)O`jUnVTzCo;oG}`=o39P*LkNL5lyWxX+)o({XWJNxuH>t`ZUwQc`*nlu{Sy>FqeM
zzhM^AZyTF*cm|i`8{b%SwSV)skz#QSa~GVQSwR&`r;QtY<@k;ro!M&O)?g<|?J95@
z3-bH7Z+tPy)kpQn2nO8oC_jI;U9!Z$cN!{fKBOU_Y!(k}SZvz3xYMV@j~*3*Z|e#=
z82D`7oX!9<{w+{(*_t);l8?qC)B=ycG;u&;%7<n`>dSNmHNg|sP1)1!Z)n@1+r4uv
z=#v=e`dN+>)5+1XK2d$hF-pt<Ro1!M`ijC<2GO?R$f>8-d2d$5plPu?ALs!k&XD26
z#c5D#crn+Z{p9^5IS{ep0FoidvBEcu=JUVLL32>1eKEr-=tSAm)<l?x9j`q94Oua9
zPx9gd0xN9a@=fl-E@uNKuj+C9a$x1hk6d#3nE+t#U)QD{{JUu$?<L|*&CL3e+fpvU
zw}g(rl#d76Zm&$oq+5L8&?Q1LVl+;ARu4A}wG&hqgg!JAy0>&MEJjU@FxhoWLq#WV
zW>Z}T=#XC!9yhwX#~9wcv*HqFm@H=-W8+!2b`!#3x*;NYO=X<9T(j1*bBv+mkbY^~
zT|(k0`2xittYzlfKFQ9;qmK{$UH930WLww1vBBSiafHol{Un7m5l|);m-F<{G=g+x
zizJL~e=$Mqv{u_H{`w@`EiUK=qx(91Sf+PxAytH*aiCwvcco;{9tr2pam9#z6xAbR
zQ&Q+R=JNxIH{~sQScRgRL;f1<({I0e73mT%bf_-sxsZ?oLOE{{K}T6tvGC%p&PIJa
zh6@|wS46=Lu$1IajSUTS5HU-szcz!AHxfJKAIAGK#Gr=7r@6`<buiBfGpk*D_B4L`
z#@);{Fi@W~Y4zT!ic(fG59z>cSA;4;V<uai$cdOG5~ntlIubE#eU{lKA0LepD?G35
z?Bum~-CpLFF>eogcJffEj5>%5K-sUhHdtb&@@xhu0YJ-z@tlk;d@nQqrH8)aIx-%4
zBM*o+&~^`wS4l~sJqJA#)18j>PfcBZcL(y&NsLdyK8dx>3L<7m_2@w;s-e;gTC-FM
zV<bvYP>;P?j;HUgQ6T=^?gS|Wsnb|QZN2}1;`2zf5)xvQ41+XrovL&_<6`K4VpKpb
zAr!7?=pdgdD9YfF`5iT;Y~H=Q5~2z4!@zE?3(fz@<72iako<x)(fRV`NbnH9RaaJm
zNdx~_358{8!FY*NoIhigB$t?Y>XaSAC}Jpk#FzO7z&I*B$aME>CY?J+dM`AWly3ZF
z@#9WKhmdUj1q<$0(rn}L)XZS8r=!}FBUW3B+!n>2b#?xlI=*-%$&ZiE<RnLOe$D(P
z7(}V|Q(h0*L;J_Nbxz6CQpPHVRKI(dOm_m+1&GK-j+3A*MgB8_X#~RjghP`e8~6p}
ziZ%kRnOn4@gF_X^>&uf?ySZ%6vNR4lfC2=aK7GKPn`h6qe66Ow-Dlx(#*I&Muh2>9
zHS=V2^fK0g*Rr*|Ikq|`mGKD)eD5Ywr@+8Y+i#CjQX(50^)YvxJ3UN1vv&(=+T9Tt
zNH7A#;c-Y3Z-AG6w%rgd4?Bci&c=8ChB46<0N8v2zvF!4n!d$~!h<5>($C965{Ao}
z5B}2rW&oGV)sYZAfAYkc(-5mU=e3d$uJPy3w|%QS#-w0aLJ$_lNkuQJMpsGDbOl;-
zFV4%ml$YhgZ>jACmCl{}korLVwq+bH^n!R5khi)29*A9y&~eN}PayyG>yt-}ct@GT
z>vR&3k-JIVoO?Xmjz5KF9<}s@{`<hkKvZ1zxIv=153Meo^_;nU-_qn&2BsSxthhw$
z9c|{`=!n6~<>^*jx15%Ty!P3XCs%N0lXQG&{&w!%=-IRHvb`+K%-Ef{V$^ci9J;Xa
zbP@4(bR}SK!XqMp9U2Y&>G8tU2J=2DC_EC5@)i`&<p#t@o9!2c(aWDpQ^%5Q&7JGO
zDaQ%J--e2!?*<*oE#nfP`!O0_2&@q=2ejL>Zyyx$1riPPuwW$j2hf|_3!ZXN3Dw(i
z<AQ59b@Fi7v112+o5qO#XpaTutlu9_Ifx|YN>*Sf##1jTu_8+Kj=xjQ6SE8OL)-o4
z%^UEHzT!k|l*mb2W_{#7d38_1han;tNvH47;9E6G**!g*c>zzOrhF$Uca}Lm)%)b{
z8CbY{aK2qsbi|BW>-1lrDe7?}xX0u<_|buuW{&7!<PA!<=MoZDCXknFx|FEF;+UvT
zpMJdPGlDq%bM6|?Nh-e8S*Lpv-c)4wCg0&&-2w^p95X>h`!Ay8v0<cbbEGxsTiDsk
zkaIXuu6qH4pg4G;q2ZaeWNagjG3W1DLQf$%@nmG%tpq`<KhG3=7bydPA(lLxM~z~5
zQk+{LYZ0RX_qF_lP<VHbVp%jf2Dn1b4)4;tfB#Xp!bqYYu6~Xsgn~hJb@jo8bR`xP
z61hg6NvQm3U*Plc+^pymqiSSGQWiwYz*!NU+ylv#F1pCPZGM!KBb7RlcTd1_H`m<w
zc~G$hel|sV4`uY0Ecrz-?(46Zjg-z_<)902ICt<_DdE}sdCa%@2rDcsCaJ0hB`)Nt
z1Mucu#iZ)R=SACxkv2Y81{!Qr+w`N+-u5}Z;B(JazJITF+WrD<xpKc&uJ`m*@MQ5-
z$q~Rt9HyzarOE^`>zd^p96>M2GB!<$|I=8xpw+RYq@=Lm@bTjd-`sF28Z+JJ=f_*~
zB7O`TIZ_DnDBdni(lA3Jper$N!GhGMy|!w^B_;;V=ncH;+p8CcncV8ZX!Q>%ZGgTb
z!%Hve)u+$9)+LN{>3K*ji~_USq}^E$^Vn-!RFF;ipO6|jV1T>J*2#HUP|C^M4jkxd
zxqKNXp^aR-n`+l=1zk?`c7oR40|)$o<{YZWn(wn{Qx>hK)Lk+^s-ue{zsNq~_#viJ
zka7833dG6&w%{fYMZLA_mY(uUu%a^G^u3d){_#(Me1k$IT?;PTU#H!;5i<4$&^XsZ
zI1#lS-lTimr0xg^2#yozA9d{=`s7_}zUl7Je_mKf*?`4XJo-Fh?oT<)F(NcJ$(@K8
zeh;PQZ`{aw4i(FzoM>)W%&W}q*xk0nslsG3V)+pxni}5CNtvv#7;^pA7tWt+8oD|D
zXU|pv_Oz5KDIZhg=K5R+LQNJj8Dv!rN?p5lOwwQ?p2EnH>s%hNbc+5)YjeerG@5{I
zVpv2(G8?(&wT3fiijo`+W?c`ECUuC=bSELvvW_AQLVmoR%)}-ezd2Xha?>+1=5@MI
zJ_vB{H6aGMPSMIAZ9gVjZgi(e$h9Tj;e0JZsckdM)HIoLxYLyOMfZ!8c?pB(Z2FMN
z8>M8Wc>IEn{jy~<SAAR;wJ0_rVS)MH%#B}$JRL)}TVK*qP*)^{aAl}tvMNckOG-=E
zjTt;;*)4yb3dYn;sgf7y0w*q{<#eTCTs`N~vlW-fy|l}u(pE=dc~Tk&YNzvsGbSLI
zvnV!p#KMY)_j7ZDiypP#)|-)D_2si|@McI44<E34aEA`tA!F2j$pc$%aF9oWBN9S3
zRgjnFouX~%Yy8%&x5-~onv~A8Y>v(l$jk4-kZxoRuJcR_Jq@97^-P<<RE6(lTMF_U
zy4Lrh)rJ9k`yS&;J$&N8c%}eQ$C+S5Wn5lq&-htOk|5a8GrM`i9@toPzjE>7t*yf(
z1RuVoY6Z3n7v^y5z|IHXuKz0rD9Fp#&mck04=Yyt@%v7z0wtpII|9FDcp~Sjl={t0
zgt00)`9B5{;+od!26KEZVsAKA48e!A{=`wHF2+`G+PVzdk^WW#MvLg`+7qWpXI#Gw
z*}4HCzB+Rli8O9&(E*I8UWLi%LpPa`&`s1M-80{iEs%M>Ya~?9@NK<k`4OuA+C_xe
z7rqOwy~ASzBKeD8$bFAFj^d<jdQ)Y5KXc*nsRQKX9w(@?2>4jdW^-Z<JDx0^^g*LG
zh@!Fc?6{{c?ZkF8kJEfoQPD_Ej<`E?OXrj%Olp|>=Sx+R*g|m|e$`>EB$*|T|1~)`
z<s_CRBBHeE^F<=@J-Z12QMY2iitiM(I8W`d4t-HE#qal2gQt*T6i$Z)Afzaio%Ztt
zWCg*<eazZr_V&7uz*(%l`^C2L0<9l%Y<R%jj`DuU6=sITlLdW*CDE!CT9rY3*Eav_
zRBzSD$jC5EEdPD=e_DV@%~`&Cf*|k#&W9WxBM|nupj(YV8|jG+*s@<yWITO30Htef
z9N`@KdEY<6Y{N-a+8oO(DH+(0e+TVhSg<WFPO<q<ppOoD;@w(NTicK1x_)i+xix?N
zD$GmSBox)`x)~T7_xjkTd{SYjUgwWI-N)*YE8(9xvMR6EvJuF<23^U;#Re1^Sr~qf
z^bykV76r&EB1xlT4_=G(u5bG?RaI59oQ7T`uZL&9UCB6(oNf@u?}v=h(h6Ty{~4^Q
zub51PWR<*63IV2rQ?EJO+3BqP^b$$IiH<M3GBi<-^Ulj9YT|0CG3jtonVH8e)MfYL
z=d$N<WL~Pk#p&zcv!_4v!lX$rf%g$FoTek!K2&dB^JJ=q+Od~&q5d2l8%yTr*v^{O
z&N^ED;L)RAEC7nQ@VcZ|EkAy!yB8(O&zMnm_il$HLbUc=(h>*2nV>{dVP4^>oU^lU
zF8rD(nqf>4Twk%z5rW-Qr-LfQ-^jkFVq)6;d8ydZGh_Hx9c~Z@5*urT(sriHmzNV!
z*GMJaH8C@TSW_%A0C2I6uSG^hv94aN%Bc7$nea}sXHSYvgSF?{*lY$_rB8ofxO|u1
zi6kTC`i-xnGxs*Fo;cER@P)ioP#Dp8mITXSEi~5V^<5?Ik#<o-nn<adGZBt@n1aIT
zj7=R&o|67+p1C57{vKX*5>V3Mcv}criuB)2m~*0b$tzAT_n1?s0xU+TJ+{J{HPR*y
ze&1_}7H=-Q?lv8qURM!)@tL`kp`-6=YlXH-mblC7>i{A*z}Zt5VbU_1F9-~D(@?V0
z>E&2w-2zf0nsJmLIdrIz<2J(jd)XU!2B6wCyX-^I{)Um72W!91@Ug4W3_EtL^pz~e
zMn0@JR)cd{=4-wmor+yzPti-T<(Ls8I*6~(+?YA^34N`b;0Q-5EkO+M@LObP4SjV4
zcz`SmaBadHaX>JpCPn9G6I;$quU(qDcJS)Kf={UZ{hm8o^ge&q(bb)&Hu{Xf!dx<?
zdef=_y?6<WC%s9Sn6KL*74mx*?v8i|IgP;H+WAp-_VP`~AIB5HAz>nu7*H5s=jHwL
zo2r4N+K87NXpqX+KGoJPDC@IzqK3wY?r)hZdSV7VrwwP(8!+fKbEoVWdS5Eq`)zNc
z2(ahCfd`eepf)^8nMmxS7WuZ32ktQ8vVbvEi;mBh=ln|l@KjkzsazYk4lpner+75U
z05IWQQZ^g%;M<X-CzJuab`{NT(BpRYg|0EVMP@;io9f#ddNaeQyz*^zEooerewYSK
zoG`)b^$^;hDSAqag&vDTOHK^Sp4Cgcuz8?n(13{$ai<RF>qGc653TnRC=55Nr59jS
z$eeXgDtN8=`pMWZi|m?d689~kx3>E9`Szn}b?>I4G4Lk)womQey*q?R(VZ74lY!R_
ztM8VT{lSTV4e<W_eY*+89#>707i?JEzD?(OQ4!+ljz^|=*62($r|LlN7y<7j-AzJ*
zCcd8Ptrshc5{M567ylqK=ihr|nk?e^dqg>x+~&wR{9zA`LIzvRm}ZU5bMNzEo0ogq
zQ7e+~6bMY(v!`29gnakGV)@ad=a;E8HyQe_EHEy69{ND5aE$xwcS5e;)Wk6e`}<&y
zU&rCFP}8PmWPBSV4ch5vW(w9pOa|E-G1dDrJl3U4<HOhW{4K5aeIk#Vha#}P+Ev1#
zU6!e!)pcB>uHkG-C9AJ}oV;J?64*R~F3L5;2-2pU$(S(kiA*Yb{+vok58>fD>?k7j
z+tG9A{+;as3$<AGhE{j{yW>Pxl1NnDgC;u2ZoX+ye=v0gfq`|T_=lq7-4U(^D3Auh
zBh2XzKO-*|3tfM!?46%NvhCUxop~}b@%8!2^`sma_E@UO?pKAO7wXAHy9NvtSj79&
z-1aw3LJZ{2qk;jmFft-podXRNQQBT)U`DOAi`;<jorhY6VXix3+@wh}$j!H$-3TYc
z8R_u?{lPVO@e5BjO1JkT0eBF8xi61mXpWL1nDc6>gt)Q)D1h>p={j@fFt@t=a#)z`
z)0bN)tnjD%4IUgM&1h<1{$s??UW@3BzLnPfn$^W+?WTW}5M$tbd9;#t6<H$Hfm`+v
zMk(HN%;a_ZX;-nn$l1#m^%3h#tOv)5rba1oqBsT88n4zmja9TqQgvUzhYr3MnG`CS
zx#ia$>2pa*H`jfXvff`BHgur(lV6CVuU)&w4X=BFMoA*+^lqln%q?ao#mTXkTl(ox
zV8puvj?Fh!*pZo6SATVZO!9U)`9@}unVDPXiNr!D@(Qndq55+1V(>&c2aX~L7xf0a
zb>Q>2n<N9Ix8LqhNH(yauqm#G(VVV(_w4b~Ed$ZNZNIvrw6)d8!}`gxaf~t2NuC1#
z#Lj9eE!M-aHTaq>xmxQeWp#CiVz|m7JHaZgJ}Hhq<O`nIY|XEE>zCqoMimoO&#9@x
zj0T~I@4cM^h}t>gQ3)}~eAD-}WT7cnUt6jOL)VM9`26a<Jdn-j`=c??E=6c{@inFD
zb!%gN%k}Y8x-Z997Ae<wJpWp)M_)2b6{2)$Z5ZGSNl70MTVA|-@@D>_u16$<@-g{*
z%77w=?0)7uvsPSU8||E-3Z^^r=fWwyeeM^k@9wbLdh@Jr&F6>--?v-sTz7!gb*Eq@
z4b`vq8y=<dH8Uiu>Dj#%mq<+cU<Qx%Z}N()Zb$vvcCs3~{OVK7#;>Td4nWS+*ZQlA
zY4Czswzfk)zCh_$e)u7;b}~klOpT^m`>y%oK+2TX=H@#dgXg~X=}ixBV61Dn{wil@
z70*M0GKbI2OS^XMf~PzAr+lT`)hky*TMbiU9>+;YO0HaRX_cd6$@!{MLiQ!qZZzYm
zf!5<vjg~Hb7WUfzfOnd6L8l)N4~m1u_M(UiP!{xxgc!nOdj2Y0Am`wwc>c_po$EGC
z_o^pJ-8pfmG1EjCF$(taZCT|M?Y&Dc>^U^&&?FVn`vI~8%HMbJT=NJTA<sfFFI6H2
zyW@x|>(;SSj@N}j*2X7#nuMqu_4BWkM}^2qz3vL;Ed-Ffscomzwkt>`U3z_4Lvp}v
z3`rf5A4DxKF!ba>4XrB}T7r%ftm!Y!sTeWA{t>Jes;FDauL2Dy$%hXX=C%K6h#i9E
zm%NT(BjhlxZh$YMlxI$Tn)e4=luX4)ysZ+o)z7ND5tqAn+}Z`HUc~czbE*YgPMyHb
zk|N|5=l!dO$P7g?LiwGi`mc+DI;dBVguGKS^4}xCXiyXK=Z$P_GY9u^H~tuKFfube
zck?Qtfep3!mLH7@6a&-KBim+NF8BN<G_wL;f#X!DXu-R(vO@6nV-*JkpF39rReel-
zrv6GYM7r9LY3WHYV_+;W8ukUw3r|<j3)&($VILggNp{d46I}O}WjRf--#Pr2Vc)Kq
zb0nH+0L)aXd6L7car~<4*wB0~ZQAXIP<STrlj_LM5*>eCHDf0++G%Mf#W@795r^Fa
zTvgld)Eos`$qpE>Tbd^UF?}jYMM-Jiqx1`Bbv!-QizaCdZg!mQ64b9IeDw{JMds!(
zApON^Y*ESvjd=rdJ3}kNrqaVS@YnjSWgU{7D*_@S1}cTvpL!{;pa6J<<{eG#h$9gm
zrPkTY<G})9$Pb)IWRBLfX}%DDWFAoKt)NO?i*8i)?cI}?-pm_oS(DoaPbB_tu5_E&
zYKUhlF4C|x)Xv}u6+^Ng*jeQ?1cW^^{&;xX-hMd)?rh#Sn1)_!ya|YUR#p)QRPKnb
zgwxDU8Dm6%kQ{&dR3hk!Zry~lEUzkMf3eZm<*d{q5z=;mUUIp4O77`XQQGsE_}N3$
zQssN;C3l`1FH;qge(1Df8vVFc`KKkN29Duuc=ANvaO<%t%l5{)!lY=O_-K-+qB&D>
zhx_2oij;czStN~6lEU~PE2~G%S6J|b(<}B@I{#|fY})ywwTA-@4%g6D*!o{TdGZcr
z&+P1ZWB^N-`av#pacYz5Q1PJ2xW<muKcThP#qD^UBD+6Vn^nGG;_|2nojpatFQC<c
zQBmRHyQKv`ZlG-Z-d;$XAf3el`+|agd=}eEcXLvU68p8&vq83irsv&r54o(`Hu{I&
z$;5N&W@+`18as9CRo6JZttZ}7eCpDr%jH`gr$w|YVEL+GB&rm2<v0ay<T4s+YP?e<
z%Ui!_dR!1JMnXe5<~dJ7!^5+~y0sUdI)6SLIMLR&xwr3Qt+ZrSDvLr9tLOzT-x%}{
z?E1Bju0c@S+uI$c_DoW$Z`*QC);8(vGyzZ-G%Z5qqNd!+LrB)_H_U>AUT*vfodWB3
zhOue-m^<iic^VcPdd1+Yi{#CVlcV8<%V*R9JK;noO+FLWT2xrIeR#y;mx?EUyJ%FV
z^}Q-pTGq^QPp3UhH4%PJvV*alQ1wd6tZHKk%$sa7>tI-z;70_DgI<C9mS_IdmLT=k
zP6kiw?xonNYM;f=KR>^bQ{N!1#v`!+kWN}pW$W(a$C5oI%`Gfu(2&{lM>9n>7RQ}C
z+uo0hKB-vXxo%zTnDx3zyT5<?8@WZIfLy-B`sE$){^}=3jcsighE=UuYr9=Mdxua)
zUn)+h(l7=k3$7RFs{wGVf`%iDw<?b6=r5IZ`*yo7x~Sg|u2LA!oZA+Pss(V+p`m>P
zf^i0;9Hc&I+{B4}l2Vv@6_@hG+Vq9odshSP0AVZ|MVO>S0UnK8-d-EK%oFJ^tL{2E
zcB+xnQn$}Ndg_y^ii&(*YGFHp0p`=XVb`Zm&Jl8|5f7~2TlP$9SM#s*OZvp?Ry#ei
zZJKQ)-<32+LlD*UEUGe8|MhnB<DLc#G^5Z+Qctz*K@gNM8;}p8m&Xqu_Lq|*T?nuB
z>(TsY^7!$Ws=IDq?uPbwW`g6hs#4j`x5xGGPB^9aYFGeojbk;wx&msGGi(NqN~DMl
z8Im>YPwVZx-%+N3D720;)1WT7@Y$G&pb?7a@GE?o1UhQ2Eh<PwAiGV_Dnwexf1h0^
z*Ij2?cF?y|c_EQUk2<VfyWheaJ3oyH6C#*Jx@XUPo_&1kQa0dVKbKk#Fvgg$dE?KX
zg(SMFw*p$d1KB5fZ*~EtQ3z2Uik4Oy(8Q3IID$IIh=6jN*O*VN*6i4_`{ap>bGHwC
zy>LU}q1wZuP5BM#t*aOQa;^ONM9t!-o=dk#Qb#Vdmo^Q79&T<9kMfK^ws<VLAGOCS
zCa-UyjWEz;)F`&}@BmIF4#TRum*Zz^6i$Qt!JS1~e1&rYm^0mH_)MZIB4^v5-(muB
zW$Ps4t2}1Rbc|Cu33;SThhLg3eO_<ul)@R_DZ05F37+fMLn|Hlvu4?{Wk{`JV#Fgy
z&WWnNkdPqPx35mJBwLq8KJrTjeZuAW0lAz}-)VW(M>9H#WSBC{%N_MCwxK~=-2Ris
z4qFTwb0|M#M3EykC1veANtj>h?GnF*q~zxM>fYLO5$rH%H{%9$lq#5znP|IQJ8%-g
z{+;c53`wS$g~b`RVtjn@7GGz>!gl$3rZq;&MiWQ5pM17*k5|uusrmjc3&IQp%L2-o
z?m}^ila9zwh4kd~iuG=8^vVw{yW!BawZS{$wzqur>^?FwbUToP+(36kz5t!aDb^ss
z(a5GdPo4<+E$8yr<20$sM6VRqVwfOTqKeZnJd2vuh&*TLS`uGv)didP{{9jgmtxsX
zYs!?;?Ch>xc97~qb%!|RB*sM_$aML9@=fB-h*K8>r!Bv<7#>aYtNGlyRbcj;pBpoY
zj#O9C!eI+}1a(DiqLQMLQX2I>eyr)7|HM%v0{VB?lk9T7bO(e@;fy{2G-$`LD=!Y!
z%3K{u>4>Ip#|1u(39-LZyN#=EIq?o+RMYewKhSf?)R*^et#I_{H>mG|?N%{qmdho;
z;rR<u1ab4nF3*9}q1t?~h@I7Nr38BC-RbD6PF=bnur*q`HOryn-rLLcBQ^70zVt$$
zz>{+Q^4Whs<=;J_4BXLv%?O|c+OE8L1_W4NjwSIQG}Vi<XFD<j9uE?J`Jjp6`q0hv
zuYVyuDoiyx^P9GxGD=TQ^Zut`7x|YV>g!T}G4b?ig)&3<!svH&+c5=ZaLy1EhTgq>
ztt~8e&XFutXmIH=Yw)nsQtv%<6Laq@vi0sU(DY{$oPbd5v>U6s@y~DH-X}2K_yr}o
z)M<$hZ~XR<i1X(^q4uIJh{O9Wae}=~Q$z0^wdLgv#3w3VHKralf38yLoO*|~m^&*s
z>lL{k2|K8{T21m`Y7(3?dW(uiwiP6an-+-;MMWzsrneTWI-dxYi<(yudis)FGu4Lt
z9FE@~Lr$SeV`jLH1d3`8gU5zJA5_MU{pdQ@fK@#w`6_(+saI9=;%;s~fT!R5`FHG*
zXfK`gRb$MUwLBn@0t_3H74lh!2RW#iD(>LWF)-@p%X4&Ed<{!w!M}4P0W$uhZ*_d-
zRfQtu+us82(|@#PVdJh|BU&6nes{YSpLcXkjl$k9Lu;PaEqZY8fw7m5&+#c6rNnA9
z=c3=yTiv^lP=zemj9{xu*;KiH@Kr;D6oZ=&xLuriY}iiJ?kZgmL@z>OU6`G%#3ICD
z4T@aa=jTqR_4;8Eoe(*Pg#v-xYt{w?1AE|pqpx$xSZ6h(z{lQ>0)AsFwPxyO@#?^t
zdEsB;|92RQZn?e#=|M<J#BkXCVujSbW{8-y2u;W#wUNwy($X4mg!K97;ln^|;AZ}o
z3@25rc6+27939urB33F`<GRF1&r?T!r-{n8-yiI9>&5fuheI*(dF~UFDyYz#Pv{Q4
zrtNpmJ8E^I<4)}GQqc+k&(T5&lh3E#Xsa*pVErv<|2IE@_g#kQo-!;P44=AVa)*bc
zHMl?&P<b80fT^BhHON)jEtPn1S?KF`KLV((Dk$q_7x<l^f2ffvW6Ro|@|n-`^D82X
zgb{gm$H^Op`2EQ$^z_0*$9qxifzOLfO-I-tT6MTzYbPai-t*EFRwwzg<mmNvf&T{P
z68zd!OU8^+ktKpl9f?0UYH&EA01cvIC8=!6#g%6}6)A81t~2bRjDOaO@_nyu)F)-0
z_-(~d>$w#NxOT0T1=jHvF8aePEEW>Irnpyh)D~2rf@I)@1xME@mi-vCj0Jv9$ichz
z<AA<@U})L-g}oW2RPG#{z|%XFc9ED`Xu$YcwRV*+VI$}Lg7i*ysZ46}@6Vh|rcJI`
zQNe13#}a?<dJFVhr5s%D93bsE+>&xI3ivU2?ghR&E1Ao)LEpmTn`hh5*m%;s|C9|X
zN|Pqb3FO4zPfHzE=oM=1D6Fi_@N6R>1Rea8f+#{@=k3!UzF~WnPFiXF^Q2Vpp?izd
z-)>&s-}}iunP1WF$oRZRDdGy_>;ERNvomFYAW8Nsy27<(Ic~bV{vJ88FJ|DocN!iU
zueuP6mz_U$>E3^4ei;d5@J^wxYUWSJe4m2B#cZOvHYH>ZRK37K9G-yz0cbT}-MP<!
z2%Wa)v5IUhD_8BXfYW3@OZ_TaJToG4zna+oC6Lm6)|@#zojP^iK7Q4c{`n<PB5SM`
zVA;>Wk=$H?7i{(f*qJCEl(s2bSkQuP#k}KpaM^D)+y8ZB8VP-9e67^Q+X=xN^@-R*
zBci=MT-$qK?%A!Ubnuaew_uaWef`KA(d=uYuYW!;{8Z^aRtS9#)vwYfj`92XEiv!r
z6jof@kvqyYN50e^2B;_rCwQiuimcGYNL2+Q|Es$7StSd9YL~6vl95$^OwaCorhaLo
za`QQ%W)mW^$xOQ7j1U2cw@uoFA={h2sd&c7GUnHSE}bHudDsfw3WU_e(cX3n@MQSJ
zd90&no^uSw<H|mv2hb}b?gR02t~WuotxigUK}`8%^Kd4}@;1M{)h^R?*!HqTj*g?B
zX7v#3WIQyom`KO6ynV`=@6HbQU!z~-1t30hsA244fWGmtTG2AX)cY~N2w_2Qh5#uU
z!Yh2<Klt0qAuOldnBeR>XwFxdH2-b;=(q~`wEX!dj!HHef+_DGji;Fo5g4e;!}2vA
zDqz%Hi#YSQGO7MFJ%_JS_Pi&w=BBsKZu;77<)y`lVZkz}8BQl<pCHH|+8Fkw*QXbH
zCmMGYy-kmna=~zqKOi3wSinJq%znpX=j~093aq&-`?itul1BstCnP8ji4+=Vd=0qD
zXoW35V27l4TcOhDN3|BpL)0n-Z&Gy3d`2n~5rMCxYT01*RiUe17;o61VK9O<sJS#A
zeWyXU#iWcTifJBc!@Df}yy_xB^x%Y~&5=|Pzs6677=D<z0Y5f_leYo#t!D#4R>2e0
zHMbjp1!CQM*9~Xd2ev)bWZ>L5d*tvKuC1#Dyt6hqr%or)Jhopl!94L~SBK9=fLV-(
z01OW*!M&jDJhL${6+9G)9)mQ46<3b;D@wrW<<P~~XU~p0)OJ|#H*NdjS~pIoMrIgH
zs?*@skoz*zgVK%s_PIZO@M?aBqxgc>!|K`)$$?K5zVb2+oa@O0$sE}AKsgU0F_HS1
zx|3|0)Ksbi7FQvdF0bm5{ryQ7N3&Kcz3g(Y=kiel#;>>s4cqc&go74in>hBdSla^K
z2}&sJcwc0M@SW!J`V#cL^D;99saMoC?WfU*yk;j$M(piuzI3T!$kAE!Oj}wGI8wZ-
z7knB{`?5lWr-NwCH~9a6BxYj=nJij#`b%$Ni3y+j$Hk~Ua=b44{n<ia%D2zB#Yptt
zeVJq`9lmzqW`fAioga^}^@q7<Q^UbaG2Ky!IR|awd1_2fL^4-(P0Dniue(CgaNkat
zfwnAm>7)tt2TYpO?^oH}uI&zmhMpResNW|fw@P9|ZH)K*ozgySE#t><ji?=ii#ly`
z_?lJ@2^%08sk8-}Z04gDttmmgLU914qU=6?Txqm=n^ayZZM9<K`9$G{rl#4dds||_
z-6Pg*<mmQ3UCnG!m-RtE<A%j=a6guQ4st7Bt+%Y~4%dzJ%;+Z%`$B(3_O#DL9q+_%
zD4&8%TbT-Zxl@ypvU12b@23ahAZEp;t%B8BczLP-h%MAfAX?)(dVJf(%VOwM6=>>&
zNg}uI!qP*W%J#r?L3N%BWB#sV(MWp5snq%;3Aa*KW_k)Gowv7Y(KRGmChxEisv_3b
z)-En}*bku--TGy%WN`F!<G(ECgcUd)qdUNtPO~ES$&-C?1Ivn(8?Cox+vN}HyEp63
z<FbpthCB8syxr+gZRk^u(}+@M_^~9NGrX3Tec}Ly;N4bFzjoN?x%T@9;=NgbN`<74
zm6he2vjx%hrpI7b_j1k#n;B;*w-~h94`G_l>ecAnD4q+W#QXMb(drz)+%xU=Idq?)
zAJMEWq+*icBXfj~hO;3nipeE$urOV^^u&joE5X<RzH6JAoO8hwP1{3nhxK~x927tS
zY&_)n&z?MC>3_l{_@Qopk*#LZrhvVBCDT4zT3MM)qBCmSsZ;Eh(-#KLY9=F#laI(?
z-6a_S`jKH?dy*FL0&R}L<#$6h-TYVeV{f&5yvsj%?I0|QzaRgl3l=Z#zvV5vT3b)5
zo#<`qa!1Gcm&2jw298v%xVq)-P}D?H{fN2s*Z11smlUw?D;4<@nNKNG+WxqM3>h_)
zn=rXAa%=Lb8Pqb>e#IvxAvqo@zIW^7|Fi(wb9Hp=K#*U5mCMZ=X$&`}eAj8wqQeZM
zRQ8NEhE#bkGw~PgBn(itq2Ub-Imt6Y)H7(6+YqtNkXas5InNmU+|l|31=X=*4_J&4
zuzGWijJ5;5OXzchHVEUG-j;rm_Ei>($8Y>>W3y0SAN-B1urNQr_uO}=fm;z7yK&C0
zCp<*PH-c*!%@uL1BshV5f`Ze#MtXf{Hqop_AQ&)Ra%@^r%+kzRByfmJG%rhcG4dFb
zmGf6;y{~D`+TzQBs$mvLm(G8xhu_Rm3jv{_P<2(ycS3P2e|!1*^=d^A@1XWV8Q2<f
z{=$WYYuk|wqdV};nGEZcu6^z0Ir<n!;U0}uIWR~5ZPH<MPP8e~QH$>gLU6j+nqHgP
z+P>kTPzEL8<PChOuAXO_M#l=v(x$^tb{w-m_DUZL3!A>-Q-6d0-)Ur7O5>ri@xjQ*
zHk4W+kw@z08X*G?-nQ)ydK0%FBzUasw?5ZtcJ=xB%_Sh0!o|lY;j;^dv3J;~jVl|W
ztFR@B^jxeGhIGg_+#ZPz;o0#@aTvD59kXY73AbYO1>~lvsHiciyxsQOn(M2ik9*Ar
z>vBof#EL)Mf%5R-`KyTf?0XZ%a+_V3_w9!_F13Dm26e6fx}2HVH^s)TG_7#pWTR=}
z?uttkaj;8`pH_YsX#}%Vwo0ROMBMwXdl{|7RJjIfpCz@Ue4k#@RZ42Zx^>E<N7E1l
zxA9(P<ZHM;?(p4BQ$IhyoD)LZ7zp@YCB0Y&%SxkNV2l~@jh1IDX8IrlsJ#!Z7F|Un
z$&x9v2x^$M6j^Z%$*M&5LmU6n!bF;xY%kk&9RpQwxp=W#&c(4~#>9oI>o9(NysdJq
z*5t_*gSrBkoa6gSYeSkUuJa(uF)22?`P*B51YMH0ghBX(EI47MCI5$5wuo8s*RX1s
z*(41p-eQcngAj11lD0fVTd0d+canTJJ?|xGOHTEe%ybBpMVhq;pAPP9L~8aOQC3wc
zQe#0e&@3KExf*Ta!wyvxBjAzpzdp#zJLnWV)7Lix!SX`U6*P%ZN3Fl>5kz>NO1FP3
zo6~6%l{R>!>Y~YO7ZHGIK6$^dJ7xz{vcId07%_XutzPY?USSfH?SNds&ck(XDP1~B
zpcjk*5x=vsK>bTQs?EBf48K1^W+(=SguH8&7w%Cyx(rfZY={2n>E%_(G=mo}*0-=Y
z@@g@CK$z)vK2riG@}uG1PP(m_69PX)>DM|l2`$;78(~08dj1KWLKh1p^`b?{0P^0v
z5o}}RwU3zE+gAcIrL_rSJe0NTg;jlP<4CA=<SdM9Kz=}Chd_r*rQ`1I)-$kW?;?Wz
zaEfX%D=I8xv(at_pI!Lk1)aeNuV3@lsN5`Bl9AUT^~x3bkkhDwSs}+M9kTzpB61`Y
zfnSkleWs0xI?Wo!i}eD+^z8b}-NR!tttD`va3|E42<X2_agj_=7t;F~5*$3U$A`Cv
zi!Fu`|6$S_?g_Xa5ag80xZ4p1PEfyvn<{bqY0VJ&ze}zt!T$+;b{EFbQiEilmK*MY
zU`siE8sgXN+u1T*hw4bs3zzzC!T_`OKXjIJxo<A5?D9Jj`4wb_21zySCHW<udyFjS
z^XAR*tQC}^2<xZv_V#4cQ>r7^7#;vW2F)Y%n-3nmgoBI&>%@sauv8GOj7^pnvp04B
zX!Vky)sq~*!o$Qw0QOLdOX&^$C&0x<a}d@RU>f-;%lfcgAo!0)L{OsU8MA3+`}L#T
zASn0Qrl+KmPMu3EOpp~g>H)qRJUx*Ete6l^_3N&&CEFo#{CDu@$UfttxvHwG!$U$$
zsjI;^Q!kKFHb?U!5ZqgC@?KIdUAi5j$0EWtPS4Lf#;|^$G{wCsG<|VqNNbY-SQ5if
zxDoQXWte18k<dUVm<H^EEr0s3Q}gw_+}xS#f&>v|xSun&7N0(~ad<AWut0cO#(9A<
z1X@;G0)f_{OTVS6;9*!GE{|RvSlWL3?W3F^L?A#a01N!7A{OVpiE4lIC{@6*i!UzY
z1VSu}wF!Oyt0shVVH~9qGyJA!I>I@_NbYP>&d<)?{UqhO@6Qy{aGZ?6kT@?uH=yvG
zfTt_bK}|t6owFN`u%u+NqGBA2Br|h}q1R%1C$k-J4H}=*wYP-0PoEG9jPE{2VUA1P
z9|X_i1>vZU9^I{bcgCOD(z>)a%f!@_G2R+aU;nTFUR19PF6y;VX%cg6fn8TOZUjy)
zaxS^DyVXdr*BzI;6CG>kk@L?cB`syH0O5nInbu>_Ar*0<r)$NEZR=za`l3XN&+809
zgG0}Bt{y0L=F};)C^T9?G*gy6r0&W@f_uu6y{iqmQKCNP6+;+0NF|zZarm$&L>~N|
zkb6tSP)EnHL9%A58{DsYSM}czj?}eL)wLnoYTNhh!Gk%JfH}eHjy|PeTgm1myCDOD
zWC9~m+U0%mKA&Z0&yrvc9Kp1?DsOvT(6(t;h_@7GRfY|t87LZgUwV2Ql3P|S`L5=|
zyDwiJtv!^CXk#;AJZHh+Aw#BPM$KV_!gyl%6VgRoPT89Vm<~lp&onV<<m^t2N)lSv
zq)%FUO&dMh5z0p*hQJnFtlfqNd_?>xEn4H=W-T5%&FB5wx3>~X1X0zCi*K&1>2o}R
z83z@Jv|gP1Py<)2nKaUZc=4cNwizTEEXlAn{o>hQD1k}*8>&y@!P|9Vl#`tuxz$G7
zO?1x0<$M?BOi;(w4EeMIeuN`O@rUMaPATLJq#V+7hEYSQreP}m+gutJ=@adXT-8%~
z`|ZUUK3CJyw30-(>Did9rR82%$IIbZTjT2b=Tq^-6d|u9C>B~A)sF)wBpsH(^R$`+
z?Vs8+#lU&>SZ)BULKwCwHO8z1qMlf19j8XyZ_Sl607yXV!JASn1xhU!dR)J8gG~`p
ztEd6VM38>J`Sr7BNqJW_G{^Vv-nMmh$gyKL5Y_eezropcp}||IIHg&wsj990@+vLl
z{MkEu!OA~2QQ`a6++0@}-=`=-b%w>$;b#r|Qvdd5XGFZLpjHO+L`2s(?fUe(tuZhi
zzXW<$JB@t*jz@kOMaQ~z>r#gPL2Qfvb@_9ZG>J+5uq$zMdpr5`B7J>kd<%o%Sr*Q_
zozW}q`KaPiC(LgEtMnYCc}r_$Z?WK}1+YAHZ)aj&f_dwm#`^kOmr|TD9e@V^+T5%)
ziTuA9kUHnc<pE55A+~|aR}aO^YpBN-!Cb7RVWn-<dtFo0kfP0|^l^U$DckfJHzEK`
z@$v23aZE*ykfro|Hr$;sI2kcaL@TEqkl*IW(bePn6LG0gIlj;gMEwk(68juRpfI$n
zd=LwTHtIbT5(kJ|b%p+F#%i*>*FDiSqA@-U(`;4Mr_DFz+V*gaX|8NQa|N|4_<AVM
z`@@|vL!37L$DU5mfh-CNQ@1?Pdz_+7M7CHw#*_v2yWw4zF<m-$#@(6D$h@|`hmIUU
zIelgK?ygDQB*Yv`Y%X%YrgIl*Y$h-hSo77|Z!vbu_zxqsWiM8F!R~HwZ6cdI)Ts>8
z?jj8?`$CpdYPcx~*^W#XGR%W|97&i?wU#$Pm#>@dEsyo&mYPDP3$x?QAW%R%xacWA
zjg@`XS9`8NWSRaZw-?Ys0Ks$r&>1-i@q}0;fst`D(kWpw5cd<0JN^Cxa5+Azw+76b
zl}_vW`AWIoz4J3RZA7TespIhiAu`=tAn}R5e!}<Ex>NBY`(V-$NX6MO6f?EC9+@6K
zE%oAsAF+PeQ2RpF_Bs1zZrmYK81R96=g4J1D{hA(0DhC>N-^`4Cs?rvBQ}o#<}gZm
zP*S2ZomW~b%?M}E7J>*c{I{&QkgGskTW@tPHE`z+>DJcf1opt0Gb4*`$#wr@NSd)r
z@#QbRo25WzQNCz7-d)t$`#fBksaPZNw>hD%;=AQAVpsn;$p$B;XH>^H8?0WnN&||T
z9t2%-ID2~{CdFL*?l#iz%(|ydAB5SvFjE*Mk4*zdCH<zqTN<ddX@eawdf|7daSoiZ
zWooAJhdr;B>mSod+<n8;*f<Rj0>I;JZEYG(=;Fr%Mo~fG`5D8ZB(@|1kspGO0N5F$
zU4okhrU_?O(N{QV{0fYO@|b`Tu{n1xmPhniJ$zWj$qI7-+UwqVHa-8$R)(R>eg52K
z#g<$_RmwmM{s^oZ<tlh`m@gKC92G29F=@};w1J(@U@cRJI~zv{<rpLoZwK}-8n1-+
zr=})ymAGryyx>n^dOupZU?{-%?>cbc&(~^GHW)%zclYtzZ&%Seaq?sZSv!Z^tlp3F
zO0TTpR*hLbU?J#o@4z=H(`NaeyvWrsc3F(ID6x^_5C9E7+44-7Ezg7fdTEDqOQtR4
zX5!*YE6@YtTEO=J*!Y7gvI#(Y&H%{eqqr<t?`Rp<e;@z*8UFp8k;G1l$I>z~b(k<y
z9mM-3qNP`bFgXd?$dA@m5GPzz-+uiT%$@u7Q}H_bm*`z^{3@b&pvvNmL$Op>7Zn`r
z-@%a<D7>s(R;-wSO~VD(0q{)xQbsz^<0LE+7>YjuF8|1}$x_)6iTRK!Egx;P>d?<j
zL7sknT8;i$r#%aw$iaLg&;A1s=n^$-njL!eI>_?R+xcdA0PYFwI;;eG_3w{MfiXr|
zpe?{Q#udv6wdoa2{<qX4)(-HGW0XCO$S(+j93RZKJV;f-(h~f1HYVm0rdKQ-W7GK;
z2jG6fD*FP?1W&R!D>`*#A;aerq;J5TayY-Ut4}9>@Tq8f${L~e^zi9ZRZJT~Ls@e7
z%05wb_u48kkQc*Rriqwi1u>HWH7Q-)KpKR2Uc7T$i}S)}Z~Duw@E<deH4yA$QqdKp
zdmKT9^kq4~U9%OZkBiL{OxyM_bq-6ys~hU93=N-wN8oPX##ljQ(p*;y&W(uBi1@JE
zkuo=HTOjWm8wt18{3^L5Q2<0FOnhNcsFw`oMZ6jcyMTTh533hNMQl{;>&@oOS&g-F
zkj8Ln64-BzjU_xaR1>^CI_QjnTC_xv4N{KepGu(+SIjb$Yk@353GT=Basm?tkN|U1
z@~`h<+f44n-cEn>vT?Ssg^0BvyJpU*K~ZSt4`BDiQnj=!<~9U*1YB3pZ^Ir#rm~SV
zRa8Eqnh<~*`fCUZT8DWr4}#=U83)hd^3aTeT(rv-<ImQ)8oUvj?f{eny6?Do)2~l~
zn{XsVH@9h|xt5CFAL=M-8~xS?msH`?vhw+h7x-#wDkyXk_Z>7yKVOy+Ik#qw$u5(#
z{#+V2vR{Yj4%=#FM54A!5eHj)t=|ll=QXVrqxhLss{g*@|Nc`tnv<v^w-nqs`~Uu>
z|BL}TWxve{(r)cm?fAb6)_;Gg9UdTB&>z~c3soE%f2*4R{$2F6-MP+!XIt_X(N=uY
z`M7+s75?4ZKSF`%%@Y3Wuw`y8|CPzx!l|-DK}%~BZb)^g#lsA&lfJ-RR^AF^yy$PW
z^=YoG7q=LW5QE9ou_2{z&=9O6!I7S_an6=@ydsGhcvA_d4x;sLRAD7z1mCNTbA&(3
zC%TTE4jCjXMu*MBxLm>cpzZg=Yd##6Kfj^pt|G}S*JhP*K=T($`Y-va>K(f4gv#H8
z+5f|xo2g>$1SJ;K4ne8B^OBipW)}=d_x;}Z{J*o?f5tsFSi{sN#9-)Mk_7oj%ddl%
zXs<Z*tq$5Qcf=8;{%V~?{xf>;?cpKNgC&Ylf1hnjB2(wzsdrp<&dGFrU5QLTpmm9G
zB{O3$T#$NZq+s#Cx7JbzCtOYvCLzXm16{2^$iF=>^S*7pjzj$>0m4%9;j@3gl(+Gm
zIbCjIO;Ehww}Zdy`w5-4-{;w#=@nB<otU!Sj75u{6GT%jcm91$TjWR<IFTe`2t!vk
zF5S`&@4IXC)9F0o>hlmjmOD+cVf54AkDnC#P<C&iG$JOt_gsV*_gjMEQC1*zrvL99
zClar4<2>g1cM-pxG<%D4LVWzM8Q(rn8MDX9{ZC7=c2YOldwY6y7#()Ceaf;USG9Yq
zk2l_)*I#{6(D<-dP6liD-CL^`X5-Ok!O0unwsrdCbi2KyPSBpSqeh=Cto;7q)#IX}
z;?6Rfx3;|TdkT^9Q!~?6dEc|+2alaHt8Z#D)u1!&$0OyWhdnxo{3<yt9_f8P!#ov{
zDAa|$i|OS~>5~{WlJA8K?&5#?tku<XXqSj3oS}BBXT?}z<-?I_e@4_T+@s(n<PEOM
z8)QW@FPS{1Dk3skwFGa>;%HxMX~PuPN*uG#MEeQ@a&MiqTfG`9P4nX8oUTaKUQHFL
z%tsCzD2)UQI(z>o6;bd_g7-*yd5O>cJNWCK6#k--8K_u3z$o5~-0X64XnO?h$*HOR
zw2|h`_C7a76grc?(@*=X*=UBcP7!`e)HjXMPvumFw0Gh0LEL@F9D&QYy6P7jnZNDq
z-+OM_N|oa+4;jTG^>-ADZUxASGhJH(V|zNrirwe8qfwrztm1pDW6R&NGqcyz0Y~Gu
zU<w<BFVrWdMR0XjXsDcO|ERD1&)TG$=J948O`?lxfDKa(6i=hD_HUDk%{%K%H{X)A
zy+tz{V*lQg(9LlM#33y`Y|4W8gPX>B^1wYpL^CsK<Y_F<2{IGDJZu>VL_lrY+zS2a
zMjHl+WcmNO%zl-)L{j|ZiGH!WXqYe`lVX^Jn3BlHFJH#u?;d^a?<Cz(y^+{2I%n2P
z8y0ZkhA@-aNkxn(65qRQ|Cl9fk0E_J4Nd2qfd!^qAD>Z<v<SBr-TbW(z)X~g>Au&w
zQ<a0nhRb%d;eIf&RpbZW3tq$2v&A|H53X7z@`wB@^!|?KnJWwe!~E6yii0sv!hW@q
z`qXLDkQEIN5axI^E?F)brG-bYdrSRtu@1$yfs@v%@RfY}CSsL8TtPusqJh~fK8%~=
z#c5|W<xF{WAL30|PBR|=a)8VUIo44$tdlS*!~f(-^90YyQJ?yrenK2R90UiSHcvF{
z0PU@#<OHAWSMtJl8x_LVq7_mMaP#nhd)g-4mj#82!!l#&8>7ge%0;xDz>ADLrkfaL
z1E_Zd|7>Razl&tlEDAmqm6ZwsFCoAnEbRn8e_<FILtaJ&jKaAdsT%)~AM-!ijN>d4
znXY1{jU~@NJUW{@@rXAYUAZ?GQiAreP>lP3Kf^EgU`WV_#Yv0;J39XdxPez7h76hR
zkULDQvuxS0PBtP19n2hHHv*-Bjze+6{crIFAW$j*ii-n~yHN$e1;T!0`(=5gZ(zK2
zbtUTJdmO*K2r<Jwc9Epfy)a?q$Oi=lO*~FCYnK_~AiwPI#F0=H*UTSr4AYYyPAgLN
z^>+R?JRHi4QPNcLR|*4r-w9VYvlsLZe$0lUb>!5>8J&hjG4d5Z)6hER9o=)*c>J`3
zXjQT|b@E3ZJHfqiK9VBYy?-aR&zB9-n}~CP{U*K+Y%c5;jP}<Ea?`b^SQB}-Z_nB=
z{O?21hGZoZk<nIjepxTf*y4EwNUuPIMh>98i%5#C;3J-DzTl-m+NCYQcxPeVu}%Ed
zMpya?1iOE4p+$kCsGoLsIt|c(a~BtF`Y7rjW$K~yow71N^cRlmWh;b`Y_tliI*8wU
z4<1O0dC4y@0WKEiUoiUh7h#j~pXQV)0PgG9GV|;%8u8NOQKB#o$|~^<>gHw3qCe?~
zL~D-!@$2CoEgaN)a%k^iXO0XIMvwAe*mcWdSaFDh#Q_&nQoz6CnS#Z~zLd-(w8n*A
zQU+6uGUk={la*Br5R`Y!4nZa$yvGHou(fCmhaVT;W5qLt#6NJ;alrw&iRuq7NIw|w
z!3cF3T@}7`8Sxq$pWfPd+4BT0Qe+jbT!p|=P%ZcY^wuUxs}m-XFx!#O9wQHrMn?Fq
zhbFyhB@7ru&-|DHLVr%651r&#Sj7RLy^B;D+l)E9E!ow)O&Bp5VRS{5ru!Xq?)+na
z{b$L}&rk#*tHEOMGo+%7&oF*qW&^Ikkh_Z|4n{<jkmQs2@{|_`Lpc!`E#lt@lXi*k
z!s_IY=LxMLAo@UQ?t_^h(H%Y9-Lc#WBEym%K6UD5>Vki7i9F5pTq?^N=?hbPL|(_g
zxu8}IJ>vrJ<wh(D94wR$Tat*K)xzi)_RI~>TC^&|d9Hi$@*6O4AUQi>3EO_~eN3C|
z--aA}f#$*EWK_V#<YZwY7#lEnM$|%Kn4eN9dYqUGqUe|XyYJXo=4(-m25-#LMeRkq
zK01}5zR5%)slAIn-T@N@JI~mQrovrmODuPCf<-Dhw<w{Tm}#{6WGnFX#WA8#cS?c6
zfKMpaKxxWw6Z>~(bjRh{|DFaerSxxIm#)D0{DOI61lLl31S9My8pR~Vg!MA7cR_@(
zM@-`SR7!2YDJg?acZGl!hNy*(oW#g8cCdG*U=qjjRSGalc+P$h8tY;h#3>q84VAs+
z&##TxXB5wRlnHr_Q|IVsey*h{btGU*Y;5dywl~sXtEB(<aO~fxjhvjd6kMRb!Wccq
zXU_|;ChK=(z*)2Se0HkWz6t)l(W0$JpZ0H}4rLuC!Bmq&e=-t1Qek|HFv7^^>s*QP
ztZr%zjc3(3RDS%K)*mAs66!$dRmnew{%P5ne~-<2Q5sTwkh)_b+A36ocB_?s67-Un
z-|Y-*FTN-Ie5xxcje+n)X9=~0{L_0)G8lx%(&_QvhC5#D%w&oKhyM#@Mvd`i=SU^1
zn|;LhAWm_k%W!-?TKEP7nmMYNabuDpq}l8Mww=gh+MgL+M;~@XbVQciPn-CF8HHhl
z+U_pxc#;d;ko!XX0VUPYLNL%5;`4H!!@kV+!$^>!Stq51X;+h@)>0(k{f;u_j6y1c
z8El|1mYKNqg_-51_o2^ifVJ21|1JSzOFW0O?U*69_Eif<Z5W}k+r3AR99iOjw>nTC
z`l_DQS!p}XUz_BSneEqLJgD_`6*J@LCLB$ox$=~LqUer!%&Ys6W(as;;9|bx)xSZP
z{j!|ENS6O`)-AG!?xnP9G1n(DG*n(V>RvJX(UeIs#W5<|cJ7?R+v(9+u=X)Eu^nB$
z_kUUdlPzrx59nCNL{a~=N%sEE(S>_=?PBT_z`LKe*;ylD02DJCy<3&IRZP1U<3UFT
zK~~F1VG~RoF-u*M{TI{)zT+r^>7=@=z3YVE?=(7!*!44K#Xon<uw{Y_q|b6Owo4_b
znaN@-@5<fU3**7BagscG%<?7<Eso85XwXSCYK<AE@Yv~(>5<B0Jg$9=Ct7B9Zz=`*
zwgleYqoXjJtQ5gM&zoV0uZgMWILAFqEh7M&J^PPa#_{;*F`!w+@-k*7)@w(LPFp~Y
zGT6uC#KM<wR;1WI-rm3Jb~A0QK^T_#en^m>Y3kY~jJqhPMlK77_hjNjVZVgB4P{Ue
z6|O*OF!AHMBchqrmr;x3n+10xAx3qAFZ}?lx6kzu9XG@&gSauBv50h7Nr-8PUj^F7
zCAc_EBvLRgzv3DwjX>x3*8;<_ORk?vhkE|Sk&X1Eo4p4=mqrN+GyYTpA*#bsn<)K^
z$DW9aLfUN=Qw&XE1b#CRKxxJ!x^8HKcZaA_(dzm(oTWu<_)g+~bK{remxb+2=qJTh
zeOS%DzAMa%#I}H)u(=CtkQ#j;S$}xbF}Wv&({SeU7V4w5h~f_(T+S##S|MZgdI)E%
zmLQJ!YloKb=rN@j0$>Unb`R5bqde(8Qs)v;b647f|BKFB7BHALjWkTbJmxC*3XOYw
zhTm@-@|`t^nWGQaa06o=?wQ3;Dufj~3wF~Wo^`IJhj}UmhBKJz8~bXR0OS~SCs+Vg
z(o_EtG&Y`gc#^vKG*M`K!VO=8(@_P*-wU7O&EieGyjp}&j)RiP#*vZF(bWy74uaVw
ze|yT4yLV?>_L)Q}31rmiQ;U!l&&(sj{bW=?fHYX>_`kEGUi&luuzcrG%6lf>@#YB}
ztPI8IJ5W;8ZTR%*TM#5N)Xa2kWi`Ww1u(t{C1Y_O_hPX;#Z?AAsP*HFKi)(amfw5t
zZbFu<bSN^?d0c;C3c;&4iSti)ladmq#-g>aT(!Lda)vkhgK8tPio?_Jmt>;YLI#cF
zy7<ajG(V0tEf{R_m1!BJcQW>(p&P&uGc|Vu#R6!NronM+vy6<xiWe51X=-k+T)vB&
z6YVMHz@{}`K7dTo(Z(i{;kn=+BZ(AjEUA;dS|rERJKLn88qSL$;R+qE7CMOLpM15*
zYoFdqgyokD9zS-%;fQx1e5{Aas8MDM!(k!!7```9&B2HRQu_o$CZf-hRxXEd2O{KP
zCGfhKa0J*XW8l(?aqnv>WeGE?Su<fjLlVssTtGK&Zf@izOMR*p(i%je9f5(buemdg
z>=oU*Ax;Gws&bbD@O8hxy~sACer>j<LXWBeGLf?7lxm^9Oe3!0OLjg^xYOvf#7<6|
zDt?Oi!_--1B1b?>-3;I`1SzQDiQ_0ZZa^7EaEjr*xwb&abA#@AiRN#^XaJpR|DgMn
z0Vz5uZ1fB4CWD4{29u_yj}nPG8Ot+~0+zG4oZL_SGiId3#LZ{xAHhu^UXq;tCNHnS
za)AbcWDYTAVpRTF;}K9F+YWrRlG!}9=-k_PY37}VKD#=)#p}YN+Yi<ycAK8r|H5-2
z1W^ifPIz8JD$GE^i&fVxNA=|~9%pp+?PU*tIbJ@=FCm`b%BbDKlL{YR_4#1Yo;lnb
zP=b(*`Lgt1L(7mGd(yNM&G9C4$7?q!y>b4f(|C04-@BKF5R@2@fn?H;Mm+ib<niML
zYbt8iU+0$@;wED~S9p-JE67?1b_WIUJ!ACfJrCSPqc(v|rH2g3q$b2cFe9z({{1+B
zDpv*RON*W9+JQ~uB|=>Y+K&dm6S_*lSpN)14aXD=6INdh9Ten}(9`nDBSq1LO0()p
z*>RAV@52}V0Qzw3{n0-Iwbaa-?KHHEKM$&#USQ2g@ktyJJZu1$GO?<@!6xDV@4@za
zb`=FB1k`et7*A#iGgwwn?$?`o+AqpeOF0wqIfcuZf078z)P!LwD*COlR`7FhFY#*b
z)V;r2{Fylgi#rBDtf?RbrEuL@k;0(BnZ@gP*q9|?TW*nPPD@<ym&gvI?h>vU;`Xl+
z`{VuH&%{v|m)GcU`9F+%$>|{iM5p(eZ{SP(4>@4FLbLhDpPx_fCon-)(^f)>H(}}u
zsx|MPnN99u^eq(C51n?1zF70F#P_a0oEa2@N`Mcgu=COkVVbq3A_9}EY`g&Dx-Y<l
z79HpQ{pPklUS15rLO5gZZbQ52ntwXO(=YgT2wvp?%=4tdSoX)v6Br^ZknyG_Cc>@K
zMozXDh5X^!h(gigzD#GzbFlTP7F60C(HvT~<PI~}EZSC*irQl{lfaKxhpzUOO=&5c
zyrI+3FEsX?cg@4wakcNbs^savk2)=K<8{5Wk{QG<xMtqz!PU{%D$>kB%+Gwf&Bsrj
z&k2S^nn?(jI$%W7jmk7_9BGb3NzKedm}4?zAevHh_8fg9*$cmZKW7%-n~K}OfujQ+
zqA+D%hf4*3Qe)#wJZ<&~SKL?I;i?t&uUCp#4!Cwzk`)fOQP~{Au~X}S*VO_}1(_S^
z1N@=!39n1V2-!-Ar9zzj;<s3~->6bL_?G-RL&N|)ALF(2Z^6@#se&-7l721ZaRsnF
z8%&7rv3%{pe_W~P{n+v28&E3F?=uPQJ-g!n6|$%uZDv$5iz$<DyyE+FgZLifj6%Pt
za*c~a8HwbYeMrIk#VxoYyefqZ>8p<~36Gt92T|ylE3N{@6pb28CV?%L$FXbF+b11+
z`eXms#zvEfYm=icfEv(8WDSB`7tQQ?1uR(^E=Q!H4Uu-_ARz%3^``Y0Z<@PU40YeZ
zKB?3~X_Qb@%K?E|=X1xap#dU)ldXSg0amUFR?v8zger0{ZW4M&zl_5ajD4YG@Cv54
zh`n@lop7Fx>Pi`k7$GP_B*ko@=%QLk50NNXWy+MF$PV;kF`H;61bOc_2X;_8^U27>
z6NhDM(!0HA{)E3|4v4E0<u;z*=+O+RTuCI(*?1IQFaI7!dsxn=rlyYl5XldUPQet^
zz;6UdvsI`N3q*t{+HUuO1C!|Bi*;wiqJ%OW!t-LJDsf+`Yu5(Mst!wwjPi3c|5Clt
z=V=s!DvHd%ryj0PedovT)}%a#niq))YVIA{w}))<Iy8_UGg4GgROE)g19q(vzj0+f
z2C4-MiFtGYOf&~p2qzfr4*ZYfu~4EkbaH=eaOM!r*XDK15=c0Lz=Y2zg%M^MM_fbE
zz)YxxnRg?jqU6*ZqSf5#n6r%04qTBV<ipXsI2YXhPUQSwQqPg=Z-N{E)zG75;~1BQ
zS*Mft{uh8+&>jOAV1!vdVTYte!}|TDkC-~RfWY_n{`ghg)*t@&JfByu=PXUWbV=#o
z^XwLwZRhwVJ+0Vz40!~pAr(VA;SG+mXZx&F8%QR>r8k)+Vje>dmsBK7!n2GwQLyaV
zPL%a`4mDRDRtu(KX<9^F1BeU5u`};d)(7H-3K#{`Puqt3!ZxUnWQ&7NJgaiW;(H(<
zoY({&g)Q}sjD|TwS<A*@=7c)sSN80IL2(cjJW|pijN>n}WcKv<?+)vi{#!C^xyh4T
zIhlV*HPzSW{xW3uqF>#s1r8JWx3^03sI+#?Pzb1RZl1>ARp!h7eSs=oa4Faz2kE^-
zZ-Gv&X%Ke);ItRD%|u4}MGx^jjS3wErwhJlGnGr8^TNNlB<ueD51V?<ip?ubw6<7N
z0j~hTyg1RkpC2;}MIyhjhzO<;zQ!m*e2?`bV6wmWXt`437>j!?C1btVY`aJ63ZFi$
zV^lLT+RvbH(4epphim^^HKMi*+9s%7j52s7G@>aeR8GM%I{Vo(!+$5$imW~Vom3aP
zLK-0PlE{N%DBJSW0NRaJH)i^D+xYU&#mOTlPHf7a%?LsAX%;EP;&{l4^Zb~$&VN5P
zHJQsjz1wL*I728S1WY;(OP$lZ8R48uC7q1y-vV8Hp7PuaYBlInN=oQ3DqsY~LE)L+
zGU1>UOrSe&=P2tTxQwl%jAW5i)P+ySj#LGdSTtkz{}*Sx#AM(U0_XQBvYQY^L@!%z
zmH2|>?f>EH%)@d_!~XvaW;E6!OZFN=C0j+P)FdQZk}M%hNm-)MB9&1l>x8mPB1wp{
zYqKXyilmTGl4wzBLH$10^YobB_xK%ee>jGDx}W>L?&~_2@A*Byr-)NV0C*H@2}3@*
z@33L+;Qb~6xGUHZbHuX&yd65Uj#eg+3c!ByjghHoa9AM)&5X`;`<$IY@WT;Ia+QMo
z{6dSVXnR=R#Aia6tS3wO()~S?t9Uf&Gg?qfkv(A0d^B#vWGKZjJP_s~XgI%qOdori
zwph1wD-Q6W0}o{;rbP?Oj<-%*hHn;2=^%e^%E72#K-A~Lly_<VEV$?bdwyW}rl=={
zv(7J`51Zq`6fC>1_B%E%MGcVNP9|tIj3AN0<5DL*jFZCjW-ZoTo)ZUeuJYa}rwdnE
z0nWQ;{M?8q_skU}>Ix0^GgKtV2Ms(d9pCmCvFZaZuBMIas#OI2M<zwIY}INhU<BBe
z>`+*o6ofOz^D3Lbza{w^C0)_H67GeVk+(;l4JeT6dY<Z2cl|ZcB_ROBl2?lD*-%50
zNb;z*TI|0}Kw_s2v4hP?%H{Z0bIZHztgH^MlX#3!Wh`?vryq$B=D*`qFs@SjlJuGd
zeE{>G14s_=<@^<yf$7<$OEv>MsJsdT<I!NUC0`IiyL0PS-cX_WexPK~X=`Mb552fW
zhxoKeE1CCGzgOWIFQS31+%xm3q!4*-77@NZHi5^&zfz-|+=FqalxUt7RgwjGF|XYI
z&t?*J`9W{j_y6?fL^857r#=M)IUUU|Ra2}r>`VG+q`oi771Z(#)L-T_3yK8(v)}|A
zn-we0&W(1?JaY&WglW<0)?mmi!t7~hfhak2rLYY{50rOD@jG01<?0c0AOV1@ZW*r0
zTK1X(hZjT%__UW_HOVkz0;iFz<EIpGcd*{(>2`r2rbw}@-~@9_iHR#c*MVOX^&IQn
zOmbg-)Pwp6R{o@eygY(|ALS?8w)p@1_uEU+-zIMF_&+v^asm|T4cGZLLdiqH!IgQc
zSO?||K|Cb2XU|NtHj$j|))2fHYrtm1&B05W&}S;`tqC{jT?y*59C$u4F)==V-QWV@
z8a6)#nR)Z>T{-GOvdNqDS0w{=V-Z(jRp52PMc}X?lGiJB3ics>ZcjFiqGG6JB+uuo
zE%!$1e-NT$+xNV<MFjM)DuJoum0!PFOEXCP2nVV9i7@N_C!l_C+7(T_Y6~Ms7I%tp
zLUJ4Jq#}wKxUD)8OG4581)|@DRHqx;GjeKQhNol7LQhGnqWnh6aX^Efj5T+BOOr@F
zDH`XG(Q1!F*QeiFhRiz&=4Po!D*YQ*(YaeUEx%Gm?`_+*+Qnt3FrJcjlpF3W*6q?t
zFwzSm{UF&Ueo5&kbAAA@y9r@Z+BKZ_BsHoc{U*-db#E1LKP5-6e>~jX)hEtAGzmOL
zr=uSiH2%E`7?~Ytdv(<~g)(rKcxJUqVSM8lN=e+-ZLAB^ukqcJdss$g5Kj{@;Q$!{
z%Nta0+HfW$TgoYIfHL))_>y}1oCGgIT>90?2+iA1k9YzLCE9(VSWur5MwT2Nx@^B<
z7)}&E4}p->o&_nhx8cSA6Vt1hulXXJt)<iD|2(bvK>4GkgXZAz5C`Rlm_i2SR2hM1
z!%y!oja!U+z>TRYFQ>~F$qOcc=3&mXgpZY&tHowP4_+zVpcDH{4LM5k)s{YKj2K28
z34pZQbP3(W=r9SqB^cnUk|vVd8ycKaQvJ{1kVebRV*9+`H0Ed|Lu#ebD8moV%{o1x
z?mS<0b_GEws0c+HKsk<z)Z&CHUxr?X2_|$R$pXI*F*ugCn5of`1W#4P6b9#fa5hBi
zmK(dYB(s>f2Sh@vqUM*-VbV%5m#!WUNY40A5irs^iGYXOURoz<2Vg&8$JmWBW3Kg>
zXdDGBb-xpHu6?Cf9Njyq88UVRgNj>tw+#z1sIveK3LuL|&y8-|rp?!?s)0e_%^xg^
z{pX*%tgD|Qa^e7nqgJda-7>kQBt~v_)ldANL4lJZx2nDhPhVA5#(3n7iZ>SPQZJe#
zd*{}aPK3AYvW*-8@rC=Y=S}=uKwL~Ks^m1&FyvM2mX+w^V{B|(JU-YQMCSzL>+I*x
z4XO@GdMPy+NZ*1Ta{LRGUD^izH~#h01K6jsPoZV2`zf?;{Ud*mt+W7atiqUEXAyI~
zV;RtG4>5rL&`D8I5$n;e-P^*#no~MHU$Y$G6(+}u0jKpfsXp`%*sAMFl8qbUqfkYp
zDE3b16TayhurvWF{w^cq0^lNf3n(L044GrFPa<_Drr(GBvXsmHty_k$D!GLaZ-5Bx
zbh}Xb<-d1|7vj8l@d?}l-2uPs=}L@>!TM3|4bsl5BpJM_XwuYpu-wd8B+K$Zj3?wc
z5WcLXkKB$y;FN96rzdudIjZsggm@{d`6RqmZwS|_w}7&l>DyH1EOz6op&4OIfpd5b
z{ZrGr3~^e;(B)y$X|-gNK11%ob_cBskB9@cPX_A%^KRK!SE6j#a7-nm`w@>qS}|{5
zMbU?P87Ui`WCVV}eU?LC(S+*oU^qdJg(hW~el0hk?wn+&O?Gxq*mTMGmG2*@kh~A-
z{I%ru;fU4mp+P0ATN^)DOt&z4{o?!k1I{C<2SrS#N#Y?5BKVaKE{i4VT^js~Wb-s4
zI%$s6XO{-)(d+q;@-av=yJbFlbViz?hBiYOq=LN(JU;6*dP8CR`D%%Vs521)kPQO{
zfVvuam>o?!k8nwJCPwonEeu&%xH7<!`p;mdUxig;4loCQ^K*$sfZQ&c?UHWHT`z7C
zNi0pc$wy%nEpMMm)Jw_NRWL__n$fXR3mC5Dhk(Ne##T!=rEfR_vj5)%1eJ^*qQJaw
z-^`@p`l~*ib;&npyzGrOEhYY&8myG@I02vJB`XnPcJEF%<-w9c#F=0h8WU&x`1t7Q
zU0U#{W;*jN=aQ<4;u0>#IO{xb93q;6Dp?-IEoQV!O@*YcpT7QDs$R0d9bdcldX^@7
zY0&WVBWxw=`{WNCWXh2yoxd{iCGOzB!}nfeDXQ?D_?<WpS1`~8+xHjUY-{uq1cFjK
z<uiMG7C}9VvYQpC90<Vgf>BZT%*I)^5Ap_%9GQcK+IELERQ9^}!oW&112lz2TS8yd
zjcv^({(s9KTO*K8rnk3#=MWNmu)p8yKe&GV2$`~Z`%63=_@CyZKtLDF4lE^#!3@h@
zMA3aqISe~V%EiG8?|3m>*(3nVOxN5=D^2O4@J$rR0fsfc@|g`WVyfOKHXXQfgedzj
zA0%;KDc^PGhovTw$lhLiALI_wh&OMJ030-J3YLO#-!j0G5l{G;<?T>$qG}cY<LiqG
z6INmFY}7t!!UjX8%?pM_*_ZnRMKK?;O)|x=5o<nGtLZ>$7|4J|hz$N6ewVb6@@n{m
zZ+d^C5;A7i9;UdLbF~!oa+YQ<sO=oJj%qph4z3)A$qomHdGm6?!2uX70-X7Rd5#Yj
zx$<umK>ZZ!zZV!8)qi)DJ^J5WXcwcDvL&^gBR62i*`({&-`tL9;%m}?UPwYGT*2f~
z{Q?mJ3;;hQ0(WpIAU?xUL*oJ4dGqV*DylbKvEhfSY-Y|}S9-lUK<C>>P_vTCvFeYS
z_w)iAo*qpUa2Kdew)0w~+`nJMs0n}V3_SSv!}Z@I$Q}K)yGr7E$t{gN!Y2PGmf`VC
zkLkL`OgXgePBNB4PRjeQJ|$wj8JBroa8ZcQfZc)5nXxDhDkaLIKSUJaR+<pL!UxzY
z%xyt4--1yMCO^qikk>&`&D*<Ce+3T3#zDT4dSQ?hs$cz*^9IIOq+=})kL&}-*1#YR
zJC(Yh6g6pqkb4FGG6~?VP(`(srdhcvB<iavQu~iwMq~-&YZj@e$zc^q3wdJf>u)a2
ztVqWA`H6-V`v59@{`j%BfIjP&krqcx{#vffc|?WzJ&cjH+w)hm$F&}^WnuRFDH1ep
z7x7Eq!EB$<TO_j?09jiWyvN+rj8gsWTc_K35(`E7&h90Pnj@s4`htZE%j1_2w=}?F
z()#Er>nMN4F-NCFXLkDj8Sqwz<VFZvX7?1|@W7)qcYSnp2_d?_A|au*(`EkI*l{IU
z4BlYx!}n_YZKE;->yg`?x_n9#<H7Rm+&4}X9i%lb0-wFqZb}BxnZjU<LzCQCLjh<O
zT|?X58=6P3<}}YYaRYl}^U2lNk(}N84;}<{{mpnVd@=|rD_5^(Y;p|9f2r;tW47)!
z@<~t(19!wP$wGYhq3~0>YTKFZNbujVVH8Oc43qf_7w%fSr6f9}?AK7ObFr~BA+KJ!
zGLj34luZtgN<tv37Km0s$dIc(h(U6b4v!=cnl@t>L;J+zQB}=ctm{9-;V*J>7rqGx
zMS+AGS?Z%l10K0Gw=kg`D@5dp0@250LugJva}cby)Q1k3mnWz7i_M~=!v}Z;uuNts
z4GvI*VQ}Th*Q0RJ1nQ8{X(mHS9a231L4Ge%bZ&d)N>GcH5c*fGI?sRbSCFL(ZTek>
zwA)KE&h#&<3p^R*i+hG;AiOLJ&tXAR6~`1ncS}uMh0xw`rAe+U%gaSc5HRZ`S^QGx
zi48|XlA24DgM<lnCLRt5j**eK3znuIyNB7|ujgF%cB<i_dv>#~u8K@sj0(Tgl*CTH
z>7%1EYQKG>xi$f^3Uxif|5^nKG~!S(r_m$;$lV9SAx%;wspuRNs1?|R5#Xg7eilj4
zfH}1<oD(&S1~pCE#o48tHUy2r1t;F5%dlN+jo|Tc1Z?A!;3B?;ibIJwg@HE~e;XpH
zRsOoZt_sV@9E+U=fiy1AlIoOs=JVUPH)8hq`kPIj3_4UtObq-f#>E+oMRlKQl@YNi
zxzv5L=CFmz2rVb=*Bz%IN*_RT9m}VR?8kSfBR~U~ETd;#L;B8iydZ95t%nD7Zc2tz
zp6Pt}ML7aol<iGT9vqF?-31<YhsPWhb!kBK*Vx9e`|^-eGBEF-p5C1e+*cf#kpJcl
zzH2L+tz*hk6NT8UZc0jn$$PlS`{MJlu}d&e6j?!Ei=IY~I`r#VJEC#~xP|sL5DP^N
zmnsY(MSS|;!&#zs?|wNuf%JD7p(hL`>nKL$nLz-RqBD}-FL1C}J_2sns>QndVV%)J
zMzni}*oKyp1qKoqiu6p_BBXZXTY(cm#jgB=i86#l0vZtJZY#Io?y7`^f`Y0#={aE)
zOfOMb88|GJvx_eL*Sz*0R*iT?>~71Hc%X<*2fI;xWAg)7!h`w9$5MI_4A3v|{aw#`
zMwAB~XziQN7vi!>)7qJAWh^HKNw#sc=K%T8{3IA1uig>f-|6ZcNA61rE2wiT*u%Uf
zQ8X4?0b}Lr_Vq*BLJ%%+oPIB><iWOYr*!yokVBP=4+5`)Kz5}L2ffnuU<gyOXyKsr
zlJ9*t9wIUdUXJ|skvq*Sexp%)1vMS~JWah9V?;rT4j*oA*UNblEmJ%#X}P~*PEHOK
z1h0g{{$l57CoLU{(uOm%B(Ry39#pd+a2_LEGI-D;=?Mstb5=|~NGF4d<6`dKyXVO2
zz#*L;mEm70FB3^hzatz>JI#KKk@Bw0$f*ug=>fyMj>pm&*8_=-o;{=EmOeX`b!uiT
zTXTAKjU;FeUr5MJ3HlDGXpkZFin_$Q%7H!Xeh)QcCBvaA(dXiHL5u_CVC<H{6@l;A
zSQzFlTen)xwT`s3hfRlfJ?_>rG?&yPlhzjSJ>G!&S{fwL=xnhh|C32nnK&o-#wIW|
z)K2EKPzB9;j31_##t=mV-w3MSny{-QbHETE?j8J&B9fK!F9!Wkgolp&7T12oRzm01
z8Ah*>KZn0>VsR(_Tk$pSQ0ix=##7_*y)Ak%S@ocgkS{#nZPR1JGaS*RvSX4CATAI%
z*aXqxl-+T!uDCi7sE~x%s+Y$$1e%hN*R0T;?cHqx+7lxZe(#4i#XnI56ItraSjf4P
z@$ZMd!(gpJ?SQ`*Oym2-tpNci=+;+V)O6l@T+wc=nc5sexP+>v<m}9{cn;zWF(~LS
zIBf2)e*6_llo0tkMbjV-fSYedE!eBzkQ>uu{i(zEz@UKDghR|TkEi#U(KT;bdlMmI
zPR%@_>`vE#!}>Pl$`XS_4%iuLM8hXNU98KcBMFW<LoPNK#f{I6ze-3D`)D_+j~zRH
zB~n)(h##wkomS@SF7eMt-xyvOo%6~jgfkSI&Y-0wWy6uMA}2@3SARcbK-ZC+Hkb<D
zMloCZ;i6c@FdiMffPtr)-)fpfxdi!;bIz|vs`{CSiv{d^*z1d0`~OUJ6la?Qcv#yw
zDnr1Ag_)Y8ZNlwsPR|;`X*anSNV_4m+M{W3J!4|%nY~9TXPUZBQ{yw(PedabJY}PR
z+b$<~e7voxMZny(pD);Y*Nm3Z7QqvzNMkPJzeUgAKJC$2J+$qTsle-Y+4j;5S{b&O
z|5Gp^Pnc5bc7|0;<<U^-!83E?XT^K2wttbGEhxrUqMmEAf^P~7A-QcCupw)yfcm6~
z-Pv>JHU$KHfDoP*-(50(cSuMbCP!=+1*iebbh}WgRM%JbjhTlP0l+s=ATuB&K6|+n
zFI?*}TsNq^>h^0fTI5xG4m3AbLGwNia6#h*Hn9?j=(|_B9F<9Oy$VZ&_Z$?qj9BQY
z)9NyZ&QxE?E&T*j5j#Rd0RJeNH=MKBymgoJ<VC7}ga&j&ve^Y?^r|7EvP2Z1#O+N8
z2P=v)Cre?Q(98X)iNkWHk_~r@kh}nw+h1SFR~zXad#FABiYDQf;zPMf>r)5+F5h}V
z*5Xzp4tr|~CUwr)`C`%%VZOyz*g6Qxogy1mc=P6sm{kn*`hJ^VLzTM{d4MkXDRRFr
zU<66Y^u{Y+P)H)U0ITs+6owb249<p@3C5Ek#a|Kdkxl2dJ={>9nTA?r!}w+^6U4G0
z<N`2l`+x|JrxpDf?hoVCLX~n)EX7xm5G(syYJknr1qug0E2{>}f(4h+uGOunEsi)e
zVDR863QDLIdwj7YSDF#X4p|4^?yX1S!hvrbeR+5MB()S}8BFsTtxbdH-)MI7l4SEP
z+ywTOAb5b^b37@Igu`N?iIfT)7}J^R4%8>GYa%h@hS{}4!aYSB0~Hde!bvdzisuLn
zO#-l>abL5S5ay?@8u4?bM-tRp6yL`sue9x9T;}TLW(y+~>_|}%dSLzF2-Vl|9j>Tc
zshZ-SakHXT1UTkp0-1GwCnp*o>CU*YzfV`+1>tFn(H#%<>I!%lPyO(-&Y?4w2^LbW
zClE$Q9>klpS!#|Tyt%l#vQWPMwQ$D;Y^ZvR^T$A{-@~`Il>Dkh0<EkZgbqz^?h2;D
zu@DVOZWQ!o(Lq3=smr!Scn_dp+=;LM2-uP^`Pr-_&~!A?GB+)$eGT1V(jW6(;HKLc
z&7D<8D++Y{z{OBxuxjm0P?%tyM7=Zo4*rl?V?lqq;BrS-ipqP(#n2x~pgNlP`TL9Z
zh$*;b097qNQU292+`sXHjA0?M*f08A@zN#%kY7NwMYl^jChQFMldcGe>;Q{k_Cbdf
zj5SJg)|T|2an@KNjXDn)8oea4WO{+UZkI~Wc*QUxQ+DY2OP8Rf`Ho%-AZ=msm<ZNS
z5oi#_NY}p}rNi~Tve=bPAb$MwfQ(UcrdBWd5U{XRuGuv63V~^WeyQ(>A-^FZIk;B7
zENB%jjChS+f?>miGKl|o>2|{D5U1|hyI0+Bui@H@R2Id_5$OpDLhIi)D5{YwXlb45
zWg9fD)4D;jFArTY;qXX9(d#pqnxRNJwl@`VZkEGgtN@6O*37U|fxpnEMk<RQO3G0U
z7_c?z;|I!e6Xi=-_ijesvlT>pI1EwQ@27FAVzwbf;93ePEnQmt+`(;#I!KJ#i@PUy
zo68HV9*9-^cVw-Z0#9}hkqKy2L5m4`QECoT3}cx^1Ci81_%_3iq}+j#(K6<0Z;5hK
zz+-fF?e(h`esrERC1JLF=dK_=7Ad2@B1ES-AR~gH?}IBlN&Pz{1lZe~&K$})Vnt2)
zUJ!krn2d_x%<hfo1ep;^bo7iyTZK2DKX+GA(GZ<UJ_I!&Xnu+?4XsC>3i<ozJ{plX
zba`-_0g|9@T%1C?k_ml^AVALKI_jImV26$!k85qwS@KK^OF<D~0uFQf&>YXA{&Y&^
zrjlz!FNMXN=iK~BLr!C?v4TuQ+V3X3=&^C_rJZJ|RoXAa%+RZ*zE7O>vbUpEO^uC{
z2&Cz2;o7~E=?-Gy{T121RBnPPZ+(F=H!Z}8ma!4}EzeJuV?2`ZB<yT(Yx~vXAY@}F
z-xU{QyRNQY0+_|3neS#}GMzv{70_ICV_26PtrE9yN{ME&nVF)=d8S#4W|MA`<oj7!
z!+Z5IR#-`dL<?6$+xKp3`7A#{O~^JahhAOtS(AReyzxiVsFl!RMzswIOYy>cu`$FB
z+c_LKo|?u*Sy0sN%BAYL9{C-_8by<J|CN<Ir+r?u+$FL^kO5RpafhUZb`HPze$V$d
zG_Iko@HW5`+<%say2<OcC5D2XM^_LLU-VMZiboZrdi<517FT-C^zoMmfaX_;!k|sH
z6fK74;Q}@IlF7>3zjN+6zIl=hcqPGC3)ODjy8|Aav@Z8?<)UY2vu%`31e=dT6cZ~k
zt|Mfaa%T4MDZVyd-#3c!vm#F%P}QeX%hyfR?_qEjIy(=<i&fKk!%Uz-_G`&Jfjf2|
z5JiK)57aSnMxvj}HfyFN*Kw|QjlJqE3>11R<w5i1;fh5%b(L{hh^6eH8!yD<Xqx-l
zwJlYH#y)78guX5W7k@?1cyHXgv`8h<&aaD^9Wkl9SkFQiqvJ01&T6**UF;Q<$E+1@
zZhOSVCe`dsp}le9#Nb1}`r45+CHmClcT)93HVkd5hOIV!(j@DlDSHME<h>fqDZXn}
z+<bb%Pw#w;qDex`o40S(#Q#17sWoP0Nsb}ko*Wz)I7k}&kgJFkU-sMssyZG9wV++F
zbk&ufQzs|h9xI0){+v_XZYK;fmtCQz<0ee7`Z10-U{~<>Xa)~i4u#v9*XNgBQ()!m
zm&6^_$}ysWWxDOUY0}`vIN_y@7pL20SI{p#y-L>?9ENR`dv7q{#*gy7&}wJyTW{IB
z%1154dyBlBEHS@|TCe>mnkFVTkxY)TuCF?CEo<rS1I>I*acD2&JP3U0M!+P=*7i@6
zV&{~XZ<|`&$oHOL_@iS_xz&SOhY@zIiy*HRAMNF*SXNfX!R|oI>`4+Ykiajp99Dfv
z0!D+n894AdC|f>5j<cgO>m!J;Z>zKozYmG>DP>H^?8JK0XeZq$-@0rY3xx-Z%0vI!
z5Y&7scv2k5m+Y!EC-G@a<#RTh2rX!blC{C~k-vMfKTS$$H-IWSUExiB{t)IF$c~Jp
zx+}IZWemoocxVebD9<lQO2b4~fMa@ZRlhMuXOc658%WQsL}D<JyoZ?KBc#qq%WzoX
z&%h7Xgr%GI(-*%g`?0tRnvh5;L&vvC0MDk2{gA#fnz(aF0s(Z@^+!kEl0ypoT2f0D
zz2!jaTNT5=j0x~X>y7wP?%()R<sz;E%<)qsi$~rs=G-|cT}k@E)1Rcj!5^i1EE#;1
z`trl|LVJc33up}<6z57scX8mQOI5Lt))0(RilP(8_VNnR^^Py?plKzd5%wT{*TLD@
zR@tYS#CT@#!Gi`sQ|uhoTWr6K(7$B$H%aJ<PeerQ19I+Z#mQ)bAo!*a@h9p>V)h&S
zD>$<^3=#-H`oo4jrMyc52*|W%)hex9z2Sd}%7~p^9%McIn3ZNQbLqLce$jF1P=~?G
z9QOAIIz{S=cora#oRj<nzSk^~=v9^2hMNcf{a^(ch(KEi|G9Grj4>B4BIQV+$25!2
zOl<^ms5<47g!bAxG*I}rYaZo@Of4kpf`Vz4bYCbn6TgXmDzHCrM79M_6~%^Sx&?4l
z%c_A*Cd<(jNvP?y()#DuN~*h*)Yrd@-qqc--K`VxPXF%CwmC8D+=6DU)fCLnpBsOF
z>_ew<pDp?Y+}domRbiIR_zicCA2HdqBcRpFo#o%&)q15CeAjOC=WLaKzu88+&M7Hc
z7qZFb=$W`jMOVGoF?5u$B(3KrtOI%jZQF{s1lR|g(AG5y&9jn(Z_uecICQleQ2Udu
zj%Yjq$D^h2IkdK$QDD`pfUH~T%|1JCJ;l|!d@>ZUhb<NNkrJ9gVJNfJ?~>%1B)4Ti
zx?9XxoUz-wgiBLRNfy76NlirCAcO0|<NshgmjeM%Rk(+9yaWq8v$MvaK`S6`IJViY
zqI2iT6IX`ntzW;scEjWlgW()bP(ac-PWMK&(VL-m1DK)DRg`(_&Yg|WV*mMv+|Yv;
zC=_|W`O&dPUM6}}s0hC)BkUx+EWo1@SkwcvF{dtlHsXCMii&~nbGa!t#t<$q@?@Vu
z5b%JevE%rx@3lqIa3{Crjhi?T!pz*Os~jn@*5wjJ5$w<=3t<@IMg2p)*I;P<ANucG
z7X|S5p`^rU{tZ9&t!8t&|3q=ssIFR+f}xoR5uJ_Wu*yQO3ulilQt1I1fS+rmVpNwo
zn+YH|aJr9+Bw`apTE{lEfa6SkOWxCVR39hVvBoe>5K38CK=Y#0{{FXtjQ>zm!?hvZ
zhU&;m5_>W+m7KSFOlCYsiJpX<_!sR)(82H2Xy}>XzXXQ|&_{`)Rsy61zCP#k^j{^(
z{Q-F1(X!8)E7N3lh(d>yQ6jNhFQ6xo5g{E27PNJ%0i(GvO2JcE4J2zW2Rz{JiP10*
z`sf{UIx*%WX|8VBvZYcD!0xM8H0FP{xg%zd5T0@LyLam3K=a7Qk6qfeb0Laj`6<)G
z0~>ub4bCU=_&Rn)bom<MA&{yXS_}J3Iw;Z>&VLd8Q<yRl#0Ef1n1Hlt^20mWbXpLo
z;Pp~fz0O>un>YVJ^93tKLj_zNj)dA5zMO>S2fb*~HAASmtRMnGMUJoq7Lfsv9g9j`
zWpo~xD@Ny;TmEqh_50Y7nx`*u+)3+i(!Auso@X^+!%Qj6q1~h_<+FePO<l6_dZI~H
zgEoloQqAGRukfhghV7NmN+bm51VoV<k-uZUil3i*hrMHe(tOiXMWrU?m0*Ug?Ee1!
zdsxQ%jC{QL{OMDtT6ECN`|zPNld8zX?el{)rV@TvbjrEBa#X|<#xqUvv19RJEk!(0
zX_L@l2c?OAcmHXnqNaxNo-$Xvx+7>cdy)H}6e+qI!c2c(T`nwt@_W${O#eD)3@VwL
zV~I?=K-#3bJFME;lm$N74L#p;0m_<IA1LHQ2};Sneo5^u%#KQ*ib&BM%?b*&!gb$9
z3>&uhzyaELJ=p3vkCeZ`&VFzjcvT=t7a#$W)1f>%K1dz;^Z;tZ8cTpiMSJM(GUju)
zgBPZTdMZ%kKEt(ZC<}clNM#~*dD_^Xq?_~Tm`}Oei!yWKw_^R9OFH$Rb<ArHQSFnS
zLhXRpLf);5x)bXql#IbvxdGrj_?}aqJvg9O!rNDQzYjGk-tOpI4<0P#j0!J+r{JX{
z9Yy7a5s98ZT+h9KbO?cPC--F=Uw=fk1B_N!8MdE&O3+|Ey@6yXROvx@qO>jpgi{9G
z>az#O2CwGv#bq|wD;=F!wkd<L7V#~$*AB77prdB48MKQ94Z=+6CKzdt`fs;5(I^A(
zX!Q~5iymj^VUulRVqt_^hMR*`B~@FCz75X5B?&#N{k1Uj0lSHchWY2>;t-}wxjzFY
zL9`$eAa+q+JSr*V0;aux#OBdtxsm3V*NKT=@}6K;$xFt67GSHyWh2J@qT`b>k<?7d
z&KBF9a~UgqSjvQ~sz0=~U8vL&=udL>0-LL?<tU@czDxUah6NrDup$`BZr-v5tdP21
zmZ=>^TP5c)fhYxOU(0ClO^o@SDj2kNq=4*${qHYhxu|%<>kQsQbzy?hI6ZP;!ktK{
z`YiGNif_o19U-7HH>AiwgUmY*jP|qe@tuAcj*G|8(86UE+4^p?V-AQWLxX*@YX&-D
zuV_M3!f;Q^zP#hYhlbQq64;$86pEhe7XS~umz#D$PKux=`sHV%`kH?&XUv-Qu|WCw
zd?rpBRWc#&$HR3${8LPAl*Du-j*-sVXmXK0y?a}onjt8J>+A<fjN1?rK452UG9$F3
zTCny4u`Fk493-J&lc)^ASdO*F=&(C<1`k#t!v40okJ^Iy^SR=`6?esPI6LpJANP58
z;kFB%oMuJOH4J~|bEfX0)~xep8kjC{_Ta1-tj@=^lYOe+G=C=^S~s@s<Sro`LCZzO
zi}v0{Ecn$c!<z^$PpF7M^)$HeN)@H{?RBWBR@|L9aU#Ud6HhVFdNHFweOlLBqzjEW
zOHp|${I;oVccV4xj(#E$jQJ}nK+tC&SW_>^sJ14#fA;#A*!MfsMr+$-9U0Yp-J$m$
zK5E*`5N*G!K4<E~rQc6aim*Aiz&~c#&3)}9zO!@j695JsmDv6uQz|v%r9JrROE_bk
z{-Es4Og+@NZwgLw`yCkPh@PXqP09c%0Z>&5A@~Tg?0oT`<5P}LPziU>e|K`L0xl;Y
zz~UooQdm%Ud^*PK$K@=18@u#XGF#(f#_QMPQ%hqjI3Rik0xX_QE*MFCKbxkT2SXiS
zUA>U-EH&lf1VX=x*Xg>XY0=8W8dE~9?Hq&8f|?7ozwMJPohae%b>BVg?2eTUs=m~C
zg#dSKi<&R8JHd%0kRH>K(IBR_oYSYtDX{tqef9}Iq1#jl-&BDcX;fkow7>uO3n4kS
z5J>xPZF?-u+a{3=&m=Gbls@)-jTf-Rz8?wFNoLxR!7AP@EkURqT)AQi5eIMKPc@ZC
zW7b7zTAc{Yifr<03-!??5n5VW+Ov1z9>UQ9^m*3`sQ5`H^q(OK&sSUrLfv`_F8$RV
zvCx6iGjTw0HB^>=yVv({=d4?g9u;qBJJRAK*yp?U4xpDeA57}NfwFaYjs@51-@mdF
z2>$ib_I4YK1^gp^vUa@LRR|$!vDeB??f%?)5bfuK3A78xl%1yM;J7jgdhPm-o=7iS
zZKg0mavqU5d*7xP>>n&(SD!z`nE~Ro-)+fGBw{)tixr1kVniwr?I6vYoR~xhCM7U@
zIU%-Z^gYw9UXNcreOeK`L`;2DqXl4_PUoDiPbaT`xb;nwn=PL_sk*)BgxL<Y+OKZ`
zS!gIOc=!cNqCT3#TsAX~cqjD}Y6HOuDDpp8Iul?J3VK9@0|oM;dvP!1TmUD+9;oa)
zf4k~dQa9p2?!%!HEtXwMtA^?LPUo56dp?l>Z*OHn81=gWQ-zU?s9zH5&{*nhB_
zNh|+U6ZVa!>bmJ|)Y{=fm6dz{Ht{NFVi9{irQ|lH5M<_B*UNgMGLeSJWM}yLN|Z#<
zOKCBE!a>m%ELxx*-^yDz`MGYly|qJ^XzLOUV1yT~8LF=Sf#9;^4&s#$Z6S(wejPjS
z`rozLr8g=nTs?HAh8nNu#P?fGR#>M~zp+Y_z?{05`nzu*sLKjubKjwdL;#B-T8(Yl
zb<&$5tBA)@sbpwJ{G^=^hF<TwP@YEnelqhpU{hB=j@j)w-z)C?y9mbKl>LA7>C;CP
zUIn}>0=CjmZ1@Yamcb*SNxF1ViGn2g5fR$JAFrE?->szquj8Z?aLQW>dEc_dp-GpJ
z#ke^Y*bJY2m0>vSfoW#DTf^usqUV3fyDhDqdyHKB^+B?^PVDrp{f4|uDXlv;Kg8#@
zyI$#w^VW3Ipq?|sF`nsqhZ#%9`J#q)v=#I8%C}YB?KfDClNhhD8}>v^L!)rnMeT#$
zO3KPlNeeDzArtobfOEnWHL8`g6O9{wCc}xWuYaqAUwvnrM`egM*`Y(NO)2*p&P$S9
zkm|l9XTbxqA&uwgZb{}p#U^&vnHF*-jaSI|k5rjrxbfes&@FWno|nEq^5#&I-n`4f
z^MAYP3C>UG>0Ca*8G%_R3Ias5YHxFMq2JC%26y!z`F}n5&s}vGFnfmW-CMUh+b;F0
z_9Nj)@P0S^^2Y15%LR`>k^q#_Jf4ggLf4BIFRF?%OZwBI71)~2pdXlCH6c_%lWBuX
zYCRI3Tev$#5rF!jTB1#Uuagq(B^f*8btv0!N_mOBJf)=*r?=Sa;IjR{-uV`6o0Yu8
zz5MZ`N0V&3z8`#WQ`Bzu=Eua{1kP!mQ7x`Elnf+xV|n&xnM~2pO@J$Lcg&-YCD~id
zi2h&Xw;Q~7Io&=`9nU-!IQI^!=<#1>x=Vb!6`-_2Y?}~3u;>i^zQ2Qp0Be22h)}Vt
z=BFQA>!1YOciP$}cG1L}2WELp#3EEw5~$gGm2oQ-7v4;~UBUPWr@W<5eCkHkk$V4W
z9+W&Nm2`cXLF(ES^ysa7MJGUqU3vDaWG!qs=<WN5E;||Bx};A;70g{$qU+4Z07#iH
z%}voD--0PiTP!+0vi1vK<5P2vQ%x>{5~ApB08(^!@BF%_B=8+-3)e1RCf^7U*;^MJ
ztqiNV;zyl<5>jw22_^0EG+w--OENG0`laa9(wuqBM=!h00nN-LBpn<h=3I<<G?#f9
zwwY1W2gVv~yssTZ?;QJ#sLcDzy}oy*Ck(#n;IH!N!^BZFd$e+t8ZADHBK4Ns+pXlL
z@BiMgVVm<b(6V*0l!e!BGwNDQ4va31@(wVH&NGjf#H{<0w+Zr|cJ;Hgv~!eD@7yE+
z?09IB9)L0xrcKEdFKglUoRm@=jL(prolILC<VkUo#i~btqD4oo=hP-wZ-|T{K&xFD
zi;4H9biAk^GN%zG3Clo&aI#yMuB9pc4+o~!MMMLp1kVg1`6(Qmx99_va!TjzcHkYm
z%=|jE;*VXUdqba!wNEixRJQ%GRG*LC&`V!?$dK-2RhEhFWj9{D(7$QVu@Tjb{N;$3
zY_lZoQ~wt!Mp^>^FHA)+4{$JM=&F?~(<TQC?G{eTXgh-R=m||gD`dh?%at@{o&SJr
zWJRK~$f|v{rhqwub@f|qVG;O6g?G1>X+Kf>$FHlMY~*xdR{o2fstCoBT0JFD&`EHh
zvWkb*HmD?*fIQuAwcxtwJ^EPQyHB4k_Yh48d+DvKqvPu8suNPMEhBR3SX*4WQLH^S
z++*x7z5d&c7g3_aF+@EDQGxn8qjm`AQ7|ER(6ZAcVu)4@3J)P|AjV0L7K3?9ONY^h
z7eK*CAf;o5KG-wxa9x=XJL=zU+xnC2fo09D9P*3AWhYAo6>p}gZkLDD=x4{duWYbn
z{uOTf*m6oedJIq_Wx8^5Q;a{QH$-HNBd4F9wOSf{kk@^tMfxe0-kD^q%#dXFJD}(f
znBb1vc_j;2Sneq0KDiGFs>;1syL&rZ9ljg9bEh^*YJS_an>UZ*%kPxO4aU)}y8&uZ
z7*XFPn~KWD*SdBc{@ch?Nq0%&`pt|v7Qky0oiiNuO4u!|CP@s_u)rgSf%(9AKyA7{
z_!<NCNUCj2&(B)M8)I+wgv@~oEPYc9hC$eyp4Qsx>Hss=gM6?or8T*Q<FH>=lAlB`
zZStEWuNN2?C2?!-8o^{@FGtGueDPBZW!sU}#`Q6zr!c0h22cK41_@wn&E>TymLot(
z`b}o3*t2In&>B;!={?;_ZC1sr=+h_U7lWoRA4buxy1JTGh2bh1?nRe9rv!o;p&Ef_
z<f(mw=9}>Hw-uy0U0{(xa4LxQv1unWoIq4MckcWgZ$$vT$&7d<E-o(S<F~-M1R52S
zi($up$cim!YxI2uzJ-8`><f=Tc3(^#dcx~bTeXg*O`h|cEQX1R02E=|$r#hR@8zjP
z11GvSFL?ok%QQlPezZzOxmJkLVOd$=Rr{wxx&;CnY!LRO5KwR!**JvjR&F|adR2^c
zN6K(X&R)>iRxMjj9Ux|o=_p-K?bl0B1wmd;mgzCl8oc|Zvu7=&_)*}7({tmqU%i@R
zN{v1D?c1<52bVg41K~=iJ0XW4wFIAJ_*@n_#y^kXJ%JxBr=MfTMAX*7A+Hn6)1Q!D
zZLRi&;CjyG6{<If5NEb+-MYgLXq#d*MeJ!ZA`lCw-jf$Wrz0}u%y*+L;7t<<&VmJr
zvT|&9PDK{RHazFzvIFt)V)&CY1FpU8IZ?;i2S^>h^RVW6i_^j$eA&BiAB|;5$%S9J
zUcLYIN0yE3dt|IVAl=48Lj8|}fs%~M0MY9f6;(v}H@(~Rx~?=tg?TSsAsQBIso87m
zA1ErUSEl=OW1H^#v$SU&XefKzEn$xtumw5eP+q)1PN>f-t6PMUfFjNH0gg?-o_!tY
z&)_avt7zK+%>q6lUFD96Wk=FLNIH-2gc=Rqv@rAa3XHIMmC#aH9RI8D%iiSHj`961
zLX+@y{0rNnbkdc}m%oF|urakT23#;>`>t)Y-;ry9EpQj2<xQxHe6I%l(Xc#5fd^hA
zJk7Ph;kG_E!R3ozTp9?F%Sj{z*t&iD#h4gPWPSn3>7{7>kD|kF2S9_39=IPw>K8aT
z2>6G47@@D9=(6h+vqU-r)I&}u;TSt+j39&F-xJMq^E^ekMhI-w0?WO3=1r6bNXBdK
zYK@Z&|J5kk_vIVRHoTxRvQ5)lnVCW@%Sp8EOI!>Vy*BCZxahU$N`GaLTsPPC>*;%I
zw>Fa<2>!HNg8UYIrGL{s^?Bj5WD$+A=TGCzXX+t**wU5_3T74gh1@@~p}b-@_P>t>
z4xv11$-1rHC2`k5pa;fc2PHI{ut8*NC!|It`OoS-+P>ZHR<|7>w|arE@>37nieao7
z)YR@6`qa(V`0%``OBnn7^0jOID)Ik<dA^)M<&s`{_ptNA<DH-!x%EkXpBvTvNB(yy
zP#=xaOzFHjPLgza@7~VgkLz=r1WpyU6eZD=`lYDmXEHxiiuf3x39H}Z0#YvhG|8cc
zf0>QfqLM$Q;(~0A_e+;83pRQE>^Di)t}hEyZr$?Bx@5dvhYST9vnd%y?q%3iviS1K
zwz`fzd!D`f4OW;GUZ01-3t9l_gyOY($&o;v57(S4jV^27`qYq1+PRU)SZ@Xej}*`H
zxNud<zht!L`}VH*);)O~4KqRpPz`{TE*7dw4R7=Ss*CEku~1LNauxbaDD=_Wp}MFc
zvg>s%ibA<1I&pu!>Mfaf3))Ih)+PG#r|7rz^?5@e02jeL9$ALE_QERW`16ef+9GHr
z8M4-I`NfZtB*)F{vvTqdAW73>sQ&;P>Bekr`&xA2^A@f}p}B>XFzsz%F#9tC!I4<7
zexnJ)xT)MqKn-RP+jtz$BkU6Cy)-23m3b1fWWY;EP{4Xl6y~=IREtk67}T-1j(jKe
zx~4N^h=58*=dtnWCbNcRVW*|5Yo#%=Ca=BNUF(FX6#HFOjf8FnqI=mQt@3?2p}r&^
zSm`9osa*~YOY?R==d!ehILfzMuIM$`Ol6mA7%w779DOT2Jq91ky_C)ZAVg}WzZw;m
zs;a8#i$05IbstMOazYsv!be1IA9OQtx6q*GW#{$hE5X>{C;69(sw>0@r_t$6ehic?
z5<VqISekIKxUaZuQZgu4$3^TP1r~ADgWvL<9gR;V#8*R=O%-J<Pyn+c{5<}zqte>7
z-w+1sY&$`Yh`RW)6auX_B?5qVd0KpY35dA)o4mYZd~@_4BS$6>2*B`H(<X!!agJ<{
z7dtFper9VT@$NmW*;B|oju7xDA8j@xwgz9@I`FtWO&sovZi=gG`yC7;ktI$^_4L3~
zN!g~h0AV9)Vr+KzA&_$d0u+=Y*=gvp$QD0NY<2T<B(!36JyZIRR9flg=99nR=i$_0
zfY`nR2eu?rT1AFk+)BM@u_SKZY(@gi=$wr0O>;Yl@RW%%N|fZXuC9)vks({Ow)@6~
zf$Ip><Q-t8wDOPs41vdpRT;VZV^Dw<hyxopdiLa>i?)%>1Erp+ra1Mps|qc-_aq<o
zChImn($K)*Y3ruB!T7-8Q1z7H0*eR~r7hXF8Ia_NSjH6pNog;d6|X+b-Y8l%LTQTk
zg!r9fX0{gZ9}DV3&dh+!<JM8+;fV;BBJRdTjENXNpi8VqcLsrrCEIu*cVdBEfZ(FE
zkNH%f1{srtEzTQG1PSGVcX%d%e=Rur??_8R1~WV^&?)`@#MTf1>PDpA8!RY9ujPEL
zUM+D+d8FY)zLU+(5sD-fpAJPcu9y^;plCdKIK46S`C6aa%Wc__*n_53vN&q#1Sur0
z`}dXxnQ<4n>*z<jf7qxVWZ5(iTR~X(Y_YD>KTQH71Yfc1&`(qg)V{zK7TmqnXWoX$
zNZbV3RP(KC9@juT6&j^1b#f6wJvBBhHK=S5p?9-SI_og~LKGWK&G!t5UtMI)jAvOa
z?(vinvLhi7DiKsY;H%jRy`pVcH)222V-$)AA3PsM>Czw4ePhG7#$;381pm=e!@%)-
zTN%s26Xs2kDdBVks@)9!d5=N>he5jokt7-0p-CJGQC7$Q%F?^!Cqn4;_{6UKuZ0U;
z*~lX7<yXF(z*tcd=tE;7k`rX>jxgqz%uSZt@Vr4(%<$3ecVGYshvu>;rN2ZVIU|y)
zjA>E-K%rOgnQUSDm~<kHz0ZXGH(rggba8X*w1f5^UR0u2jivZPwbR!6u*8v7P$I=~
z|MARbz8r;e2_wR0W%~a4=cZ)J%0$yq7*>z*z<F$bHnN5q--J$*6|a8+jx-LK0_<H4
zoGylkkgc?$(xz?Oa39M-b^|z)VjQaY=7ZF<JgGjaS)xD$BntSQnYcSkZst7j!QXKG
z8W-UD@J^mS<o&21#-HwK!!K|&2?~4%BZ^^Ow2WsXz7r>$O_hijy|nBFs@s365kUX0
zpg=I}8+TiX*Ti3d9!$KK=oJ4m4GJ73rrzVEO@($OdfgPwM~ge$EJ)C;y<`p%<_-=q
zFcLSA_WHFgqq&#jG0XGsN67Gp`l(bBemHzeto;}zOn$i}Ss&vmz^bQ!aYA{n?sJ<i
zhbHaGK(A8#_*SWcknxCO(&Xr4SQzTY{Q=>#k4W-dNFu*hR47wb*hS=9Rrq8qx1?Q(
zmmy`x6<Qum19p1?ipIb5qn%q=NabXK(z%!zAuR(x^Xa5!z4qusFZcbWDSQo6p;UmQ
ze$#d7ji39;il>8k$WxsQV2tw6CC@%#F2xBvz}FI<uQdO`@q6sq($0bE{>n9Lycwk(
z0Dp9!bYJy)QCoJmr{J}!VNp1F%qgDAa=-k9D~38_HOrYCF%hIx@5MhqUv3t5=`re6
z;U&+mUsvtjTjVX`J6{|-etdgZy+<hVc!+b!3yAFcyRQ<1Q@I->67+!ckotS~zJ==b
zXA9|bS0ciT{Xi&fQ^3A`S)ksa9^q@$C08trjeVg+SVwi(L1syF^Q#9BK0Um+;O7Rv
zh>Q_J)q=yL)~<VZdZ)@sY@)iiFh28z0ELu9<Mbuy!boYK&uNnNk_;p0*$dDc!tqVA
z$3H-7M(fl++P}~bLprsFV!ip=ZW6oSIauHh_!|u)8)i1K>Av1Med)iIZ-bl+)jHZm
z0=~EqtixM43S@qgm;W20&j(^-%dxDYRQd_@r^m1rq3ny!v5-^I^HI_ur=Wj;{T(UW
zf6;#q8IpmZJ2;Z%T%vDxN=NvoX?h(f3=#9t&4J^yp36N7xhpy}oMZdOHsFbYU6r+F
ztN;xrd!91)41&b)nBnYL^4s0|vrD1jF9VE7_bkfIJ?mC7cb4<|r319IXu2Dx7M8Xc
z9Dh`isJ#bnpdJAIk0FogH*T1iij0r<45aved=vMD@I`<dh=8Wea;EBwy<&o3*rlcM
z9e&1>d$M4x3)*12c1$fxBO*^_5GPCyr-CMdH$Tzx1=a*NZTejH>QY>&;L=@<lyvSy
z6`wkb0m{*)#|gd{-f1N>K<@2%a9~O?HY`{WVGaylIEIo~#>8KH-6bs&AQm0bN8+@m
z9)G}VBI?_vm32^Fg2@|7Sgb;`01<2O9z1eSAQ5&4CF`fHf9o}N7%?S~CMn;^xbrbF
zwGdhQPS`t-D2V25kzT~X-4|UgJLrFhe|7(s-#^B}p$yM}IEH-{pnQJ#rcL9>=7ja2
z4tug|E932=qmEqMn^aK1)+{qcPMF{`sH~mxZ22?JX^E>ORR`s`M>v+EgdxRi{@Z!5
zV8(r1)HD!w^`AB0zD3VC_m&&2-5~5qSs9`K=FQh7acyXzr@Bq+z7qeGBGd86Xd`mf
z+-20Qeb}3@lT*f1Rm6`o{{1Y#lh?~O#-7}kV1)1tbk3g0a0=c4BW;G1gSYTmLZ_c0
z>jkRY!#E7&+hj&2KBW{=iYY`BX&?a{k+#@sYx7?EXpUsj0m)e=REC3c(r7Mrov?K^
zT0cFNjkgOS>vb4QH9CaF^ePNhlngq0W@c`V%1IW8Fd6SLBZgrXg8c|_O{b^HY{c8{
zl9&y^HLN(MrxXGWP5c=>-BzsFt8Kp-S`$<9b|-55ykn5g1ViT>12*oDZnOPQpB65L
zX3aTh8lZCts6nsk$qwz3z8%SMf_TIa*Hu(fS_zYYL=t?u^O;Cmn2_DX`a)pMNclb2
zmgn;!3WkzI<rv{-3OT1_$9E<{m;;ywtyuw^H)|U#pFdxqxq?W?e5stAxmRxA?d!Py
z<-~|5h!toJ9V!G@$o=C0Be7Yq^jl{JX-;$EWpRcHWj)3Yme){?Lll`3i!B9ntRc26
z2<hxwfs-WGp!i%0;2wGC*QCT1IAg#&w5|e@MOzR;#0>{%I$$3dEq!NjJN8e~mnbU1
zE}}0E!@0WnWz8I)^C3TvOMkjQ5qe?HatUr5<`$8a@kIKD$(=atqj`R)9{BAuJbC>j
z{3xyp&__*;Iu<j~9qtG{$-qvuS9Bk?qSvrt)%3@(@=u&D;DAHBunmFV&Jt>1ZPDxd
zajol`1Hb)zbJy4$^`LDeCx+{4tvoufV<-cbGfuQFV+HWz{3*KA5Tw5rvi_IcS2(Uh
z<kdwGdW^Ts4QkFfE37R)anAf-pv=v1lxmE&-u~4^k4L{&Kb1QM(1XN~P~TaeO7i($
z1uC>^lBEdbCXYMkM98o>Qn!8+o=WGNhzldMrf*dLJvQBQ$@1mJB_)%k_LB_ou>7_0
z5#vc;aQL3+D+yGB2G`S4RD$Kn{0Y|+NOXHgJkGY5FlkaprGW#Zc`Y(bRRsEk91&|8
z07)*Ho56EJ<liMSDk`Wq`K#ET(gQD%eCZ~)#C*0_b2FAEGx{(w7wu^DQ_PY%3}4O0
zH`!(oKrb<mlE&=Ir8MPIY?WmhTuxnXrnp?-tNtj~;}6spEMG2YG~k4?fSCK7^S|!1
z*Hl_1dBY%lYG5@ww28}hqr}%>n>>)<qR9y~%P~EoXL#iryb*qyf0Rfve%2!SOV(3h
zE>5M_kJ{Br%xV_%jW+#$(_Z>X-;~DBvW5m}fkVTL-eg7r7soIK!pH^b&;^M^p=X<)
zOKE&@7c*0-)11%Qtv*GqcW*ywNWgPWZ2WSTI&fPcDr!4H{D_x>HKvY{g=_#_qvgpX
zw-VC{M3z2>fPl!zLI5@)(J3<y65skG@|;;bPBKs+sCwj6g2Xj2&-G;Fe&a6xYYmM}
z^GH}IwtCflzY-vnqCgjAu#QAxwnctqxuji7I=6V-t0Es9hJtEM&Az>*y~avcDDZQm
z=aC5Mx>I-nJdxrK!UX?~8)q?sPd4vC(yOW0?9S5P5`Sn4Np*osJ$u2shIF?<zC_Ce
zOmgO4>yzv<sV;#0cZM*LgM6Q%<4QoE;z{X(f7-A+12r0Lr_kdlXNb-|Q(B|ZK!L{C
zU`!>Fh2(9MJ~!ZMTsrxvH?#o&ZsZ+_sC|8X@e?wLkR#Dyue|ofM^`s%-kj3iY?Y28
z)@s=B#@mxVz34{3?TT5m))&sv_vJjmUV0v#BE-E1UJ|%7?-xdfnl@t=m^~%3K<Q7k
zfANcMOUc^+!x}!`^*b~MOrnMCVg`BmLmaaYb;1A|B2#I0zvbsJRJxme53axV-=exl
zGsaKAMCWrz6~$zNhE4C=?bd|PlH?|ktSBZ%W^0J=&NBdA%TDx3Z1`(`d;`ZSjt21n
zDmq5YkxEaul*Q6)$R@8YUHOZRK)e&WMoJ$VKAA8&TS<DY{siJ6eCTuk9RMv$C?fva
zLfJxJS^AVoi8n`iN&idyQ92SQSW)u29vYgOWtizEM&1!`%Qs4{?a@YCy5!)bh^{yz
zT24kEBUvD!2ArBMzwm+3#-Du&Q53DYKhz+U!8@uawIbD#esSr>Mu$1++65Rx<Piac
z7MoBYqcuPZw(!xMZgP*oU)=ver@r=fCtInRrQDyv>>}|~`X5sZ(*HHYpgHgRA#19M
zLMUOw&&zdee7U~fG^zCM8$r|;kPMhlIB(Nnyd-wNG}^*}mCRHUqi5)uQ=<+=+!86j
zWXw;W#*HK|z;#Ce@53$;DUdg%2-uqBOw#*I?$X!=^&^pq#k_(KbQCl%=J29@cv5~s
z?>9QlzFI<PoUrZ{gWOH2rc?b|Y;P~pC-LKZ%Cxb88iT9{L211}93!bJnwbR%&{66r
zv0t4VtwC}VvCl@Vy6jaG6JT}Hs*sS25}IYh8#R8``0YFQgM9?VO+46s2ly~11yF9b
zd{dS*Yjk1ve)J)*RKwPM+8dw@Gf!9dJgKvMCETYs-T(*2j~ho!OxTqe@H{Jvd@7oV
z>gQ+wY5du)Kw0R5u%SAM5E^M0pNh1xKR^2)BaNMK0KZ7h?JOda0W)lDD1=^vWbyN}
z1&yzp$Xp?9DjkH9O6Sg>XY9aO&=a{uD;?SRZTO6hcp{oj!70w3Ev>35d3<Dpe0g))
zH`+L*1JzGo;xg@&sCN7K)Z?+_?>F~HV_y+Ho+}clK$raDbNUj{;Lp2^ZhV(Z(h64z
zl$&IFG|BZUc(YIsrpgcCw=s?O!CZn+lz$dcxD?l9r%h}4oNtT9*NlQ`;RueXw!q2h
zDouZ#I(3qtf)g7WIiI*2q$R+K1JxinQJ&}yfmMDAtbVd|*^XQHQH#I^k0vqHBIBW6
zF85{@yY^)_)b;pa;JS&l)KV=|BQO`y1LLxPe)ZNyUu|d1qYxQT6BP*-&88*|ahPx8
z_fi2z1*ALy!4@UD7HBidhkGWEnF9Ma{%k#{sHj!bk|SM763#Pc&d66ic|hY8s$YB|
zo80_cZS7`(T>!dM84i^nzNLPR?)3X~U^lWNDKQbl2dkc3SZ*PWzy9RD^Z2HwWY2Kw
zylG5SqJZ_9q<<t$8uBQ{PQQ`4FlK#_aif51+MA(aG=qrzTz*d1G%^6jbD7iff?7Fv
zct8L-5h}d2^vkz$;6!=pL%e|qqVEa{Ao@)GmY+T1(x2;)&}bc!uaO`=XAe`+4KO1|
zpySwr4#A)IyX3z{42;qU0p)~^ZW&&A5nO;;i9G0wYuCt7c%)J8qU&W%<;Q7C@a!JI
z0G7ff4W_M|?|-Z7Yf!+%xFzVEu%@GrVIzRzgp8B?@VWe^bD^okxJP(~6T>SPd2Ne~
zbi@P)*OInjU}~p!*>)#8I~zeb@-aFmNE*nQK_U8E9y6ms;NgSxy6-;xhX4_-k_M5p
zO^)pal&7X<5-F&lAi%k+b2_nb2seS9gdvdN)Lgoy<8BbRfSezH>2eAYv;P$mEfkyY
zqoB?TQbY7T;B>IzV4(y|iE(1$an!o#2!P<iB23tLfZWK47x*$^-CD%WTtu}EoQ}*{
zOeyi6NilQeWMXt?Pd)jhL(&e2q#-ai<kIIG7)W}xW$YrIv_jn+As8L^(p;!e4WU%v
zdZL4?moL+IyvYpnM2gEu?Gy41eNb#@i+z;M30iav?3XP&R5y<@Rq$J26$&fRneIVp
zM5D4DltG|<-7V2`t_krI2%t(DB5AV>hvKc$y?Z=sNVR~mn{hlq;cGFulf;dd*By0c
zWPFK<^#|6ir-;)BB0VijyevVjr|iQ`Plfx}u(#@#@KUJZO`15dgOW`4ixRSY<K+$F
zp!lZ1t~^T>EOYi!Cnry&4}aW;nntAV#l#RopdxrM7!m48l@5%z;NbP>-hG*);}y;-
z-?u5iI*R`9G%zDV;abAJ=FOW&cx<6n;^o!V_fu0-&wl%g3QaspkuD#%B{Jk;ZaG*L
z-6199EzW6S{z&@qJuN$E9+NF)@)Pm{J(?cF(WOO4>cT#iL`_*JP@O4FGTmKCcOh!K
ziSimHi|Xp?&LN0u#jh&dDbU-Qj`1DfiR+Lp0v2uIBqy^qpM1(f0o&EJ+}BrPU+ces
zccYdLdgfM>L2W;RHa3XHtr!qvx~UzZ?kk`@_K@t5^h(8rP@SlK_5zj`hk18HtnaHQ
zY<Ql#5WQ(}^W0^%7?1Kr!i-XIFmt^pKvfgRs3BHN_5o5LZ|{y^<M6NyCu*_F9UTkv
z@`5t55ac$)0D?l$y(N=PYtp32&Rx42jIhVwO#gIswYj|FNC2Wy?5EU2`qP=YdPvrf
z-zy@F5Yi<MxKHCY8>gZ<kV){OmmGB{*t!q@WWGW&rT&0VFvfmt#HV#oBHzu=r~i{p
z_8sO+R(AFx4|j|}(B8e5Ia-`U0z7e?(D*eUH*Si|X6DTz1HjMX$T}!dZz8E<WdW73
ziX=M@BJgpEqqib_ke*&<&p5PewJiiaxNzWL3ei}C(W1Ood%uz+PZ8q+lRLsYneY2o
zaJt>v!+~_ew2Cpbya94M(X)q5I{u`v!4O|bVL#IxPFIQPt?X=1qAJjqpN6;WfdC;q
zUIB##sa`0gb@tYc8*hX4zf<KipMur>ah+m~hUi@nd@~JhCrtp8Cr*s#HfV8gHMxV<
zj8g3S3;NhVgGeqo<di`&v9@B%4oT=m-|Ph{j&S$Tl48Lt3!gZ^b#|;<F5RMW>$(2w
zPtVK1@6@2CT;i3poqw*7o(T4>xSK?w6mWAYcoG%b%ViV_eIO?<6{S=1sM>cNiK#6J
z)mjbIvIsTaAH0zY6^(t51e*$sY`}m=Sy{tzY0<To#P~KCWUK&14N*X&WIAWg9O$Ld
z4JT>`P&HdkxqJ8iYOoJzn;H7OVx;t)NpeIe9;!{591rc_uK6R^22iDE&;jb!N=oO*
zY6v0Nb)*{9DJ>GUX?%*Es7z_a9R1(JbxU~#EtS>Ja&JTto6T_JbL;!1#8R|7v8I{C
zB8$6<b&7((B6O$dj+xA|QZw*`ODn+MY%z8~;u4Q>g(7WyWt`{)Me>|z=!AS<RY_Ov
z8J*Yc-T3!!Ijg!GTxj+AR#~J+&mft)N)J69ohP<C-&oH&ZLI;d|H)xNNC({lI*oBi
z?ZH|C8OJZW5qFBc<usNYw-4lhnyo+^IIW9cU9BXJhm3xt=W8jFmHe2pE{ba7^Y6?9
z*%v2v$&x6!y`O#C^fUh2CxUKKcIr~>FmdSU-W+`v5*W^Lx0H)RaZ3AT0bK*;J7%_>
zN*N+pC??ka#Sps_i~-I^c!y#{i?(g2%LY5!*`m1x%*l8a>Px&wa+vWAahvgOL8H&>
zO?JdhrzL);dy$Nez4C(dB#JCJk=m)EG_o0$?^c&^l=JroJ3?YO!b6i>V5jcwEWMHg
z*)(H27>54Jx3`ELV%JPY8Hz{>|F-Jm(@m2%h?nB4gsUgM695kZB!!1MT2#L?%G)rs
z;9EWY#u?*AJieFLxyA4E=g(4ke|h2`x(o6TmOJhpI^kK^gKiyTH@kNlweQLEu%Qul
zlUy&(9QR<RdGph|<|Z12ypH#do;*A*Ju2jO<(JIz8h68xe+zz8e%kao<MV1CP30C>
ziext5{ns5Z=rvD4^riCqk<gSeI*h78Xs&ODKo#~3MUS`c>B9P&f}YZ$rl9BLPk(26
z2*tU~HTR-p7~ynfyhO5Z9n`CA^Vc6gd;kSn>+X)Re~^-5-fxNcrlfwKWHo+D#wQd_
zCQmLAx~t%wFGtH_@3@#%c>~Y@=tF@FzCn!Q0@j_3aq2dhy?TouqsxKxa=7KpPbVng
zX#~F@uxX*yQR3Ulb;SyWR;}VF(R+D)ryvs`#qp9_Qo0zfuRlJ`X6n=@fEt@Vh$<7n
z=#?;hij@Z^s&&hj_vx0`ahQa6wMyMdLPSe%3HrE*WIjb{u5uIvD%E9xD$##OP1}Qv
zFOnRN*XSbKZ!p<_;uc21L}ApZn_};;@Ft$br=4Gh@mjWQ&PLB)B>Bm}5jStXqiS)H
z0q@tOO(ZAG*$NCJNu>6vph~eCU`SM!Q|2^)A^o=JT#{Ji&zv=D5-LFo0(yf}8hIyT
z!oIMmsD5H94E+$(wi$U<Kc=9p!1vNoH|I@dT|E)`wI2l_sr$RdK=^X3gR7vs@9?2R
zr$>yYaFF%!SIJ^q_z93E2}gEdH)?8Xl%(`RU&}0tzldfY`>>3?fKeM)A-!KoXp=xT
z$@J?SCc<D1zr8dud3z`5E_QaNu)0+B7G4Ugh?*SK@lNzK^KJkg#wwg+Sacylv*upt
z4s_aL4cJWyXhYM>aHXHv7`~cgBCY6~_VDmPKk0W>3>S*5*Ew)0bA-+qTW85%lZ*N2
zEDB?yGzUo!q!mdSv(qd56)|_3nwqtU06z*bWOFUf@cQGAqj(e~BxWDy6+}l8$zNr%
zgr_Imr#ViKrPjy&cQn1pRKHQQKlY0IC$K6iEE_L0VY#UmH<}M7UNtm~mnu)=5{K+7
zVOaTs1z!$^rf*fzVVzsHXu+T2og6*-ho6PIGR1J}5pbo8ut#u%?HnBiF;;cdM&%_N
zjzmWf%y>c{vcsVpOrhL=^mNBASo!q7#r_#Ju?=dcyV{()c=4HC!p9LyycHzIMXg%5
zMgV;Smk{l~UF!U$SgreRic!Rdb7(+NI1&}bsGC6!kGfsi(r}>T)q~8#Uk=Ir^E5UI
z4{s81_Uu_?5|ihM2cPT40FDeO(9=+Ty$TqDIMgaPx9BNHH*WQRGn|gh?mc=8@Vg8h
z0K=O<K+x@zTGHi1UR6rCXF`#F3tkfO$x+2&Vy(EQeucCXCe)tTg)oi|?BgXUC`%-Z
zr_kp^hF)G??ytxeMxf;qa{+&z`R!&>F5u(saL8z)On&ktmg0;{ru0#wg9tt!9MacQ
zS2xQ>*P{wY00}Jbv@9ITy)e2~Y){`ct-6n}Dwd9(&+WjJxuN70%&~FIynELHckSu<
zeY1E9PX16YT^TsXUo6HkCd<3}%|DRV_b7%DM6tD1kZk*TbH%colm4pJ7)%k$yUD~y
zenQ9%kA(vC7Ws#bKP1nQeo*>HUE6R=nwl%FH}7ed_5$_%gCkaNmYbhH|0<Dp=t+Fd
zdm9?QVt^$uP<k;A7?qlOgvjpMh(Z=WRv-R@mn~+JY2AUfu{j4Q5k+X)zhoyDU-v&g
zsDUyb!eFX>`;Jv$Y>$xpCndbsU|uAfkN$_q_&)gZ<qPbhq3C~VNX6U;?%GN10arcP
z=<9n$5UIfN0;@L3t}H8K{L|1ug90yU%I?&lWqbo8fWO<76WTH*V$$Xuh>Gyn3@CBP
z7r=gu^u0-c&G<L-aMbLQ;duA&KT#o#e2u&XnOn=^tFr5sHt}?k*#YtQ((Egs&uCS^
z;pzh?Mpxay;3fVb=cMe@p}%{|`-WJ&6CiQ=!-tPcv*92k?n-1C)<6=P_G_ct)ij$s
zHwX4Zmu}roS!wz!qJQy{1|al)UJ7w)enOQSZw5c=1@4}nA;VqAWK-s@=fu<8Dc_iq
z@bEv}{sWYv6VP5E#l#WeD5zs|CO62}Vw!2A&EO)&vJ)}zHpX3p-|#%fehavB+%(z6
za>H@evd2W5ejtZ~0UU@FpFCfbpI?c3bJs>2C&gr}u$c`%bN^y?f~fecT)89c5)hD3
zx-d0umL}VYz9)slk^jsRs3Tz?$JqRuGurYvIbOZik}0xJJZ{ryjTcWfHTB~rmE$uq
zGDNdHCSK-%DS&D>+CHJ(iSVeLtOABUPs8B1#QGnp=tlf}b90V4{}LJl=<7nW4hTLn
ziWoA*1)zWw9fGbA97un<ppz0ZX#NfQFT&@LgQAY|=+-UMpVwK<br$!g4h02nIQm*3
zw^(YtEMHnwTr3j$h(`!)K)o4DT8O<uu^?w%)hnzUl4^TqUnF1u_(uzWp@zpv2htK$
z2GA<2frk*rrYp}RfEF{P4RU9OGj^<&WCS#Z906;ywx(+KIZnJTN(qn$Dz77=dgbFU
zlH5PF=3K2Hyn;*vW};P7B25tDZm=Y}w4VS1m|r9BrgBNf^~GBDqJ3RVYC9%vS@!(w
z8_~vIn)}zevec2^1a}6A#Iomu<mAqjKFFA#Hply-&o3+*c$Ce$I8b1|ZnB{xoqZfD
zO7)e*vt3kFepeO3*;ZC!2oJeE=(DJG<V}H_LcZ3?WNVipCtHkm*3s5R;KCLI&TotK
z#ObLS<BApDeE6X5=7=bo3B_kBz^sQ3oW@_8{>G6Ik|_8UmrUvX=lAQ=hx+bdVv3z>
zumZp_3mqLboTtg&q`DEWDlQ3U1b3yMswt>3jjxrsa_cDT&+vi~sVax7fN_i(dF8~3
z#VF+ndXr)pa0~(KkfB3I;^6?81l<&IL-vUntdKVo-t&1pm?M0PZ&ZA+>{op1>o}$a
zMpdljxPfpoJ`!yU<_l2`G>pytEiEjBBUSa=w{Ip>o-Rh44i}Sj9zE)4La8uehOvso
z_oVtCe=LNlN<et&{CQNkLScykE0`P!lx@(*F}NuB82|YDYXqB1uf=#8SW{YV4Gu!x
zmZvsI#Ug}%SVjVc!i?jhMSZr344Cu7GrIz$)qbbQuHh*tc)7Xr982l`7D}y<89-hl
zCLXZ<q__#<34fo4VDs1RfLREo(pJYC5wUxr$}-wlv870CR#Gqr%m%$WnvhHfh*VaM
ztV1-K=h&;ek+`If0RhZEO(pE~<BSZ^ai}N;KC>J7VQ(^@?F4+3sn;@v12vw;B-o;N
z@96YW`+W7v6;a2vvAI7>7QRX}|K9%cSILPu#uxR0@#+UyL1K1I(=&>xHCF(_D|c|d
zTdKl~fW3cgWHIjS%^Ov}0K|1D5B70jI#L@2g}{qqRB^^-DkYHH6c@02EKiNyxqJ6}
z<Zk?s(>^$8{@=%)V_d2sri5?f6yCS_oiOnn1W&M76wFn+b{+o*OT<vk#js%rXnuVE
zPR5vbT8sdaqzJ7Dz>uO>*Dfi?pC<AE%3_CXY9Io{^}&AS?&Ae{6g=v#dW%4&zm`_W
zh_QzK_wU^40&J>kO5y+oV#~vBgXSd>pZF;fIj5h!8FjL2F&t^D4Rpy7p?+bQ3#@L=
z5=dTn8Pt2GeYaFaQ6d~Clcpb(0d@&HO?6pR_QF*}sXroL!u%`*pE=j`?zXOO`6(SJ
z3OXm$j8Rz0mc>H|=#Ipkef;I?SEQ4dpBqI0EcOD(gu|jm`wtvQM6MolLn%dL=rTHF
zDZ6(bv1&2PKnZjgI+AbSY9o_|Zv+sq_4zT)*0vrpcNcBDfUg6ZLie!Z>g*lfFoR@E
zQ2QA%!jm`2Tv?L<zJ-Aw0I2>ygTD8Bo`_{Vxf_#-UVA=EnNB*D(6vX8<qH@7AwTvf
z%)|kBLcKP;wVRvU#P<xTG0A2Gf@X~qQC9diA`qt;zSLdM@7T5L=*W?fj0s`+S44v5
zk!w@>Hk&YEcI+aAV`&XMlzHEAqMQq$@AhoPIuAlSv16a-vWGL=o}{On_i$(XbAXBp
z3pIjMpw*3Yo_!nbf+0hu1#f<on%Wb=F&Iow3ka$n9yVescomdatDZ(sN!cakU%m*^
za%BghAV6Y@lvxE1Z1VnC*d7ND9%S#t-?I5l61Ndyf<hEl5IEVro1E?<&R>jPvDB#h
z)@d196F3`Q7>dq<B9eDT8rp=2gbjo}i{`fTv`;@|gG@sBdF(%ZTg#ky+}vsdg(RJE
zgJ%jY0-KDJBc6`D@Ng7~+_5ufL<GC>*V*x&)3Sy1WbNhc+aGbvm0R2<{(&gj+i&lX
zB~W$OLk<BfKK<rx3@Ci|`ubL+NL{vW*`gnM-0q#tYD@x_l2!-?TaO}H1lc9bg=l&#
z_tY(TwVQJ=?aNtl_5dHGam1dB0+&N*Gan!(0r=4Tj2j8`Y>TI$IZVj!QWf3fk^wpG
zaW-~84i#4|2-jpz80`dR^<=oM4#BOW(F5T%<IJ2F#DZ#SVb3ou7n><`XTbLD%QH>}
zYkG2_*P=i6z|d_C;ZxF*0OFPqjp4&*Dx@J*XK1*s?#yMd@bgn}k2|A378cUwibfy)
z+xBJ?E8rextj0g34uvQ`M%^1s304>RcSjQ~h+CxbT?P!eCgR~`*;d&j5t}|wEvQrL
z=&ytu0A2~aQDEJZzX=XaPVgF5f}_{L1nq}GBSy?JH)^T6v2D*B8WpIMG;7ujJ}W}p
zC!;Bud;=Pk>X1TV8_<2ETk&jFQwn^1w>KrkQ>V0mDMV6Rlo*KC4(?&dzTYM8`3&2b
z2Pqo`j%!$uRjVqvIZT+J;*~2`gzu$~4i85eXcSF=bb@{;D!M;spjf&9fG|w=0Avxe
z$pybc17kc`ena{s(N@E_6{6#OtmDc3Monq&v&kN$tLyc#nd9sspNA6~Ay-9d&rk8r
zojdIE{=@syHpl@bKLONJHlZ%D05GV_?%EcDp(&)Ok6toSSO?FtC^KsRGJrs9k)R?M
z|N3OuC6fRwv=3zuph!`z!5bf|yRHei7c`W~qwoXJ$RQ2;bDP=9`QetL?1Fb-S633o
z?6<NxwRW&XViF)l1GCaoQ%m?lItCygfu3|QK_eUzIzR9gkfwTk|NecV%O5?p#ZsIY
zMEuKg9HLb9aq2`?N<@u-Q#m)p|HgO>OlKnvFfy{uetfn=lwufdu-Wd<jy^jUPR%OV
z-2PmvhwK`m0K2RpFHb1dcz!&8<cR2IJe-~Ob(>z!42&VS6#fchnt9qV2X8UH&B^*W
z`Zd)2uv()CZ?;SnV@_gX%uywMe**sZo}oN94uoI}5tneKY0CPBhI159<o097I9Z;g
zrrPKKb@t|QHLq{@Z+qM9gs<3To<cN`dCa(s70PNglQEPzBn@g)hR9S)h73_ONTMVS
z#tel>g`^CHB0~x#b>2^_*uQhmKj*C1_vO1~wT92<dG6=Fulu^L`(gM+PW8PG)mVcL
z0F;(?eEIRC2TeL@$72qu$AVazKYsiODBeZu;?kFU`XR%;7KaQwEq{H%{6K`~Vly2g
zG!NoFnaWdgD&VJDn|`=TU<^DMr?HiRVmyj<yNc^!@(1Dh&8t_du*bHKBf0@gb0_xH
zS9`KXB8DH*S*RT{d(fQu^Sdt%-II_~@cOmkL&Nh?Mn*=u*%PudGh^6d;B07(JhI#N
z<RD_5Y}oK8y&3}EV#|}SH(_@+=!L1kj93pR?_C1W2eI;LMoIuZILbOIl2jY<S^9o_
zq+#=p)WBV1+-(bW6>oZh1QHUP=zvVWvl-_d#>egs2<Yj>3>f$I&7uyXR*~MdXn1JQ
zS`Mj<!yz%er$vq_DX;(6UNdy>u8bUbGd5#J!x<3)M<XJh3J@;I)dQz=l+;29`TbK+
znUrn7oIhwx%<v<2-i^8_iZTB<q|$`lN5rGOql#r(YHSdM{IHtCazpA$MrjwZ!OF_Z
z7t>ipk&MQ@S@Y@cWq}MI&1?+A#{9?$F{gmnXeH57Qvn77C590_I%4x_ADCDJPX=Dh
ztEQC)XT8theY<ymK2^c4Pw9VMqD&wwvFI@#1nbD?vBmAQGB;$VWS+7z9Z^yey6|{N
zT130)OHpkFXR0?)`qY&Z8%_=Vi@f+%CyRql?;(g7mMlN=CAPLbaNh?nIVN|A=26D!
zjT^54v4iLR3KepdA{(XjOn!-tkIsSzygdL<ilSg&5#Zehb?Y|H;rNftWnp{w?iJl7
z)A&NspOs#+U6bzMrYp?#N3D21Ci==A-}SLqA3y$H@sG^ify(Ug@Ug{Dg)Mr(={dwh
z!fDq06N(5pt8%>A1om^->xj6v+4o7iX-pZq%EAO78?(H?d+j`f|Kmnx45z(C`N;PO
zxly7+BG?fVRLE9zL5KbHs|Aj9kidyLPSl}LQ_B(22(p20+QLO*<<subq|W{{1!SHe
z-$EknB`Jm1zi<O0w0}ie(yOAF{B_&Zh$`v~S$M^!O`GIB$1Pc~fTYgC(lWF-WBPWr
zJ*UkgvW<?sB<N|n{v2gS+j>@IFSE%FN9=#bx7VEO6f$@AY?D9w=_@wsD{K4Hf1Z|a
z0&k>|gk$&qz`#?ZmMvI72Fa|p&y+VsMW1VWiBFjNjAEg^ns@|P4qne8gyRfD%(^eG
zt1&`@zfT?PxsXHynRv8nSER3gWsx`&M@Iv7?i3uwQnM@}`;D>bdDw8)ETn+h!W$hF
zK?J+?|6(4GcA<qNksPv*yAN&&$dN7l_N(ve-atvF!HUdBY(U1uF6~pk5@drymeUSv
zo1Gr|;zP>zVaYG%^n}-p3xj(=PyWBhkG!o|Q}b!_efW^f?jco~G+}}}ys4BP1#jM9
zO!5fxft*1D2hvupVd>%CAlyfZOA+Za5}YDcuim+H3Yvua*H*TxD9OZRX3~D-TVk|b
zbp}NN#jBQ=$<Ob$8)#-hI<eBh?(xWw<%eUEP;CMSwC)5*9?qHGSOX#`<bl$w73i|V
zx10g3jq9v*OAMtJ<IEmBpfhV2A{}&^NP+7aIvP?}TC{C-1$*$*MFC4O7ZagcOhi<a
zFczf`j&tX_CJMxHjOHXN`7bzp4cE|kL7>UY%OmB4YP6y3dI?yL_?9d~?vd%v<?BDE
zwB|j5=7A?*`Y(BUK2o(S{v?R1Xd2b}YD)*HFTm!H{sOm?X_43)etd9zv#KOa28Hwi
zk~L-MFx#lhZ&}WvsRN80yfkav&%=GRwGD=&s-5Up0V*GEDn_%|h5x1Ge;05Qh@92e
z@t=RXxqll6u>Fdo8H;GeIHFsY8hlyLM<(mnS3}B0#Ky-B*-eDTE8-%3vC>uwinFKA
zzh%8W-(bIZj|`lceh5g3*pDOWF%EW`M|=yGm_(Thy}W{L-=ul-Z(qL(7e@*x%-R_;
zOt!^fp?MnDQ9&$7KioTAe_ih+%$CW`P$PO^YegasFohg}mv<B;+IV&uws6j;hbSEl
z<TN64AtU%e<-*DSQ<DwMba<8=aPuuQA=3AJWHn<3Sl>fbFuh7BVi`_BCqi3I<=2ff
z8_SJrG7xneG+S|oZr@%-s>^%p`hvI-kRgl(J+6YGM4Nv-6Ip50n!B%Gx_GfZy(~(N
zqPK5li^`*txa){a-9VsVFi@8AO%JGEy?%W@WHfSbXau_w#wcBmxSgM$|L~z{)>y*~
z%#e)5Bb_`W%}fw^Js;(w#TZ5llTyz>fGuq3n&OBk0gd;rqb-{?VRQ9aFn|6)WFB1b
zXUHkoINWabd8Fyd9j8x!FnzPOI8$&dF|TGjr>CWz<D5nPQ9K2jGZ>Y!1}Vv`)8|DI
zp{~CFz=7o47ji@*-9#4T<(#c)*1BcOJ#x7ndW;t@=?RebT99W*rF&M-CSQdzVswvY
z_`O@V7BSM@VLrJdD>{6;KS@p57l(%@d^auh7)2+@eyoNU+UXvf#cT<H8bwRwb;O5$
z8eW)v7|9zeX~mLIhn`3CGX!{_wLE;-u-ldb^yh-GZebFTo}YFZJ_$$#r~e1IdH%kI
z<11T@(I!oX<}<wAw82A$c+8Q=xU7bUl4I89tvlIkvqeimb>yJl<Tp$2BFQAyt>3GL
zv7U4XmkJZikMuSDKff{Cj#rd@Yi5`6c<8qN$;W<5m(!xpoN2>B142TIHtvfnA4{n}
zZK)gtX{6{_3H9+6jOi|2E~lj#1)1EkX)m5at*k}f$s^_jU?b6sJ@5h11Q#f`Q2gBa
zSx4M%DP6gJeonsIx8t|kA92xtBa2*tr+YfNReiom;?j5U;Jpd80Ea3EeibYe0!^q)
z2l$vFOV+WeY>N84_mc`q3hy&UpKsrNE$|7sFau^t{V@SMeDI*I@6chxptEHNsJ1Ry
z{*<ctCGlh>TXKtr9LF^;xAh^x>gkKF<sNhkk>OvwSc)Nqcz9YgW<}OLOkyd)Ydt{H
zM;RF!?wLrjIv5C%g_;#QeOz9S;(4EnHGVfg!q2eGMMoG$LB?rG5SQBo!)_9gUyD9U
zr(=BG1Pxxmxvfa$CUtf%c>n&CPoD6l$2^E?VSHVi!esq_(CP4fkRE6n5(Y*PD%wTI
z#R(H?Fw5UB-#~Gz#D_bY>P%?j0Awo7J4!eEU}7K)MBF8*$4@85)*<$Th#iVA!+H1z
ziywE-PhY;kG}$q5?vf=WXa(#{SmCMl3&K{H#JcWR#)O#5WM#CDD=RCR-e}a##l?jN
zqcub&cFXTKVRip{6DfrbUlQuvcY;(%3t~Cd4ns<XG19NQ@u<~*?nc{`l$5*s2fV@l
z+QgSKyc>3fK%@TAb)B6t|Lr7H?-Yjw+X5C-_}fUFs3D=wn>Vi>GaKXdpU-bcGovv^
z))p3zfNKr9fzRfmYA0)FlNLlaQ+(=OZ*TwZop}zWFlHJE&<W`OKn(Yuzj;IZzl*m-
zWBF3WFL)0BeJ93DBNcMx7YMFq@ix#<NYLE)7XMj%%t-ltg>JpV%M4wAA#lH0H@r%S
zj2-*U^}-rxyLa7{Pyg?2i{T4%U@?Y$(jWw40|a^G)lG{C^QkxL_Je0@O6mGLpfioH
z2iMHy!+FXk5T~AN760ZLzM)LPK;WsN$}C2D=x87#9D)HpczbSb#=}>w>+WS}|L=W&
zy{Lb;5UKE_riTTXl+`7^ZZFAZx&{Ag38ix5A8;9f`2f4@v&7~Aa2ofa?iI}f1T4$L
zIY~`jop}9$TEnsRpZw%#hr-vdahtk<&nS{@*@We+8-hpRzI|_By&6|X15h$+&9aHw
zfWXFE@_<cy>{!>fX}9j&iHV7!1QJT_l4$yQ(CUe_LZDLBvqz5;9a5PrFb$BI_||#A
zf+?Iplsa;n)av4T-#?4XDp+aGlP6OdE==i>ag=36EMdFr!@lm=as3d*jqwckHNIeC
z%fKb|nt&ZUrV+A973f*JlNj#VOqbed0Qi_uvY=@cWg&8oXao`$a)tD9@AhSMU}P@k
z90NJ-YeQws3`In@O2g~Oky-29R(O1QJ=I&%qD`CcSNHSL_kk3s&LxQ9`=y;_CAt`7
zRm7l$c6LeggV@f?*lD0z5SwDl2FW>nxr<oI9PDv{FLhb>75jo4%mQN#2&avKT7}CP
z1CMXGnu>R#y148-tXXR6lfq=M^?m{^l4^ZS{BjTB2bEDwtg}>_LC}tgZI`-?Qcqeo
zOj|oFF+CR7Hj)gQP9Pm;64T2iT<_SJm_!gF+HtQZ&AhaJ<j|p(%Aa3s?o8*moGU@{
z8YUCU&s?2`N=GFiq)tT{b~xD%8#YX`g{y9KX*G6qA&o_!?UM>B1sL<9|A8w0;lqdC
zs%$9Apix*?_$SE8Q)(Y$4o=QLmP=heGqpu4b#)xCyXfeoW@no#1I_fK80&p_5nVCs
z8O=l?cfj99ATZ~LFAQdG1`!zwkw<X^?V)xkYXy{28NPMvZ4ON@RT3gDaJ$2w$xt#1
zgsG2xhS#Kze<;~%DwY`O6MIOa>@9ggCjvU%KmS0l7&rEx8GN#%K9mF78EZ}+f<0b2
zlvovwrm%z(6Pbo^0a6(OCUs^P#kV->{#T;ON^T2%hRvHN!Qo-ryehIhVe4Zz>&fHC
zTuM6HCxe6i-3Q5f1BOt(b89;xH#nc2NIc}y2<uT?oCWb^kgbV{uyKL*2lJ?i)GK{>
z6@h$jt0xrTn-&TQRSXjVO*dWrLn(AMT-1CTkSrivhAfpIZ~=hh2jNw4{dzFvDm$7H
zIYG6z#zfe>3nzR!Z-PV&*&0=;w*cu_1l((;B$G5H<qoP_VTImhz30zfx^yJ&&l=Z3
z(TRNlXZtK-QU>G9c`@M!^FAWTK}-)&#hm&X-Bg>!V%9Agl`TyoTDpks1(!$TIx9&~
zAKtzDfxEk4P=NTR4^Jfb=S(ooI<d8?%FTY9v2oO$!Ujqv+LL>WNP@&$t9tP|SIiJN
zC&OMNe(MGypmwK>$tvaMZ1VB~PJBu10gm=-M6rfnJQfnd?~<}V%|=6Ur%duD=Sw=#
z*~-{t?vk&fK_cJX%Q9}+Oma~3R;MNd8k%aUfwAW>RfIqTw#CP7-@3I0%{>alA$iW%
zZruu{Y!sNvI^hZM=FWZ=$w5d$?HI9uWnTNiQ(R81>Iamg;w=d>IfbP`K?JQ?{$@BK
zf>Lbi@B)%Lh=aHRY=R8R0;ewogVdFHF?X8?GoO!e(F`|&Bb$Z7>~W2cD3ig#MFkQr
zF7eE5X(}2ZLqK9;9ydobsd-}!I?r$*#bqK*hvxsWVzZDlC`XeM6Jr<N6~wsWv%O|q
zFj-?;o~HiKKc=OZsZe#*e5k&aH2|wbLc-D}r4R%&zNcpU4*&>Aj!O@%%>#Pu-?uMK
zg0HS0lW;w-lF4LCPSApq1i>k5rlJxKCeQF?fB}T&(9RyBI;YBo^CQl@l+kujqrL|2
zjnnM;@GsH22-OkVbv3p56g!w1a2DINW2{>d)gg=e&E12Ty=yG@R@}TXDMxR2EeJaP
zrDjh)Nu#yZC%R37`O4-&MK>G@O5`c4EBqphFr<ki?~h#j{<CL4u`k<Y`z&tx5saXj
z?NO<La6(L-OHGyfQWC%7-|2gI7N%R;O(NtubU2xrl?0?`m_UI>0qVPL+Yh`_X3m%q
z<LDEx3U!P9HO4CkP77M!Y|y2{teBP(wN|azMKEhG%+UD<_4#prkDIpFiBx|%VIE!p
zxt`hiB32{{l?wFLvPr1lMx#CAF=B)pSvnAYuk%Z&AK)E?lwiRqXa#NBgkH@iYQVe@
ze6^E9Xpa{A8`{wjWV&eA!e#0zDfIe8!|u)6uz&;4iR&xiiIBMOI`CW=U$DERHX^bq
zl`{55<$wRPO>kN|ZQ2fp`za}Q`0Y^)W@W$GRd=Dy;27N+CvO-N8=IB7f!1ex+;3FH
zXm@L?GcSqKvsq)<PUN8WQ+=6Frp(m?>lc~-#*N;p_+9!{CK?9EEHgLX8y{am7-SXD
z38HNi(xF%+zUUH{W(_960|Vp3c44|W=>$=mbAk$*L(k#}HXFSPJy?i+nsI$}ve0(e
zN9br=r+o8LrQ8jr5^WWrE&<1KW859(Ct<Ig3*oKG-Nl%}arNpBR5au&hdrG6P$63?
zz!Q!PTF6%lPdhvN%AZ;5viev+iaxw*FBlcF(NlOz!u-Vbl9nnpqwL78BS-St3#3|9
zUT!q-U;y(8iPLWo5O}GIyd}HDa?gPS$S?As!xg=8W$6)nfr{C7<i(cCjEAhKifgXq
zyi^`uxYS_a6_H8lw1?+~u8GDJhnEM94r!S=O;jR1=j0U5k%I@@*KurU4HCK<!8+t*
z6kQT`0Hme8*)`4`J02n|AEpaxv)H^lP#P4EQ}lLW6Wiw{#;YEq`$N{rOxzoY?}P7%
z+9~LOFvfZR9`Yq<J}D5Q5i5lD7-xce^UIAjnEuj4`@7VM>OrVT0UVf<ln2R-I?LeS
zOil}I%U^{Auw?g21`yzkXTG34El~!Z4><iIjEOkS8EXxI5r6Tb=zB5;cdP0#GI=sl
zp-KT|1&g@|dF0Kh*$xgmnrZm09DkN0qd!HajBy$)QwL5tz+KU*CKCba37_Rmqvo*w
z+G)zsd<9@KST|^}IV*{J2E%gb4`C|V+D2d&91Y2++aSILw*b0928hChI$lKsEl&lb
zAA)?3bWwUP50dGSQ`Q|df{Qt7)F@<uANh!3*}D%s$C-koD5S>)^c#9<9*$z4I5#FV
za5FefI5x$BF@5@O)vG8N>1u&bLFfS)lqXEA+f;)gqIo_t0+FQ?#GsKMR2s?}RLaGV
zqM{;GAm0cP0WpKfO)r1CO`7>WBE`F+pO;4Ofl`Km#3#Jp8A(tmsW*F$ExXjdd!Ihb
z+1|B`qBRT^bni&q0g_%#!b$Iv2!@qYFW05e6d-<>b}j-Y1ljE4bpbWbjP#8->Ciq>
zmoRb5C_$HaaRE{R_n8k7peiOVXIw~5u7=x&E%6zImx*VdF5`9(AQ7>|+8j)!S0}t1
zH6ycp@dS%a!hB1^3z(P_ZrfCNn_|ALYS;e#GqSSGeul8cjoPzRSW`ssaGUAne}Clw
zvcB{_%9AZ0@i7}%E5;*5_)--It)npHwn`&ca4vIU!gc~C$Q``lt<C)wNs>ZS;<YYl
zFB7lEx(g>K8mD?@ZOM0TrKekzz+phC6fDzaq#?bj2w@n8lf}$%b*h7tm9P4U84+M5
zuXRU|H)Xw>nGyVBl|^Pf7r@{j7K>DV#a;77vNSC4o0+wB4v1)QZlvllaxKyW-K8JQ
z4`u$fmOd&RYH36y>&2*9QBk<q-Tn|5Pm4uM<BnJ<ZH6JtB9;bQ5w(pxdaz<$9Np8!
zeVgMq4uic-4HzfsLTH6`ku#FPi+;eVc*kW!+_*uvF=1Ok95_qp`H*RGnv+E9^%-KL
zH?Lo-Xuxrp?x>yhoMSe2Px2ZkC%wT^zN!7VkzO)ua0!}AMMj;gKfM@NG%S;2q)*Z<
zQydC=cJDsoT^868xpLBq7GXNtoo93+k%b|-ss~jbjSi{uXYebKN_E$)>}*k#691$%
zv)807OC;E3Z7Gg_kr8Qm<H+-flPt;N1h)BYm{F$T>Tt#o+w{vijiJ=4Whp1Elik)u
z-?$UvKEoB%6l^7U)Sg|tOiKIw`{sg2&H8Ag&)^1=M+Oi2M$;;yryB6dz=~BT?=d`t
z=6I|PHs?j#Iv)^o%OG84O%g#xs;QQa?odE%JK<i)zvhqnpxgMH+^{e)ir#4OC`-y5
zxDi${i>BZ9a4|G;*q{%qk1Z$$DLHINV2`qDQp@iO>h^OvP8c;boH2|zP7im`TR1MT
z@rbo%9~JjYNoly)$J5#KJs`;fEks7;(nTjiK|trInf7km^2cY!PQPk;ElP(HQ)k^|
zgaxKONqSp9)f={l9%D)P)p5p4a~@G|(1<Iyx0CfxJrzDRY3uBUrsa8|fj<WaUoR%6
z!+=Vi=dQ1x@Mi6BxO%tXlBHiTkiF7ezUNJ@Pk6JeNM$8YRf!KH<q^;i#Zl+%q~&JA
z*M6v?-4o^n54M!DWAS3)8LG60;srJd%!Jh+a))t2A=gHj-%U$<$6lorV$s!OTS{x(
zY&SVRBG^HM))-G6N+AhPjx#_=Qdm#K07Lf^J9bQ5xkB5bQl{cP7xyuCFeJ2(BD~*7
zwJSR{NhiXkS@_}ds?60e+!({|;^cH*ExDI|GmnAlRJ>DiDE@mr`X`IyHD+d~6c4i^
zJWV!R#lEE<?p*ElCck_5Xa4Aus2+6h=FLg&aU41!GlS>~7aK==m^)Su6CJcu+cO;K
z6Gf{Fm!xoYp#N==&)>ea%;`^m=|rCO)7!VhVsycD#*GZBu8OHN<;%Bn?MAK^VjV>7
zm16F^^@#R2xz`WFkd}ECYz0<0svjMQ;|2!n-bKbSCr0F=^xJamwi!&G+=dDt$RT(p
zg9q^sBu4eu6JX1jLNXnZ4)K4mhGZLwj<Aznl9EK^zDiLnAWxNX)a*CGVlbd1{90HH
z>E3-lxfMBKk+2Eaut_83jd6R1Wg$36)ybqpn`|GWQzPJnN;`5m9(&eKCNn@e9k?e-
zN1n?2StyHPMlUviHasw2df*^O@}~57V(C{Zlx@xEw$hTIg0D{aH&sj@lWc)0A%9p&
z>oNVvr>cYF2c52%DwVeN*bsG?NznaI!(<HXfBN~07t?e8zTf&)L4oYX5Ug`-zZwB?
zSl&=i-PcN8!X<rG(d^!=P|kR}OKQ0mEkEeW4P9p;Em#TAPwuOyrG=LORN0%HWaK$D
zj_(Lp$ThI7msJ|8ap)q)pne(o#>P@yo`DuXmgw)G1R}Mb`E%n~LN^CC(B<BT-)`68
zI2IG_-Y?v0kw-`6U1nG}uYHJu5tKO0$V!c2Dp|qw@crb`ZuegDXNSQ{_SL4YIXV|w
zhFe4(j@ca;IHNR+&d=n|2O>^1j?Fw<Rxor86%@>rLg}J)998nOkrbV~684_l74AS8
zIisOyj;lN$Ro-K|Z$y4~h)6LUls{SRoFCG(r!?VVz@VmoU05i03S$i<0WhHG$nZ!f
zA1ESTQ9f$8h*jc`jNu#SKCLm-DkzG3|FnqXWq=MOlB;}K`keK6s8S!W$NtPKv|=oy
zYS&@IDj>v}`Z74e*yRrXQVzF|f1o?CRG5@jyfZ#9(4e;3qXb`?H3L1)!-)>=?I>Sq
z*B-6h7|ejE^0G27RWeS!!8Jfx##2WGOrS;&_T|$oylVvqK{_Da;b0}TePa!Phm+4<
zrs<J6q@F(yAOCbaVk-3CE?$tkcDZOoBv6rN9<0zjJovQqt4O8Hj-5O?gvCQFFzUS=
zXkp`q4LNbkJ&H56n_0lqr>nDO&6=MacV4QjKE5`g2M$%C<q$5-CzqkC-_i$J2wFvo
ziv+tz?XgKG5@#)AnarPB>KFKBrd(umYaVC-QMRQ7y43sy3k)~Xu>&YplZcU5nhh>+
zpVcJD?SRGf(`V(<79|s*$4P7Lo!p|OC~iPuR9}J<3EM#rZ7LByT`S2x68iY~up4VQ
zMG8^@MzcEi?CB*un6q`^CY_JLaIIlvpVM8RH3fl!ezJGdW(F9}3?hA0Df(Zpo^U*v
z{nAoGxQ(y6S1KX%RhNiN<DzCJSiV7fY1E>4jD1W$ch+uJB?<Z27^>prH9q8e{y~;X
zo)g)loS)GM<ccDO9vE_Eq|^I0y=&q9$h13mpx!J6c_8M|c<wrK&Xh@$PU0N^dJpyS
zi2K(k?UyHNtlckm6_H7upi_GP(Ie5mR%Nb|*~r#IJ*wR_u2Veo*}rm5ETrlzEIc&Y
zV?A)F)ZYox5&W<9FDj)!p7LD+9<>ks3!~pf&~?0+l1x5r%zVSUcToW?0&B&1v8xx|
z35K6dAAKE=LRkz76}lfz4hkmWWjM;s8FF%re=AW8lXgh9(9#vN*`a?Vyffm1^jOLq
z+EXL4J?y0;DFr!Y_e3|P<w|DNL_-WFpd-mG6-i&bqnOMm4SdFIAMce;N=o8zcNGim
z;B&*?%jtVhNfSW#m~GRT^G<5Z8}fxdKp4+>&c%80?j3%eS)g-#m7+OTwHJz4*#_V>
z05E~xvc`2jyP0uF&GU`T84nN^73Bfh4#R}Y9AEeEp8=qe-c0?L=h}x+wtgwh>s^F$
zZ&|E`3KCP|-H?9$42+G@a>YQl=Dj%WDQmn`Nl5l%1sOeV!M(sI4A|DVPOQd8(0<V(
zL~)m>u!L9ffddY4i6neX{4-MCy=PAb6AZ}W!zx0{#yx6<WdPDfjqBvku@{y+5kBIQ
zEu67dmX^0HC$gtG+Opu@W7$+&BprmR@Z{-J*ep#nND(@;XrVE09i6p<o2IU?Unc_7
zqJYfz*&LRnanQCQGGtuv^D||q!wW}jn^qoH>w5}3{mzqXbo}JWZ#WkzYbdM`Bw61H
zD3E&lG75xNImvs21{=BN<sb7sD850<&u!{$O#t98Hnt%a?FfTt`BM3etaLk=SRAm}
zB!GN(2G8XbFw;^?c@5ckfQH7{VrL|9v*^I?995~Mp)m)MU*YsTL>lqr;^gx-R#x&^
zo)as_G9r8cM5w@N)2$K7`(NC;z0*kR57y%;fmo#pz>u|N;Hr@$lX%<m_fG`-gFDxE
zzyQD6{`vcg-xtK?+*7nJ<Jt{GjQsiYFgOUrXF4>&H|tb2N?P5#rD6UFjS_>oWrp$B
zeyQcU?4(X116i<eA=kWCljP{7Iv217YPLPF)7-gT-G3-4sS5l8w`8UvcA<Bu%-0-E
zk|lafl&^bx4As{sKT2jzoZVY-pdD)|vvm!(Logo`1pmrE2L>NF?zO8|=|7$tmB(?*
z|NhsuKN!UL({=4oPYZP<OR}Y)d1O)Ql3q6FPxW^@)P)5_5~AFXuCNd{O$JuH#Mob;
z4>2ZQc{)fmdP{9#!&gp+v(qp~g%ZoeT6*p&Uyr#R<J6M`2#i1zWML(pP2_^Abs8|G
z)CM$t%<{-FnQ1D(b4FgoFK&SZYKpNjE|>^VF672S8I0$&dJTX;A9NtXu!%xC9XO0*
zb4v1AfkiJ8Qhm-@BDXzM08$4*E&j|IHEH~KG9_x6@s+RJD|T_M@@0%1BKvuS92(c@
zLTvN#nSZJ~Bp7TrBwO&1+THa}rK8=$8h-$k7F;9iTHbyL33}^}9ZO!n&IaC~Mn|V>
z(2g!7#-+nxPm(<)B_@(c=q*2_c(2Rv#t4Dwm?m^XK%3gcN2rn?PBt>~OMo$^qYoZJ
z4={D6C<;yN0!O*yyz&yraWZ2on?VamMDzkrhy1(yvbqFE<+sMo(@;<^i0U-SM>B%2
z(izq^^F+k(AohQ}L!BhicGd6BX=ty~FJFX~7JdmR2$adJ3+(8F2M=PT3GfX2aeI9S
z>31*Qvx+#`5my108lYC_PPA_o*mJwM5Q$RF>aMJk5J)M$xYDk>B)FVDXF2~^YUQ8V
z?e4G$C~<`zHKMM>RWepcEyZtn`h2B3B_#Q|7sUBs(Rs+=!A@(}GXCZ}sZ9i0Sc`Ra
zFMoLB?~bRsKssuwe}byOdr76d_kE{OiZgUo@d<0$MdB^~(@z~U0To;tf^-1x;8Bk;
zK8Jb*ABK}AwU!Sfo-eH@3fQj1G+QgnjkJZLi(DI_@ZP=V;p4=`4zGZ51g;Y@oN<cx
zu*s2aUQtT{?eNHO6*NM#2aD}+An?h{26;zsvtrGfr2>8vC<?t$w-?&BM;4pi(Oor5
zarvHSjj3xZ%l;s57qNxv9Tz5=Ei=RC@kw|~&Q`?fy|Oew8@4g+DN93mgl1I{l&&%T
zM7Ej0Asj*e%h?rFKp)!(mPic6tq^b8+I~#>mPcHTH*e=+_d!>2eG}W&i4r|iBak-2
zE5q#>MU*9=Z7paRG8HkT$vSRmXPOru>iYRg{`Fi8leTsX7Kp*uaP}|IlB#qjhTH#m
z+^qAcMA?^FFI!{?PV0}F*tKuwOqZ85xY_x93#$nY160)mEUxtKzP3fm<dw}IW(*wk
z&7$AkOxeI0(y(5$X5BTso9WmmPP+1sN4M@Pw^nP`aDtlJYR|Ea+N}2o%wKbQoz<p4
z8Z|2WQSt8Zs>5GKeCx2VQ)1ccQRVLf%EDXPlMNc=Po@`ccv0n>p+~On&y`VSH<L1E
zWhGhUgv9Z8vuCdA^!Wn=@k6`0r-x$uc&6TAfu%nlcGMpS>!FNE(6}y~Xn|MfofJ<w
zTD%TE2=}p<7kNZD<L9Fv{!u*(G!Oig#>;7$PT@xKSkT80c(RegQX+5P2T9DcTG%=h
zqQQec<kwVxi-<~gc)wb44`#PfXrGmo<hRhIer5VhNO17vJ|ybA&<Ly{NDSD11R!3i
z<vNfi7Kyhi+u)xbQ$8`73HJe#Pv1kLox&s4rXL>g^oli{cRlF*kS9F%D!&|mpc
z__O<BUdnOq;>A!v%RpR+os)z+!hX;JRtuK&{<CVe_4H>lzTfOv`*O40Sdb!C&u~Gx
z1>OOfV2mM=U`&>sg9GU2N9rASx_L0TB+7C_^$s0I0Gz}>99{eCO5t6@6=B1(UtvK3
zJVqCoWjb<0WyX5M5H^U%OeboiKZvI{=sReT(8Y49V|F+dvXaJiB=Mrh$vT~PvW^oZ
zJyy4W+L)qwq;08&cW4RIDdFy45Yq+Q1k!&d+Z(dvF?fKM7kLb}a2Z_Z1@99TAIqej
ztWNMdk0Dal%<2MSW^=uwV@!B$uiuSpRVte3!l$0ZNV0`Oi4Rjl3-!jdT1K#vlIFy6
z1vR5@e-Ht<Z{L6XXfMWKc{*Ak$00~Irz@xoy*!SuD$u;g28tkXbbe@^DEEd1@cTSr
z=xH*R<dWMlVCBp4MTM+FeD0iHo%pNv6MMD{`b|bTdJM|LO4ful5%@_AcYR%V8vLC8
zn^H3SFR`-F6L_lvG2mP>&}q2h+usj}kN!vTpZw`;0EC-NEuWW{N5AF9J#k?1sI0%v
z{P*QWl&tpe>y&yX{ZHJOR{Na){1Mu}{ww|dVcCSb3-tR(NBh(*h~Ga_a{te#uKV%Z
zZT0Ip8CqD>gGJj9)qO0UFuP6N-Sc!@O^1uq7cwer<=n^dzhAY{n7a4YngoWdE<sD9
zudRLi|NSX_i19SqYKf)TCMx#6;<ef+Wsx88IGPBRSVLFWNcqK^Hw*cN`pqo<vBA;0
z+v6X=$!jo{R_OMFwY)g-uS&DEetqJg2aCk~5DhP1U!fP;e&~OcDsunBhnLk~-d#t2
z-JU)tXeI%us0i`x>}B^xkLAVuF9ZM5WM5yHDhF#71}ZnEDZC1lYBttXDmwUucpFYs
zp#wiBcM880-hrZx9BTwVMf&<r>n}r>(Wdiyicbh7Zwm0h-VHRh+YMoLc!mpnN3w<5
z5=rX3H;PyFtQlK>SzBY16!0fJ%vTHeHxu>S9$Oh!*LPVD#mn8=Tz?1k3VJLhGgADE
z+3u<Ut$HQ6Z18IqQlq}CPr#tI3a=frbiSVNp+9ZsLot;o(?P@^t@iy*%4v*F9t$I6
z<p9M#8Z%0kpRCLjje8#ZYqx+-d%2;e*BRu~g9@MMdyCdOCExCkv&p6?nHT%J*-qw0
z^A722SCCN(RDR;{&{E6_9}0qO{uR+X0(+l$`{bV;hOgG*kuSz9W6S(Nt75XwLUYe6
zRyH<9|CT+fI~Zl1WclWEu;nGY8R%5YnzH>1Im3-<fAr}^5My&U_zs<tVHS9xfLxMa
zZa;Kyn?aaN4>K)_C&`vM*EYeWn^d!y+?Hg%L#Ix{Zxs|4@XkDf9uY-cAu4o^E;KzD
z@oaqKMvnjj`~-9hH*eynawj)eFiPMN(!?Tv0C&B3#lqje(Do0l77dp5xsem*r7DnI
zN?a;_Qd0;~w7w1!8ZombKcZbPHI9&mAw^@tyjD^!#9YW=P5n!2{AxOdJXq9Je}LlN
zrfw;Is&favF^|WJ0{YXQj70-sl_P$j%MPGqFAn43<2Vi(u@&r0V+u-2*2rp<4HQBK
z)289TD8?8V?OqjjXq3CP3h<Y%<Fm70s1(b~)g_@>#k4Ql=pX7jGudre-@c#FQ)(u`
zQgx!7<6S7Q)7KUYaVEoX$zW)}zkU9^FE>=Q&b4OkK76>EGF9j>avIK|feOsWCnF!`
z?h3SHUG5iYzV1d`X_7OiR&ZQ0(QV@GpbgF1Aj<XpL&}sw``r2S<pUyGZ~r5%^}G_9
zWD9*=A^f0R$@v>r77ywXBor~2FnauaH!I|z8v)6&sE)B`JGlOs@t?S8(ObYIZ&i>e
zE)!XOpO5MRy{uZcZ?Eh1_`=G0EKoXnHhH>+Ko%NitvMDiT)b$0=UAVexw*Lr&z7+w
zLf$PN3OgJxH|_O>a*K)E+kDPh97X3a9Yh`Ydc=q-QDLCMoI3SqfuAvSgx0+*O}_5P
zM2Ntp!oZ-l#L~(NGu0E^4o)aan+gH<knOQ4um<YerHg3ub6PEE8{jAZT(^8CK4JNA
zsXGo?78qkSXvyOhVDFF>(6i&Alr82{av+fp>>wO-nBv5%Ra8Kf+FRXDv1mL4{;7|o
zGjIl<9wysc`0qXW3=Z+2l@$+84?VR{U6b1*y-%8<VpFF1nJFSjS|?7J&{%`@U(RBY
z8fQ`2!0u!frA?w#1iQnE{RmSbtLYs|w!k`n6lS^*g@fJgVTkTIPo;wnqD|sF?Kxz<
zxt1Cq420_%z;ta^S2sL@>L~5(vFo1SR6->PqM?CJ(WX;0kD^0o)Zc6$_4B5UHP|si
zGHHL#;lZ&KUV(`m!KU1BI({?J>yx;EQ*t8{V2V*A7mr?NZk`QVjSe_<ALy}ogzNn$
z;sS-NhmBR(bK@mvK?H+h0fxc#y9;FTr#S}>k)av9CZcc&sQe$gh6Tko;9^`KJ3;k8
zkV^YYTg}I#=0`pan%?CyvQbplkMtJ#!9Y6&ahn#Ri;(C9d>&Q=lX#a)-zFNPaPo*R
zGk;3-p|94>>wfL#WtZ4lO>a|HchA-1`Oe(cFBEJ|G_Y@Dy><=AOXc%vmdxe^L@ulI
zpn$b}3H7Wb2z0Q|yu*sG8G5Wf9nflqM3wu9@5urnAl62Nr~1>{!FS0lNk)9jE<5hw
zj5Y|_%aug6YvvvKqd)bJKnjo*lZDYqxqIi1;Ydav|5RzU_cn5AES5dA%_Fh|+*&SS
z?E?<@&4tK7j;TJ#k!vH}wQt`AZjCfbtKajaKTWze%C*&5a<Zia8X>c&4Sb-Dtbt^_
zVIE%%xqQzQfTO0(n?G7r3QWNZj8pChro~I1El?cgp5gUriISQ@!skd3*Oh+jt}vO6
zO=&Nh^FelVG^Ovay&XAnWZ}^M{m*7LA=KDLnj5X87rc5qu<yCt7p0WKA-2=!UUqGG
zbbQkbNwUY&G`*A?Hzv*BuSWeI7di);p8wi#x;XC!oU@L!1%0j^T;~ekC2ddrN*cJT
z{_OTl)dkH_5lLF+c-t{Rkn|$wwC!0zPqVD;YqDT2(`dbNM<M#|@NQYf5?nZni<yQs
zNQ1#r?|Dyh5$obL%^ahY{I~oO7od{Ie&^KN^(Qq1SYzu!r^sRHb0#}~K2|FY!&J@6
zs_3xjObBK=d>^{xQ>GRzS7ZvGO6&7S*&HSsQNs&AV^Ufw1r7zS*Q<{oKfZV|=Y3}N
z=84B~uo;h!0-*>B8LBEyCX~zl>DiV#FIqzj9so|%oPfY!>40NT=}Ln?aN$MwjKYkf
z5Mn&^9f>m3kd9eK&~lm)_L?_G^oo=zoK_Fy0cdMHIUv9SN>$S@r+xf(?_P<L2K<hI
zOMGv4PXA_dJr{tq1<BgYn>X=H&C9c`SqE26D9V8LVM}m;^#y;+$wAtZlkv0&9aT_j
zq|VvEfq)G=Aom%LG<I}6+u;!`i*L_4`6p+gXQrWhR+ir`q--#yH|+=Fg&3fXXAF@9
zq?mR5ln5xzy+*p`<?TIT;>1yWV~i9@(1B^`Cvd`(Z1mb(7BQwr;Tu3facL1j@#$=B
z4<o-?9F;T}*(C5)w*?_G9TK}vty(!DC576+=ScjTvsj!cAfUec%$~G$aP9Y825$ty
zz@C?oBU#W>Z$76mGRTT^h#fv+L?Va9@J9IrL;wlN7NA$Tow1_kxZK3EKGA!^%%7Vn
zDTVsqaV}w#2^>#H$8Z!Ans_*~qd3Fa?~8VdUOO^v+1o14E|Qm1U$L$1T(LFlEV~!i
zh<CScBGbEH!2t`$r?CHc4KM3R9CLk{*n^EQ#C-%sDoG}|PWR^obNid^I|MDrhK=Ct
z!uAYcZ)&9Z;?Bk(HwFgra6~}U2<8`=I16X9*iz;Q**&aPIC1CoYws$3sf&wn<Utg7
z>cOIdjiBH<avf|VsUvwUp;$mdBD}Iqw1UHsLC5wKqf9shVs`?!swMU$srmfni>^)<
zcTI3P69x|?DDmjuzZ6Xc=Hcr&-?zD6BCF+tFcIV?(Jyu<t<zdMm@B6eX9g+ZsZ@1s
zhqb#ipPe(0gK9DCd`wK{NXrE80(PHaQt0$06#kqFIr+z#1<ixSLdOcVjkG2VBnBCi
zhWgnw;UP<&LU3OG<ZKG2W)$8esijs8K3Le@xqe2tOc2Q3{)YX76SjUyH^GJ^pNied
z?m~Ms>xiaICkq%&B9X*2zk%E%C51S#{MIfF-f{2OW2Lu>fl!wxex8^dmUDh-0w4kn
zH;&@e{PD5Y?yPID3<Qe8g}ULvZJq10X^@OJ`iz@r^v5#oYFaEj@uYh;eq7<YS+7e<
zB7aV3C25LDSKq!S{(FPYw{9>^AUCLrQn<_6BQHQkaddl^-MeE}95i$;{O!AUk&NEv
zlrTDEyA>>GT;*0VkIu)6Vq832e#IgK*jxDJ3>-29IzbYV0Oq)O)u>sW+qTvAdd$dj
za$fH1!uJCwK;RJ6xo{IwW8M^7*_#-=4jAx-l_D&(`M+l0-xkw*=EQBHfg%A)UCFCg
zUs83WaAyTg4IJs}#BC>WVlGz|AJ7BF>0G0Al5yigj?T8*SL>HU;t8cmgsp?@Easg*
zLMuw2M^EnqmY|?)CJ|Y*OOXxGtZ2^^fS|kuqhKD95T@O}-9p0n7*}{0ATi+a3+N6z
zJAa3A)!@%R1+RDRn+n_t1@ltFi!X~TvQhI+h!+Jtms3G3Og6RXv%=0{rCuWCfGy(x
z@Tqol!6bbpsTo)vJk#VyRmG}j8)J<u=(Ly?PteV?nB^|4g0%&VJ7n1m4iMrt1&?vy
z&}b4M)`l@Ylt;ptI00MwxRe70NE9t&B8?HbJc|;9uE;t2hduCZpio1@%?f9@j!WUU
z6FSB{3VVY6vT9K`KoAA~7DBs;$2oMx7lL<+2i<zeK+rb@^>KS|YolUddUh3hxK4wY
zSh7iwlvNXq=rz42_Bh14VA0R2?6q^$TlH%uPq+PXvXa`N;4%Jq-)5Kmk<+?W3@|uz
zmC0FzW9#Edx1Nee!rW}du{LI_Ngc$ZBV2O~gh-^IT`H|-mfb7bsR2e75SZv&3J+ZJ
zVHJ(R;7}k2^nDJMLyi0L1)%E7w{Nw%ILtN@($M>xVxe-XNx<%Kr(^y%W2TaL|BGL=
zWlWF~M8*soZ^>tJ+_a9C>M9dRI5{5Ag2BUec$|~dYLFN=!b5HC+xue^(w0oeFoiH!
z;}Ec!eku=6m9?bB(kAJs&^^$b4(~w;wR6jsUD6Vuz~pnB=3=s)%msk`0ym}NMG<ah
z3L{;F!h%FDE9vR?)M*Fgrs2ac-VXua*6Zy~9g0`w+x6$b17PF@@dEGPBOhH59~tH6
z_mC3~!-XEx0x`OfJo~Z;S0#8f{#7E<bN;x(`4hk!cP%2TnB*Q_!>n%)@94_Uoaw8*
zh%|u|pL3Lyq2N19>f+yv<5cw?2gYUq&hMMyB92NpIjIT4)Iellc)L-qSHBruqwN$9
zUVzn!kzFcGZELKLa@WLST!tM%+1IbQ!AZz9*yDUy#<BN`w7dK>eEa@3+3<UVmuK^f
z5E`s9&(N!usGt<3mv^kDicQVbE8FO~IFs&lyMOK4xXPkWWY<juZQ>ia>Y~=h?fWuj
z*TKLwKvh_sIOabA=A`6$%{V!^tzch);d6HZhtu!fBZp<{q&_NgqUsd%^Z>IfI}&q}
zF*h5wYxK2-w-f$FYs4p=eywa_Xi18vsTiHIL$C~8&oH1RsP$`>UCrdqL5K$~lG+Rh
zGZv4;zD=_&6{y+Kt|fU%`hENMo%QH3rBo6k8YwC*XEF{qi~ald0bClb<SmkKZh3Q#
zd6&KuABLMnYzSH6l0(Wy)DIELMaQB@r%?nQKnmQ)wV$>0c6oDXtxCzA;(~(iqishp
z!FsLVCGao1g$rpm!_lI7=(e!t%aNK}%a_tY=LJyF#(^uzyVkU{Vs2lq*BYGq`1zfj
z92d?BX|tG7xzC=(8ZEbjT*j|J5|C`cx)gL(ZO}F918UwE7#E@=0hSv1sP|}*v=j$>
ztI~tpWt3qQ#I<&GLzeYyW1;aD)vmKzIE8?s6ojvauSKNZFd>u@1P#UwF8>;1Ip8dW
z@S<z>ix(%%zuhwax!G5u_nm`7jD6stz<$vyIkzb%D)q2|*=IC>bW;{n0zpyE!HZry
zkNM42zM)EhJLDO=`PfW!aWsC2*saJyIlKdvW1~PF%vp9csjf=B$>5_Mn6{{NJpN!2
zR3Pd}W^U0qFOc@EL$_Nut}l`eiy<T8T5{zT*FQiU<gJBWm{Po55g3rqfzc3;sE{RF
z;__S~R=1_WO9#TnhbG^QR)IUQ!XQO5j2k~)pzN92$d=>Xi?DiGGo|adF1^0rc}Ktz
zTp8(mTAn1=$9gbdX2q4^qZ=UKYSz4Yz)LcOR@SR}c`YKcQN5G}n%;ayeJc!1)sE<|
zJ$=6)r!P3S&(^IJ^HlDRLk#ELPD{gz%2$nGaA|h?S1pS&!~ABnT#E^F$8KED6EjV1
z&BB*chFHYgMb&z=nFU>I^uG?4Z>x`!F~28pN=KlF+OXzDOE4*V_S(3QEKGi#-RMbF
z(>(@e{ouSxb{^cf@0M9Pbp=_5`rbX#F!)}UK_?43Thd%`aGVj_W`%3N_tWJ2_iNuw
zscxFl$s}`HEEx}1kzf6*Q6ux9({B{pM9ZQco7D*m^+|8ktlh1wf4xUZa!@rwNZj=j
z2Ezb7z0>#CfdN9tn7e#A^N6AX^seEx7oQ(a&u6-wn?#wwlhJ$neQXrlw`dXc>}X7v
zg$oyI1NKdvJ}=XuoC?@W6$_Mx4~3#6%OO^+^{KmA3zjbJ{q10{=G6D{dC%geA2~Pz
z5&#_;$R)-%_s#ui%QzVh(t-do@ZL_(9L0$n)-;JcfqmBd)e@E)Rbs$P@>pVAc<657
zgt9*D+03*3^%?Zq;obK;Fq)j+Wl#MkbM(G=-zuZG*Dj-rFfCNuwhePn?earDwtra5
zb~tr<jB8Sy6B|K-q}Ca_LD#fx+rl;FX@|U3K}RA&S2w-k`E=WywL0+{7gafZB^;Q=
zHYH8$K-I)>D%Go?f!D4b-yW~PW}kc4L&c$cm?PR`BtXxyg$sM8<fI?YKJl#6*-$4@
z_2Yttq$4xZhOB-0Fum`+oR`9w!E!|VnNCQTZzV=kr}lQZLmNgTR>=*hTiD`!TteHY
zLu;EEBIo2{u_*)k&pZ^<<gYagh55n8Q(E~+^r~Rys&`-<`N)#IV;J~1vWi<xLKFpF
z)mQ@wXfo@6?vcx<cM4`tPL8#Y#VO0_i$=a>dtuua<~}|-xW8#cmgDqT#qgCiO|yS)
zO}%?pJ~|LC^~KSRa+;{0TG#v4db`V0bVfh((1PMF>=@?C4a<qhvdPk`_wJnzU4PB7
zr=y0jnMx^`rv(VnG}+WX?j#nG*&{7o$6U$(2lNHbphN7%X@`cB4BAbpGi2z~@>hj#
z(vG@$!l6BB%T$)m?di4X$=MJx;>-mf!4jZ@rCF?4MHWY=?<wU-e*UG*wt1M0?N}2t
zuXeg%sPzl!mYq9Cvw1izky*e~rHW}1`A_fSYGsYubo74q`JAP*VqJ%rkNCO#Ebgp_
zSBa?x=o$GkXb+vpEcp^aBm3icP9SK~N*}7d2c{!rrZBmysXD)6Ui>!x^c89aAT0f!
zJ#P}%iMJ{1mCFkl(hW|^8INq05wheF4#2_`v)u5s)Kr@D*+8V2^?0dLoqix=35n1-
zo1B=5eyH%oJubjS-H)~Bo=!!July1umWTZ;69x`|?4AFl{|AdkcY;eF{@mQviwJUs
z@+0^=@nn-u>Z7Sgj+jf{Y?{%y?Fv`zoreq)o+MU<=owOU2emfDs<ExQx~3OCf&cF4
z^i>fSoEz77rNX;+Y<~99Nt+Uz<w@#lYTdmi8yk-%xx;ZPCf%@E5Aw+>jtu|d*FYju
zS4M|y-V|O$ZY8`8gq`@J_@$#J_%cI+6)AtYAuA46oTkfSk=`07%(q(GqjI3>owT&4
ze1EcbzEj#BOYWsdWzosAcTB{1KX_vT8zN^0YeWj%bm%&`hr%@#`=#zUwS`C{DQ8Hh
zavIR5WKN0j%qf1#5!|Nlzk8$+S#;#Ji^Wt35=UJxXI{+h%=Ub%k{cNm7MMo4oTvm|
z-SBtX*;#D||I-nS<LL1LZ=vQuZZSR9*eK|+uPov3b9Cz8tgb$?<L;y%C*`9KI%&?i
zToMxKq*L;7d9>Z#oCc+9il)I39URAJDSA9kaV0-F{;s|*>JM%8j;Q*blP9D&0{qj#
z;+)<5`5l<RQuVPxzR}o(4W<cK<^%y?r=8u~9S9ek8Kl<VmKe5_8kryh!kH7dn9K^i
zF0-F8?m4pPM}SY9bcOn&OewKFlad@;>bHM?*rBZ-!WX-b>I*gsx_VR%WypNaGgvp|
z64{5>v3CRvXm5JD3xx%dcAB9f5(}Xh;T|+g_F}LWi5&%;J6JONOCOn-u5KC_eo9IR
z@e9P6;j5QCYLZ6?vR0$?E6)o$MN4*eUH^>h8)i5@A!ere-k+&w_RAbomIdehFbn%Q
z#h~qc*QgOdfByL}+qWLZw8{0%S5LP?YsqFR!5qLSgf?+gYBR+(?9;TaZF)Iva*zqW
zfhG=jc(=Paa8avGKDnL)Rc<KYQ3`{-c8yE)w&yfIuQ!_S;Agb_CJZHjvW&a`v})C(
zA=qLs=WNCm&@;eg!G(1da=iJ<_;5N#$X920MwmyW?YT{|U6^5m4FueUOO*qspZ0=-
z4uNsczI~x4TFAt<m1-r)Ib1-9&)sjnb$mkQ*I6}{7Q;g3jLBKrXPdiqQne`_!H(3w
zcKaiH{gBTY5LO%$H+S5c4jy5g&)Sa;g_8;rL=PGSwGNksbDnC9N2f^hw9INPPIWnb
z{%+Pz4H;y*x8gE{`qZP!g>!+EIC<E?fM0{1^t{^x>?69<8u{LplEiV))7o}RZ6Bk3
ztDL7#(^k5;T>Nk)$Jf#54S5h{#h$qep_<%9C!QffPZOS7QNEHUA`36F<Jn*J2b~HG
z?9g%H)G1T&3pz5=wMWtvBO_v;uEUDxwa%Q2jx<!?>sY(suE=l{f28RL_wSE{e-Zo0
zcEH^J<b}Kc#Dv1*(so3_lg(CNwD;IU>|NbF`{z(s=#s<mxzTbenk#p?)Ze+s1SZ^V
z8#N?;{OXTN4U4MBwWvu@fA?5#wXVIn+}t2v0JEieVVtIg`7P0>p62T`V5uy4ELyxg
zKK*&Tz7LJzP*eOv*G`V~qEDi~rnrpSzKI4oOg~&W3B5CDs|_BUef8?x`$xyx1qwPo
zB%?iZOL`pj-eWY`sD#kz_^&-!6{V!%5aTIR?m!x@Rbbx#@MmZw1q_O-T`!@El`M37
zmktw5g@krnJJTguj--VJ8!mA*-rWj*tnY>qt@fF7=N3bZ`fx@5kYbPQvqS6F6vbyj
z<X~yF8FB;+#pqv*k(mm%((eK0Yr-G-VjdnQ5m^o$Cp=~kW{s5NVInK3#BaoRqUjBX
zYUxLdM(NkP6hvLpdiuXz#?iCBuqSV?yfQq^F*W?<?d1&ad;9&LJ`dXWd;V4Whdxq$
zGXT~;wuxF^aF?7|K2T<T+PRS=Ys26cb^PJ+M>dqA)1XY8{F&|KQyE_e|F_=xxh6!t
z_DWy2%yW6yTN`8s4ymeyEig&>0b;<CO}j%L(#IQyJ}|o<<_Tc87q+KSs|?G2_Hg=I
zgVl=`g{qbD{Lp?m?ka080l?GYpkMH#tjO=<1uO*A-oCvVHdDt!>*w-PQvWr9?$uTC
zvQ^rtPT#gq4wI21U}0^p{FxF6KDqkvI~XlId`MYwHu1~t)KsR{1iYk>^#A7ANR0S+
z{klg=JKxvP(S|pwp;8=v4`LD3WrP$<LCv^7^it_tg^X@z-%UqW^fjXNR`7eS=Kc5v
z^pyh^S(Da)SeEXc3q9?O;n~2m;m(zbyUAB?AGD2DG%pHYz3SGGw2|1Q<6w!QT~$PD
zE@aI4^LphzwO32Y`AI!&VrvV033z^3?c>w9K6tQ(kCaE`re5VMh#>`iW?l?FzV{u7
zgx#!rI6~||3A1`T)-1bsoO3LX#G7IIJkYtG-~N){Yz+*7p%X5yoFi^0frm6262vFW
z)Ei>l+sCOe8!U45_Dpv_rUVo&yFzSh=X)Y__r;Hgqp@n5a&T~OC=$y3z>R^t<oVWI
zEsjEHbHfj8RM9|xqdREc*H53`a_CkR&a<raI3~C#uHi!FwgZ$a$W=6@y;Ui__@xQH
z+U4u*K21rTR$bXdBY45nhMW}YYr?hY`0~~h4vmDyIb&o#Ny3JXbJDaU`jdd^7HQ@z
z4-Rd1{_!)j1)QZ_*XqDOsj$#4$ct%+8YXq=t7fIg72`#e`ZWJ_2&ADmB>|CEQ2{a+
zjsjVDc0nj<v|r30+B-MaI*9^7ve|y%0d9rAdptN*s(Q4zMa8>ca-b$6y_@dWy?gh`
zBj+y83eO_@IJODm_$tm=DU(Zj#|`cMRw(E<Y%rTzIxnA~CF;vh*7SXrgv<tQDNMb`
z@pG)5W)Drxj-%Jl_$H$%;lBZYZhl6JS7fRq#_rLgbY8daF2m6hdafKsrO58*oVutw
zS0H9Le09rZM9H@Fm60C`E7Y_09k&UM--JViU5w4osp8ouMmY_CU4h_F9M`CaU~9x@
z+P61h^AOLpQ`ptI;ftzyf#J!M_OPVm7Cn&otS!k2Ij&O%s|qTuM416=&t@($iksDT
zgx^_FNhHn^j@bA62~QX9;novO$m#8H5_ufyScKZa0|&_960e@s=>`d9*m^eN*D!8B
zi**%hi3+{lYb`Xqavu-sJo3^?(Oz^uc{Vmy9x#+mpSg6%5e^S~8jf&ju}uld6znt}
z&o#%_k!YO5nspjsxy(hU{7?UPhH1-?Pl@44FS(KG*6kT#dJ#l@!^}2DG;zb}XGu@N
z2cbwg^Y3B|F7XT6VNfvfJZul7LJ#^mf|ixqU;(2Olk}3Dy_Y;4&DHIVc06I%s|^iT
z5eBfa&(hP^O=W|z3H4HhvB2YR7Ln%6>=pOyuo#@?NO3gdjDz{{2lS5x$baz-Mm&hC
z%(1^T3>gk!!Kvfp-o$P<uB2jKiMk(W!(p@yRttX6rNd2+-hrUfU}y4dBN`B^MN2=E
zDlNRT4~_5ubj0uo>AfCXFqG{_&CHcP;O`&9WV2(bf9Xm|?!k<^r5J`dA_8)ZlUbpW
zqPMs0=e+}z{ztI-9fs>ZDbI?>T(OYlAvnJIYn!f4x4QT<d_;fkZgjfH+l*E+GVV$<
z;mAT7;`em(yW8v>{*%<Pm$L(*NSbD*aUEc%$xq9@rsj4ODP3=paytexba~AS(br8j
zA{*@8+8A?5fy(E5QgGj-=aX=y9Uw#MG{_Kriynz#fy@vNg!!}lGL3<d{GVr{qxb8t
zU1lX!K*yJjw$ydXK1m}uZAo(q0>HO`kq2dBJNTNMQX00`I`S}?1ThYr{kVAq`%d&d
z86Zx7<_bf)@7|4kpEec6kzNy81CJp&Ls*EA=}?s6td9jmUuqK&?2hUE0wR_R>4Ix-
zpyR@TS%d8}#w#O(6N*BRcI5ILtZ+7A#$aFsrmmua%XBs8ih5uW*(F!U?<JwN(cgdH
zym2Eus~BYiOnf}X3!%%1KG)Zo7@~;&4xe7K1!z>bLIS9hM5o@nC;XZTkj(L1$?B)b
z9`kJkYe38xR?7#}VF&Ryrq@zao9W0Yj}D=lq?q64u7X4FF(>b3(>o4qCJ8T-AL&Ad
zy*~Zr+kLe4j1KM8Ov%2A&-QGTKsYok=Gs#iP@l?VnP@{qnBWs1*uP)U(s|2A{RDJa
zFcget#z%QIREwWTWeq;l?t+rwiUN~256dd%;|N_nfr*93r%#zyNYRQrPOapI$Wx9$
z4k+~pxh0KJYBjv=DQ_WSxl>bxgh0vDrFFf=*s}O%>ht~n&uICCs4TEwE_%~I)g(xC
zD4BjIl0~6hM-VlBmEdgC5~TEJPwv>dbscfWFa)IH(kQx2MAgajXfY2*)b4X9d^_X^
z?HbR=)X_Aqs8wFRe96M=CC_SA)s)pPbT2*_kEpAve!_b=OcqXG3aB1Op_4)%hVA;2
zB}-PHT70=A#Zq4`2_lp4LyA~SO@cnf;s?qkP7^Un<8m0jq<S?s*9~5VXp}{VwwQTo
zy$I}7;_{qEiZ1Zc(!OEO-^{O#Z=M0y8CV6z0B?nyZRU-z*Xc((w`?iRd;%;Q7JMf?
z9W&9e`~AT5_ZUT~_-x<afu@iez1PJ1(&<ZS_K?_5I5ZQjDj54$u}Fwct;{qALI>b$
zPdhL$Y<AHLV1ADL7K#?|vAwI-tdSRQ?oK^RUF2so;x$7<+N!FmwraIEYDh4h2<WiP
zs1am0--)P{R#kmp8J}|Ee`Gg8bc4Hy%GW1yj;h|aiI4O0lJB3x%BPwAdL^Z%eg@;m
z%EADcwPKEil7Dd-_eVyS005L8Vyj!gA5Pv#n~GMXc3A^j#7yP;@bTlUPhl@BJ{&d-
zu||eZ*R#ppY-~G;uc8m@mue@*7z!_b`mG6+?~YCKFp1Z*jtRZr80n9m#jPSp=@-Ce
zTa7sE?~nHFWO~yI1QgM9`Wo&unq{L658(?pqREcNjL047dj3O&O{_yK{up$2i#j=#
z78sPQ_v79#qs$HJmbO01P|QjYCumS_Ka|7@44Ot^=^>Ql`*Md{I8oDp5KSCEUM<#~
z-y%-t0(85#)Gb<X_H_y?HTd{KC$2E?M9-hA?tf+80p=-ZXRn>3A#OWw3`Vk=t?hP_
zC7nh8RC4aX(3NvJr?J-P+_B@#71N4zs|0?p=Hr+O6a3vfn==jK#wT0w*18wY-DYPd
zu`w5S-nxA|Be24)BlU(llkDJ5sO3C^LENw=McQM`3sA@jr1^RCsg!M0?}pJ(^^U)n
z^~d>+nLripg<^ObO{}7d62G_c9oIQKyJ5IeX>8+9Sm<MOeu{E5eW{X8C5k+?@9<xU
z+wA#bjZ?A6qQleY<r<|vc_PpP3YQU}Xlw=gCFp^0)F~02P&Tsn-d6GhFa-e4DYL+F
zw*ohxJaIxrgGs#*SA_C__7iTE-Fo#pb$>C+t>CUXR2apkE?8YhM>lTT6d<IGr_nPN
zVmKxTV^mg9kjYCDE%@|rFXUdiGKbGW*n7tgpy7|>Av+DT1raY`eb7dx1}dt!LD3gO
z(m?Bk%c!HLH!VztU0xQUA2fuozZSoUm=(P{Lpfu>6k{DkHp#AM`#Z$uz^~yg0ZRCN
zq1qvVTy4zo>(5N4g>1mc(ICQJ%GcaT85+rWT9H7{3=Qkix9^$z{Ya*SJOrH|tBGam
zci;d~_95sLnS<dG2k0JfyT}9P27LMaxh-S`8cp!9XyN@lX1Lt<CB3qetcXXDIhm^)
z0DnX-FNF9<u)~{=b}Ein2ysV>tp9=FO~9IM*Up7=hIxA-Qpjn{RuzZpt5*-{#fIgF
zk4hETmfu<Cu}$Wlu{d!~389cdm;ep#B<LfNhaN%iXMv!&2#AazB=HYi;$Vp-lPO@F
za{J;F654A<^v8AJ8E^wf^Jv>-H!H*2d3n{qACKta;TzB-NzAk-b-|&L0#RsCS)CNp
zOq7EAX5rycV_~~4WJCUjIYsA8Z*y5-+pOVY(Uf8WhT)+HoFak@#5H3;^0TbRiuE~W
zdcFN<s`nqR`N!rWf1cdXTkzG$c+sXPJ-3@wHyq5<FyiI#wu;|7nn5XwchN~zV2IU4
z87Ys86#u}VGTVBV>X<<NwR-ycHp&lz#{Df=*R>j$+9#T<+uvSak-jRmIa1qdj*33V
zKY5dS_H(LJM11dDuWKp1O0P>91N;2}0Sn&?3##x=P_r8nEr<NSP{cWryj0uy_5jeW
zrKZb95|*W1e#X|lu>9}(w%821-G;w7;GsUOezjX3k#*g9%{j~7D-;u#w}sIpiAt`-
zF&J4*Mae8U?Jc+M+!?TeQm2;UF1}d7JcNG>-wQ#d;_+!T>+}l_(u#o6PQOlJQ`Ouh
zz5Y2$GChbrFzQ-KaCpA+n@s;7ZG%n#sgmKpfb_q}>SOD#Gp{4lqq)3$0~vl>!L}C<
zwfd@n{~n{c=g^_rnTi57!N*(NTJadO{=YBMmGhMq8%cixKp6c<t(-tSuXF&NxB*Ux
z3+f)<J5w4{q$6UxF->ualq%{W?)oPwDZNe0eEeItQ1^4QMs-*J_wziH>yfzMKl}eG
z_s}^o@%XQ$!^@1(uKzqbGDenQiu_Oe_KV+-|Md=@8GZlrt)AO`Ce;)|)JXG$3m2#m
z<B>z$xTpN<`C4u3lm?zYEP{ie>rFK1C2-!!bmY+k6l+F2+i+7ohixT&@2?b}h#(tl
zFm;p;$b0PD=Jot7Kk@&i2$8UwDRO>BG4??9B|JPzTOLE4q`aoOm@vw~?K*<I($RtS
zS4{nGR@NG_M!=`qiAX>RpDD6xbwx*Cc0er;Q3KC#cp?Lwgs~<Mt$uZD%d-V;L6rxW
zC$C(wLRCVuhrw&SQEIKU$Ugyh5Iz)s<fP;bGt$Bh@^M?m(m8s){sY{20If?Tb5XNq
zDew08M*<K`w<Mz)v^nuIPI{s@EC!x=yje$w-<Eu#{sMTm9PpwhruHLwwm`GyMuIIm
z@V3ct3OS)yI5`boX3oEFqO-mhVkP{P;E<5U8q5^}O?dn9<MRKf2&)@*0y9~_oN~b)
zCs1#Y4_0yeu>c!XtNWU*1ck905k)t&1OY^9ksCtZT6wN+--rELIo_Ng?hNP=Mjp0^
z0-PD+abqe=`sjApf^c!5P51Mi*v*T$C2X;P2B2|oKUBw3H{4mj60AaH;Zc{WUFeud
zwovj7amc(?dnx@lO*~#f*cXf%u<zX58AZ=^qY?!X5m8{RWKUclf9Pqo*XgL^R$t#F
zf-e0dyV})kIFHl<845eHv;`P62R@0FEXbryKc>})M;o7C8ldl;(RA?8Oe&@*BrI0$
zw9r!H1#};@<OM|1^gxs9hf0!viO51DsA+wSz(Q+S^P-n)$mkF9>I)W?uWXBUD*mGL
z+!ikq3%#T@j*jg>&5_(MwX-ujW}tX)ll>2vhb|t8%Cvu00ge8=2_@|ttwv4jxztAj
zaCxAKnAe^WOVzIs@jkxfQPZ+_KMrH)|Nd`V{@>q{_mA*&Ehkz0>+ipDkhdob7T0vp
zpxzG(6>l3_Re!Yc_t`=dwC<JfkVQ_yqTs*CcA|1sRTbVMQ8mssHc$8Hz4-7!O!1Sy
zZHeN#rEeUlV^K@e7R`2jE?8(@Ny_N_e+WVw=0=dR2b2jDcpkFeJ!r?>xL0?yDSpVG
zq3x#l)(O3T{R|m*J&O7JXTOwczkf7l)_-Dj-H-pPrmOqW{nr1#qiR%5gMYkycE6ii
S@I$<q!Gvk!PfKQR_`d+SPvjf`

literal 121695
zcmcG0cU;bY-}Z@+9}TNW)5@xpc4-+QDzv15XirUTi6oVfM2k{sOM53Oq@k(3q`mii
zj_+Bn`+BbDzMto>=e%F{&lR2L`Tc%A?{OT*`}lm_<z=O*{$cosL?Th0J#+FBiA3#0
zBCY;Oxf*|SFe&jW{#bWIM*1XaiTJ;e?1*P15-aKKNl68pfc_>u3&r0}0<D4WdnqWd
zQ*S@{j+J#Y)xAx-b(x+B_g%_=znaeNZOV=4YNfsy!O%1BPrNISVhXz@pKyrx+Cd67
z)eTCUtM<FB-k`O5XEV**ozZFi&!n%vHmKFQ#n}ywiQ6qDW-8GgU-&I%=IiUb3YW6-
zl3z1&asA&PNF?WVC+6t>>qq@_{~vxj#NA8&2HJN|pFS-Un~O<HON)%ut&LN^ShT8F
ztup*VWo6}S0h8u9^~}hR<X@$FI>|x&kM#lD4=ZJjemk6=o_^=f9TxjxN&Hde?o1gL
z5utPI)<pj=^WoNf_CSkEr%#`*awp#7{D3VkF_EWt6Y&G>M!Zu_d||xA|Csnp=QDi%
zgv^Z_?ar&#l!^>xd2r<j9zTA(SCIH!iR^HPjrcRq(HPf;%d#8&%I<gM%BZj3rOTJ?
z#=FhxuDiX9h-jGHLQVVb-McSezVy|`FHPkxWo!R<6`%F$#S8u$pC6ia6f&88-h44^
z4e_B2qyZujNRwB$Z{J=SA(uOl(jYcJToCo_{rmSP+^828r*g$Dy32<gr!qHe*sys&
z#al%+wJeLCpF-wcB>_U_)lrIye>yrkxUz;nHJIcsBot749AzdxQeIrIg^0BTC)Fg~
zin<S4EqDF|MjiY0>zA^|o!@Ke)t<a~L3jOVh@<UPlQp|skf>#EReO8;@cB!ZepV}M
zIutQk^XmQFTW?5wm_+v5<(psB?yHFvXt5vLDkpmJ;>FEDLL;BI;(I3-7v`jQZHin<
zF>2ty_3e4)P|n;~nK(_EMQ@efXy;dA50dhUk8++}jw$DbZ@6HG!Sp|I8rj04{gn}A
z3sWuPH;bQ~IkAeWq$c(%i{o^g-B7mm+~h!;zd>AjSN?hy!>Y)Oe?Lcp9F5KkMOE)F
z7kM%5O8JeAaGLq9*=$-sh1I(FXEj5Zx7cjAoA`WN)}66W1^xZ~;)^5Rfx?!Lc()N3
zLwkH>{numtYc-t~w7iegF*BQ&aAPyXJD;3*dtoiF1#;wa`1$n7dIOnr=UiBIE5m=p
zT={4_HOOSiNqh?Hx%yP%PhOkfzkh2LKE5;gOQ)dVa9mpZND<4_+7St(D>?Qv>3@Re
z+T2*yNn+tA|A;TmggujeB)ohXJC`qmAtg}6I>@|K=$KCFCKuL&2lc)^Kj^1nt5@~L
zdErO+h1aEGbNyKTW0WqPot^ZW_9Nq!a^5SSLACN336CB<+Pvp90%D^i?Ot|vxnQw{
z{*Pr|!rKy@4smc~cfa*moGubyCs`hOG1UK<PLNHz`$ab*R7kr+$h$1DhTp2c?&~x5
z^~AOE>y!pyS@?TT<}Jo#WzDY_pU%gM-(%ISiTSn5B+G2PLRy-MD0HNUd@I)wwPEZ2
z$1LJvlrE<|85SnuosJ{BLS-rXm%e@bR(gD@apy5@3dtw_{^^Fl60HX6Pp!QF;L7{M
zX2$+F4cWCEK7822+dEjyVRq(EFpK5xR*8$3F5O1raj7J*Qo7{dTfek0<Ro|g{Nt5H
z5Lu~T&c~HhRBZCs(m(h0T`Ot&og+1}dG&|qPoIuPh%da?D)N$~J))A(sv|ykWu-2>
zOq?PY6{@mdI>8Hmx%2xdUAD>!wjmcToH_GQc(ZBVOl|HWpUrUV&!0c1r>Aj=Gz`24
zdQTE}F7dc-IU3h>z4O!fCpy*N-yb>Y(#t{Xp5rjrj5wC0RZviPyz^LiQWEdqH|dg7
zwEW4o?b{c+rN#fL^%h^W`Tl|<^v4>;;zG||wYg49tdyf;V@RjL$PVJ0NZiY*C~<=4
z`X^V*z8c&fl8A^J6ijN}k&zKpQNwfR&e2lPhz{pDEzPw=ZY9_F4^K=Rj8abpl7G<e
zM1Hae-R>+66xqe6&x^Rl3%|KOLn&6(s6MGDHnsT>Hh_cU_(auZY##CDRYG>lmwc_!
zyzKbZ6vGWJ*ZS)|xG~;7Q)NbSVWl+A=m|%lu9G~9Dv)eYdzy*dPa@4%Qe@NBRAYxO
ze;pUrGcq!nGhMGkz19qit0wDDbg(Q5Qo0}k#PD^v72@l91C}d2Rl#^qrH6;dJ=PsU
zw{JG27!mJsLP>aqJYc1C9DCjJ{KbpE-*xrxcRgd5qozml(}Z4FJ-j_uHCcGB|KmN@
z>2?n;4ab?^D+_8Vv$A#9e!Swt;%{^bLC#3CI9TA8a`a1Ha<{e1In7>9I!j!VbH;KX
zkXUonpeDw2^C0I2`Ib%0qG^iJN|Ll$v%S$G)`O3Qsfpi}cS|xM?n9TPT^7W|`G9H{
zozWI&{e64)2HgI3P?FZLIZKG0oqeUjF#XI~i(d{|Wz!d%iZauZ<DjIZRCR?Er9AOx
zRa^WK;v=s)y<5&vhg9Uvh1dLRC7%QaGSSo1TQWNLGC7P_wC(2N;;P?E{IW#g%17oz
z_kQ>_O&3{~GuJf4Z`>$YPW~$Ag}~+YooK@CZsW|b>?1C)>CBlk-9O*S&{CiTU&jUD
z<t!Zb_j}R8Oe>-kqjjH=`ZcBv^wAEnsh+|_cO=OxFW++H&?66zf>XA(wpcc+_&Z}=
zZEqtZ53F2QQ^oSF=0w*^C7yk@zheJ&O_bFAg9Z;a?c8D+$B^Ei_&tYt@rOW5qlb(q
zlgMPB-z;k8l?EU8)9AegUtVxreS3jiw5phvi$-rIYK!S+tORij9^OmAa!rR19r};o
zVx<$d>{Xb_^%5COi|nvhJay`eqO!VgP*8KG_0atMe0<g{BK!W=7Ml)FhpdXra>uu8
z=$8fv&Dk6zZjZG44S5+zwDU7%PC@99T|Zu%o0~h0hq9bn4t3|*<#-~o9^m4NSM~Gt
zJ@t~DJI=PU<Uk{_3QjeeOM5dng`IsC6BC1_=Uol~QkACr3jTViAtm+c`9bs@|1FlZ
z<ge}(S<XH34<v~T%l-X7eyTvFnJV;VX^B>jM-Pn%3quF)!7VL}1uv;xxw6wTDLd76
zqBnSH{*N@1rGf_?2ZMmIJ+MolRlOboBTx@Qz19&Qo7Y@P-X_vpg)3L?v^Y%Nx^?Tq
z%cIx7Jlc-db4pLIr#{(WX*@za5XFZ;E1l2eaz<aglkqEb_z`H`JmdR8n)yy=pH{Hr
zY>#pwwfOvSyf>QZKu4M7(!$hKcSXlw=8y(@BPs?u&Ieo<8j^--{@Q!%s8l~{{}9t)
zAuhx@a=B2FE@q$*I!=BJW^$Szi3jvU5B%UTH<^`{waYk-4KGR;qAu^`>FitEXgl~|
zm+^FuoRjLMOIs);kx!b)`iZ{Up}G%y#Ko5o12$MKFY(1`AfHGrayTUjEC;Z2an{n}
zTxzpzUz%A*S7{&t_fidi@$m5_>y!l%m9=GYGBv?D6BoUaGcDxp+qb>y*>+QL*wL7n
z#>89SjX52gENky;VGn=(P;qp06tn`Us`^GVG1s!R2r#p$RwvN1=F|O+Wr7`#S2k;)
ze&WSd<12t{SQF!{kwVpUCSnOl+{<N$bTT|4A;F+Fj^_Ayd95Y`zhND&@6*KFQyx|=
zA+h2qhQBUt&%E{hMef3Y$=0n~b9tWm`cCAnp|PJIDdLtR7h?&I<@6`LwOE*_b+c=9
zY?>bF=xA^MG_l89bW4G}ok?%idt!^zm_@7%k#EsVbNMum<){xky2z^(QuB95ga?u;
zb9&yDl$4;)J?KLU5&M6rs`)j)k!rQAfVe6GdAO}W>nSC18_uf#x)1eCE3}zkKk_Q1
zS=5s?l5{UNvDdQ$Is=rq35$v4D93AL?kxTG?a|o-#9K-F{>#;h)*s*2L}M}7n64k_
z=cim`Hd#G4l&h(#$`D5*+#Q0R(6lMlq(yB18}j=iZ!I?jiJPx@^%Cdq0*@=k3K%!4
z5N||Lj;iVD>B(eStO+JBwe#%R<ve|O-hMvS{-pn_SE|X)iMM2!ihe1h(#5JGtNI-U
z+1TEAEw^NO_LZ2KH2@G*?8DZbei^nuCm<m#Z0{#>DJK0bQ>;9ioV7~PU^)6t*tG1-
z?;tjlgPwL#*fhmHgi#ZXNkdBPe|~haVO_%YsWk-2sTMwbxbJX$;g>IpvDSl)GZ*M*
zZr@Lpwe0!14=*)>b2KeXrnby}B$JH4On~Gw(;ez<mAlr^*x0z*HqUvL<{dtSbCh!?
z%CkvEvD4yMutRa$dImoIDpW&L^@|rj*w2hMZOWY+%;ercG$)b-$4X7uefi==ZhX6m
z?L;m>7}`a_1mLZPqG9Y77M5TipUrW#F;~Ve)Lu!rmY=gO_Jap!Mx_1%Ae5!RvyVDu
zadTu^MXC~8F5j%@h=>-*wm@Z2R#JM<*B6%=SMQI2<WW1Kk(H)D{awRpVS+|%`dYA7
zP1PxS^(rj0>G3<GohJ1@)`gFE63wdQ5*athd;Cq}y?gf}92(7vm^7XACi{QMiH@91
zV?KH<?<KcZRQ9Kyh+t+;fa;Gx**%Bjjq4KHz8#Ji?GCx8&o!C~i1J#{>_%EMQf!}}
z+9f5WNnii!Xk|^yYDEwXZkd%OS?;o=-N#H@^Ny7YcF^ZefAQA|nwjm3r{BKa_xbZI
zETBN6X#u`YLqmg^BA?BTaTK(KO)O`Y=9ts)J(eVds~S<ByhTTg*@Nv9k>aRSa<BPg
z0Y(lUJSaZ*tL(<qp0)X)aZ{DSi@a)OxCLzDG3^pW#tBqoHx@@hV8Z5XI}^aS$p#be
zTZhOApzpDgI2!?3+~+jM{*=+kA$$NIj6Ofyj8713bKT0r!$UCH$^Mzvdo&NK8vyzz
z(SZBQ-xLU_^B+IHz~wX}1NwK5wGJ$AqE@rzgH{pneX>!*<XaEU-ntJRU|CO}J&W!V
zvFN7Nj;wz(Ib1+PQ`TtP7ptgs_UzfVuLS*)q*b%}b*rtd{LP7I?FZCM3_)3g8GSiV
zdx4Szk6xG3*Vm_|ka=-LXsqPe)nt9&r%!*ToBtW<C_>8Gbd~sn!YYm}%uUg7S^nUw
z?f*SS-UU{rl`TJj3W6IOzy-1#(>|YS+=Ls$Rf$;j+kluYp&z^wcXC9cT07lG&5Bb?
zA5Cd623gmHN^t4YB{ym&S)t$0={0QHl4~^#Q2q=ZpTtjpm2(^&0-El6Z6Y>Wya$p*
zP(VQAn-gvw0PP=&nC-x$@xP|eEQesiP&?3bXeoIEGLPAgcSi&}3RAjRw>YGt_XFTg
zpLWzFqBZYsUNf0Ll7E#Xe|foD{l`!8BKWw1Q)+5ze{pE&3Lx_Xk>|vYkfB>chNVH8
z?$5BZ|M^?B*c;P}YHExGIsz{Ghh8x^jrb1d1@9FQs1CH278#Yis!Fac{{8f{%`)D|
zb3DHckZ0r2<lEXo)4lmO<QXd<OLN1iQE;biSaOL{ljr!o2r3t7g7uXvSN;Og%n{IF
zH@g-<0iTOH<oxV?^7kwMlm_k+FlMC4AN~D3v~=~br&5f{W=`A5{+&i!h))WUU4}XG
zEkMnTfVaTd=*!3sPho0_37{`}&e`#vt^fOPmy<T_;y<ER5_DVyh_mHpP0STC7Y;W4
zwBbK4fhrHpso;y|(rhgNt-@h0uAxwGv431z(>lBi>XY=q0r2`4{9W_J*VnR`&5c6x
zs7Z6yGQnw$4g$b2H7neybMiGA>O~r?P!N)tnOW#*&wpG(va;+!=80`z0@Be!gO#KW
z3lB$--TzB=UMw#PRRM@O#4s1u=^rMJ9|3PbROW-<Uyd-YPdZ5HvXLw6=$<`$R#-#R
z3dFw-$*f7}Prz1+e6(qT)D!RW#^*rEI;N(1=eKXg1M=eESP@Rvbs+3z&Y$1p(i&tp
zc<|7nM_5r>ihM{rBVXBrDI`sCL*s)@A}ik%xLo-|^1JJk`-*+`pbjMIU9OgWM%t{J
z>$m_`zm-DL-hQ6Rx^c55Be80%bpMtEe97p$gH4$P_+n#g0|1RM+J9Hqa|d@j8kPes
zg`e8(uO?1&4J)+l!?hu@HpcK&Hc)t>oj#Y6yolr76=Z_7*|hZ)pMjD}wo!Fdwd;nh
zZ@tLP?(@TyMJ%BbXe5{sMgF7hhXIILEE!u#6DYuot?R`pYf)y;pq7DX6BqjVyc)1=
z)lTAnUn@JJnUm$Tw1{3RNjnb(F1OWX<6Bt@Mir~UMj;4P0ELGsT`J|o9nf_yvXcSP
zjiTio<`vDhov;PgDwsfd21}tcVs4c%N1<}9Za9G!2deI|%noT+5}o%<C<+3fz5*=;
z&;_BCjE#+fZ!;b+&Yq|N1%Ofl;R2*p`{vD)fn*r<a78JZykurJg1Vn({--o@_4xon
zGYFoNwDu!k=nEcD%|RXtJ-3=skQs?XgaM@sgo{5xcAO$2A}bn1%ojx^rPE|hz<HhC
z?{B_MnbtHetb6u!lyiM8DKP|U2ElvHt9Pk(C%;LvDAY&*6^IVQ`RjARc7ftz`(CeJ
zAA=S*6#m-yA8}=;P9N#G?8*8S*<tfC+Puc4sGyJpy(cm<vR)Zz6Xd}fnZ#(1Phzn*
zjgSqDqJ!+2yhE!g!xBij5gZdVxG4iV?nk?+L3NMX^@xGDZ`;vVo%%l%eJapg=vBsU
z7$o@+JNK6+BuvSQ&2*w?4EAK!rx?xs<}scQhUj-rMy4Ti2g;2o6b5=O4MqydbLYOH
ze2bwvXJ>B9t2ILZM=P`a?W^p<`q0CJkTJ=zLk6I%Jj+?#pRGCHPH)|4CT*l13)-(~
z{QCj5*mNu6+o8`6Qnfu2Ckxs}TN^T+kTIV>e_sD>9b>|aBUf%W-}w`(p2<(?^7->;
zouE5i*jH$C#P!qeTZTfD&EUd009Ca;92pipqhN0nLoG{J*=1y8Oh5^uhVF~^Cloj?
z^l7qy2U#-E)OiDBG!oPgzY78faSqD{%_Mg!d+1aknVCO)xttkxL(sLMVP0Tz_zXep
zcI5?u1#q|vva)eAnc>JaFtLG#)b*0I^z;JSB`=9JHUc2^aLscx1QV{+up1zd;;?CX
zh$IN36!h893*;VLwSHxRo)LmI0aar)CqW8>0HRRnr`oe;W@ZrV8fm82ZC<{3VKtCk
z>%}6T1NfQzYIB`9hg#Y&LTI)~d~q{#cvx8D?e81{%{E$S$}6I;?QXH<aRIO4!t6wJ
z(?)G=ZP2h>2kh8nob4`(d|=R=YxyqjTiN-I>Uk+$aOq7BQ%y`FR>Y)0IY#AT^!2+7
z(r3?ph5jXeEzeo<-a17^6JVXX-{1Yfip7<)$u|?VqUbq{PIq{F?-Gbp;`Dv_(xzHb
zxd~_zQc<+;#yHK~MTEU$@B0V@SF|jVXAvOMC};~1n*s7w(>Ir!LR`*9szB8Z;4`QJ
zY>g_l?yDKVj6t+7=HvWZV)IEkQp;V|fd>$*t-x()&NA`iNA?S^sv_iq9dfIbW55$2
z146-ZOhpQE1<T3F4gLD41Ca=eOW={9AdRcBnjvJ_?hx@(1^OY-IruSvGkVbc_hYC}
z8Nged8QpJPU0ow@lgrn{3bnG+MzUjwA|xaP7KRr>s##1U0Xvl1WYxe|t9Ci!R4T{S
zl=DDXfVfvOEZ&!Wc8-^klM~0SI8GO^5bF8g9=oCk=cr3c=7Z-J6b^tV;AQYT5si^v
z-J$}O8%_4|Vfq;NPoF+r0q2JT@GJ2a0aSlE+_gObf`aOJZ#@mOnEf<h*6Zibw^{Bc
z7A$1da$yN!KuW94?*o{PvO?x)qhmIKf46_}m>Q>3&#<`D?#`ZrL>Mry%T`uXo5zmP
zZQEvuW;)L^3$>hbjKn7ZDvC)E0%m-CocXvdBZf3PckXPNjjO7v0?N?2d6O3nAGiYw
zWn86tD$z=v7gi=wlC%`)AJIy&-+ug{no9doRu-S)_Ug%#asULx0bYnQCd;aeP-h8^
z1>+a_F}ru+;mwel1ez=^-@bi&V1XiU)y<AVPd6qj70gzu{Q*t~zXX$eHmU#q=SXs^
zqV;!iacOL9OfbvTt$2$>RTilMg9PYT<}=RC$-IeHtnXM!AXP$4Mpc~@=9hrX^UubO
ze}23cz?jER)A0_r8U6Nb)f-|Zo!8vYCJU9+tk72N<_1y=3XNoCOQB3D45%Rcl$2`n
z?ykXKdNUu-nfL~AJJ@0J*Pu?$Sm012vWwxi#K55=M*<+!-||zh!Q!us>ef?`OPcdS
zV{dh|`R&`E3J0F<lR+Q7GN7WZ-4!Bv?^B`CP;>U>OP40QIf-%zg*>OH8nrPxE~7Ut
zb5Q?h*w>(U%R|XXoh_kcVO4_TFej%*;?1*lX$}xeA%e&csGy{MOiaW#a2GLF0s}du
z>tQW&-aFW#SD+z0lg6gzsF4*VQb^Ep@aPUhHH6@uY})n-OM3hFH~rk91EBWUX%LO;
z9VzI^*tKNeH=4PQn&Q9k!O$9(e#&rpdU!;~?pjs#2%LR<+#)xSyp-9r$^%PViLH`2
zt}HMA<n`-a{KkIB7z`csi+GM5`}pxA@&F@7=x%D#cOck2_3^m~R>)jfROHRTN6;Xn
zinphjnl@k43~*YUAtXBJ^uPTyn<1^Npd%`Gay6GINWcgHh0D#eVeLk`n5(IA^&i5*
z!XQE2U9<jyCjmKlwKrg0&~^e@DZRihp|_%)h-;^=tJ`zx)G2HxkWO10t_Twc>&2Nr
z(yz(W9NhzdS9{{y_wT?Y&^dAC0P4|JFBTp_gF#T=_iVtXW6V?}s2_<Hg6x>n2H7oV
zrVG^Y)YDZV`>{Jmff~?{ALJ_2bExv(ET&y<bRiG=$s9)B8v_sy^$cE!;Q|8IxOrrB
z3^|vN+f8oTl?t|Jf>GyVb0ve3_Al$1EXu7BdXe`?RcEeWZ$m$uo*ygY!Z-r>1!&0T
z@2ppnTvA!jWm*l`LRX;YRNKLCtQ@CyWuS=9-Q69v;cICr^{!N49&d~n98{ebE;%~p
z^pYn*@+&io4@%^1yjq>caq!@Kt0Tvb9TO4Bj52%u>J>vr0I}&LlD+zkDsrMuI^im=
ze7JF{E-g^pX>oR<FPaGjuMet0T^f_94FPj*?Al6xle0<0^6k(4`}#J#QjKi<>jf~$
zg$Q$Tp!1CzvoOSk1hWR{T3FaGf`>?UZ0ziRK(L9Gsgfi<(V6n|zrfrzCwUc>G)#&U
z%w9ixb{Vs$0Tu8&%+in{Nam|ax|?zJ{h^78iPTKO_Sko@yX^Kyhf77rN)SSkC&)MS
zVVPzo_+i}O>*we9?Aca+;}$>-{h}>fw`N-O@aUF@;JP4vqTTI~UK>L9BS2^@sZust
z*svjGpnyi)zU@B!=^Y!0D}4BFrHt|JUAuPeMtV+cu8bci2M0&&|FN)DfnW>XEaHpS
zxpV5*uV1I70AM#jfm$hAbsxwRySzbSjDnemVIxq<(me1~6q5m}hL1G!PJUxFj+h5)
z6I!ApBW<8|1|y-6Md+iTr6YgA`$=+~v@Ts%QcBUUjv|-W*TKP>7cY)Xd_b2(fz{U0
zL5_ub37;GKr!`MOLnG+P6Ix4hqOe*mOAjc_|6^r7#=~<XU}f8j_njsSjjXHx-_`bC
zZ<;+#zD7a$7>vu2Cx(rjR}ycc@mG7@($=QNB+{^P5@ZdzTqv}vZs<5{1fT#S_#>2>
z+~fN_(@^Uoj}iM&<qpMrpUewa&jtcN;}@&F_<)x%?=x&9I(Y2WR4+4G67_+htT9<2
z3|b0QLt^6mg<i7}y5&lA*e!F(Iw#CoQAG9IKHb0GVTCNLb{zNlSN}tJ;PXH|>LS**
z=2-ysiA~mNDZ1(D>A}Vzg#W$gF_|~_ZzdOpkn4vJ94JOB-Ia=YT*C(~>0~XGDRMow
zg5>47OMtjIN&;75n1?Z+29l1J;=(K5g9i@i60AL)xJ&0(%jB5hCBB|hGe;DQrjl?C
z^rG4e>x7m~#VC06NYi9@#U3o$wW-_Y=0szIVhBcZw3j?_%VS>d6b#PD;Xj?7STfXG
zyp%;=`1=bjM?WAM-n8Qn`7TJ;a{YE#k}p7irLf_PVZ%Uk$1(%jV1j_o0*;9_dxSe7
zzo>c1=vg9LemM&7Z=^>7_dTqvH0OEzzpYj)?^9WR-_3vi`3E-;&5(+FBS!^d7NFqr
z<;z+Ky<Tt3h0zI_Gcj8Ot=M8ow)O~0d{NBwAnY&_>UC(`V9O{F^D|@6!!!p}R8>{u
zHL~$Ht@-yvEPJ;#yd=px9UsnHL*R09P$;XJeYsDs0WF|%IVke(o+5{8<O$dz0Qi9-
zuXjuiq_)I?`B{yYpP*q9G`&`r2JB)2ZR7^yb`pcDMz(FN%7?eT3BYe4HD)MPu4Gcz
zD)DT2Ew4FU{+|mPnwM&d;Z78^a@y>X!d+b1<3BOGn}7(qUedILy9ncd;uatOB41ja
zGCBf^?)R@>H|$CU#??sHT3+Fuyt?wZG{7k+ZI44&=Q(P9eY%fWIY=S|uR9q?W(U+q
z$cvuWeBi(V70{WwG&B>$v)<oGRrG8Ca{L<+&h@^_cM)>EF6)jtL}0uj%Vy+Hu#?7s
z%Cr3!h{l{?CSo((3MH>lkbQY;tCnegi0yx&%U!8hQUtyxiwvf;;Lui9R&{B|dm}^J
zJ36$2SL|9hmQ6O(;;6FZ^|wM(#d^nEfkjvmV=Dbds0p9(MG4l6gvJ3;ZO`e)XXM}~
zA=5=(1;QJ4QHQvY-5<fCQd=BF3>&*TJMCfk`1kxl-C52bXH_!{$;tvn1orLwjRug3
zW&#I=E8*xOHxr39%gtncz`s%nHK@Na{bT)yf58bXJ?1OKmC0u!qJ=HG<<SBywWo*M
zK%gEUCCh@mCszigy=o9Z04WinS52~$uNOSfFM7pq^vc(FJHN5FP}fV$)ryGEil|RD
zSpxDWvqcyX#FpmAfQN`N@ba}4Xp!}%IvU*ef0VM-PyX9dM!FFb7S;(>{5!l5Q$Qf8
zFh4DeW#xI~`B<Lg+mH}e0RaKzKX5^j7t?ZHF2zG!PXVdoE+w}`m;_aq0fcjQ(*GUM
zftwI(Lw@zkksD74+m&ovOIcZ2%yo>72XhxE;<3q!|6_S_UhpM@$0`HBKXhM|Szyfi
zG&8MaE%4eta7v^=ORf_L4bguDY0tw$l-aUi4D|4JxtUyi6de=uShye+vy(Eh#p#aY
zwlY(LO@vM~HUo-;YHROpT!F^v#UwIVag}hupa|F4W0uhq8R}IZdeugW@6VO$03Aj1
zAjKbd$UmrU3ffLp1=Wn$9f<hb>FJdf6iza&k2D7v!;}s<x}>=Hq44+S1BVY|I8eRJ
zD!=(2j$U9H`tOTmYu*Qh@8m!O_**)3BtmC|Hivq=+42AhP9cnS;Q7IKVOTQ&b+T7b
zB2ebS1*7JyJ19e_6kE0qC{RiaJk*=BLJ0>qM&HhaziO)66Qsj#y3K8>o1;v0>^wf|
z#~&0<CkO(A6&$C%81Ddc3{_m^%$*+v34c|Vs#mFvF_fLf#<Hj`(dbuWG5Vz+qlA`!
z@W}u8_6>1kX{Ll>4N|y|pI>T3vf;H{AGAMA%}^$Z(f5f5o6gG0dI?tu93nT$SpCKq
z&z~z0JMIt76R2m?j&cmGi1I^y6IWIONjZwT^5@U}7hYMQhf4#Fg*+hk4WG)TktGP(
z8$)Sp6fm-X61IV%=HrJCM+4GF1ljfm8S_(+H0eBY{}AJ5*d;aX29h!B1$&0f(yvEU
zRekWFc3-#)0VOpZCaUox$V$cGBg88JqAdmo!SKFi4>_207W;tgX@go;Rk&bNV^luu
zHf$^n7I%WIQ|*Nj&O~oDpa?aLHJ2k~KX`5+4LhBFyrTkLhLGyxvnN$)DX<NF6`|4u
z9<<UKs81%WoZq=}=OL`1Oh43s$b*iCaGHcH2BQq5dt|;B1K&9+dgpBU)PV-<3E>YS
zR5gTZlq>|DoU}B!KC`=Odz!Q7VCKq@PBn((kNF2Nev&i!5YciUqH@CZg2`@myOC3M
z{|es!iezQ!GJOoEfmd*Ajg_LGe?s%YD!wN!9qoVSn+(DkBN8wfd4w2(DD=$w&(JCx
z;F{UEaU*1^5jftI0|U6>%i4Jiv{BlV!E&NnIn|(+^TqrBjW7I<9D#?OlqZ0(n-DM@
z;b*mOzN3Q~1o{Wr+=Nw&n(B>?mxXE!T@TG#Q!M!9%Q|Qloaz}#z`^LnIro^U32g&*
z)?NIDD#$ou(ypXL7gUD!`Tct)#<UM;SR5g62Vmw<(M1t*-5sSN#-lGzHMti}Qw_nq
z)O3(D4wa@&KnuO1K>YeD=XEI6R0VD{a_7zoBiXsqJD);7Jr(#co>&HqV1zNsL<vv~
zgk=2tU_=0q{q!(6?X2A`!MyEsbU70>SD_ZY0zuRXc2Keu<KQrAL~Is$mlYRBR%UX6
zPA<2r%9KV_4u{!swE8vcHVw0r6#zS<e3!L^lhv>9AIx$QcDo=jxw8koMEws4V7xBM
zstOzhEo=<(5A3!?S>-bEF$IKbhU5W<$|E>!sm=_fnm{}n2dv44z^JHfT=DkHPMrX=
znkzcVCM`KuLu*O$wZwo3y!$?34M0Jh#D>7w=*_=fkx*P6=ciHh@4JDKM8Fw_91_B`
zAG|~N<En`Zw{HE0&2psbvRwB3=y%1I@}H;;=vy68(Q#3+Ed&28lxfq91b762D*E!J
z`W(?MoY&L<EyU-{_F`KV1A8#8-L9<0tzQ+n!)e2oa@K8hbYctRm2j)fK=6!~B`$d@
zyDY}PCtUMMy0rS~4kAz{-I#47^|^x4t`VBVlntDiZfG@$_8379ps6lFy)^?bY4b-E
zpeIi}IYI5tzk^V!p@#n{@!!h4fB$}r+uy+hTehIQ#y%R#-+E@7YnWPM#oPR`%d-AF
z?;yO`S?7aOEdyb&wihp6D6P~u_3E?>7cMk?U-kzrX~M^axs}=24*`>=3_j6HKpesk
z9rLj?@$#AkI|Mi340go-D;b5Cql(zUG>K7v(jFR8=0$^n20|xxoEwPGU9`1%85Fcw
zz_K`ucmK>>OPX8*;`v(i&M4vd8E%pFWZ;{{H28L@(4UimeR&gv76i`(3Qb!Z#yfVk
z>ehr8qh3Lx0C*_45g$u5hw04YLP9eHD}||sswD^V9b$_^12C}t3t8|8C&bIyaiA70
z2nXmRxhSqxs<trVN5Ztu&aMN=-D+VyNxv2{6eom4pzuAS#Dremx{2?`XUgoWAzdgA
zPE(mJO%TsvywbDja@{KXQp_Qv%yQNA{^ZJ>1wu1G!9$)uaDy@XCnja(pmYwoJS2&Q
z4@fuEijTd~I<hc+zBb7b!lu+KtbYZe;Hq)@@5Q+xnkA;!pgv~ppV9k8detOO5b_x+
z@t;3`+}!p^dj*Kzxvi>NpPFNaStsb(;<vB=#iH#RnW2QHoF<VXM={AEX0iYbz%}E9
zc8KIB=0<b(fD8jrv97DLadH~NgbB-)1QPyj=~~`15W9)|XO|6tQo5NUpHPE9PR+m#
z;rb2{iwc|^Agl%~OVdS2XMmcyFI<k?nB6(#?uRg^psFg2t4GJ1YP$}NoES}`O`Lw+
zoA&{G^08Dnx_6F_GiSOTbA;J#+v}vU2GD6MQI{ANX*%%-M%2Gr>emupZ*-hdR!SsS
zEnG8Eg+{Ou9FbZ>;*}sQ1PCKH(<ZcE%nKJ#UJ|^wkrKFqAVXlihU$|sNxVlbOmJ3c
z+!zFvw`OB<gf%>J-~gsw7eh}IT@7}ZZ2&91f%SSV>m-LUQvsjs##W%hIK-;al0uqo
zL8~1nqBV_La*k8FK++L~HGgr#wlxSXMwB)p+gK@Kgc!n9%OF0RzgIqQk?1aj!5nHl
zEd^Y>#f|Ca=+s%SXOMSJ^BpWjjOHa6&oM?n21ac_a~0M58HN!MN8`yTfJ}m_5luWD
z2P^d3KfB{!jHcy0I)JNboTg8pG`*!>+s{tGIl_|;3%w-m=PzHHoR${ghdF`H9jU1w
z>u?na9~v`ONj04T`!fYg7)X9xLc&o>7pSu!_B})y5w2Q{2?=RMebP+USEQu?qFiif
zS*$^(0L9O}23aQBEL!Xamk^8r2=g-yY=;EI?>8aJn_gu&F=55}5}q8`h)KK(#AE~X
zlsT@*bJrB=IGhG2cWtOEgQlSl%Mps;CK{8>ffUWfQNN1Qt3x#2Cj&p{-PK0Zs8uun
z0cjfpH)vhh;(_?yzB8aCPuNbp;L>EKki>M107HAc1a}h){yrgL`1xhouiw9KbZHf7
znJEQ;H8R>rlBb6@gUK5KaG-0FsD2W2N#n*e(*>A)#sQx_`DqeZh=C;Gf4tuZhy8pf
zySO_)4QaxSxSVE4;wbLX5NhwS!oK^Rn887Fi99i2f~2w{h9JlpNm}^kW?+sPLSZM)
z75swgD<|9&2GNU^5@jU?(=#mjvL)YnX#~(o9lj)_5rTv;xWEz5WV!pAxN`M0L{p-U
za-w-7Y2~?e-AJVVY)nv)Hde4Wz$y&Dd^tPT5^pEs4CDHioCO4#qRHKi8WbHgR*Qjp
zK1vs2>tG`V)L1@@0DFHc+((SC@T7gOLwS2=yYX|Lx8r!|@*o?_g#=oHYaHHu(u4~!
zz?f8oOo&iIM!%&_WO;S;`X?A0@39sa7r%t%r!43=d903ki3nty<#7*DA_!9%AsJI!
zpidAdM<Ph@yh8O23|s&+z_1%AUK}kRdLcC{%6k)02Ph;l!2rHQ;?rXywVN<DN*qtd
z^5NXTo0ym*Vq%LX@H4!R2x7p|g}l*trv(Fy=K*f9l7vD**fsD@=QZ^lsf_>+@sLus
zBQ(#;$PgX@S_7;GMA;uuDO_3+HU4}CFNQ+b+;|T&2|Ql_CL3L@;S<rcGID7s1oH^5
zj64fb0pJjX@(ODQPBQ#9N^PPe4o|?Y9EP#VAxak%yPT<JI}E+tv3hx{qGDqD;rikv
zY7Q%`ULdne72b{(pEpaN#Q6AOATe7eru!}-m}5XuAcQO8OvEp+Mk}jHSTS5!VGaHS
zlhiYW!tyA)H<Y}(;`64o6re0K@Vy$-tYJL_)ngH&{SJ!!hnx2R5z)b$vGl?E&noV?
zrKRck@KfjB>`nCDC*!(z+rcg0f*3{C7v<c9Q~v5cU$2FSd**Hnr^I}HvG3hIrHgLo
z-W}01sZZ^hDw>#U4xVc&X?z#H?l_B6cH<P^)WR!n^B=rp8JhGsopT9L80g0R;lpbw
zb@lZ>%k+SX%6Fg~O+bo@j64G#*i#t+VE5GOG^zZ|+V$%p@hd4P95{FoL(?c&EPj^4
zeG#_q6d{+9hJS3JqB?HcN@6>C_H0jgMd$$xjt|ZP0_m}DH!&H4+#(}F2))jy&t1JL
zA}T7%%WHvFkH~d>0yJ|@<RJc0SI~o=i}TQ--L6n(=-#E0SWgue7J_;2b_F79kKcl~
zQ!h{FT3;W#-C68L!?Go&ehsPR0WJvBQa9S4Xghvfn(a@Ct0MJ$D=nQI8M%^X`UVF&
zlFXsvJ3nac>l1ODw~>12<yDFiP4_#PFMnQAQHhL?UxH{XRg4aN+MAhU0A*f6Se`tV
zAhpmrIW3_9ZI(h=pxe524`gTJ7aqF1pEWf-%GQZIMn`^XB~1Qe{KxYYz$&!3-Me>F
zvJtisL9@3>$5xYAad|1p$@^S4?KsN1cQ1wVy456JSw8)`XD?sAeERfK%X{)C&`Mz%
zCbdRKN9TF->O6rP&`WsXHN1N2)P0L*<Y@$cO;;4!!g(1J&&QAVpMS|ZU_l~LvVATr
z)JF4neFAed?(ZD2?oYfJ6k7l*s%mPi@JaS!xj9=25zx7?|BDAbioqV&?!G=aEHBje
zkVx}OfV4+AI5x0h962^I;rnlQ^#zDjx3#_9W$-C!*z<{x&vjM)qm}S%@bXtHw?JhT
zcbreda2*~+5Mrt)WSyT^6+0Dv7j)cPIaKBg4*M0NQs|j>7H{s+CJXY(3CN}La(O+n
zDNd6eu=v1%hqOO&16cL5xCiGY!Z-*;Y^&7j)vMozhQ15L{PT?D#9At#LoN=EeXi$U
z@t&2Ge6x6&d~2r<VJ3u@;`#&`z6krzPucaPRwu}~n7R7X-iAc;`SVG=2=XXdlZ}Vx
zHj2oa_0+t)yyK&za10Qkk5e3bV1j&0c=F!8-av9r0C2v)4r6#<<NcUSZO2UmP&}dC
zy=Tuc_-|*+))U*u5RZtj)RX|k4~6fU*qFuj-bKWqiR~mSty-oPd7)twRKDi8k!It@
zs~F&792RukZhzBrd_agQx&%z$`&^N6h-_(MUljPP2h}njO`|`+07<@o-X#4f6Jn&9
zb>{>nSb8RC!M!lD^zK;&NT7?eN85-sX5C`0c<9)&$<q2db{sPOU~N3hf({BWWbLrm
zgqWysc=zshocD931@l%^R3uhMUJ;5I^ae>v6b<)BkH|4zULN&62l)KG1S_j60+;uU
z7;)d?uVAtRJlE41VS>V)W;eyj76ufFG$vMG!WA)yIoy3(oP*pd7R*H~3~n|YW^^7H
zs2@Ij7!neK193-GlPI@~;-6Z?#KpxK9y5t3W%wi8w2X`{tVuFN<h$bgZ^f1D;JJBb
zft}dG;S*T?uaNAaH0|8HnQcHVXU&HXA0RHcKJnQj4JJUYKo#BI$I(jOym|Apl&oIo
zyn<AgnmUE04<j4O6u1NhU#<fh^dWY*{pi+h$8N16NpxJiFkxh9c!bThsKXL@AvsE9
z;j|fM9imQ)Sx`#E#5C&D?bqWF$Ju+U)~q`tfY_&Aw{9KpHEr?`6~9i3q#5s{x3si0
zGBVQpgI!T2rdHL}8=`aBkV4FA)v2rRva+$=rTq!V1KI(<0-3OiKQwO2s9@#fl+EzB
zr-$-&>K^|69Qhkc7{8RL5}!@HSj`}NL7Ln>UATjka|hIKzbgiqH?_6TiJ<W7%HtdG
z8xT8PX_=S;AABRiwY8`s-CT#ket!BQ@$uc3nyyc<9DhH40#$J(O{v1)zLlycYBjHL
zi8UAbOU%#^-b&uM@z&zlDzLLcMTggZe$w~oFx@`GLtK;ib0}@)YbmDfbCS$wsBh}%
zREEGR_VWh?$@v8I9z^;EgBo(qvNYqiKqt~M4{~u?O)L?qT%~oF7HL`oRVIgb9ZA<P
zEy@JIPOlvPmUU;>5!Wvripx@==Ue3lwL*&0yQsiTjx=3Zaaf@zhP=t*S>L{$!x1DH
z(&~Qwg0jbPC2{Zm{io~CViV`5F)Gq4$1H-l%REp2@ZopdBnhoOMIYi55}vHX`9Z3u
zCDvc7t0y3?D)I-3-bsWJ{nFPzZa1~G#ugXsCh69$z2Dk;P4D-bmdw-Bk8fL8j89C&
zCXT=w3Yq1}IkBo#|LxA7E6OhFdS2c-{*wzK$n4$s5BId!-hKOey1NyA2}08;@@A3Q
z!$fj_qpTDXFN8aj*fW9w8|v53mt}wK?%erOR3vUQERk`Axa{HbBb!J$^ife!yb>bJ
zsO1l$XO&oK%Oy^q4wrm-ca{$^jIfj{MlA;PK0ILIcpiw3nwlEoit7`!IWI<`#I96W
zbZGFGG&J6xo(u2~FK|FYIE6{QoLpIBV^+|)EqiwFW)^p3+`JiALoXH_k3&5$B*N^V
zqN1{6=g#Vu@41}b+e!Am81v-i<)LmtBf|l3a9~U?Q3!Mm4Ep-|ym8_a3Z|xANq4ud
zre+JUD3@jqsD+-cE~>&UFx&9(@X^uHEx8+^%%MP!O-(Hgx1BhB`oW_|bZZw>{(1o(
zg@<>6R>Z`{!pg4Vw?`Ag8t{0?2tX9T#a^GGrI7n!2&^sQquy>}=cYS1pp=vh5aH-~
z4(=#~Hx4&DLVE>rfP@C;`=ym&kdH&z*{J>M#(qvD%w9y>u6yV(u!%-QL@c3?K)j3n
zvYC<mqGZd@&qtH$Vm?AkiElP;$!Wq-0Dve11B2T3$H`+omF%jv(c$5fO%uN-Mn>M`
z1MuCM9oOsGU(kl80udfoikYaZa4S4;bydr<;l_$Vi~ZJ&CX5#r6Yhx|cyPe<A!4P5
zZIL~H-onz-6X4CH<SX%V_x8@UozREH2ewo-7P+eW<4R9QvqeMq7FQ52AKEQ+bSXE#
zZqbVvTbkqlIO~HWqQogbSkUm#idJwl(9_X5&W!%XkufwkCiFCLAwFJS{o8d}S)$6y
zwR2NL9|iUU_OP>y+m4^Pdesg<0%j4vx+d069FQ(8E$zRr+TFNg>sE6VVnWWjl6X=!
zj-N#jfzsL2b1?n<s*pn{eBq)MfETQ+5*ahZeqaLs>h9fq)Mzzzb&TGI5U$H$k^GNO
z5(_mP`uh6=o;;DD6ap>8zV~MC>4$fc06&y7a3EpfLGl&iBcgBXGraWozs{%Q{{6=f
zODn55b;+;59^jv)^B+-EQc_Z8XJ>J&0_=uG%zk)k3eFUJP$ihPUDj?)F>VqD(aiXR
z&CLR1`}9dl>I|4W9jBTg=8;ImuCA^J4<6tw7{tDVzzoo~!Hcm;*}aaZqsUpX9W4t3
z6o&7`#b{hL-@Zj*laZyEKcXQ)I!|+$vqAxokdU}}vlI44^n-M7|7XuWf-iM;-jq56
zBmjFX&$T=fv^<Oq(UI4$TepATz8{zhEG;fTRoRkG-`v~`5%P`ob+Ai*etyJUS!pTs
z(-8z9DjJ?+Fax<3)c@<ZZ;k``>S}7;yky5T)>VFMZ*OmPN*j5J@gL_x=jeYvBC?Y{
z^g+*OIPzv);oz(W2xLoyR`A<ZvPFe)IYz}}{OfSA5SJ72I}9ISDO3gCieLp;Y)H}z
zMe|0piH^?1Q7I&P#h#56t95k#l$VzacQNkTWnf|=XHbgDSQacU4oMsHNXX`?`qjk2
zV%!bD*IokY6Hh^a*U?KSZ11$nDtl?nt8{dU*MavgRq^|{xN>nq2*_CVCKtvsQBnH3
zy4~;<4i3t4eT7v*{lks5nYl3u5b2;CR{m@N=zt1`qw1H`)zz<DNyi`uI}*rm#K5F&
zVuJOY%g|Xw3}dM(Y%oZfoSY<vh6)OVX$K<*sMPTB$w(FFE-m)8wT&dNN4E8XtMmr#
z{kwp~pH+eJ@$n@~Teock;?v(NE*|{VU(bU8C!Q3_6S1gS%cod>VtTbsCh{((YUx-e
zkRTKxzN1GYhbphAs1PXj?AiB_d@*IfUvc9;Fh8PX!|x@9ZQ1)4=o$`$!%8ujP{Z(4
zjap`CXsGYNd*Va^xYW1eV#=Z3#`G~L9lEGWK)YX$w5x4IHN;$$-1+ez0fAJ&3#Fad
zGeB=@grn3MSy}4K3rYr09b!nW(Re069`JEz91^oM==keGjBt=iU4o_f4g%v)`aFAP
zZe^vUs2Iyb_(<yO>s_B97SLB}xCh$XZzwA(+XiB1wOkt<`?|Zq>0T6yiHZ66`0$C_
zKoZ5eZ(u`vjMNJ9M8~GN7*FPs|F)tMY0)UYjtjFh)6*0b6uc#>7e$#(0Mm)s26F}%
zt0C!xp&?5}`<*|3zVr9*UHw_&St!@R@VK+ms$97OYe7X-RT8K4Yi_M|MH*UK9hm5p
z3vzRF@82I@!~V~vP4;t>9G)m<(eK|My#4akt9pcjUjNV#3lo!i-?1%c#g$0%=GX+(
z4#qV&y?&vgWsB5cbM{pY4bIy*%({qzr6-Ev0o>*ry|F4+6RxfD)P$A|vwr=b3&kx?
zOMyN<k{zI09*kPIZdJcIv7UiN&@`lLJ<g3u!)5p2K_O&=-lsQ130eX#p`L+3JPv{H
z-YrD{fAY&-0JDMKpK@sZ%dZ?s&+OS0ADi*+%~T~ne!P4A)m!?+2`ymL-F6a=u~=Sn
znri~OVFT<2e^6!4i`q|{dilWFaP0<~uWGQ*(^jpuB)*8y(8{-`HhQf>RTLH$<}EEN
zb3%3$U&oc8h`u966<?TsG&Tn4ML2-7*WWx($rhHFIEwDYi-u&4rTgM}^C_r-?O4}^
z3)GGn5rAE6k;3Wv$hU7V_3hmiF*VeJ8wNHALH)w`L;BpgM+6%tzox?>DN`}<o>5k|
z1|G&xnIH=*uf1!kQ^j*|>+qOKJ%kjS=3Df}3eJ2R!eCYKp!zo}lduIP74eEq*`JJ%
zIA1b;FXsO6u<8Dq>gwM+e#KrD01aT6o13eo{+7JQr|2J2&Nm!5mpX9*l}K}-_|<u?
z#l=Nl3`K8gZjwI*OgcB-bD{&*BtQelQ-w!R2QfF}<>%pP-|@BidrpQ#046%P_pMSW
zed+NMBx8g%p8fI~LGu2650<-cv~bx0MH*fMFUvLL9C{3zYI1Ti5uYz!>>mjGdy^q?
zone6_HdlbbK*)dy6kITHC#?Fse0+hJSb$e0U7llM5qHdTT(Fgwm&b0QOh6nFwjLA(
z2!bOO13LF$PGR9$JPZU^3}67Fk5L<}&O;TUMQ}RC#>N^fwo<HJ>-*xx7O8dAjKyZr
zsLsHhZf<UXH)AvQs026(i$dw(-~fj%rY>i?G!)r+cz)K_`h~Nh;J$fN0qB6B-?d|h
zeYF|7y9H|K@bEA?74SE+cLbVUY-|&hXehI1dIuxlzdze4$oE;}^?BL2NiGemyW6JJ
zA@jd~^yr`9GIm!mf?TJiAiXCu$qdsUZk*}ed5ZEN9?xPoWh^gW4kitPOE~zUh@iFM
z<^UugsAs9P;4~xp?^Z^}0K9yC--U#fqfX=6k>yZCakP(LW&cD(Qc_h*%M!8^3x;)t
zE&(eSMy_yZJO$v~wslUUIU$G6&UW*R7c?$(pwmQ=fJErpp^K|<9BE(67M7GW4ue2H
zXFVVNjvd9HF{@_WgZ_IE9)*h+B`FE^iHu11MjtBuGX|<Z(ifjwvzt3oij|fEG;rOz
zILx&0&>oyIeF<*}<f5=ZdV7`|H*UzHf?)|^@a+2iJ6W%?u)N$9r#mq%(vDl&48&E0
zS4)fdkt2^C1x;XI0zkmiA$SaGjtoXQL?IWEhkl&unBL+Rzm}CLBVI8HLz_Ty5)gSX
z-Rlr1r<l{?JVXIVQh3n7rHdEAf-8_5GBV$B(jW!%lW=b`T_Vk=!C1R}=gyhd{54W%
zV5GsKkGvz|+4*xenmc3_Bn%J`xFn*hwyKJkn|mi>GdbBZxkV@!zXCxFBnifF)DWYe
zVH*~{)k9V<EIh5Qo_&3g_!@gnhRE4TC^{e?iu{Bd5%?1f4cL|g$3=I|*e{X?e~u3L
zd-MnE-YR#8XNYHq>0!yvgEcW%V1i=o3dZrJ@!?@wW-Al~Y@2E4o<UAL52_1N@Y`E4
zRS0fqQag6+sEbzSvbMH169_}QY|eGkyw!ozzlir}!)=rlkROEbI1DMN)pj6ScW_Dr
zH4FzWx_f$NFg}Gt!7TW>?ff)1QEN|8<GCQF*48>xC-%7x&)ACv2S0xfn@Bcr!_FN$
zN&-b{(K}C{?m`CuaE`zI1o9TZh<Ela3`$n5TGh`1xRz@*@G4Ez<Iy853=AZ7yFhF4
zoC0`rga8sT^ieWb-oWPS>gE<KXx0v7-hYEf3KJDGG*6%p>?}XVJ9zL{)jMa!Lv@ND
z(S@U%Bys%4KjK47jA1g33$&QnoPDkkcB?aHQ`*iVwT`0=ptQr3blv1U2FDjJ5LF!y
zeBwhiqqmRREY-@ZT^ieN=OMw0@BIuR7}xmH6JkAB88)4US(IR_knlhi)W<R>lYzca
znd`3Fh%$2|--Ijtds&%|i9g;A$gF?+5e}-@+0E6}sc6gS=^YF%b3zY?30^5)!^ptk
zs?(LTy;L5w?cLoFA-^~8rls6OMHRgXG_4+U>(i7FX#7R2jeWBT|4N!Eo1Mq9UK6zm
z3l=T2LD0^&r#?A)*xA*ULbdrE<$EjU@|qg$cGRPK#g@ciQlpL`2I@d|J>NOFxv?~l
zJD$G8zEm!z<u1+|;A0JZR5<YU#8d!dF)DLmJ>)e$9WVIBlOUxgC*#;$@07+%>WPTN
z#GeHPT4)m`jZ&0E=Hjy)?ClBj2S%ZwA`i2Sq@-M4zivRqz=N{t8eliVOG-+Lno;oD
zty`9(ooBt=x$#sh3>_iHX_=IOKb4kxJ$eNCtKXb8gA+Rg{ryQvNuQZM7ZnkX9xQyn
zCz<Yj#Rd@P&H;Y{0t4@h50fQKiBKL0q$qnug@q_iAneGt@cayQqRH6P!&@-{Jzn|O
zfvl(~JmUqab>AcikDb!~!C+!yVs#&~0r9f1Nb>Wmg>VgVV7IYe5uhi0L+DBm9L4~G
zFh#=)c@wXeej5%N^t@e}`8c!kbeKj3zP`<i$9Z8Hg1+;1h)^)>|AeVIAo;r6+CG4Q
zLRFxm@&v5~0I%3xi~B>rCityb{Wr&00B}N;ATEC+-I4OzT0H$=aen3_ESWg+`vS>*
z`}aBb0Em<~fH8Q(`Qjl#>ea;T3@-C_cTczIxrD|DKn7xg12)>F0bd=GaLr^eVj~)a
z6P3fxs220E!X`1s0(!%B54l(2@?|))>=BcgTceUnQ*NLkUO@R#X*>^wQ8_g}YExZa
zC5i=xkHB5Y8FNuJ=w4{&V0EalF_ZGh$nd)_UJ#SKbyN&tad8@#E)jJZGi0n74jlv>
zx8vWp?@K|!J@vyg1H{Q0-EyE1wi6Gk23cY6#Lg$#Ct$s^vH~(me(GjHFJG!;KI0eN
zAQno=h5^4I9wp!@{dfoAHbIkP_MU?F1SkjEhJKEdg}cSXnwy$%!t71ZpaR6&d-v9G
z=;N3IJUij2%n-8SscL~`2G$g`B)DF2@(bxL_sJ>5kqev=Pj$f(Cg@imGB+PX`fb~`
z4b_JQY?qT0mStU_Gt@@xjc)7b96x~=)dP?u&z*bwAtxuNShgAkP^(@4yZx^<bprE;
z`gehtDcGG>C1%<_0Rd|73<H6VPaJMS&FM=%ll=&r&0m+EvleO*J^(M2Gop*c#=?83
zm7953BP3@4OlGRZi3JbhfDr^B563%U?=1@u`e;4Wj9%{SOae|pmG_wMOuv@Dde*oO
z%3zD*oDq0204)SnZtjZOT5Akp(Eai78O-1AEY7DF5AmW>VNqsBI;5qFkvhn@O`A4V
zRac|lVZwm^<p6~U)fuB+;-EJA`|cr^=xD;aq$>(#9fw~aSb~`0zmqs)iVs7uSXo*+
zz_W*1s{iveR9Czl4Kp$_P$gP2EDz6R*b;vg8H$r#*vj%aP6h@B(7ksCZ8*Xy<~U#X
z<;y+{K#m+ip7cX<gfo1L81V!ofE}{RPbkAEHqH10-;Iw!GH0fz|L*Gg8JE#-#ZP>E
zSbmfV&XVAzXL$4GURp{@Hb78jW@a3Xgal%tjPi<S`7{790bocK<Kh4Sj$i*o(IuE<
z9u*wSayfVwLE2DPM;UAePX@}}9#=sTk(M;Gf~u<LO$X&~inTXp+xZ>L=EF%PG{aft
zirb2pFINJ-0_;0?u!8OJ3PO<p92PpwgJy#r`w`<zfHd^Ety`ZV1#uAQ32h<>{fQGN
z5Y%4x;EqAq(MruivQ(4DZYKfd6GBWe04!FpY#TN3B?Gn+F9rszYoZAsfIxl9v7<*#
zQ7GGG3FOE?c;%oRG+JAsz@C2-78uxsZtPDym<U;!diU<#&`_-($^m%7%mCmIJg|~W
z2ie&pz~STL#W7t(4MSRCKc-QPktFeLtKM<qDSYWqO<?b^yi!FxTL@Y*Z)r(Mr;Wne
z)si^5HU`PGQ8hT}?%Cm;mY_r7<5uXd=kExxg`ru(*t0{_W*C7CYzolV-qZ6n>%d+<
zO>VsF<<AC05f!uOOJkgt3yD{P{t5`VMN0JeaU3q%o!FW)h#M-RC}}+KxF^F1PDIfb
z{TsL&U>KaIy{`Hd7TCv(LbovxhbBo)MYYeBQP?69UyK3FgpY4na{?us7x~p6bJD8w
z)_8BVM{_<F*J~*UYXJ8ate;)&?YoUtejIn0O+qCq1Ww%|^q{FYz5cuTuP=%1!V>0q
zGK7xmg~JCADmL)F2>c0I;Im?jt&I(UynsPXf3&LRiP+zrohW!{haVvnL7u|tmNys1
z-v!d2(KIx~BQE8jnf=g^eS;(eA1s1!i__&eWrU+LM^V-D@+8b^&*2CQ5n&4&As{Ca
z5dwCThKMgj2wsRX&Gg%+rc<D5B#qb9*Uv)jDyd8a$j027fmfG!s3VYG)RC|}7%&cE
zCx8GfQX-Jzc!9U!Krs$4IbxUAuV3GFkDEvv67Ox5k2~<EL>&%({3#2Tqa2x-U=nu}
zZ9*4A1(qM&MMp>Hg=04_nytFa*)XQ;$*Dp&#@GtdjUJ4bG%R8zWo4<!$*2N~zTq@D
zW%uS?DmVwx>HpbOyfnvQgVu>X`DB?2*<@U#bAH|)2N^QVpwmO<jr$!+TuKX@9{*w%
z8YFJy<+=S2l9Tx^pY9kM;<7)1@tk&YHwwR50G@H@onj1dqCfBy?&5ivWpo=c%s^JR
zz0=Bsiv`wD2=n!UQp7<s{I$>aL%6eu!wi%ZE-;Cjv-|;S;5~ZmSaf1EpiO@M-512U
zX;c*V{$E0Pc%f}no7Txwr_{4;eG9R+H|WptKzc8Fyz}zd`WX~w9VZ@bjI*y{3dt*W
zXLPT0+XPqv$fmRxBcapWuF~Lr`Q4AJ(h#B=215#dCooic?GD4%ckWT3r~c;D@n53@
z&svWi;^XtxQ~iabeHgT!vMGTx$DhX-044ks_rCWty(lH<6TCsN)nBn~-WX;=j+
z=DTmUjV&ISC(Of0cfN<?grwwkkRLRN@!+_)xbykCYa%Ch)mVchY~%&BVBx;uTFjkv
zN?6f|<H%UcNy<0M&h{LWu~Em>smi7?o}Ar+<Ehap4qRuHw6(*5iJ*&GSXh8|Y$e8v
zk0ri=P9Zw2ef(ZQ=e0t`=LM6&0~8|D?qSOGLB?b!su9@N4o}F#hi>oWvAw^Ejd%dd
zZgCSRSa(oG+GPU+0<vy=`G?{4%a@QFFW5ZBE}Ki^_!`1&|DY}r2g@&c5$KYTt$0z9
z(uO}pU^s~UIx=AB`}+0atPt)o%Mo~fPtxtM=&PYxn~XQHdhte^%-H8(BZjS*z3~K1
zCx&AzzI7<CFBe@f1Y+c41m8k$$Jk;4y1Kq!C+Hy#VCx!cX%U0#+jTgU{&Ka5`%zxr
zo19O!@N1XsV3<c&K(Mwy*g&zm{@}BRQ8^BvMcI^(X?f5ReOUG#toQx6Xk%x0?04*W
zy_ln3>WVP(@7lT3z2Up4Ef}NXKl^q<2?w!X8vQK;b_ocwFh8$v(`$?KzxhdHYN^J7
z#g=UbrJp~$x(AEi`NYk0^yrg?vY~ggN-kxQ#K?x8zS0KJuw9iOe(h&gUGQ0B3@d8q
z7uIz+{K*+f$-9%sw-<JdyoBI;1#RbdnnBAE;0_;y99k)Kc&v$Dz^hlYc;d~v?@=`-
zDlIuEIrRrJz%L0HJGEDb%l*LUB`W?&=lUPJ`ma{sOt+fc;ZvOo0F>lChh9XK50B>(
zyFn$LTJu(|S+fRDNS2l^0t?a8p}6$XYCyG3raltP%GclHWlh&7Jiu_bu^%4LjMl4r
zWb|?)fT?a?MQw1;Jx)WE@e<x-vyRhd$0A^q7#nf6^ZhqHbXpbY_56A_43;0x-M@(E
z27o#65|4|37E@=}BdiyeqDc=TAOUO27jsOXZ~{lElQX=*3H8y@Q7n6#`;Wpxf{-R{
z?*=q^+0LE<@IYi`ezHc_G&;-ql8V(YiaMy6gvU`zlSMW*fChAb>tMurA-Q{y;6URr
zzws$R%0W#&MOjf@Z3I;1n|<C~Ug}|bx=>Ni?9>n!JG-)+(SCw6Cb#1E^sZ|9WLOPE
z;X%*}G7m2ggcdm-K&1$ch+r25%z4m6Cm<~R>ix{KN64b`-88s%?O0FMT|m|N6$fJ|
z34d@-A1dxPW+fa&d#8LjGqY1b29bd5hNZJS4d8_F)cmVguW<6r-NR##Ya{jqfTh2;
zAfrqfLX@`tZ>mk31oeOaQYXO`{bk#tqck3OSIDh}V%=C&<W>k=NHv*itPUmUmc3X@
zQ&V6e@(uX0{WQ<5ZdY1t`(Qz0@KXP-8pb)L+qbKol&(kY9es=z_qDiKUO@rRIh5fT
z^?6uVSBD{vUZ6S=7+mj9eEIxYP)G<yG}ujULe+snsB-7yhqh_aO89y9><LAa*(!wv
z*~-8Gz+B9nmsMd7)8fVfQ#r1qk%TdN{9ZXYCR+UasHj7t+IS`eDC^c{4KyzhNd}x$
z1+-9A1M#%zhA0UMi>(uw1^>>MzH%x%<Pql6a3m470g=rp4$dauk#_#c5->Fgo`#n2
zqNWFDc2HQovO{)`74$)WfT?9}qL1Bv3?l}|jUK<D*X9YFc~zYX;7*t7ai#b*E$9NP
zT1nWucee};8MkdaNqJ|y8~)W7rUK<SDTalx>i8P3sH%$Qyo+JXMwEbf`DC5qivC^o
zy61s`9C5RgME{{Rwg*qZlP1n;p;n=;dR6l2{p<vTPQH-BfWmiP-2}mw9vy>VQZ<?|
zN{01<5FGA<JJSh;15cFfm@N|yO5z09J!Mzk+t-JOzr7z^5Bnkz(LJyswy?CcX*8^<
z@$s0%luQX$Q!6V}kz;lp))$oy<m*(yj9X-pg2$|Ph$+B2sXM_DD1d>Lzq(~`eBF0N
zbEmR6fY0~uXD|qtI)ioqKUP|)OUsc#{}jNi^NicKE27}^c^u9;M}*Rq)pxI9uf~6o
zwYsTuR$nlZ*g56%YmL5ga+#R=g}8-l-kZfbFj<n}^2TBL`!MhjQ3Soq++xHqfMT`e
zHR9C@9`NJG4;YFHa>my>UV~jx5AOaV63ULMgA66c`f-;Wu5K++coG!EnPrVJAgarL
zSCGAMKrDnZa2$k%I~Tkd>F8d-p`nEbXAN%L0+=lmZGsd31)o0E(SKd;HC3>Cs^d}5
z?(SbPmq6VbZE|QLBzbwcx<H1y=-hv_mh$kdvCETj(18KN?$cgUP~gR*4RD$fXQ))v
zRuRSwiS42XgRTPDH*#A2@=Qy)Q?k1iSQWdtm06;}3W%s?IKtvOL=9+5ys)_NO{q5Y
zua3#Ula?X!y$KB^&Q}3M2thzU@#2&R9rqrg`hR#>${TXU|9Sxg?nj$Ed-lvfQ3~Yn
zAb<NKZ*QF&;SuqIjAj0Z5W&`H!lrFfP#(0jv<jBKY@2#$Hx7*vCsnHOgg8aTYG{RL
zKKw7n-aIbH^?Uojjb%<UB}2v}DuhTSbA_aV%o)pAhz4qJWyp}E2`Lf{Qidc=W+FS4
zq!A&K5=AQMd7s7Sv%kORd0xNg{$uZ6=)SM}y3TW*YaPe2j`bxnIXRhlqj;9AiV`8x
z?pC$@<*Qd$o|+1lPQIFKU%8qqCJrFa=JBv?ooNh1`9btikHr|o=V4B%cgw)JhF>Ns
zo(1sB-)p&j!@>Rg!!E}jt~4zhIdsH`UwzECy+37;MFDl}*xJ<hl~bRaWbGZFw0!3Y
z;r*Swv<Fd-@L#>Gc=-@lwa*8O)Utb;$1Q(yX-%*1>35gwd^KGiP9!E$%IL8$ooh?Z
zTMTT`0V}BfK;#1lp3Pm;{b!H6+q$elOYFVh>RWg;8W74FD$T8*Ud&~^K6sN7O%dYK
zafSAm%jj3JLD_$wX8@!46sGL*W$YCsbra18+Kno(j!Iggs%lhL`}-)meM)<$ysWI=
zZocz3>fOXpq3YCKVOF_mon}&a0EjG=yVW8iqgTbn&rubz$T$+&R<THQ&J5*%y6G|P
zc;cprs@#<;#(K(T-*J9;M3F~S_v6a|#kZ_-Qq%Weent6>8$P@YU4g4<m6@1LV7O?*
zggd!id+e9%(F2RG**7dU#@wB#O%?->-_Lcel~tSSqsSqaTb9^aAN#TUq@Ul1q9Q?3
z9X}bc!fhWiY!H-7gQdcBDE&l|ec{5h^mI+o(8$t<Q!Qv&rh4ZT^hN0mAiynCZgDjx
z21taY#O6!U)EjQ~Yi8bQ*RdnVU(EHyVdfW4>NsnAei-FmAYa3USA{<~{xCK5!sU>|
zm0c%zk)LHHw6aAQZ65RPmyp7$>Ux6o=ddr2_l>k0S12D!X09G$!neyW=rSneFj+_t
ztq&Q#-^uu)G{QG1rtZ=(UAQuJZo7q(KV`3;WqmwnMR>x+YA*Bm@o>1?Rgb%UFTMC$
zSjRao-72U^!wJSS=bD-Z(4+%*O+~PB)hce0QqG$@v0=Gm*COj1jFW8mWqNV5|M{mJ
z*h0g9+tkBW)WO_)HmBq3+pQetn!zLhQUeOik}d&+A#=dH1<R&huk$Xe{;UA5`ua6|
zj8yoZz_KPz@&$+g9N$cP_*BKWL^K2tN9>G6M9DB;ups5vtZT&w`XUjfd1>UVC@zbG
zxxA?8GP@12m&02Q3`jn1JTNb1(Z%_f{!XkAVl&BP&YW#3f4}~+gGy4Wqe4Gd`~qQA
zI`-8*nd6AZ0*L@;)W?#NtXjEGOBQ5(SMWBO<v}5T<;tkY7Ha`i34{j^9m<PY_uyi^
z`@w@NW0Sj<G?qPM$969?&>3f(F}$^<&cm$L#$~(FDo}76Yg7DrdV9y9A{@2);Niow
z3861yRsoW}{FVD0sY+C0;!b<}I0|Yk5D4>wcC{sWfr-=6Nq+U}75Fp2ILfna+rCly
zBTQLfVeu#>WpVPZfS#(0?$>uX`f8N^%GiYC%gkd(4GDkjH0YLL($1`;)SQOMm|ZKA
ze6~i68T8NN$E6GzaFro~b?@$bJRdzuuDVUk@Vz-L!Z%DBeiQ{fXebD?v?BE#AW#0P
zoKJxPFV?hg*Dknz8THoL;NW=&3<s{|P@vxP-Pm#4%1xV8!#?IA%sVKr@#y*U=cI=5
zYcF&>YFc*n&aRaA@7`V7{-wqV6mZ`@>DoESw@5iaTf!qE9;ej53>-rZY*@F@6LvB&
zF_9VuiGU+C4L8Lj$NR{USA200UusuDW5j8n*4Nh9+xKDPItl7V>=R(_%9Nv6l6-oZ
z+(0dlCc@{>VnJ3`djBf$&L?Z(z{QHdDT0CmPF)>wrlzf(-I%i5YNTH57X51rMW_Ey
z$=L-v7j9>l|Acq@(ElEMm}PhlLGeRw`8F#jgI}>LmflfuBkBK$Ql#BvVlbt{fXnaA
zW^FcqxvT6<;kUg7XQL1MQx($zm!7e(XHS2?BKcmuvNd#uB5*Hg^p*{y^^Tb;JC79_
z!_b0YQF@18Z+3O}NFfc~Y1-Y?%JbDI_xh3k6CJN{j4nQG=3C<)kOI-Qw?i*8U&EyB
zpBl{CjOo2eOXMjNG>-fE0jp(4M_=dUF*H12sTnO5z3GQ3Y0e{sA%N)|B^sK+bWvP6
zuBAATO6Xdm@E*i(HGE<TClTjf&cbNpgq2@*B!DI(=>G>xHX*T`EtRyG1z~vM%$eJT
z?_RySd8`m-DgDWl$Pq(6(#S`Jd*#X&cxiy|gv3Pu-RPDkj2oB0jwFnKIuTv>l{VmA
z#Dr}##Xdx<J9y>Fm7<GTMI|FMGh(r(uzd+qH-Z50@&Xq+-;nzFam1UW$?(%eNJs)K
zS<Xd8eFjYV{4zQ1*lRM(a<T-HlBotF5nc9%0uqc2EWM2)7(AhQ$>fl#uE)o2+K8jk
z`}fnOL2K=~*TiROMKWC!E=H!Ny^#|4_DH*%buBJDCF4cb4VyQux18i-vTsy<Cy-HL
zy2?OhdmiW)9ia)4vu?YOyruS6cQi}w24DO>X|=DV^a1(;4jc%+1ZQ8p(198?j?H!S
zs4P2{Zj+de1s3ip2t_k=F_^ot^pjW%XWP&IJ5A~P<Fn-x%}PfuojImUM_70aU%Xd(
zq)cof9dT{-@rkRlYMW<9J^7eta=`I*S=r8tSCjPiaqjHhD-}OyU@Tnp<42D&qIy8<
zUzfTf_3VcAQgidMVr}=E{%r%1m+Zm{jAgj0>eBd8dWrN^Ws5rK$qDn)v@sO}Uhirc
z<odR_c;qFVm%5<c%XnVkD#Jnm-kBNljK|pl_0WrG#eoCwqW?=;+C>j{K|$3E<ml|4
zJ*~TB-{^$Ek(X{+bi+WgGuNi_Y^jZ*Z}l1$RDWE!=f;ikkw>7Ea}ph6$&Kn~mLo^S
zSYgD75we=X8{=n>>*EVi4<Z~u&RtL#n(w!fkm*g6!?`b1nbL|hJw@0R*l#3bArBA2
z&1C%cx`q2MRQ#f=eQ+P_Pa-|;j85V~b<N2ZT>z=33(#7`)TyqHy0g&CZ1Bb&+qa3t
z-`~&bigL$zxykdXZ@Of^OZU2njsj%m2K_2zahaJ{><(NraM$g(@8H3+m$(SIQDK^J
zCy+L`?gHh9udqDZvC{kQC{O9tt!1QJUR@D8W9h<|X%l@{uUe)4?E#7X?U<5p$4pyz
zJ^ZBn32h_+M$xs3(Mb>+OTTpsJ9~CCnml>P_$|rn&|w^J4Q&G;RvSLBC(EU)cF+vS
z+vOLv#%O4)`h5Aym3EQ;u+;s(Ai4>?9BY@-BA6-#6!O5KLx&C@z7`uhy=1r%h)8}5
zC=GwVor(+Ki6%{Ic8I0^$jQhzh;EBQl2i(&R3FHyXemHQHJcdo0ph_my>usrecrSV
zo9Spk^uB%jt~T(FIv^gW_0__v*bD44!^OGmDtJg-s>t$r$aGp;JlKu+t{MRNe)GRx
zanLL5eu;73gG|qc$X0JZlsuekJZ<8xpMI@TJocBW*pWa5I%>LOWpRfG>1=hD8ZUC_
zyM+)#5APZda(#GWi$Vh5&oJ;dhRNk-hx0p)3`|>N`TfjI)2F5nlV_1iET&g+`SR2F
zSo6(ZxSc&nTO;)WRdDNv?^#<{<&0sk4hNj=b&y0Fd~4+hPxM(EVxlHEIy%<scQ*gF
zu(amU)2B!FH`IOBDIeXk`Crry2pNFQsvnLIPibF4X;xm^&DEyieDvp}hxZG`6U79p
z%{-Tdr8zMIFxatUhm0P@+pnLMb37jx?Xb7!XhTi9=xt}Z2WIXjo8Y=^hH!XTUK}WV
za3Zr`mXHgv(bxVgy4UWoC&HmMMf7n#E8p600d@C$Y)2^5U{7HcA{X|%<Dsms?zzHt
zfNS)Sp5LuoQxqDemhT^SaOk7%K3-m=#RHIasNc`Z@{XJG*8(XQd9`Jd%Aphc_dk>C
zAq7T&wuP5$&5EYns_|JXeUH*p&{;ee&2CjhE@ew}Y&FK{$fLueWX3?<z-P&u*W3{J
z^{e<Oh<`QHbxzu}HN{``Jc|$g1LZ7@2j$f@z?+9XSs9UaB`-9B6&ByZ?Oe0t(SU$i
zb>7NDhuU0q2^hJmZI@Arwo@(3e*k>G$V1R_>uyo4%{f~3Vn4D>SL(YGOEl#>Afd4}
zACAgfO+9{Gusbb})};f_!bJ)_F~>K1gp}nYz(jq(I$$pJv)sp`K6c+fEs#$=G1enE
zsOCifTWjPz9-L5H-uw_p(w#eZG+S5J`~<Vm+jsHei0KcCa-Wz(xLQ84qmK74j_RMd
z<ICUL4W;qzJtwws`t@_c+aBdovj*0xx!?JfX}(gY*x^z5;VIwyz3-D|xK?4_+9^|}
zbm+8$l|%|fMg}cLME@RavW3$;RckYUVRMHZ?e2x4X;qFFTiKb`!l^-P-$mIb7*e47
zbvvhp#zQT`e1GMSIL+{d(TV>{U2;OV-}UXEPhC$$X|l2~i3w=8l3Iq4F&U<+C=Hf<
zaCQ>7HyVund3k4Nb^$_@H;;4IH8ZorcVYDGIdeKmOTQXtKvEMBOgWwxV$i)@Gy(A%
zC<v#zJi+L>Y;s4_@k9z!A>We6lbyG{s{qN!yosb{hwAp&%RJ;v-IbaCQIC4^uXm~G
z=zS|geCekg!eLlfQ{#EV^k+2lV|=VGynFLzz{OeS2#{me<!86dwD#>YFJH~s+4=Bp
zss>jxUs96IDi0^%R(S5zXU?7?Ge^~-Lr=F;Lds=2v^W!W#bMQr3o1C_P4d>+0cjih
zKA`s7*Q>a!?8#20{aOwOImay)E?hW&zM!B6zbU1W$%+L*u>&Q~8M4i4LoXQ_HT$nC
zNtmGz%m0Z&hs}B^`rf)#tMuFJFv3GCzaT%F;y_AjFUUVDww@pnGkf9R1HT>Y?~1AU
zLTK*$09^_Lkon9W))CF#6ZH$vE3?4Atc(^dO0_xPviU83w~Znni}Wh=d-S$j8&{`P
zjgKs%Xj|&|g8JCz&}>}kJ`9*9O<jBF;nyOudi-?m!RZ0lTmjb&_-;^mWz8J#6CXZ)
z%y@;Ar+;85Qs}JbK66n*5z@Ozw}j||Tm?bD_+)24_!76F<KmqgcA*5R@S|2DHGTSm
z$W?IZa$9;)=xZY=*!<j{dRzm|TEKm9j?S9*)6zWb6~YtGNIvcl5C2Hj0_j^x+OE^^
zGxNm@KY!O|cRQb|?g5dTnt%rSL1EVUIepI!+Muf|am<pwMhn&P(Z?r>j-<r|Mi%5*
z8~OsmKT&i{%<TP=WZ;b)$9GlQUcQ9+iB4jbq3WWmcPU^j)OZ}?t=Jqdq0MwTRIn*R
ze{z37JCbpbrqyET0af6%H)2d4ohbRs(N-amnkilKJTi~+!cA(k(_%yE<-6p%{JP;M
zlYyZvdQMMGKq0>|`CY3wh^6fGd6(-)S{d&lu}>dINvET;6khMyGn4*OVqSw#{jAUq
zOx{*%_FBVQd_sBoub9XVQ}GE^*kbhzL2Yk(Ftv)w8S@wK@Gm@KC}rfyxkd+p)hfl|
zL2^sn7x$CFaAEg%50Qd;TP(rFm)uxwNY{;{diL(U6JpYOm}t-TYrU6ilUcBUlNCv6
zt8yuOx+ei7f^DWuxyx#Edq78}`>@yHBiD-t_9Q2u5>1<;mh&pi=g{v@t?J|LJ!rrH
zVGPDP%dRydeWChwBx7B&q>y)@Legwa(F>UDuJXz8*UvZsMNTm_-9}oYuqvO!{>Jvt
zOD0Vcmho`I{-=D62ZpVYQ#?!k1XpmzX2*^n)K^oq7eUwjgiw=K6ecaBR=0o9Y~94A
zOl28aAI<|A`Za3$U%DVK-Fo+)C5>k4B4}dF-pB(aergk?A;(k}eH6JiO008EaeH=X
z6%uZ!9K+YsK)G%6X7=dmhOL`7FZ*?PgUf}Fp(HhismHc-*8AYxP4O%}D5e{4YYoGK
z$1SQSO8aeC?9J@W(z}Tgfs>dFiY#%0mxUh#Z^*c$6=|~&dt=1QmuwzJ4=J97o&}67
zI$TL#54(Umks)wE5jNX0Kuqc}Mk*<-B0mOw4Ihbe!-m{zG-TPxx^~^yN;sM6TSn=V
zL54~Bq~TDt)-y_9vYgG${o{!4UiglZA-TmM*B-rkHGF-n`Y9353+|%)p~|mcd0K;i
zzOg~+{=jtddX6O|lbz#`C=N%hFM~+TOZoAU&U#4O9xU>zL<r6k*#C3KW~3x=^PTmW
z(J>w-`*>4}rKH~^_E?pwFfq)@&9&oF2fsW7#wD52IrG$>XzL|y6j=;a-IZ!5cfFI9
zB}{Ne^B}K1>~@X4kJnvMWeul1h=xo~_!wGZ7R|W`jI5rVYF6{;_^qEA<{|bS>f7ER
zEhdBOZa<l~{!v&jofYdULu|G4jlmOt#@TK@m!qTo#%}6!s73SUyMEQI$+eC^u1aah
zg@MU+3`|=JzEzNxg?<(bnG7*jlx0BNL|eyKphhH-hWMkhE}owdgfjz$R3qtuO2c|i
z?3%Pb4$X3qI3cPkdH>$`)G2=Vl$Tc}su}Tyw=)S*bNtjM{g5V5joKLsSV5fljsg{B
z0}qGjd<u#h>H@Gqi2lDH&dbSBf7}+O$TFB3FjhA=H?D&Ox&{gx9}C#wI@mZHg(=v%
z@lOm(JmTZy!GzH^unv$pdL2D_xX;8J7_MO9X<f;8S>AoizS2*_I<rj|@Qo=pgjC&@
zsI})LEj71ot`hC-x^AO{sLtVL31bT6!@xIu9fpS>RD1O*+VY+|7%Qb{U&JZ((+{hi
zb2=hJ(mU_Y>XYAQ^-oi>Mrg-w2ua&Qb310k&`mnzu*fCS-Y4()a=WmwFePPXKN+g@
zTRisMl=GZO@J+%8SUM~;R5*w6_TU+wCr$`;6bK`W2dYPK>@t?t){pA7Jf-dJYpD4$
z#zD}+E_d$SnOlTZo>fH4P(61EiPqh%QWs8>YEWhaXJqE()dBGUvJ-Wow(uGw+Z{J*
z+M;<`;!JDZsZZ*$Xh#Q!T|^;ng_hPyvsEYy+hpg9r#E@>?)%6PxqNQmP*v5mM~`l>
z?orc<4qZB>$}6?eU{KRlo$0I{s6#zjUg8#iYn0*?=yq~D>WCq(KgmnTIg*KKFiITi
zCMF>5r6ZOk%n(f@d2w6L1DRca6aD@Wsn}u7=gd}MkB+vpwaw-GLTC~?$w<ku8?aeH
zRnkR|I-PcchXDz4B1B*r^S)DMT{n*hqtw+A3oNCbz{4XAn9P4$fW-PCOdI4nnyLU4
zoq|fSwMF>`l97m(2vPde1qRcnzenJ4dy{8*d3kD<8LliIFsxBgo491|JDL^>W*EE%
z0?qTY-4cR=ZX%*6EYu!2a3FE(%$dKJR8-({qTYK048tI&zgjA;gp%dr&y|!F#Am;F
zA!I}JYmvb{#)hD}8bL@sY6x-)!hS=|`@Sj@1xbRziN}LCaq;n^dgoFFmiX=!fA;bM
znPw-2aYybG9HcvSQdL%V;P?RpDEWF69MaMQH$bw3)hwGfid;E+YV+pJ9RCj=KZZU*
zc%26a%HL96wNXR?p|JB9E_&){Ymj=aS-l#i`&&GU_Uy^c%Uif$LHeU+L=>9?K_lz8
zBK_Z#f88@Muz@@m01w2o?R&uh=*adw?3PUiPMJ4LdI50Ul@Io1bS<byD!D!JQ{O$}
zz5^B}phz}%P`ci{wC5WDe2L{dA`1cC@_BeSn$#VyMxCDlg?R4U<n<^DCpi63%e3>1
zB-BDxvvjLoTZ(wSAz)ood#%kH0e#R*>+g)nv4|gT&$0`nEr^&qvVL4oGR;#+`ID1%
zB6UZO8Kb@VmCN-}myyujh>zdv=C(io@tZHjX@SW=x;Cx;=F+!q-`?H73`raJ7#rKI
z+*sxK5sR)rCG-C7L+cXf(d*}Xj-fPx7-L~^8zMf1fBgWysyTjq@!Pliv<_4DAa2KR
zGkmK)T(wGkvpkL;k$)zP2fGKnncAlU(44#7JubqXqqJwwo^3W&S5_k2T{r9SP1Fe=
zx+J-yfhEeRx4KR;Ew>;r7VTPYg!gW5?=1EVs<c}ZQ<03?Cx(WH0|i8op!T2sy#7+H
z@==FrbIFJc@LZX`;SwkU&xQGHvux|aYuqDg3gE6Gi#*?<#+8%>6M;1)86l?OP70(y
zJ9pme?c?v7>;naAV-sidW>3Wkz8q;bDH%tTsnyCnG(-+=p${)Wzmeyl&c+UIkkbo}
zdhG1nt(@lfU67U83zFyk+Q<!Ewfdw{ma?CBm{SBpVMUIJyiLPTK|wt%&TUO0x=no}
zM)*)z9WXFfpaQlruQqnlc1EUC<ny`YS(w*>0|pdYnujrRX<@e}pNttr_?CmtRUbTg
z5D%x?ld%XMLUrjc)5Ye<HBp_1_qIc%d3=$saU}N!VJ>15sg^CD)vq;X-Xs1nS_>EE
z5h$N!4kg{A+rq@u^iu20P6LJxoq4^RGhV8!OpAmam#z=4rzr$<auF9awH%0s7QtKu
z5>v}fk@C{tLXWMtRk-ka(sl~EgesZE%Mo$&%lRX8a0!Y&)lYGwMDcD~+9m=T+*DC(
zG+`xlB4j*!_I8}K(|NVu77PP1XJ+m5(GC@_npL~oi#>mgb3WZnjKEoZb*<;s%)eU8
z%E^tkex~HvI|kpO?w*k=e>e#vb&=~`yn6<Sw{dk%%V7)91Pg>a)#q;`Y7GJYCGCvA
zuHBABM_=XH0{aLxHMJcGbvEp4t)rG|PE+D@k1M*-V2qKgd#PJad18=by^*vStm--h
zJDoRRkbp)_Z8y__7SI`V?dnZUJ~Ln)l`GeYxeB;=J*gam8?ekhd!~{0A+3|@AU`F_
zQ?`j=L0I;>1h|ETBr7jpOUgjA5YK`~gCc<pw3oa*E_ZI%H09RNMMG*E4`EAd`GzOd
zoA70Qd-dwI+I#PDR2ExpZ7*NC#Dbj$Nx<>$@c>WfQtT;-3d2=YtY7pM$T)jEk%dg%
z&OmS!P=EiehlvG1pgNc+OeitZ-0=t%GknEoo;FfOnibAGynTJsJaPqEWr<!#yu4P>
ztx&Fa1H%ojeWbGTM`|WYs-~`M*eGCM9_;8bWBO>?4$Pc?IFD!te8D}yxp5(gl}$)&
zhdIV+N{Dn<vZxX6OSf(7P+z-^QwFiaPXDU1yllog#y^jCw@5Q57bLqBeG`PozjyEM
zA}dSoL}pF8!)gI>!<Q@j$RKUnAh}Mk3m{N@LbrjjLjw^t>4Fr^pg-hfSFd01#D?b(
zY}K+QZMmo=l$4bbD%v52Kv#P4d&lSV%(jgN<b;bsqK=OE>E9M0-$Yho`D6f+x3hRm
z!oL>P9E28cfmW1%!7nh=dKUxpjMoPfm~J4+;-1&k)^b#U5DC=}J^khR_Vj;>G*rIc
zT^RPj;Me^4@h~NY@is@|t9)cE0Rq;p-2sp8?A!n?L{}Z0C@oN{xm%<eUCaZeWX(6k
zuW~t#Aw3T(nW+g?LcZRr6*EI%p{%o3e?Rg^3t(-Hlp6A59n0vG_7_u%b<n0ISbT%#
z0upX*){Mqt_*?pHRTf>3W&`EdpKN3^RMs{W!_3kcH4<=$f)v<$-aN0QD|xxOW_3G5
z`AQ_poCVbPr*xcuQP+V>fID+9s5H{hDfI99QykqA$u^;cfS#E)efohqdBKpp%2Vf$
zSoT1gbh6StgDVz-=t$>=UnI<x7;p{zI+*&2y)Q~}QXg@4^GFUJY)|RRK?TxBI%bXP
zqA2Ne8U1`P+U%X}Jbeq*FI1lS`HMhL_<o$QcoGtTA~<vuG-<GAAjx{(PDC4qM^Pw|
zL9iQ^uUK(K{G}po;T0{`1r^3VRl_KSeZ-t?d#yqiq4kSB!oufcTBppqYt4du2TGh&
zn_`&wqR+-w9c}6IxmEEnteHxOS?Ju3RUJ6c_2TrGY+8(q#J~Cfyk;nbZ*o?G#X0jA
zN0tfxhX4EPhkA<5CofM=t7t9V{!K;;XB)l7e+F{ESe@rLWcM@;gO%S+=M+n3<^<@7
zwF!;p4ZRH)5#2hNe+FWhDv#~F#&08%<3dKhPqb2Ysp-fu(M1nz(&%|>$;;~qaP{_4
zRa|Ylpiotk><tW#;tWML5`ys;u34$oA2}o&jZ0|$?bBiNHyrv_+%etx_~)@1&I=m*
z<D#ZE6i#z9o5k4Lzh&sL`|GoDvsb-n!kGN)Ws@06#bnMBw&Hll?-yvq5e~v6+rmvM
zD1CX7W6F~!jow1}epYRl%45nm2G5pMjh^&!PC6>?){oPmuTM2vZVp>Fi$OdmTj%8D
zG?}R|tSC{>+h1ruK>)SDqqZJ8&S^lpyats;RsYdoI<4<GRsUVx4}TQ(e>tjPLW8IM
zXv@3%=swn%uP5F?=O7!N8?HBlz;ZU=@%A9r(`aUac?oA61!}HeI^WB+Mua<jY51{b
z^$X9blUlW!Vr*pi?EdhZy%(){7_-sZD(;%qY76U)v9`m9Pn{Qc+-iYO@yIu}S*dcP
zL)uK8tF9q8b)K}GjBC#y^)}`2N;{>ulRo*E{ltdxquy`%C&7PuhrXRY*C>=+N&GNR
z@J*ri(AirlhOjb>W*_VA!(`cQTY^Mln)=|u^jv&E{!W-FdG*Cz``q=l?Ik|<KdRS}
ziisnB)m+}d+V70>`mt6SQwj%W>0xVk)rK5_gWz$m){;IUAAI7c1`0DB-9si2yTS~Q
zNJ6A7&5Mo7w~<J?J%BU;E#RfCy`)@4QZX)L>I$0aDefMzM2$lF#5Nj=pPG^`fAQ)j
zgEzOnM~VwlZ!$qY^CB-V8B>0eYM%+xlAE#<F=Eu)$9)C`iMt}vO+ktqaP(;Z>z3^$
z-5Lkm=&sU4@GGNt+K85&M*$)7n5DXr>d6$LLCsiP(ClV=49b^EpEgo@W*w8ifUD<a
zeHkKiW-p3|BV*f0wA{Deo3B;j*-8?v(CCw{e2+?vAfxJvHiFtCKHnys{9jllNGn45
z{_{0flA6g??rNytuIOqJ`Ms*@*aQr>c<Ii1PQ_)lf-2_g;ASq<(@Vc)Oao(l%MkKV
zhu?3HYrxr7ize&oz5T~{gWO_+0*XHFL(r7*0kdn@zt>Z4daG6KI&|1(W7AoWtZoQF
zw|tz$Xc4FxA<Rt%7860W4<8#8-Z&*aR1SxKr2UXLWx1y1Dp`BXB22?f^!8CY_!|z6
zdn3`cp)B_v!w^SJdoS@3t0SVLHxn~4zOj{RCNXgYe#ki5fr5!--IuqPtEP@Vcm8}k
zMe?dOt5yx#t{~AhZ8YaM8VVX8PsR#|M@IQDAS8D!XD5NwO$KV)Gig|RN%0#%B9uik
zdRNh}fneD_5PLNB8EcCC=_R7jNHfPzFVwj>Nq8)Z6N6r`A4kPQx$q&_it~}1D0%p|
zST(w<<|=zz$5@ohWu;<EI(UN$)5Qu0N{mv${6=g@_*Gjf{xNSa=8q`4DygVEEB%H8
z4g6sIuKFAKrzMgsQ`Y*~t|N9)B7?|3WD@(YIpB&M5N<MnNS_%oAXf6ophjoAQ8?yp
z($UdTybIbwlGC5B|HFfGhn&?ydM*eVpEQ@pLgc8)rQpP28jOGVMC=VL`Pg@dT1rBb
z<l4GbP5l670=kzXJ~54`20PTMR72v@s%g@}s58c4KomnaP_ry9RFfEqa(P<tTxoR#
zXwc{4_aqXvr9cDZ{Rte|=1X^G@rgiOXlft!ZYwc51b^`yCogGXV-L>pnBQ@gq15lf
zvXV}Rr~*|NZ`7}oTh&BSvEDTFGdu_Chw5Oq^d)c-!dps!v`feY+qW}B%XGVTp!*F!
z-gKHieR^DD@Xr#-Y|2Xf9>f+6a##rOB#><x5(w;V4;ZH?uaLZj%$AXr{fgG4ts*^p
z!ZC0={*_vO-kf?j6GBbGL33v2Vft+5;BX_sUNZkWNErB={>w!H8tb}ciHV*;Rmb!P
z@zYH&M-0vD>+9WQD5AvrU}YL$0x;Bc6R<nXz)+rx%lf7u@~P_c%Ld$)yXetu@}^+>
zOK<-5f$tc_2Ix31k;a-x7y^g|CtmXvQ17sUhsm{7yi3gsj`ePK%bT`~!Nqw3deR}r
zaTGQr_u}iXocHVd1`>o;#o~ASR59b`*~P^Rr7y9%krc3;T-<6wF}kbF@8=qQ=@JjT
zL#&24`EVJWN=Tq9WPmHiZ{;Z70)2gla8rDgbab5AIMkJT`-EXGEtlm}Boa;U_nr1~
zpwji{kA`OJ`&qn6&}}9SFwbX7?k?uR$;!&UebVA)b84=#z70S2rmU3JV`-fyk+dBm
z(hKV(PVTq?V#m>V>9ljFn+z?zr8LXEJ>24^Y$9&&NQd>LQDlK=iuKa(%2y^#qew(k
z1U1EU$ZcKw2w$8dv`&4+(Y31{(ljv*M?=Gu%T$?xsVCFfxB-J)KV(OVfluOFajC@u
z*r}|9QO+k;z5S=TL~R1x3jG6@u3W(yV&Sz<5m8A;(OW;h%&$LuI787jF|nTI2te?5
zc1y{T1@^hI;CdMaW6UEhz7dJcwhrW-U+DnVoHmPalVMKR2O<^ueg1yQd{>ekSPWe1
z^`z6$2x4KbUu&+$Z@B2k;7LR9i(GJ}7@Jjxns>fpRf}hudcYzQ$CkLO6DcJ>wv~h*
zoPC~aK6$lw&z?Ex`RpsXeUt2eIrX4AW2SRkMRo-bm?>L-xz84@`qGN7w9k=*CMG1f
z%Al-4^uT;S?+J1)^8c(Hd5E4f>UO<-;O3=U$Ag~4H4YN#_L`cQ{j9eSUl<M(6njgq
zZ=O_cB#~5#W@R$iwu**>GikyAt5o5pYP=K<(zn~G_Bb?6@h<kZ0}A3gOI&P66jlP|
z^H+}>JwOEgN*vRhM=&&LLDmcG;yq#NlWgt@lCbB<i=;1+T62uNjN3Au5466(C6JOc
zH+ZJ>@=cqPDYbbHkBBM~NwggBGNtbEiH@9_F>W%1R9HRRz0D<l0jOA#Fr?Mn$1{UR
z`IH-Dz^bqwnYiR7;z$fH6z>vux~VP^*Y6T%gnfk1=ZC~X5AE8u)RubEZhBvyFWfY9
zCt0b)0A;lp)J|x=uqbY%lG2RwaT+fH&nd&~$;}m~kZVze&r9C5lbaZ7h0zQ^UPB;E
zsPyu6>*`n|Wc}vi9!gvWA%#Ni(!Na_=(iK%>@OC34Qq4}50`J)kjVGJY<Q-)13|17
z0bFN<izP>07<2jZ(Ft;rn~RPm?;Iu$lSPcMygK-Z%o&hU?g*7^M9_LZXZ1(QCzNi9
zw(s0!Zqxb>r^7jFyEnXs{Ggh<l7C~HL1X--t66*8xcTDq4ub(x@QzbdoFx7F!-wk}
z(qwECS3A+=iew=+cDre-roeHtL0$e352T)F9I}@mFf@H@G10}{a<sh8k5{|d?KAI%
z^Yq9}PIc-jxw+efGI?nAt+sAOm=g0nYB8;Ll@X1EBp$S@d@d?7Ufzt=kqSrbIC#z}
zWPi%8p^Oa$umdT1+i_KA+A0Id69Q&$r?jTkmJ<)jT`mh?o|2sH^cF^Ci0o%ZWGzYF
zwOCphDU%6o!!Y{GUWmm30|&08!V=USSOwpRL*i3eS;Rn9?iWucWS+9OMWh%N&*7ve
zz5CW?fF`~^uzX7I4!SYEM~|M#vOeH5fW2Hq!D^!Hoe;+3E8hP+X}B#LPt27CQ17Bg
zD;Zm7BL(Hp=X@azLu>1gggVB7C{1iHEj>SBhYh>&?W|Q+q>dB8H|VD`=md;KFTy*T
z1ve>6va&h&$!C$sO)FVWI?I>&`2KyhPA7b^zH&$UI86&N1||s2BKznqFP}?P2r*tT
z^fVvHt70i3+Mel>)Do^TV97|4aHDP?F-D>k$V%t>k_fc)!s<zrL_!E5wVqqfdf#HA
zUbawiim`D95n0G>N|w{hfOU5-IXM%>A)NR}eACzFlY8LY39lHk26K`^=Z2jiKK8p8
z3=U2ohl?TdP=k3304F(ZX8Ec8HE2k)V>9XVPi77Up@4y;Gt$tpDq~Xf&p#JO?{y~l
zi3rcOqLsry0l!+|r`fSV<VI}|G^MdFQVKe|oG6O`M>B->!wLU->hP;P2a^dv0Rn3V
zX;7J1_2mn^l>tZ4+gYt7Y74tQPwJ{i%FYHBp0S)@Vvh^A{EQ1dSkcR_QC5COAHv*_
zGmq^^Z~RBD(%-S;dcrL<T1fy?kT^3tfzgd)8H+3@H`n6%B1!mPz?nR$GzJgB9b}9G
zZCXl;BPZ$7!&gF>1cj-{^y$6Y@1eWBjL<r$V<l<%^Sd3|v_ZYSVd#V;@wD_+wY5)e
zTQ0e2DX0=i#$1|Ts*J)+M1K%!g3;Y1$L<4Pta)<$8{4Lv=_%Y@zc3E`dDy(^qT{gA
z)U#}13O81#_Cqk5R2F^Qi^bzu3*nwj_Y9a#YuU9kg^_xvpROIv`$HP~jO{g$G8BCU
z;b^qKVa6zu1qIrjQJ~0=S+BHdjHI}PxCQpRlxH~i^EJz;GsW-UBc(H#wTRt8$dlbm
zf>2Xe#~-i=@z{AH!$-Od5#=7BGhQd_DaJsP%$2>x;s5Z}ONJJZnH@0OfZ1DybqpCH
zUb=70Te$4)8hJZ7yY$es;HtBMfiID;AbflKq_srNx$8@wo}c01fZ5sfQE^g+-=4#Y
zFv?*9kOyWeY)D#aqduf?xyj5QK(#rt_2m6zB4n>|#DFvYk>1{>q&gb%vnYFD#`<s4
zk`(vT)D)v+9TI<0mvy>0i~ddA7!w}F+q@8UR9)HFu>HO8TxG&(ks2x_Le0!s`3T<4
z=832FXgSFo+syMC4ihEhybKgE3^7h&0IAV8tQjacG_mi2gE}(=_#R8n(ekqhT&Rgw
z9hADM00r3~y5vf~vGo)1$w;px;9?zBOC@n%s+A;Yv~tMKh1!5F{MN8cMVj*wk*pd&
zkc@@wsOrr+hG#xM`h--G%U*D9G82<GtXMIx_Dh0!NZ&L^)Bn>CrWH#_%>;^-am_eP
zOyA&?USwaOVzQ4U9uGO)^O;?DYAh&v{kpT9+_P{~B*Ll~!|{@ml8V!79x9I@2#lH+
zG$e>Quc;A!2FLVQA$ow&gHT(tDvTt7^sPhd$>5uqtMYTmLcfW0S<kU93eWn;%AUV)
zq4|Ot+{mEXjM8uHEA<}jGbZ=ybpq1b!O`(C_pzTZZzi%czNo-WE9?nY;0a)f#J=ls
zaWlIgiW}D1=nAf1`sN4GMIe|2Kn8{Fv*;X$*t>TcxB<W)($JUU-9=(l<~O(QI~R#V
zgL0;#m@NeC_jv0J0APag;@U3`>(8~m48GCGfwoqxqaAI9NZ@}P2w_b#o^rvIlO
z%%3=FFrfo+1kaDo>YHe)4Ik)D<Ek67lYfcXZtxP116sLg5|Y_qFW6@*lT8iiHo+<7
z?BH@jU*B)-ZXitN5{@3fE=Ka<J=L{wEMvGYlt3z@Nwb$a_oi(<-T1o1#aeOb&=e9M
z4tBb!&-`OGT7KL3#Zb3m=*Fuj<q}=X6)U>1sHrUuO}n!JSWr~UV(o4b6OwSpsn}U<
zeV%JW%g?F%9cJk4!c?a2c!zE67*rg_N};qN?@OoggJkkV%9?mc^+s#Q4<f5}oiTH!
z=ke>Uci&p3hPYY(4&XP04X?9%QC3;UjHhz2P{=MUTym{(+Krk4>@qJ{km~AcUogO+
z^#n7U9~H~3@(K$JIStrms42k_;I;VyhLMC67=cxvAz>LpdQ$lzo8|}fRQ${j{5gKF
z;P=>_(QzxR+DDDrf*^r2U_48J6VAOruY=3fOVDi9)t?c|^Oro?6w6q$)ltFUH;@l-
zC3DYBe&nFK{>#g4pY(MKktknKO$UO%T-f94g;<^9MCFNv5gBj($NwUZSCd*tUf6r{
zf*7;Sse<CAvmPz|m9**rTx9HYBOnjhK3?L@(8ifJtb))GKyQTKgUA`ZR*i*2jUcTE
zhRfnTaQr$?W4Juy+BzgIiOMd$=N#3!yM_&A<&(4XMTz`ygqGH#a%qXn$OHTKDOtaS
z-sE-m{CS<%nlK^jH*64*A;N4pw*)s&@NUW`B@!7n?3?8I-MWY7KshXGc$}RbOQyz6
z7K!t-mS`yS;zo(}A#pickYGP*%osE4qWgF6YJE(b&Fv@A@;ZK<73TzoAYLY_R6Ekr
z(xK0MIauib4~dU=3`r6hx=PdVY)&94uM~8<HD?BIq!pM#b^icb$IlMFXc5VdOFVRF
zR@doG9%f1rz`~HgX7~Mxk-YOb1hVD5`6w6nrup)$d0d`K0dS1FR8xZpBiH?RphwxB
z!!>NcL!VJ!EB~HLXe3VtjGLs5Ti|o-<iz9{a%8tap|<on*a-TOolQcC@a!()?q8g}
z$PV-sim|@cuz`gKv+J#(5Z*YkaM>PK!MXIcK$Gv7BG|1A`U<rD;)^XwRT%~_!56sU
z_fCn%mL{AA)NRFRc|21>24B3jY#b!z{)V6CVJ3Kq8Fv{=-yiElKjiYqOi>hnrGrnG
zd;_*ZObB7x0c)B{(8X<}zac@NMby=H3~e<KTeMIm==~#v2y#t>G9@nZ<?xymdE6Dz
z%x7gas3S(78*?s)Ji9B5d8n8p8ox!q1EPav`gDUlm~zOrzOZ1WubR84u<|bv2Zrc)
zSVaDU_$BhyzCAB4O@B(`)KQ7#v2D%QRbl(rsr4YNpv?Mnqq3~GvB~C3#LCpjBA97&
zE)QRLZHBW(#L{FzyKocV{?kh0vzCr4VdZmll#-mg7~PAa2`yn)Z?Rx@^k|x^Em1LN
zvoBh7^4Z;qAU+V;`|ohmcmMr&)0)9dFRRh0QF-xPsqMT2%$PtN=ZB(UkFnS=TK@6&
z9eiO?dcupDt{1@NtL05ojwLspA=YNh%Etkp7X_m1UeJs1h6t7lX|ieKnB&la+{@t>
zSC_qBC<)c)tii#J@+>NwM9wzwJc|tqZyPzhvRW_Ryh7>so9nhYIBf;K>W#}uTRib>
z853nwU0s)FcVPlIpj0&uyHI<T-(i(F;POl16FB=kJ#N{cyMb>_AQ^?(Ans54A>pAr
z_-8lYGy<vo)R2cDoA?kixSYa=)_IE}HC6;OI>Yv(K=uVqF#SD_ciBIH7crc}iA$0J
zb~u%!wh#4w1UU}DUP5-Ny3^|xCS_~~B(dHyV%6>#m>bLgxUf|2IrsY3vL7Uy<sj8X
zYA}oBLb9?Mkfc~B{n=rulaR_1qDr>Hf(?IejGl#o5AkLZSY1P%HA1YloVFpFVrD#}
zYZkIn^xJgcQ?%rNKkkYtO<}KTo1j(VabLLbv%a1`u!!u~zP*W(oGD{=#mmGWL=G$R
zri7N5XX%KG8w^=w`dUor@nEfcB|IB<GS$*UCk_Mzi|E0#PtLz3>LQnn(@nEMB+4{`
zxtrWMw12-QhZ`+ptmTg%1q0mpEsd$Xn!ch|90wJ{Q04@uS7eQpC>{0jv7<AH&!^@k
zH|ds#r6x5PiRFwL4}-O}pq>DK8vJ}k2jljaJG)agEpPnrk!SvV_<@v_<B|I|tr8?!
z|05=rKRvx0=dY%i_-Oe(_pY0gYF4vxFcT0>)#I;ARC3r;+r|ehiPG8n;Yj*gr_FT0
zE?&DfbXqW-4@WRQY0wfq8+h(fj~L|F;Sxkn@#xmA)0Va^xQ*|AM^lN3Csi~npR|@t
zT%4A7mop`i+<;OTH=;5W9((srZ^}XR2f&&je3|+#nnW8>dn_&;U(Ypn312zVA3K6`
z*`-)A+H=xbIu;ZZV8|MrWzFg<d;8Yp+$aw!V#@D(r*IXvBS!(BJEa7>B{AyUh>`M>
zedE@owpgatgZ$axcOVYAXH!O<-Wb0sl;B7Fw0AnJUw@&>DAEk)yvxl;xX7zcm{5mu
z(IIgc_>DLfE+t|QA%AFEL>B2p7R|Fxs;9F{V=T&cr{P58#Hc-{-YKu4c9I0?{n=q(
zF+pUop{jKe$<VdC%h`>9N>gX$V>EJHEZQRlqP>S=clWJmkUJ{WN8ppn22{)Zymfp5
z|0TWalOJLnhT$y>gXPm#MyBFzl((1HoAUBq@aBrH#$hMfifHs66}%HipR&U5y|Bz~
zV_`ziUcH8C*bql(*W(^g313`1fpw{%@Ts`i?4G8m@MqFzM>$FUGIYC)By`!oVw4a_
z+-uufP%-V=Wv(3!aztS3T9*OJAk2#qYa}yi3uMFeQ%YmG_9wvmY5YH))IqBe1fbna
zFWE|N4(&elS}Zm4>({U44+&QX@9L<}d_LdB9(@kSmv@zzRiYdB=SFAEq$3{|CS<Vr
z>kh;IXaUM$JR0x<lHH4B>l*x@b<yuRTuot_)Bimyk1tKlBvQ9Wj~q7p8i%bXu1*V1
zw~n!nxzYAEX(+A8%5v_?J0NHzK^J~6FBfZ-L4&4R7eVn8#)%`1kzapSK6bh&WWXwZ
zM>Urm{TVZ!mVO%_AX+N#Z5+2^)25ff(>q0)MPyk+J-pKw*t1`+KjCtZnmmDIKg$G7
zh4+qvJD9Y*e7V%Ri0J_2gNwpU%yu@7`&jv(jY2&x%ug*H!TGZ>V2Cs$YAhv{T_7vY
z+~PmkNvJ>DsY~O6fPk+>N9j8*H76$yTEw`Eh(T10kwqu@m1skd68*-`lp~NJkH7M7
z#q5Le0UN0v*_cDGja5@K;wy|kP6_L#r)Z!jZjZ(9Y(=7So2b$lg!dgf^aM$wjUNVH
z&+eK=WRdq>iHZ6BIWm-qXgd|K>tYh?TktA~4vqXjA*tb=?@|JK-~3f;)^w-+IDIXq
z#UJ3G%o{(>;ZF!wnf?EC%IhB5hNy&^pV>gurB9nEqf-(|Hhs_!1KQ~xvK;A8hkjUQ
z$u2@ZRZO?MQfv(HA~`fI6E!9ELDL=0>i%bol{B7i8!1Z-4G%v1YlrxjwaL^%Z$Eyt
zXxv>!D-f_wpEeEoE0zYc9EusF3nFvJD==s6=)&tZ1CV!c>-9svrp%EJ%8eroQgNMa
z3V*;$mX0L2qva2oMR4OHkfErw5&KNu<#)>22%fTHNCUBcMz1hviPqddiQ(wcS3yoj
zi@d_f40r{P2S&8N=IF;jF%zFe<34`AzIX{Za9=1X&!0W3b=`)eKR8{<70Tw0foh_O
z|CeTdzKE`&G|kUvLN+%LEIO4NhndjS3Fk~q0JZWRrYJte>uFL`{=MTYC)$01@8px;
z(BBzzcRAG;#}jJ}R0&ikqH(Q-Cb25Fp!cEDl5^B%Y7>7$Z2>L^o?<X_CiIjLUQsmu
zqF}90%dGwJgQncvoE+2H){^4>0L;`iTW=sp>sD8qOamT^_o_u1qsYw#jNZ5jG-Q82
zGM5bf-&N*o=C}{L=4aIT-}#8V=!jABqP6eCw_3hwyy5gPlW@4<x*tC<9axgEW3Kci
z1~o7;F3NUf^CR<6Fd=xHeZKC?gT4$KH(S36G=M7(A&L0*an*_y1DdwR{U#ceThs>|
zU0@C#*x<p%D8>eL#Ne7T()ajvN?f+pX(JOG6E4F<mC}12Lbv_#<gC<oujr?E_b!V*
zbR5wDsqnc&xJ5f7t}<;DfvDh7SB><i4MuQ3+qYMTAL<lznadV-^-<ZM3*yJ(mHDC&
zT_z>s+L&A>Pw#QwA%cYWq2KFCw-r@5;0f73N<AQGwr)hkI`GAi!5gtX7VYkhr)Rhu
z32_;3Ed3>QR2t-21_})20(=0EoiiEBq>j)~CB?fKh-o8m()VZ=G;%Sj{PUS5-)e;z
z_RxK)?KydQdl~IJ`Z!lZ1kk<c%9XgZ`jguj-D<*p_~0hcr(N5&`U><P3~4N=$ebgM
z!@|djlsq*Pv;p|^;Iv@;IRT6d^79{U{ef5ueD0{fztx5f0Zguk|I~lfCg>=nFnf+G
zAyH=7Shqahs{poWT}&>B3pka5PvfPy{pX>@flki}7(YnEhE|4MD28SCimI40jpa<J
z77Mg-Ijao=v91B78RWX7t}GUg+2Z*fe0xTb!7JV+t#Br`xTi@4$x>p|{QyE%vh@Zr
z(9)5bJjNn&S}<llX3E}|2a2+|-=7d?6!IsLR_oCo(5wmkJ$^l-=sFEGO=sFyf$%pm
zH`qF{9{BRc=kBn)$bgY_E4niEu49`vVJH10$~WPZ;^<E!{REYU9+TS6N+<QQj>%;!
z{-~>a>@C9;=&JuNNF*!0um$bgcPX{hzcOnO1~AgLZfD$sSx7-2pPZUl7ufLgyi5^1
zF>bS47IgA(cbCW5M&=ARo!ov^$2NZ6JS-Xz0%o7jE(O=Slt{IWTy*cWV0*@BQroYb
zDGtWp!Wn+@JAlX)&qU5xYAtk$vU}-ZxVkQTwslc!DXI9lI8&Q{rpMuqPfikf;lf+$
zYKhTgxyYpvMoPH3Qhq<)dOc;OHL5PO&@|A*ZtP9-$-BEPjaq|dkP0>))3YrCYA5|C
z-7Cqs2RPrj7$o|;e{T^NP3maW9i(>m@7?PvCwFXI#vdq>lmg3C6PsuKLB_{3G)Cwr
zo-YyKrOzs29+`1>J*~P=SD>X=El##0#F1D^<8vS!$a}tbcX7kB@i}Ypn?pSj7ZR?o
zNB}`&hkI{?pIIcrzvNh(KjF-}-~T^`5#GM1f`St&6gNF}22}uGf%TtPUW$27&@{da
z`8-*Qj2;ez0?S=BaWdd5$*HRhXM!{7?J({BF4GNW%sAo`2dKaHlFk!sA}~B(9Fa9`
z$`k_7!=|ND^C$X;?rJ(135~aw(JD6l_xVrZ+M#1dyUm+J6K25M0s~E*nO{(Vs&h2@
z(90vzKq6c$w~k*tWs0lJZEzMg&Z@+oLPHKRfG{IIzK-1uE~PwVuuB8)4A%0zWGmsx
zVD{`0*RmfxIL`@6<_PKq6xFneD&GF73QRUl3+B#W3f=F>sUxfUgUH#)Ie^3;p(SUS
z_oKE4F+JZ8q%7w+k};LI%K$%IxY?cM6s-%`NKE#Up+%@Gb+f|)h-;@GV_!NAaHZ)@
z2xOGC`$`ls`-Y$k%`71d+7LtkwYS@}c|F0MC#c&&_cs(0G>zCbn;L|DMFB~swYW$P
zqz!(W#m<Hl>d!Vyx6?h_Ww7CnANB}3IJ(GLbHFm^{1Dl2H%8uGgq9(7XZ6q=eFkF>
z|BlI6%qJ&f0eG024lKdLW6q#=EmfZW$*=w|C7*B8A~R|IJ1doFh$8X-n$8V-P(KH6
zlWXYjr<ZMb8gz@!8sNKkmm2}BqY$^yAF+D-u+ed<N}s-Jq7$M!aQSX}m|0u0UAy+_
z6s<Jai$UxwD7wfn1x0Z!yPzNuv5-aNHJ&J`L({V~%K7sw=eq+%5JSTDJJJC_xd(%^
zaG_MIRx<^IQ~*huaWa7tlMw9i6G6ch+(PLX_0`bihM@w5cC~BxwG(H0cr_ZiM)p4C
z>6uOsAX>Z-W9&KG#8@nzsri?@%75xX;ywq3^0jQXdvH1jD1NyXcpDvU43yq~V)e4q
z|4IuDx%B;aV4JfVz_W%hOKa}~4D+%$n?`p(4rvTNFdnMeRwW9F<FeO<JF5%G08OO7
zFb4Mm-NeVHucEaTs)@XaPB8%#=wZtZkPs!iySc{ys2AM}W={z*-iFgxL>3gJ4n2j9
zhpHsJ&+mXCkq%BLfGTO&1P2FGcbgZP4)E6RDkIac@lX|WoJ^G6WE>KgL}dB=dUt%x
zh8rw)@RzoABJil_Iyg8G+J612+vKhP4MjFLyldGFW?Ip;Wo!GDQcckGCr>(|Ob*+6
z0z0jWFqUd2*R7n|(ZnEd=l2|hA|#;mKGpC;H6zlnJ>VG=4KA+~kU~GzKMPN(oEX@c
zELD^HVc<z1fipn4X%U%3{=wFGT&oNWxFE^No|P0h?sFFuw4#*`JQY1X)x*0EErQxY
z*>GH3zj1^7<Y7Q7U5#a<<qw=|>v6+e*EAO*kbCPUL)aHwHhsr9z2RVU>D#!5^T5ai
z07H_p*@i*#SI{lceaBquiV8p2bAHv`PGe&}t#pfm(=k+jOhf+tBLvnSTTaBb2wmUl
zpFB>Zl_`IAyTpTxjt4+51|*FK=IWn_anph?ota(!@#A=a8KTL&5M$G4ng(w`yTCj&
zdbH;j;9L*0YFhJAlIlvM3|9BxIFNn$6e`@t$Ee!kXi@pd4I@SA)3<Nnkt3T~-vGZy
zn7tYRfJ5Y@8JUxA9JXgM7Q?qIfj2t)#kP<UGJ{s=a|j<O4af(e2Ti|c{5koJS`)<T
zfV4XZat2>O(IxH`Sn0p!R87$Vp4O&@x91(S05WJDNn8?$+j~w_s~`vXk+vN>_8GbI
zA%(=<`ru{<wh>Q7HIL&gbcXGkX3Olz1aJ=1;b02?xrI5RJ9<>wNj&CySK9q&6(qB$
zgd7_Pao6oiC2ukCnzn5&I!^EJiD+ILPHakAfT9g1;?iRBA@J56AH&X*N6h~&8!dxx
zcrr;ETaKiNt?yp8ZR=KOj1Q!zr*_p^X=XG#@*ugP{xdTP$!+8oc7FNjk#fI&H($QQ
z3bY_6XTe3s1=^obsS<J7&%A^H=0P)Sx#092L@P0=;qF~@5pwb07{vS$ofuctvrnH9
zqEb~cixF!<t5|K*`QNym%aE_swqi<oS6gMAzUd-O0AmK17rm6XAiQY=*+SpKnIYg+
zqy(@9V%`-E_1^lXb5*4%75PTA%3q^7ms`%TfT{%JFsCo~x^q2s&*sfZ>Cs8ID^I$D
z8w~*Deu}bCScFnZabmNDFu^_eMe=YMf-T%SsOliEk*jcqOpT|66_xSRr$#;BG?OgT
zWRdJ>A6H!VXGK&@!LM7)L2IkEoRDaCaZwKC<Pfbio(!wH;Z^Ss&#b?}J%9Ib{&^=o
z{Y#rUaDaH0q_Wcx%yH9tm-OT$8(X;J4fDAnJbV&zBqn<xKN3(#1MMn1P(H3fY(qhX
zWd4YH4@u=#>Qt7`v_?1Tm=7tU;ql=Ns-d2{n@NnWsBe-o8f>chue+SVodnZ2`=m*`
z7+_mHg&TA7E-LIr>^lphmV<oiOB=>L1hSW|q-ifat={aJE@B2+k}1E@|6Z#)h=CQC
zEda7jYLc#@K|#y-HDL?#=+V(rZQ8e|&$b*)dcIuWn{WIL&v6ioESTkzF^Z*v5X!kM
zCi|Fv2;Wc=x}1Bd6dUdzoB6v`)~x~Fh`(_|{?PqL<Lt@b%`eRF+^5fybHQlrY1w73
zttwg09f7PC-cF)=C<Yh8w6Fw7nhif>VkN>ogahYcK)$waQSlZLWE83A7nH+3eIUSv
zHj1+A-REkFe%i{BJLxj%>r`=zcRRa=q~j82HxDzVS9_p^-S!h)hM4F4d;cN3*v?`!
zURvbVeaU>L6~kBPkJ`c0Acpzo+Op*cL%XUAw#O-T3c`@3G7St*2-6)x%_1;SEGjJ>
zwoXYhXW*DIb`X@v89M91+t7@q(zuToAQuV`;fw&7#*4%F#`|fYeH7qzz-e(?c(`Ta
z;r^w(sc`o1yh-vd7A?Fe#GB6vHB#b)MHs=W7qcQl=MG>p1_>QyyVkFpgcuS55yl<J
zF&==45VEf~ztSvPm!4{#G%yr%eY)yBL;XNX&I9zG(B0*$fIz5%aSwBoq2v9fQ>D;c
zyzAI1C>O`2r~EAky{im2odCtu%<Dpe9eSS!9NOMn{lClbE5-X$CX~)U+`?4ZlzS)7
zH9{_)@!7!Qc5-rpWqs^0#w%qsd<{BBV~25Mj^tchcJGjMeFsH}tTAb8$x)fxY^4W%
zompDv`K)8J7$M1)4cWGlweS@!usz3H@3y)fgq1vr7Y19pqBVe(Q&k@SS?C>ItoQSL
zAI*FHuji`+m_Pxmv)ToK2|(ysl(+je<HyhQ@@Rj$p*NDrdSXCZRCYT>kO;=@3T|6*
zO>39__!}T5z>n^T%<bpTzmpGm?Avz)VQ9v2G>!l}A!P_AR1owcX6e;Nw*xdL&e?M4
zJtm&yU+_hQhFmx1PC{?pRS_@jC;Z7%j?JUj4*>ltDwH>6Ws9%6N1jFAjj#xh((r`#
zgeev@#PSvK$#!fTF62UjZ;NFq&`dhSJ)XC;A}2zX!%o;xZr9IE)H8u<%m2PwU+DOG
zIP#Q2Es1qB^-vNEE#v!;K&O!y(g;DU(IGXK+bU)2e=Rpr3k;Zkc*fK`9w3KMc$ykw
z00cAb6k(04$#JNv!qX%-ZNV34Oj*VD(32*Ur_!$BsPyEvJXk;?hbq{DiStHE_z(QL
z-)qyu0BPM0=Fb$2mE?E|LcWGXTcWFRlY7!N;>dsRiHUij)7KQVbd76{pz|p!!WU)m
zGpA|6Hb7`36Eb=`9305bK7*7)#2a1aCb{k1+e-*)DNhK8gAuBBdySCv*Q?!~TxB@O
zC~3MZ?c9>S8CLF*dtPaIRxc@ccm-M1a!jG|16VN*%LhMcr<%}@H}L5Xe*-#CqkK0#
zWMwty19u_UKv3#Z#GWAbg9*CHkSSVRUb$b0myd9E*TEKccQTh^oV%O-1WC_{uM+}(
z7uAyRKu8^}%G6OA+iGClo{*Xf`L%(ybvU^mvv_1I(SPy%#k>7<h8*SGp|E$8fpRO1
zSqFB13^{8%KwKI=nD)9$aSEFi32LZu*xQb+BrZA23p?sAnKN$F`xc^^h*wrxuT2Sx
zrkk*AQfHbPn)&E)7y{`0tk})rC}T;;%UIgBnV-iT?V2gIeKR?ac&0zw^wsS;FU;iS
z&T298Q>F;<09ma+*CkP#o|@O}VQHK9Wf%UO^w!0D`|jF7KZctODi)N5c3ZZ1AqsEz
z4e{zM#(hesb98b@>91NOxhxdE!cEZ2iyMygg#%mM?`|K7L!`80{0$Ma@Fob)#hXZ0
zyK*B(%`LZ|@KX4G@zULfV{N14I8Q*j4()WOiMkPaqniw<MIi0+bb$PPKqN$=;3}R`
z(VQQWm2wISD)n#P0X>MA4hb$P77wZMz1RI&594cCG;s1O{$N>B;-+l{fF`;6=gE_p
z*w_ZXfe`&|?|(C+<eNjJ*)Z3&`PaW7DD2(4x9B}M1OBY4q=d=2f!;nI-uI7LLQ^gA
zYgJq(N!70@{@1;G1E4~liw^e13&z4DmzMNv-n{t|D04-OLH?oCe0R9T{2NWpCo}Uv
zmfwjl^Bx}$rU6+w(&KR95D$M@VaJ<4kNxZP$hyz(($?%I!`B5IyTnb=l~xp)*W0%P
zUFim7+>|?ic;FfY33aC86k;mEJ30#_deZ7^pY|h#b_I<CeDD&t>+1?WqrLZv|AvgL
z$xu_IZLTupjpPgBuKwH$h9RWwuCyU9<VlN<7#!)T>iXkDum`O)3CktAXN;7@O}2{v
zumU-Q!Tp5ZE<KeWBrLv_C}=2NM#EV%tI-VV?c+dWWUd8wrotK93^e-0zt7NvSTQsS
zKYTtAW=V-<^yncQJaAxRSC9_jQEN-_L75`zkBq%=;yxS<k}YQE>?i!^aXTnk=j-=g
zBvI?jwjjRB>47E-ZCm*`7dMMI+mNeYNHiXwXesF<hC^5lP*&EbV@dMx!2kAE@-y`H
zt+~xIXW(pUnL5I~kgFyjQ28yER!6pkczg-(dvB<UN)?KbnKNxRZ|0EP0|v&{deuNn
z=<AXa{}U%lvDAF`sB8J<4lq^hH@~=%Px2Q0Nei-WQk9?WV1;L?+E})X9d-|TKkFC)
z`S>x<X_*aKRpYS@n8Q|f>1n%dn|D&E7h3+leFgs{d3%fd?LRE@U%}}w)~rD<+%r6B
z-8wcS#Fz;t3#A3NgMxr9&~0y6b4ewswT@Nrhj=&oZsf&cURv`0KPj_O2ZafChSKSf
z)yOOwyZzjM*(vQ@*(_8aRMdOS**;nlztd+rg`V+Hp=jtp8B`oq_1|M!Z98ex%sF$q
z>%j%XxpApVIiu3F25i_o!7At@$h^MvYy28XwYGPYDES8l2A()^Vp%xA)iQCHk~97r
z*l*@{UHsM(NlNhrQa?h<-})Vl-ho>+-WeepL`|pl4-O~8U6~9#8@C<NVrzPc+~MPy
zWB<M=4!84H(*b&Exx2X{)I{0Y*;(-}8WK8U=KGv!DDhL4sBHlw&X|^-OzT;+0vBV_
zJ>=wn5@46OIueJF4%onn_joh2?>smX_$ul{l^OI;UA<+}j0aNdr(FB0Ip?c5n-?Fm
z{qIIA7Mi7uJ-9?PwtvEagwRCLo_Fi!7S^0A{;<NG2XwQ!NFx8|Z(dy6CPnn0ooKoG
z9SNiR-YTAK`J(8xeCv#9bl&ie2X33(GW=0ntNk+~?u8#%zmAr$+p&E+{7S}8mz!@i
zCrmKtWylul7CQJzo`GiMs^)F%QF%}NxpW!n<hy@NJN%EUy%-&Bl>6%IXvwJaCcoZ?
zI|6KqPcg1?R+!gHvijox^=frv-oAc4_s3G|II({uJ|nQPs7=(OG?{*=r>5=7^r+9_
zsb-4$l`S~HZ^|CCwRqf8_UqSg--g$AiXk}KJ_!5k4}jJbNyL9crvBMH|M@ee;eV>{
z|NN1z)gQ|JKYt|AKk(=L{?DHoS^Oyy|MN#K8Gkq(2@6k7Zari^HfyLRa7l$)T!KQ3
zz$;j6+mmI0bcmp>AihYB0m$&5<L}24At+avTOW1%P78@k+hZqA^kNW=yu1Z09}NRQ
zcp}ph^6SGxm9`ZO0ZZs7nK@;WiP8_MBP2Z~<>ecZG?RfLSlB=;Vq*DGW8__>taDWK
zU%r0591{bAIf;Eu5jOXD*i^<dH?~VHf*XfaBK_sR__7Fe4!r!y%8}lKZ<6;hB|%m}
zfzdUKxfGOCe4V5pMF)^{&onR?_HNE40BK61n6>G*pFEjWI~2@BXG8Aj-M5S$36W%w
zWdK4Hw6Q4qD5g-WLig5H-04IILth22W5-5=N&`hvm<rwrd`q+zvRS9D!h5oiE&`3U
zPlF(`0lGjzMIZva24@voD#k(ut|9zdT;IH$FON?Mm;#3}M+N65W8fTNCXDYZ+1Wou
zqY6oboK(4fYxShAyX-fk<%QuDkLuDTp<JFn{{=Vf;IucpSCD;CVos&}MraLUKx5r6
z4u1xssXVEnibJDS2Ru|;SBG|#N&;7}WEAuiTUs_nQ#70F>_<7lZtB!?<doVuw~-W)
z;1iYkcroNdb2iQpiGvJ$TEg#KzfK15qoxLcjv2={ZhM(0fUJnu%>*t^|Ax=D;?$mT
zS9DvW^<0bkXuq!*K_&P%u9%VACH|uQsMrLYS<q7$i3MNu1<a%+EbPVHITOD<3%(Dg
z^y8K%S(B>G3-Xm=KR5hkUsT!l$W#-PV^zsZ_;3D#@Q}6*vlvD8>C9pe`+_s-)V(9F
zt>Yx_l>7){9D7h)TTCqX(1}Dr&;6ySCBuohs}8cntdd<{w_kYC2~}<%GHBVQj3%r`
zxNrZ=9<);XXT@Y_TUifpTq1;Jjz=3|J`5X8tvo&87E{iszezbfG*h5NNcVsE^$?{Y
zkY(IUb-CA-Z6(W6QeRiUVh{Dzcx|(FtIC+`cQp$+bKE-&%l%ey_1eP~s~-vg=7*`C
zo*tckf@2Q3>>8tidSp8sQAq{WujV)aO}xNnpU<55I?r_e{Ojb?6p7Olt@QTs-m3IA
z&dvNJM7peN5C03{CgBLw#;U4*{-WMzi~ZAk_ohZ=ch}x*Uoi=KafDs?*TsD>+7REV
zZyzlv(vv4oI{$prchISDK2C_Nc<umSU{wYRZ%RuY(PBRM`KiGpvF`AJBI{n-yL^_I
z=zh|$Jg|1kp#7~rO`E%2v74;pSUdIoh1Whrrr(wA()CbcuS1DtxsH<zEu-dkxw}NB
znRin3=f0I%mE~7%y0=Yjp8UCQjY9FsiCfAp<|Nt`A0I{4w}}lwj2YE-zH~ZmPgc`c
zkKUL+U!Lc=!s{Z5#Ol$)<Zf2$P3T`C5PBZkzIk&Gx+kkLQ~ms%-xIqcjZW*`xPn?M
z@2A%zZU3JMmVZiEiBBo%D=EIG&*tbWS9)P(Nd&{?E0B?=0K1ftP5?1zp#A-owYAZE
ziM_#`0)~Y51|dM7%Rj~`Nfa@n9TZ@<JR{^WW!UBF1<fQbvDN4Y*z^FQn2sR;84naO
zaNrbew*+K&tPlhp>=_|jhCRYIXy%L=!rh1Od{!MCxCbWc&!=^jl|5q?L0H4c6<@|X
zAerF(;4Wci1GKdA)6&vbS}n;Tg&bn&SMjrEi?=?eqk*Ke;D7qZmlHd<Rv95tr$8FQ
zMAcvk(T%^fCc2>jq|=r`X=CBt7^2DI;WxM2*vy<g8~Mu$lKWA|UlX*^5CeX9*29h&
zs8@qVF#a{SPp9GM7S07X8Ps9G;BnkH$0X59`A~?S=?MRh78{t(&eF1otssn&kUlBi
z6|nfV4ZS*dKAl-Y5ha6g4hn%;qp)L^pasU4*0TX1UkXP#PoU~2i^t4~AxWb30vQ*1
zUE-1kY6Q0JjGlr{VCH5LT*%fnqMU&qZQpvbTidQkYJ_<o{1d1?U#(N`@z3txA3SK#
zDsCs?(apckWaZW!YW@4`MP!Ltex$$ti-u@S=-A1w^m!SJE2Gm9ZaI}dhHpk6@da7G
zY*~<uCEfs(!N)Nss@f===%}!dwzb9^nQg!Jvi`+ONEPTYR)Nmc{i`{&VLhP~NiV8V
z{Ex<C&R1fQ#Kk|OYlMy&|ARFF_4GI)+DUM3NRm0jY9kE?%ooH7U@~8i)6wh5kqTn?
zwRPDecwnQthyj?uqVZ6aW28=Punq0;yUg5SeqoURCKUF&;Pf)$IRu;;v*^_fbvf_s
zU9L2|!>B9YH*kD}sKdmfU7Ryv8EEd;zcR%gsFGJbe3{<KN>2zN#8~NTM^;bq++Jbd
zO6j)j^QVtmT&_4#UZ0)h%_I}!K4xLYg8=j(>fSVC5%k^l<Mim8>FG9XQ+f^(x4b``
zqD7C3=Y0-|1e>{`V@K}#o2o4m%@Fr>)_wRgU!}Qv@^6ZZzkf&{Fsjn;g1QQufp&u<
zt&b_2GPZR@nI9$WqZV}YXLO`n)n}_V({v{mytk!}vcGf{I+oJOue}%`MItr4!w&>;
zOdiS%kn+F#zN@64&Xtp&Z_%KIt+2tZV<Q&lI_>EK0We(mMEaAKBfXxl9yu8iW87#m
zg^}czR^6lM!4J_&Lla`)qoPT3wwF4|;+0F6Jnz%}m6}>!I3wxvU8=Lp-ZFA>13O^x
zx#UKRvxV&W^NV*sU#3Qf-LqS_Cds2M$=|wW$D7x;@K8dm4G1W@_T_zc?v)aTn_oSS
zZFP2eI6+p=kO4F-&a(J8rZL;6LZ6Mw_1${wbmP3I8M%cF<bWHP;f1bZMDWb^tGWN8
z<5~H0ADSg^v^dyM6H*to_<Uwc!}lbb;|})sYzP2i<=|f;oz5B}e9@xFYh8?m{f5QQ
ze<R!ym+e(ldSYOw^_-LA(&_tK>7pNE5xr~@y^#zRvfdTW%@<{?wFgq#f_E?RsILX-
zG!TuB{PSMbuv4IzCf2I+qi?1rk$Q|>|DvBO^Hig2LPb&G(=dxc2-n!$BpYuIQPMyQ
zdgiiP7~lH_%uM^os}^1l4wEZbqwQipuU>A#>Rd?nnA<BGC~g;Lj`0L+zMyVW*6x9X
z-3qa66$=W=sh+`+CjEu&y4AN!-lY|LpCNxl3u`51a&b`&A?Wei?AE(a!^xoU*OP|k
zCDflwJpI2I`xCI7*Y%AX|HeY*EOVwZB+)=-QX)fTN+OXAMUhCP0U@&p6^XDEDv6Yo
z%1o1~BuQncNK#UgQvc7L<+s|$|9y|+eU82DjXcluy@zW!uk$*u&|SM8GIKKUJE7?)
zDk}S}sBk8ziiY3OVtU7;54#9=^wEMMwjzbI?>k!2ePijHt<0l}=n!&+&eRSAO$_TF
z8<>-bPH8DnH`Z!kWd6R$obg0AqBy?+G%U4;=DGsIs>2&KJE<*DUii1wKcL=qRZq4A
ze8*)FET$fCdjEDjT}=d4$Tlv#zUH=Tmy#_TH9|?^`e*l2c+j<WOI>xYAYgAA0qMF=
z_TUN2-kp?3AP&?zb+!7!m~u*<0pBsq7#W+*{`)V^j|}F*qp*S>v#y)fTu~Gx>dMN#
zejTi)d^8erD!tD}g027@r+G6CP~U~G&rfqT?Ot9!L)OM?e(2*B11wuktoRq<kPIL}
z3YJYI9UtiH_<YfzS%6R|cI`DGd)u1AJrs=5*@IzL+h<^T17mvo#>K@&JU%5Sw7nk~
zeD$42O^_lW)f$kNiU+qiC~_PW!3(757Li30u5uK?a9U`q(y}s@d6!Q=XRN1dr%4^V
zbUF5Y!Hs)xZ_ST7QV7BYPjNgJ@oIJqF{@zX&=HYya>FgQFmMv=&q+rD%;qR$axfOm
zdItSA`tV)%NoNmr-o?bI;p=8wz-xIeirlF~PTlz&xg4Iek)p-pMN3q37d}K;(R*!k
zE0T_BYSWJ-bS;C*n6oj_c~YM7>}4lxVLB!b47Lg&&H%(oxG*<<s_0Wm?X=RWtn@Tx
z`~~IK52}0hG#q%gmjbR>BYw16wqqK|Jr#1JY7cFrlp32Agt@L+9{7V}r}{4x$U9Sz
zxq>7tlhn&Zqw~UR{oT7T=}13N-|-~_c>^N<ftj^t&E=|J$hyJqP%7>zdKhz0-@P;I
zUvQHYlR+%y6#a~DaMtYa8_tL1UU2>=E`(08zL7#`;>(h5f1@!I9mlNsBRM!u{apw3
z9`v_r)$}eTjey%-d+cl~-5O&0W5h!Ia#}WG6;9E=68oPDSh&+f_6+E)d?q!;<%^98
zs15Bz2Mip=sV)VZQEYCyeKA>+mDPoLSN?fErP4Llb<!5BDAjU9$DIU0U0dzs5S=d`
z5}#p9yMBthVrQ9MyLR~nr9d@GP-QboT>3^HM8kqzcGzW`6I+#ebvbaCNNw6o>QBb!
z5jI%U>clTAFU7eRW{zKdbKUoq3&xIS+UfS&o?kALk;u2&NwMWzmS|^MvV>xe=Bs^t
z$m{8TU#)6OPoLPhyl+UGw#O4bHruV?d_E=CuWXEEfi0x|W4A3XVE24AQtE6p?pkQL
zLX=_iVKcw5iNr)rcRXeuhS>~!&L0h5*Fy|{T>1QhVkDzCypA1PG0x3l?wrflt{w33
zfF<CqGAHSI+RQfTzk6@MkY+K(?=|`4aLsV4h^f<jHSL8M(aG<%4i8$8C|z4+8uW{-
z`BR1S`yBMHbkwvmX<Ug}xvM+8CfoyN6ohv8)jqtL=Z-CDb8y7j#ScEb(UkAwt~~R!
z+w+akg*#1xmuh(~<Hz@VM24GpRdHnlCM{dG?A6|8(ch^q=P-aBUk$0>_k?L!#wnmG
zo2<;tO=XGwt(tbzp7y>k9T5tZ@<W#Ge*O64tE-e`S||eJ_gQW^>MY-!M=0E2sZ{Mf
zd(qdPnRbMn`LCW5?%;bqzm87Jo0nM)sXP+Ro>wHRN^!p0W5w0~77}Qc{&swOtIci+
zC0@RcnjxD566(gK#qYGj1<;pKi{u1bO%-GK?AcJlMvc0I*?(?0DpKQTv6x4;L2Kz!
zq8GabV=@~adOWw@>g1vk%L15UW##NKcavv{--$!C?HhPNGr_R=l_ynpHLTaqG<~(p
zVEM}Unlb|bu5V)m3}sq2;v{XGF<JRnE36*KD(1PAoeKz9w%EAfh}`?g<7h6P_;L&~
z0<-|3C8+PM0?!yvuF?l6-*YF-RmSrkd5GlrLbYRTK2oK}aWsU8qpec|sM>#fQZ7vN
zqMJUisPk?`&D8g{{kFdDBT=36Jw)^zy(20r%2g(n%=G=ccZN+D#Ji3na|kpN(l@)7
zY7(#fS?(~zXfgVE;g1Q6u@tfMt_bZX+OKS5j()PtgQWtkoA|w-zSkND2jgFh?A@(%
zx25#zX&hwC{OG}&3N72Vl}}C?<L%pP0P$hL1o%SVscJ%P$578D3_ySAeMTwChyAUB
z4~K}-Y00L!$3*rDjLvT>i{i6F`sb8qozdOV;z6Csx<0{nf{ny$-ailkqHQ-@n|<AK
zw0uhP#`Ikno(m~M#wph@=j2EbnmKu6-l>{~-^=^!0oEFdt%l0NMv{W#l{~wcl#3(2
zKVEs5BA)u$*SBg;6ddv7BNB_TAIHkM)^OImhzuxM<FZ7S0i)6P+ZXGMcn(_*5f9bZ
z{H$z#65S!8J4u~Xd49x4*Z@O<e-4}ONjPRXZoE-QdfA(Z=1}!?)cT!|B(erh(k%2=
z8>{))a~(A2SB}Y>8SA%P>8szkO)+D|7;~EG9<2AJIL(h1VPR<@=UkyL{*DpDn$>W9
zccNEKl^kj-N^2sDvT}XpP#M~$t$bLE6DFN{_8jUHs%_MlPvZ`w+WQG|8>}!Wp1%Ny
z&Tk6s+tqeNyN(^xF~cIu*@6t~eOK>mUqhk@55I-wP-DouU9d=tXeMRi%ESwQ!a0jQ
zdG}vVRBB_?O}+Zii!r%3ib*h(%xJZvSy~|yqB*SQ{Vpux#f&0cG8jXeV-_|f>7Cyf
zTT@ftF}a^UepHT1Q|e3Z!6XAi=#O&$ppQ<6IG6-fQ;jY}hI^|dj48t=T*<J=_J*x`
z`E=v}bQ(ob5!H4)Cd?MYp2v3lURu#GO0Z>6jQx;zjB~9r3V!(L!_j#eL9+z~n{<aU
z<vM%*?w42Gbo*QWM3jti91c6o=YtdhlY#=a6SbyRJw^{j>YEWj!-l1gd_Qd6yb{*+
z_)XslYL7M}*qBK`1^IibCGpL*^g;)bTTh=pd~<79%KlZOC=($@Mb~e>!H?-DM-L;v
z)NGr0ZtfFm<k{yUyBq&oPm?ZBd{8v!*do369{Z1;OtXpHX;?&A>{TYxa|3&QIofIb
zp^p{Lg>AB{YA&{t6r$eyskOZS@L{s;k;v;}`Z=S+gR-fSkn9p)UFGOvDN8P&Wf90j
z%Q>7vZjB-nwScwl?m`!OLCzhNGS}*af|HBO@^Rw@sc6hZ_{kPqk=msDQ8iM1!F4%#
zc@@Xdg*U!qW3eCO@%tV2KHfHT)yp-s%+fv7qIGK!3S;&tPmC-Ox7GCOgFGQcPCVfG
zrS7y*5Iq=FoaO0T`1C2*C}>FZqJ3Ipk1YiOU<`YcAT0_;sBq8;joI{5A2z&%HVe*W
z#)_fLxgfK>81a?LDNKlYliCj6ToM24dsfO#XL2Q{4<pw#`OgCM#;isIXWDMQJayQf
zJsjqwVn_4f+aoX2Y8S-twcA9ulWkzN2}u|XDUNmXlZAk;r)#RFIYPABKfQ~e_9MFm
zi~M}P?!8(TZgZGMlR2wVb^VaNcXgV*qhm?t)elrgk)3K!Dt5{nHF1WUr0t(<WxEZY
zzNdlUN2oO&7XRIFehWvi?Shi^p53To_zpOVR*vDMw%9`4mfxs#R*<WCXoC1aPT^wA
zJ9qrSc21C!=!q^aDJemmr_Gu9pWog-(XMl6A>bN>BJ`|p$!YQ40=b5!&BwD=N7b?n
zrcEoxPfs#PFL*FleR*Ew456bZUQQEek<9;2xV>`onq|uZd~=9&5{iL#D)$-4o*h=#
zs_AyuMY@HprV+{SFB#lg(pi0P#KHpK8M=9|EWd79*G=&rO!<JFI4TN4;bSl31RnDz
z*rPHZ5%sjaupl}-);*nOKxQR{j}>j?$#btPxi6^8#Sj1t(svQK2^KO5CYWqTkH@;8
z(@`rkz5uMSWS-Yzfr-e%9xUD8`R~;)E@s{+{>VksFZyiNH@R)w0yn_e<bL;YE(AcP
zLqcIO;xPh?%DG<fNc!5M;C&{xL&TofKR)HRYH%iKREXY$L)YxXn1!!DzAn{lyua;N
zzf=0MhiG;N5Q9d?e8T+?p#01j_fg<w^wJQniXt6eP=07aO%3j4TzugWLH@$Yw{IIg
zbi6D((qBDjWw_F%=HK+L0B_L<Wwp9pQAtTI)187gL2P@k2C<ElMc=kimC#91s3~#*
zj8)P}-5(v~yd*5lTloZekwD|gF{OhvG@foud{SdYyQzw|{&c0ZaH{AezxmqJ!l%8T
zKTor3Sj3yvlSEY0rDMkm0bn!^uPL=?laRMkIj212_Qb7?n(VLZPOM$??xRBtG`oOJ
zyYcU&RnOxAS>RAqEu{9Vf3ru<Jk66?4Z?SZYzF{H7*#_DU_wmFiagS{M>8t;_~d>Q
z0oykH`Wfkao6wm8if=t?WVJIfvYvj4u#khvIRF@Z`0!q|>_<1sb?}X#Ra`R;a*CHc
z5es+CCu$6WDFf%~O`Ldal*=Z(&xi+Nc$Hrv$13<aL%4?*LWB&<`%eAsQHdq7g%FZ5
z+p?u@#7=R!_FYK-#L5{I^HErr71ZJHTu>RIoxCh~K<Y9-ZnS+haDCTD1P~K66W0{9
zZF_u1vflUZJyTZuy0+FU*gS06y`-d1Fi?)Pe1y5$R9oY8WH8@O6m&(z$SED6$)F0a
z@(tjRb1u&Nda`kH#|Hk6EPx<UEfNU^+-+J9pX0|zgSw1({5`j>cCHQ6y&geaJG+?1
zH6k?lv@c(xE92{X8K?-9z(}+kz!B?s!dphlQ*=$UOoe_Pkk$TtB#{uA|I}idvatN!
zDmTN_GkQ---&NJTTd!Vq4?_04%aNyQq#-G!G>mg<nM!k6-rw%{+{qIsE*rYXB*gnm
z4<Odcn%G8^uM>{oi1R`YBh|((0JMK5ICm}C=32xeS$&C6IDfqNv}*&--?;Pfctk|X
zqQ*Xncegj)u9)4?Y}&G_x3@nFElGN_42oe!JiK==V9aOyNlEm*RfHfJ7fm6ixXY1%
ziGs7)$r?zxN&5<>A0L{SvWoU^LQU_UW#eY$xA@P=%|un+v+Zjds455+tsn01HbON0
zu>l3=Md#a-vxayWpkV8V;Ha(Shkhi??4XONS1>NkN(tHbPcYt|LxD3Q*Cq)XCjZFK
zzda|eF((e%bqF{Kh=%VfBnmFYZocg2mxVu^))ayDxvK>v`{PphVZb>$&0uZkc??GV
zYr*^zBSXoydX96QX9GnzH(+j{(J!b|MBN>9u^Rutox(Qik4Yq+5U$aEjickKA(lzq
z;KWJ^>+x6pbC18l%WiA=WPdBf?x^7ue@99H=-r@LWlk{a{R!7apF3<UqiX&bim>6B
zyA;P$GS==*>Cv+WR^H=N+KZ^neVc757T@Hw&Q|sKAG$UIK&KRGozWcfh>v|mCG$G^
zcTUcU-!!K9W*uim9af#qDP+pPtLWIX{$PruH*Q{BR3sD}D%++s$XIk4mVtza-h5?X
zU7=M5c_|wk4j&pQ4RAvYb`T93kk1|@TQBR2ir;99(2Sy+6fr4-utq$bQCJ2wjE%&c
zL=E7rL2|lhpC$Bfn<8Mi2qpJCm~GBW+i9>bvh2%X=)RmvaiTG-u0PAIfuQ&UuK5R=
zc(c2|xP5yugevj|4JQj$nxU_1k#KQl0m}p5YB6FgEQ5$w_k0?J&5iKysBic-UrIR6
z;iJ9Ef*ey{KM7Ze4;e%KlqQ@h%Rkad2W8sl`_?(Z#+gVDM?C(@j!<X@+^G>z7qRv5
z;omueRG5R2JH$PL<gx^0S{38eJA>9(s(|cc_VTppHliFEY%#V|KCuftP@pR!6hpcp
zr%&HZc)`CT%0VwvMp0N|lQ47JvZW{~Z2(Xtc}zV;UE&M9+4xQ&qSU^<Xsd_ql0&&f
zP3>__&Le7K4j*TdVhElt#|76^<?*B+9?&X^OPgHz^at#Fn5_Y6h4i4JK0vMFGKn$F
ze`Y%kIC4`yMRcHwVqTC?eWd1ctkp+m$8nKXA=Ko4Ov_~h5FYDOPU8Vbl!=WTZ%F^&
zzhsZ0J=Z8uUm$bwKYp#K4<AVQ{bDs<k{Nj)Xwu?`00|%)K5O@wFbGj6`d3ES&ZSK&
z(U_Qz&lS@<CSB#20Ui#gq3+0)L_JNOo|@I;Pv;N3-t}alPP^2^S&H{Ky50x+g*k=T
z#bDL_Mh%E2ucCJV)iTYcG$IBBr7rA>ZFiV!?G4Lw>TD6I4t>BVkx+9Fhf}9-TOfC}
zGuG(%9{xEE6obw-UlixuFU->02kJfj$vj}%1`2X!$3?k`sO{T(pFdoHN*}w)erf~a
z==!(vf5i=;!^OtxFlwEGBxP4&uei|FTt+I>Y+2V6OA&CQMqu$ZZw${x`X+h;h_R=+
zBfVqQtYfGY5JH)R4AZoN&tO-vjjm)e_gL5@Rs|h&pI<ahGyI1pu)Q4y9DXJWT`n}1
zMGQMm`D2*x!<4t<i4s6EVN@mUY6d=OS>P1+?d@%@$}y)NL%uccd!(cQ&$_>ov8&T4
zzV2^|AAN+esC}z6aA8bDIo7Che@`=l8S50`I`4ghtSSHSDqfp&?Aw(oL#MQz%K8=$
zv@6Jsmiq^Ww^dH$iKB^6LIz!M7SS3nx6iYQ*nm3VgI%OvLSRPDpgQxk$dd$5IdbJ(
zN-rrh=t5*Xs+eC-m`?XmiRj|-*P=svErY_#%U8XMu;%wXr(ad`U9GzI&VIzkez(qu
zX#6{K(L~d-j=s_`l3RiR(K`3_ogTG4+Gt;ZpK-8&?w6O}YSg5~D$pX>*K`An#Yc00
z2$tZ13^cy*loA@1FXIpsTflIu4Zq&*>cy=1CGc_Zc4M&t_(g7qT>JJ*SFSXp-JOSE
z4wRT*XJ=?fiTy4lUS$53aNUTw;C{}+@zYfV+f%zL?+E8tfSrpjE})aWZ1AE*i&%Ty
zcymSSwE+$zli;Hj0XNe;faMlSvXm&lanNYaf(O~8MF-`%mtI5CM%U5>+*5Op_$0EA
zIEsg)*~murQ&CCE$%&tGsCQ0I4nh;Wd)I{ztnTEMz9Exq(P_}UVB?@C<Ek%GUaqgL
z_U+%_U^^+!BSY`}UCpkVf%GwQ{RVcNDEpL_%W$fTva@g^pxT1#O<yx_jts<;D;wFC
zG$MEE3$%e(L;Kx`A%+$WmV$|U2{nL-&o4;(v5Rrj?c)poE$>O|@NQAARrZSaFaem(
zOAaF?PsMRzlAcJ-w$#<??#9b7&Sys98cAWo?@JTk>`*9fuN>nBeusSes>~sQcgKJ6
zNqjOeq<gF8zmMFXUlo$MG3@$Wo4G+odYKlUTW0>jmH+&ReIWW0apvlg#0SBvG!nG`
zFD8=|R(5ICGzfUu%j2(vxj(eq=v=znth1!h>s?XXk^*{4$hd$wHR^At(OJ@P$iq_)
z+}q)LyQW#^KN#s{2e>vyeGn(hoC1}E{L{dL^QYXcxn~$$nyIagnn;~6-gAw%8_P(Z
zZ4X7g-?YD{)@VFP_9adl;%^gV7gIGBoCc4UPP3K1ZTORhSQH8(8r6aQ;fEwQC$znd
zCe*%Z<k@&iM=7sU*~1P{(iD32wtHATa%1Uf<hn@4iHnX<NIr2wpjV+Lq!rrCVYN;n
zy@qvkX4Q#=ZbN*dvht?jWX0>&jdg3+9+I~=?Iz7rDqKoi$lfN!ZYL%NbLTv@&*h0J
z-(_vfHpHH%4aKqOg=+RCEIr(J1zx)*=$d;c#-98n)W~_wi{YT?dk~Kf=+<01wpgP}
zz`-Emoq48fi$*DY@ESOGx{arbba_qLL$8`{(70>1$Mz_pESkr$qPDEfp{&OG;#+tT
z1Jj<;X`spHBQwTXrw6Cgkg|CB^79S>31fJM*?;!hU@n@VK`<07E&IqwnxcH9x*xU0
zK!-s(wMOR*yJF@5`RX?U-=QnZ@A=<>Js>2G^56^L8sg~bpowzUXt}&TzA0JJKYIRt
zA|LUzR9kg-({QT7zgRY9wAyc~tvEKjXcbX(7vvTqfYd9J&QEv;B9z>(rv8_ta8uE)
znMKu*Qw_fBa$DPl=co5jy!ZP)g@{`bkA2ej5FGK$DQ>P)YU|KlnvgW9k<?Xj4h9x7
zX@0V6&h$T(E&Ht`>;|F~!zq)NEd#~Um8F`+UFMlQOA<yXde_eQOKOR;5154Q@D>Vr
zfu2!~FT46a$(lo`UM&Jp@ybc&5|R`2b1!AG7~Htjw~|{BNwbTSQ*%XzH;ESiz`HVK
zCvo{8Bk1pS7+{nKoQP}IpZu3pH<`L1mL6wDEd)s1YU$Fm4igc<5Z`-;OGxa=$bYd`
z&z86}fidas=7Gh%<>uddjuQ@?L{Ww_UUdY@RmA=m;;4Ood4{#Iu;KfIZ|Lp@@-T94
zDJ4WDWXa6C9+i|8^r!tv4XjAuT|)nnv5i4I!mYY?y##JBU(p>s59)^AZJH&V7xDHm
z%v->!zLKX;&9mo-vWO$2W13ftkd;|}u?iKLM_+$0jb!?UppTeQbcPc&(RN9>KDC|9
ztvWiG5<zI)<wXA1`F0b}yKp&3<*CmH83l<^;53>9_G#o+CwMdXa~P>uhPk83uDm9~
z@?H{WoAdY&K{BC-zL)YdC}xWHa0`OV#Dcrk9rE<lSpUg5NDHR8<#w4eO>g~SM68PL
z#4nIK>Ys81qJ-9S1{K2ccB|RXg5P(}YOvrd;nZ9O6?Klwp@)9Zpp^9VIfc6=of`V9
zaAF;Fp@~7Mm{7RJ%~e%V@r-?b5}~}DE^1Kc0G`GE3Jqi2i2rR1Woozh1-yv&0r0*Z
zhd56<C7w}N|1dc1Jzy3RJI;{>6Ydu_w7JxRoL?ZF?sC*v(V?6*y1T;7b!*oAAZrQu
zj%Xp%x4b=?Nzl%Pq+Y)(aFHe!Qo!9N&b(99f0iXrsq9b~xWox97ZXlRo+B9{TEQK3
z9pJ#6Jvh#YrTqt&O2FPu_XMLtff@C8HCDLkr@f`NUax`P2}Cu;&q;%tz%Jicw%X~2
zzDmY#xf#iRA8|6|789Y<T0yi*)pS6Qc5bdVTrXs;WoHFUIYgd-)PONdD64o6-aI+D
zl}48q9aV(LFs4sM`~%TJi__f*?m^)L#E_n{`W0)b%g*b@u4}OKmPAB_q%!W;0ptiw
zyxKI=8CL<LgWF+H%=6B4ZaMD&tHR8NMY3PHDx`M3;q3Ai@+Kp3Lo6r&7P%#4dSYUd
zg;=?M8&5Sj1l0?ePDdq|3cK!Z!239oY<5;*%Tx&UR6x;c6H*CVxF!7Yn>rXhK|s^A
zJjpGg@(v?m&gkA!)nmHV7=x(p4gh!^mINc*>Yr-g1iE6@mK<qt4o-36i7RG^q*ySZ
zk{+-TU76!;>|FHr?G^Ay4!A|q{rlu-s#FMdcQYLf7depStFffmo;tvF^5lmElsvwq
z6T^*HF4FqXFM19XKrayy^B}?&fp2~yUN8|~@;(i@K57e9+!6nK8DV_{{yG<S$}Ul>
z3Y`vuh}PA)Rb%mJp(bN2Zb?Cmx~?G(9oP-s9v^XmjB>Q?&i@n|guJ5D`SxT@ecd;L
z_<&my7oNtrmBmxJAt0C|JU91V1@;ox-SZ5~Ovce%5u1oF-hc*x_~XhRWW6XGGi^n8
zHwt>^IH=-oxdryIYv%bayl;a~^adU>2??Ej{(xL>$aAneG3)xxnkcCI(d-BVO*K+9
zc!?&z%#Bj)Gm;L%byfG>2M^lO;mp}%S9HwJr4<slwWlG${o||1B8rj$!YJpp!P40q
zndBG$0ap|{i<lU@9c&V+A|`LFCOan#4{?|&m7NChfaA;u6Dld*19MYXO=*1V4ni;V
zg0CDZuQ(BQ1f8WYb?g7ZId&0r7B<v$*|(&qEX}}y(;qgLJO_vmHtbYT98mpxZ4<Kh
zc2?g^jh2OKp@`e0=jXZz_qI3kJU<b_fNj=rKm<|07hHJ^o%kD5+zuY$h)F75`3qyr
zFvE-_@jlQ}Cx@(-@gWEW*cCpA1YH2;*$0}Gx|X=h5AT<-+SETPBp|u`x9@XXPz*{2
zUz#BPNNx9#Yu>Py6rMY@ZlPl?xPIie!b!=BIcJ34EbYJ^9o(V>bjP48V&|z_7%D6H
zTp%d{;j?5C8squ_sLqRKtSvOd)5U8RXf&W3%>L*ObUv&)+~dFI7zK4@RvywO#5uKJ
z(e$E{Xh0*Fn0Z0Uv*EVVSVcw2Ti;IbnE^%h?Y1r;K2sSvk{aH9@NC`P0BlU-W!{PV
zdK)QLlO!0%A67~Kd?~CHQL|e9xVt|7cjI!_KYYRW{Qr8R##%xVr+~G8-@f*`44i=|
z1qV<x`Oh7#CPk<4>=<R5byR;978Tuqd`>9Dv$$1OlAM4BLn>VK^D65AOcONg>`t))
z>%qj~FFTMF6+Xe8*k*?36TQtEj>=M5tFjG}X>YS{8~*URbo>RJgN3R3@k3S-J_o}D
z$SFp`8H7F=IH9rU7z7dl!7dP<85M?Z-+q_ng=?W(sOmZ5Il3m4enh>fcC71<%fAbH
zD7AaFZl$xjU8hcjNm0W2o-d_q7I=smtvbTHnC_14amyuXYXc+MEb!bp{(24GkRLpJ
ztpnoYBz!Cntwct{hf6*K6crbP@UR!uuDnMen!SdE4?{UeLqp13MncLDw`$w=Xl=xm
zE6-L8<#($XwdLKhC_~clMj{QM2mHCvVKnK8ZFy;_7`?!|d3m&E?hmHtmRVwhP&&_)
zODG^291ctkWxI=*1m+!uq?7W2^4~6%=571<@gubpw9Du&nyjanm_;T$93>>2@YnG&
zd5bwjEjtYo$}&V$`5vN@4=oI><L4I+QC8jdR_5|wq@1AFsHSp_V+8ma$4LZKqvcqx
zR|iR2HiBKV3z+g>{8@Hg^jRMp{9fSU8MnP5EC^i|Aft=ML5D*^LO^mz4!v6Zt@9X7
zB+?dMm^^_iapMH4;N{if{a_5IAcjFa10DC?+g@k7Gco*{HKoLv;Dsw<v&nJ69K;&~
z^xwE~gZB;z8Q8H(CkMA1V62Ef2iB2!uJM$JzD6>Gk7T12R~f%W=3uNcol~dC_aD+S
z@xOR6z7!-105Wvmm3LhE?(G|U`tX%`eyYzi!_2h;m&%-$P`ggI5!x@j7i0<HvDP9O
zBU(3@@)MM9qxMWjQqTk>KM6ukm&t+!;WpFxtb+Vy4c6)?i%ap@h5y1MLMK23f%^6i
z4i~A!fgZv!&O(rlas{5^bSw#b4^*XyIRui&`7L*j!-LJ-4?6`V)<Au4SU+885Fl6Q
zA4m!#tRWLK2`AthL@s;>9*>;`jbI1(R&4)AzBT^!-Mikc*Q{SpgQX+#<uKLa;x_R!
zCr+NkQUHx$`MT3znV3lbDcL;$f)O`CBt;nIhpUao|4Bc}!pJWL7V2Ei7()G+*>fll
zrH+?Lm;}yDt%7n2zj84`jf4JPnIWUm2O>71H{_jXbpz+BhXrO7ovl3@8fps$>vcf(
z@<>eCrMe>eLSM2NjOJ5V-;ukBVL{K1EVE_jQV^iF)tnnfS@}k;i=mk#E2}f~A&ASw
z53s0%7eqszID$^cspaClE;}r`i#b5!KHNS1$DQMN5@rJgVdZkcHV6l*VO1WgbwTE&
zFvWsUpCYO$*D~<#UxTuV!q|SBa36n)k6Z}mYoV-5Jny|1vQaX*a47MvRgoIa%G4D1
zfzpM#$hbNDUvZ3&%QK<QL1%)}j%#db@(R5=qC^U{hYyceI6}&VOjLjvnqmtrWNH}V
zkM%d4;vo|$jQR@ck4(}03rzF*SY}SnX1Y<Kpdj3xIaphYZTAO+;FEOJJkiV{h6A4d
zfZ?+bEylDGhYT4t0ep^$Du=QMddfH<Hmpy?ht4x04AG!%su`tWU?wyw@x%hU_*;=i
zw2#^lKM5PW^3xzsTM`t&M}1u8E2Hr3KL~~Ix6eF`Lw!_#712k(j<1Bn1akj&f+Ij>
zB$Q*&=|S_n8LYwlP?Pg%u*XyK>hxjwQeZ`8i6B~};vL0DzGDMv#YuWK3i}dI_pO?v
z%;}MTzz`8N7<^^8DK}{hGkAcATb^IPVFUBJbpWQr*G!j~NSJ$d`9YqI&E<p|I-`&Z
zme00v)UFR0E-7rGEp))Ff9_!quP(a=ydZ7@c!lYZZc=Rj|M@JTX+fAZWaWp5sHhB^
zNLsW_UrcYQ<AW{^O!ZKc8x+zZJRd8E`y0=L0>tqvhj}l22sa~gpJ=>s<*A2RS*YD^
zfdgDtJ)?<ay6q2K!V}#x>e6Z_b#-F&!68a`j!gI!)F-dn=t>0y_tVa&Sx3GiE%ZBa
zfO{*NjS%>gl~p#6y>8U5k>q&<8pq#Vy8IZYi3>+G9j45T1@{`=`llfjHct+ryk{%I
zm*F@f$uv0lR*9>moFtA2G_UjNHl%&r>J_gofhVwl9+Tdelq?FJKP<2}Fh(=TUDWfC
zfV`P?R|F$Cc5bSbt+7;E`#-0_fSu5tFd=t~KNqWtx{_0!lN5Up55cj;Pw_;IueukI
zarf?oP?MEIkK<=(>{1a&&UE0gVHFe#>(2>g-!CUWSig!WgmYqoF&ebLwG`f>!GU+P
z97Pit_cC|gVNh^av_nk)ZtFH^aeRkF@EkB=o5-J(FVu}Mc=l$cO2;vYX%jUTHjaoH
z<(Ep|qz4bI&{3k|3J3CWa4DEz!`nOW1Ym(6GM*GFZKYfotHooba1)RK<DD-2!@Rs@
z@73sC<KjRszlKGDQ=_jZE9oeK&aA?~pm>WPN5TEULQ-I^(CU|$-%>ZyToj1rO*DB7
z6vSl{E=!)4|Fe*f1%U+5=s4zR1}B-pGHmalgDrG?L}wG)#HdG8R)Z~Cf5?Z)doX14
z>({qiY$P|mXuKhvS2mG=%)=As<DUo#5dcEP(ZEYt(ftB=Ik3+VO<Q~(hxbcCfsg9=
z#yT&~G_aJHC&I+#O>KLnb6kkO*6uS`$iSR2vKzt@SL`MwvZ;0$7h)_b%7O}fT1Q4t
zoER)Vf!h4g4IE{Xz!8P2b1$8MLqzC79~2I1Z3b1(^M<}lHrpe1OzMpcnC051lBd@H
zEW>oBRpFvB`&A|fZHOg#W<#4EQr_q?n{5nKq;&LPA#R6k^Ju4gs&j(9#HA?nhWZG;
zfxsH)h?&f(0V6aAM%H0GXbcVVT`0hREE<7DO899R1;78<bWf5V9PjjF8gB_M>?&>n
z+Y?gU%FG<)*Ql}QH&PW!ULk3P{9669V&!`^2=U~Qs2Ou@ii<;y-3jPuRx=Dq|Kt!;
zFBIzhUaeWPW|RUjc~mNhQexMFHO=JmLJK&TmBmFQIK-w|PJ1nR_W7Sh*k<fFhWZ03
zZ*sRe!G<TFiFyYJ98UYHrjE3C&%uLjn>R;t8ap=4EXEkG4)$*tYC>k5L=WB}SsBPY
z|7Z6(gp{oeopD&HG3!_Ioj-hlLU}vtxag^c9yK`gV?n_+%mm&kcJ5Q@^j{6_Vm`gY
zE1*mh%^Zz_@&froBob6whSt5rA^L+&QBKM1-bdQEhQDBIxcJyxzY|}7TQF<dlWyMB
z&i^5~rI4U8SYh{XcZ8Xn=Bzb#Y(V-8zoFJ*u*2#bPYWGjZExK78{JMis$O?sd}FtN
z8ZMBRpt#~lNMcQLjOa}R4Txtob$8=O7-2IE0^`|TE*m$V80!>HSTm~KK*_)!e@yI*
zVk?0<mH)1eqU{wf&)H}76Sm*(68HG>8ln~&-8Aavlo5W2DT}`<JECC<7$hVe+(CFC
zzQ80Ze;gSr{jayO6gU)CLWmVaaikpi|4Jd-T0^W8Vswr>$*1T}O1*oxk4xhw7Mb=I
zw{;~QfA~et@Y_O7{JsqNL@)(spH`8~EBk+fO2v~bk@FCl314G6W|Wkt(O`GnPKXW<
z!a)*I<D4>h7z{i+!x2>RPFhw<wm5K3aNp4ORu`%65SUh$m#2JRBa`<xv=eR<#tP~?
z&7B&Bszw1*2yn0~r%o*b>gl*gPCD(yc2iElfCAj$-F?eVF3fyOch~HYbiwetdNui6
z7vT)a6}ekp%Cma=ZIF>h?QG!i6h54wQJF#}=iVpEIL!Rl&AMN9G3%qkInhE@dZWl4
z7%M{f+iUsKi<14-%a=8*7vBAUxkt)`4hqdCPMk<Tf{>Taz9Hre{IRw^FD6&g4ZYO@
zo&wSEqrP#lff{<oJa;l=N_uS>sgd)puy7RhKWxl=Gc&&}tHAUjMFWNhYJ+-0uN4C#
zSGDS_W8SW7SEsy$cB}+AP}S0jOlb*vwgNG0u44X7$#XfN$ZyvT<@xz@<M(RdSy&Sw
z6OT!=(Z9m4y1hQoa9v!GH+Ew4Xj44&<k6f9GZ)jqNBwit((F(%xePSmZy~d1OCb<z
zoY_IuEmj{YJcK~PLt&2T%KKxEX+L?%%sEC733D8KkiITR-AMKRW()b2>!13D$SLnb
z^-6>*PR$#*R-Fyeq+Nt8b_*QMFrRE^MPVA_4GKcfA&<Krgidszf)Im&S>n9P+Br=V
z*tMTmYieF>z2Vts6lz7wToA^`x11wO0KjD<0Jwke-m&uV2cx8A?St*sUBNO?2{tHH
z76D#f6Pm6D%#XN`I!pXk$KM`)FWw;xdmNu`7j2&}+Qw)BiU0P`VY(YtKv3vi_g=ra
zQ9=p#9~V51r=+L&<;!{hkA~R+!7l5_`HXG+<G=sUFyrO~hRcD<vo+2wSOPd%lza2$
z@2`^3QgoNaIh);E{NN84V13|O@h#oPzC%5N$A{PJ#4L}9Kx`uJr@MxQ8;C`9$|{X6
z^RBeg8IGYAim4F_U$}|CE!~jU|3yFw{rcszP<Tx?6ku~i;d)0$JEq$*1qZ;sWk;2O
zDejUea{BH2?XeU>{yod4V1=##eh9Raai{u_K?}`P*4z<7J@7?B0A3C9(3GM9%rbr)
z5Vhv*9W3+QkaPer;JVDt4><PJqqPCr;1zt%YANNlpcRd4iasuJf^%8ko~dE3TPJc5
z$qzeV5XuzUz`@Z!H{9FZj{9Gat%G!Ni`PLDSO0CJ-74uah@<23_Vq8<Fgs#lhOZK(
zl<+Gux5jXR9^c;HjBtisMOtyc&?={uoNyJNI+uiZQ0{u(0MnZe{TvM_!Cf^Sr!CDB
zEzlGsW`v~o9J^6t@Ze|H4Ql1SS5}6ZgdQgh(Ahkx!d6XbZZ3TO2sk>F1K2Eu%0j3I
zjEns1_kl0%Db&6|7{I-f`?aH)16Io~^d7FiRd*YU9?d6eafGBO6;Gb*S5Cvf%}{x~
z`04SDar>3I3(@(6)<z9o$z9nfAc0IU-KL^?MoTIB4xZLw^huKttxZ28rdl3FQWpS;
zWJE_thak>-ubiadZgFL;I79WXHw%Rj2i^R>V;omA%qAibrFcqZJ;!WVbuGuEhh*;$
zm)4^G^?&aCcN(W!L3GPqDPm#|{R0<>wI-dlh6xFuD96c>&get>c01(AkeGBPqS^gj
zH8F@+-y}+I`82YQT>r_79&Vy~KF`n@o0rS9J)V<aAyo(~a;#w<y>Se0b!ym36M%MC
z*Vu?aGI6eMS1soV5D0cw=Nc2RzgLLYNen(AGfP<L0M?o&P;g$X4oB_<*bu_+p(Ygk
zuCTLqH#(CT)SRctMGAl?18AEmPJzo1>2w4^2Tbb8*m*V)tXV0JvJTQP*fLBJ*^P*G
zx;6}B6D|@93Z4UK8sJlEC-l^~=m&af#}lO_J!mS8O2Gju*S~Bl<}vG>0FB6JC>XEf
zg`T9z%U^lG0}w$or7WZX!+-cnI*;{TDz+KMJ1c5vTqdRv!NSJ>x=Jt#BZMdh2_{Ci
zQ~UOPY}dj;MAnmNff)SEs#OdF>8-byKuRzO3v)(^%>y?E9I#g^IZ;atBc?lKU&80o
zv?xLe;6}3Q%(7*Yf(tZ9_nkWlFG;9H<9vY7GOU*!KL@e}hh!$`!7a0fE1`i>y%qI1
z(Aq;qtATsOU^+PTpH|D<Iz|f!i5=k9U|6Ya3@{~w=OKD*zpYR|j~isxXOQW;&z})-
zo9!{Fy`0=kfRZCqQy2bt@e;napp$R_d5Gm1nlf&K{_fZjDOkn&IVB)dSUWAP`YdJj
z)6-k&R}?8(PV0tF=Vw60>g6fNMD5U)0oY;~2{{7PmQWVU;%zW^4h1}xD;I>H)Qa2$
zhz9slcQ?kK1UIb^vC9Pwv)96{{E!DzgLaLudA<UJPk(WMd26>OG5=3iC-5LJ;ww7T
z^n}wY+0(!~-!gs`14Ng_Aw!NKk?b||B^^KmAnM?L7{0!UmLmil=W#MAw@^3M-Hp!`
z9blfGluu}ihJ(yeU<}JLD<p2ARps$lB1#%$I>hf3PTG`Q2cBre{Lty=1@CsM9n>b;
zK`xnuG;Y+0I*Ty5o;w;wzO^?&fH45D>L<q!y9}g8RC}}f%MD7B%H6tAMu56N#Buf+
zaP}LtG4L%S!n4cqat0^g241**d#=r64m_$bD><+np-j0Ue3{?(px%6Ks`+tcYM6ud
zRxAplH<akb=7l$Iuz7BBUBev5EWYE8`5P!cxF6hHq!yVcEZSuFtbp~sVe+BtT+`+%
zx$#9p4>B-6M%jDYO7<zD0R<p}r0R1fBW70C0}%`j4El(Oq?y={%)JfvBhT@9b|W_<
zU?A=zFUs?4nR-kFfN(-wabGA7BS(%LI<#EiF5L4C_nJ$GIo4B?U(@IGikVK1<XZoK
zfy$`u4L@U%_>3LOR0R(8*2_6lZt|V5ofe_x)RxIBAK$t4{~^&8OJ(1)!BQn0yl|t5
zWWYG8+;uyFt~V5>TH@dE%?=wjJU&eA#|$DEPLhO<V*p1p@IPb_S>=C?T#J7i<my!h
zlh#LZwgvt!Z13jpwdqlZF|f6yyzBzK$w`Ns%j6Ag0K*wFLCz7K7G$Y@k3glxeUeyc
zAGd~!(Ag-vn1jO=4pgmQkL!RxJbk#$wVRAL;Yt$tv~AHMDR>kGhyU`3x}_yKjqT&>
z>JHw#bm{Tb$vzWWtlN9#U|LG%<-tka<#+V<S~q<Eqh_W{_s>c)v`Q!#d45?JlZ3@9
z60F-8j5@lvL*U)@ziKybxml81QM{)4*8^XoZu-aNgjE(f$L8A3jdnH<8`%3D(NdEG
zud=e}i_T6@7x}M`kI!BPUw933_|qZ95Qs;Ub5$j;wea)<Z&+;D@SP$tq-6w}n22r`
zv#;?+O+ovE=)f3_*R-$N+uLtFOLanU#+hA$&uZP;I=qoo)2qhfUsnxs=Ql`IRaIGe
z1+E+w)70IFzk4c9K$3YNgMReR%1E_0aXm+`e8#C_HzKhu;IcROSIER3ARQ5WCycj9
zb2y4IyPn&u2Qr87B{+nH-vbzlF!TGfKO`sNQDzfsKpI}NMx#2rkxtj6US1B^w4)Il
zfq`&Y=o*S9(Z-FpA1zmw%v+8hKc09{413(V7LbbiB~vc&4v&(O^bf6)+%j5b|7r9^
zH9PIMOQC96_{GscESM?B@A-<M>UO^%)dItbQMF)E!v_yWL}j(J^G`wrG&{|6wl`Al
z!|XN!H>AobBjDE0WjUJ>pY#8?(BB|v41po1(N}sCIiZpY+`q4!?sywt7#hUgC`1hM
z0E47+PUucyxRQ`M=peM+uTNlbN2gAm*jyzgC9treNKQjTzj9?TgMk=H6COTf@Zcc&
z+o=S=@27o%uVaWNLTKnTL&LoGl<iAVh!X%1fdijcgQqpmPnS{d!%vah%~A1&Cj=uC
ztOt^kX5a)F$$W0ZGc?W9%PRsOE5gKXUFExVLv(5x)oX%~xx>3jIyV<%&bkf>NKl&Z
ztzYpvnJ<d1N8zg&{3@_>r&~oTi~+zr>h1=}0qyz)o*>j%p;b`dJmWA_x>dC6%fCcA
z)+aUx9egncbk~j@=sO$q;T<Xc5#L=Pz70nSy5C!dM8&lHg0K!+UD$Qn#bVy?+_@7w
z9zs_*1s*cB)~ySVOF6Dg%ixrPmr>J*ftG1*?mx6=XYmqRRKNxMp{-&elL~M}=0CK=
zREXcNun^Q`a7>IoHmq&6wq?tGJSu>CBphL}Mau7R!@>!IO6IqVoG-L-=`lLXn}IWN
zT4rhVlq`7!Sl>crh@u@7KY0%&iVk3D>@P_nL5VeOX{lXhq_Ac&f0}cVm;VWv`3k@k
zIC;5KWjKzFfJk&1Q1_|-^xlI9uO(CFta?pmA>S4ije+pEd8p)h?D%of;|Nwk*e&u5
zqJAOMK?bXMk06iy;zL0}CwX~#NiR4UK?7TU+TqVrV>Y_pd-$-rs!A}`0rPC)A|oPB
zFo~VZ#tr;6N1EBjT8uCAgkY5z8buNXg>dh|gQteu%4^F@9fDXNB;mIpsYADYo~XYu
z>_oIck}u$tp>MbiInZ#&dy;>Zz+236G`q4yFQ{Y#WKKb|Yxb9<tT13e5U~)6<CBz>
z4!R>pkKPG3asNJG#|$J=Pqxu9J#P|HT~Wl2g8Kz?1X@xb9rEBnk7^jsO8xuuGt$fr
z4Gl{87tSXA2!u4i<<pR=le<HaiH1g_+)%-skdcv+=nuKabmh*3W$sLYr<0B%Q#TT>
zO;M8n9^$L--$hphTiUu+D|b0`dh9^$Q7`j4&{R@B`|(fDFWG$NdT<{+M&bAD_=*>1
zWd4Gpr=#OWX;XaG-sWxF+Obzm8mT9nlNykNhtOb~8ZE_Mf*H`Idw0Z#YJnMBC;~r-
zeqA)g^a>Y9ZsEHdETxwom><D%NnE8lJq9Kr9d(ge5#u1yb0L8Zo_S`Q_(XlthYFra
z$x=>q>j2fE{T7#cMv84tp%tccA=gD#5s!ckgjapqL0QuAZD_-id<bU{u!-js<G77-
zZMlB*Q&VRY_%`qCpd-26!8nuYlhwKlz1ZBFTW%71iO(4Y-x;}_O8}TH6lr+{=~@2h
zc%b;4%q15ZoJYiEBj(#8*v+OfnNZ#7X=bL=9rxyhZ0F9MYr#$Q>H(|RzT0a&Iih?a
zt9nXyeJ4z~%Ms-?&^!e(kFXspNm`|HvL!R!p8n@vq#c}Q9D7rg<FGnq76h_1@3f>&
zH(^3;KojXlFZ>hTR>+4M2mcOhl~2mv@-zJTW(O>{mWoO<{1+haz=(EXK9l}x94Hd*
z->=g(Or>t!wk^V4u>Fsi+0msy>*gnpbk)zFsnEPUnFM^W%V0#VS}0mQ@t;<t>NeK`
z7C)lt9&-GtfCNd!_4_wsdQk(*tRsW_<h;_^Nlhc*Ha?cFHbBN#$;k%X3_slHIjHnm
zWO?f9Gi1MJE<d#i`@tK{G^cHB+N<?rP}1X65k<@y-A>YRYVhuFyon5Ek>rAJpnFIP
zqS9Kh`+N5ms?D4*!m&*7{%|GU`^!ck(=2j6ujzlCcCDgG2iycw6&NA(5LDp3k>#G*
zrJ>i=<BAf7v;SH|&jc`2x5Hclg<Jva8?r<ASLUR@;4QH_?sCuy=Uuh(*ea9VMlv4|
zIX@0@1A-03dmt!qb@*7`{^miXJAc341kznWwGi0y0YMM&in|<zDh@0Hiub71(lrvu
z@#JPw{HDuvzU&zjF<xPXon4qiZz=y!XlSu$J{96|cpgY*bHxfxZMZ`HfFh1F)r|%y
z=)FKO3ho*j8uXTE<J@V6peajS0Ugs1MMZwz-u>Kve7^bwAE6caUQ)hE)kur+CyMvD
z6$HIO4&52|-N0zvG7$3waTRD{lE!Oou9+vhc*&9>jC&#$L52Uy`0Y)Fg^X?5yH6j&
z)E#n!^{r%OXO3*`W^YIIK^WXg7j)Q>LY)3X8A*9(Lqicx=Hcw*g!-kzph2HS;wFoS
z<2=(6w4RKcH!~isAib$Loo+*Rs+dli9FF|z@V3%1KR+=5C;0p{zjNs}-j5nfGg~y+
zTV+vq5bdU^0g2S#7{yvogB6~Vuf(SF{l&uED$0XM!?<uSxqt9gApYW8D!P9J(<Ov*
zmm|*MV9XiaM$+lpVBt@9z%M&+OEEkm6pv^&51a(9oD+YB1kK!F<Ee#ign3U0lLJMQ
z9|Js+cFIV5^aGCrl^Q3{m@T=LJ(yXD9Q1SqSO8`}o;qt1!UX94>3nF{u3gI%z4a}v
ztY82H{=HepOmNP0?@%^@G6G~~y<%QzmG+1cV*0rek|vg&J0ES-o;cGHwq(#HzBE~-
zLD_X?+UFAx5X7b4h^r^x<uj;_#=7Me7H_acdE?n!N>;1D5z!wOrY!aa3=oB1;~(9>
zAIRlkMcnF22qW?ELMMz7G;8QIqDNZgq^wjLEWBD$LQ2YKW(3!cB2@JC^))K~@S$_J
zZe|+~5C-13QB9&g2f|J7&P1<YFp<OUa%yOWw!ZiH@oKnP6kH<%0|UpZYH2NeOoJQA
z`%H_IP;lwPomv4&L7YzQvC`@8uRz*KiI|Clvjfn5Dx!712Cq{4{JcE6pf<x;B+xqC
zjO6Rb{mx=wN*6{J9BVC=Hf4TauYe^0KS@e5Zg-f308vuieO|n4bj?EtNvCQ&0kU$+
zg9qn;-Sv7hH*nxsp+6eL<Iz*PWd3|HZ%9zvsECj=cRognm`{#@vh57nSwJKh`#Pds
zpa2FQ669nMm@&Pih4w@w4skP-Yx^B!Y9i6uxZEa<q$EE`b^;>v8xh9;&}zyK3lJ6e
zBwm4oG&R=|Nx~(9lyh$Ek5hFu%W*su&Wy3vVz;{DxcEvt<k&v40u#<^2ZlZjL%jv|
z5ky|0y$%ynY?i**tQIRN=5kUDMw*72zy?WPWMyedZ`u}u4;s6;u9ZaAOd-rWOH@mB
zG~Thqf6tyo0%!_^?s9~)q&GzI@l3T~$TR?a%drzN(g<Dxorh&@a$!%oK?b}0tMz51
z{6}1Ez_n4}E-V_PNq)_E@xr8Vrg%iR&fbR)|1B>s&v+k_jJB9~t0b=h*!LDqdA!Bs
zZ|keS+bT|EQwc*ZV5O83P*a7oBpNGeIi;;XgZ}-%_9PAi>OG(TDPP}AU{(&PlKT_`
z11c%eU!IA<W{@0ocMAruO<YIaF7op9K3juc)U&gHahICB_zV}Fd=kKjg3;LPtFuQd
zPQ-;QDoCeg!;si{^ypU^8Bs)-m<yZ^O=ySy-K{6@Sym|CP-Faut@L^BywbwrDMpUd
z!Ucbdr&V4k%!RR-zn9rpnt6iYe~RAQO<|H`H<r-*P2>keLp#P~y=$QeuXmuZ=3UV0
z*g6~bQJ;=RW}#{bsSy_8RIBmGsZ-3&b2vO?TAaN(uQFL}8e1P@`q8MM;K(f77`Qa(
zql>tJmwsOqopN(;!j9q89mz4aUbbu~nstQe#V@bCkE_g?Elh4}<n!7A0EPO6Po=b4
z*50eetBItnjdyU%@TZH;cuKGMK9JxK9bXGuaVFKFM(1IxrM`Z>Kvw7_-)Y&Vi-u0U
z1W;iz4Mu%vQ|0bM#0c!!lknZr(o%2IBr*1eWP&&tVa$XlPv(w>^@zB~3eL-C&JtVS
zN!|R!$&;$?moHx~t*opAR6<6Rk322Rcef%CE?rqr@+!N<(##i(|4gRpE`%P=J9Lt6
zg-qf?$9@ku8oNUdA+$2VbPsIZWS?u5S*S@ysM%audR5d<sa5A4nL#!xv`Z><r&hnG
zgi@D(ubJev2nNL>+&;iMRTJj%5gM3;%=!H_-)zAPFqe!>M+lISSIEwSlJVPt4O3Q5
zc=l|T@B$-%7lR{83<-X{9ygMHLaLo2i-qx^IvIFX;?PbYT+?wn%JH`~GMmStA_F)T
za|inzpj(-~i$SqL7cd=%mV=PyWB)jX<luz!F}p+`Aa@j-L@`B3G;{Gt(V27>$3)TQ
zYS5vUBUTzp^8D}EEy69rZPn7N^(}p+Nth!Mdp2#Fq&~KVq6%%BSb8SE%ri3^h}E3A
zxdw}7bbDM82?<^X(<7@0xS&+Lo%7sZ#0xu4LOkHy>-7ZOJwR|>o5pkoDA0XG+9Cu5
z9#Z#E?g)sW=Rc1ixRK`i*2wwrwJ_2ff0QnsG-)Rs(;YkRr>QaUp|dyrHwZ3b5yj-U
z8#i2BTo5mq{o7#7G+$<ACE7;80)e2*EGV_W0>I{3lD$|AXC>FcDh#?D6*YHwbLnG$
z?P-ZK$WrXL5q!)%=HW4orQbK!c;kBx!9Y7N=G-AFQPm69C+1tl`%{+P%}r!4dA^{g
zYOCArA#*ndrMgi1Owb&t4)eV^`ntQJZ6B@Kn-t2b59lEybx^XK{Pi8qQv(N$CPYJH
zcP*k*y|_z<H2{v_`J#fbdH!lLF1U@b9MA~vh^(FRDTciV-T@`TJe)pNGn9su#+FAo
zBZDyyI*T#qh($Oy?+<^gQMdf#zP<>C($g3NAFdvMC>x-s#u%Xf9Xakh4j%XOV>lJj
zfZC8D3<wCP+|kc)p8tBF_CnkNyriKddc1JX06%G<2|_v2E*E`zaH+Kb8~8CU>8ZTR
zZz0CPn0nSEhgPOcK&&#H(`*&<qZy5984kw)HQG+Q7{Hp>O&aW#YZljQ-H*tX(cg!~
z_;SAM6ae<#i*q&tBYEvb<NyC2?9H$=(SwERVl-=si6mHE4<VUqXrnafJORBidkO0)
z(Dd$jKhA2f#Vt3$wC0Mmz2$k>Ghu4t=FPR-JJ>lUWJ-<fM%Ej<v8OncqO!sXiLra$
zOT*$8!3WI_7gi0Y;Qh-IDNpR1j&_xG@O6(X7-1D*gx4dfygs)ErbKhv6={XU1!0MT
zdBU<YctL~vT)4dpRG3S6E2R+xv==yfOe}NzjGEUy@I(A6l}LRtQOhW#0SYf!+t>&}
zRN?tPKHKiNT`aCn5Y0Zm$il*O7;AJ!w+a6m^#CT`t8{5a<d{LC4S}YgnER_%I?HDW
z$%fOnXIORyL%s37f44|<>k!d;U%9e&#flZANB&E9ATJh#Fzzv`gVsAq0qgd0<~MpE
zUB3i67)wE)URP2X-X?DX(aMp%cX|!z9gQBD+&}bL(84vqe%qBRU%3pkULDF^hFh33
zx{;*(nGkkB=od2pPAo8k^<eXD1%3z&R}v57wT`jI^oCIWC}9lyfVL3qoS5VVjSbZY
z5vE9PLY#(tnUF$vH}&Rofq`9_XU|kCsl!(BCF78@Sw<m}AfK}#Mk6v-zOM(<Y5`oR
z$BBuG3>3Y!s|>VsN=oIZJAb$U3!?>3M`5TW-KU|JNdRaLGN*Rt==xDXv5LfT0M1t^
zy9*xIb~dXgayyLwAyVB2m?xb!2uV+J>HFcshvZ>&Pp+)@aye8Sfvo&}eMb>WL5-fd
zI)d?$qGw&qi0wY|>6N9Evu9spsA$J0l~el#GBhF|w9JUQZOCC)e=%JO8#cgQW7sfT
zI%sEq_)s6`Pgzg7(K@e@+mK`mSF9xMV<5cOQccB5zIk+rIt?Ar#D$C+P27$Uln@_B
zWgD_`{kNStj}~&6o)ngG-Vta7Axj~GAGd!*co(LHJKVCRjx+><N&$6~9z$1n4jo6n
zMv9aF;R9&Iu+gLEf3amIC%91u-IuRkk%kTMG20CWOlE3OA<py3lc$`aE3ZIBRPIh<
zB0U&ygT7(b$(H)2LpkftXvl9nn@F)8AOUhAnAKt@V8q{#;X$dw8v+h>U#9g<?W5uy
zjPc<-kYdjQw3VcC0vnFVS+D8bRsTCWq(W{+8t_Wd6I8s1lVieBz-@|}gpQ`NUwMu=
zv^PY*K2{j{Z>}{yw6)?rLOS6^H{M5Yj($HBV`$m{tuidCN4vfL;diLuaeGzGW9Qk#
z4I4h3Ou3Zxq3%8Y_YX<8_AM>p5Vq&GyE1MGW(Ex$AS4w?+&sXOF)~&R8WRPVZo>`z
z?N+ZAENObrc9apt4}g!r!ohQ6o|f;y5u&ltEtNq~SHWw+Zz+7u?-}vCC=W@3j*9x7
z<fn2pNGsijv})a&sdNhN$dj*~S}+3t0iNzG?>&xj(`*WMj$e7)u3fswDk4UOYjkyW
z6^$_9YOoX_Cy6@_iLi;eEimulGO@JRcWI0makRke#lQ;gYU(y!+1azx4xcDP$=~2S
z_sVNoyz420%`K$U&wY;{$2Q$fOZz6|U*EQ800;LXk6sW_bOOIO|Cusy&(*8n=p04*
zk$Qu0SCYQq5zzJLOzr>-%t&T#@jV7#Bqt|7Ev<_Z5fT&R&<aojMCF+{=^HRrOrW&0
zwl>{6mG)Ed7UY@4Cm^Lb87wUN(3go8As9UQ*=;xE2+}?>FQ)&{=8HA`L@gWxL2@-_
z^k|=DJNW1+PH=h;pE$8<$r2+{W+oa$kpz=akrq91-imXdykdo@`19p#ZEfq&v!DiV
zL8g+LySRdB)Y<q|5I%Cz^~48oZ_to=#$1cvxB#(!((38l%~&F5ys%I|0M=j}C73oo
z3ncU7>=L7(1+VD)BF{Jq{|E8cep*`DECFvrEQ1gE#N=OE8m3-a!c$`~_c4!^f)1l<
z_*3jL5Aqu2Pd>x@<0Nw0cM%(HRq1K|Dbz_86f#>#avQFpF|#sP9*Q+dIZ@#prtG9X
zn>h%yu&{bPx@qDza38F|TWS1dkZbC%5A%pLsN$ns8sadT`<6SfdgVsIihV`rj=?AU
zk^-vO`}|4b8^`%bYPix~5`6ukchtc`(u}PWh<FCpDDxi4NlEhPFdpg(wB+yQMF$0P
zP9nX}>khjESj8u4TH1=C_zhZomaL6>{Ne?zgx5>==xrXd+}QXz%fg7ZyS<MB<j~5!
zr*<q3LFE5CcId5jf@~g6&EZb}pH)>I{bNA|kpKnH?i6i|tPpm5pFtTh%B@>E^xVHY
zEUQSs<_JNr_Y8HlgSE*Sb{xYpqu-VG`;k$j$BgNPv+TF<cpkw)j%eNrzTS~aBSUL@
zb?X+g{1EpU#9n{Kes-~6|Nh#QJzUy2lt?<!6<&^cVij*)wP6;(%$ZNg(D^!mFQFgw
z=GFhrw>=&n6=h|?MBZFS;<g?C0(`IO<#(9k*mx`(*t84T5zkHiLr8dlFjLJ*=<yE;
zj)NF(Wyqm`;|ahg?iqP9W_mC()|hm~iC8(9MffvwjY%6eTmwkK2NFrIu&~eo8>Q-u
zhEl-!^9bpzqE$-8TSZm%5$(iqa{D=r^qBMwA!a!A8$seoo&_J7!40(LmN)+g9Y}dT
z6g+$17%i+9J!1TJBe^WOFW(Ztju?#IIl3QnFt{xgF*NTB3#*U}^C^{QH-3t$9vZyR
z(i!(e%GYD?5_bpAjSV*J{>keU>|hTv#e%U?#5Qox__E0I^re}PlTNqE-?|Hs41kS*
zXHZ>y%*cUf;G<r>e2M0NZp?av7D5s}sMiSE<GITOFayh88%0MTAwvh(d`2=L{R$6Z
z@L(Ykm6@4IhQm15OWxjdR<Hg-?!R~C{Z6`~%1d;tg<`Xu5LJiP0ia<{EgFFyY`P2N
z62*Jir5B|9+||yp$V-krnOb~v<K|cwY@B471P&|4J7c8=^!V$ETbwA8xn&p-&cJ@9
z^yE<YV(H?=)W7Hu&<ji>Ahj|7y67%BOP@LmJYG<3Vyb}+kcM8*O<&{e*3-gf{fabW
zA(rY+Sp26iN@JK|NWFmIxx=ych{Zk0L_VN4#6_j5qaI*07UoWSP@evFtAA3w>>R!O
z%R*sGNM^RGy3@o2JjkBpSqs$Len3?lAg^Ld=%wxg>oD(2r7uAbW>sHwF_%vVt7&29
zucGa#AE>gr^J1s7nT@*jPo9gMqPn#%xM42@*7ABcDf4=l6NPhUpEtjab7}uKQ<Ay|
zj3T0=$7gfbqt~3iSvd(vvgM5Hu2ta?QI{}chcfIzAlI#1XMKp9E_B~-xo@faC7MA~
z-61Q*hd<eN+NGJ4r24(SJT-GPNX1QR=ft;x^^x(dZpwriC?*gdJ$h6OD3kie%r0&i
zbxO7ebDSQwXc54_6dV6KJ6o`-)5X+Be_tAD=H1*JCno^Du-=(<F{rRX*n2y75$R#y
z3?ZDJ5q2sfD?|-bX}xZ?qWf!^Dp#`iGI~`Egzx~}7$zGZ)7OmI34jT{1C%l2W&sEb
zEHq_X|KQ|%_m*Kb?V|$WX5$myuEVIRrgLxA?4LXr{pHwsBQ5xA7cUO_<wVs=?(e^Q
z*HtQrq`;V_2uPIEp0vP$JpUE{(fk>{j=H_O91H4Gk~fe+cCnP@K*1Zm=dMzLJMxLI
zKmqo{{m|0hM}ZoL2YqB;=|_CqoNm*qk}Y*+uO~3Fp>5lPu*&O)yozII`{|-cABbSQ
zKLPLWa(C|#B@dn`a^QboZs7yrj4&yiT=vP65@6O;3q0RZRWsVGn7N`*nZ_yqfJ$#~
zyFxmuOtVi;ZizH^KJUj(_yxl~F4#f0z9hf^t2^(x(y6w~V3^K(I|}avICu0Dxm>m0
z5}{wY1IzN-V?NRVX?ewVqRzHu8vI`bn$Gt`?cVwAi^Zc30y9z~GRf-=98q?L-p?SX
z`E4;zXw+OU-AIQM@Wh~WjOX*Kx=;r8j#;*JX&R0@2tDWXwS5C0(|&ZlSX1PMQTFst
z7P57E(_Ic32u(R-Ol4=pm42li#vpLIrdGfJ$Scv4;byX!hdu$4kXXO##5~pe4XU*>
zJHex*rWHcDnX-VsfkA!OHVF-K$(2A*RA#9I>M!TtwH|DrH>L6Ry28`StE&MR#86QE
zBl%xa=boi6Vn@^<Zy`;zgKiumfJ5u>E(1E^^qs!6V*9jVs~U3_%%4<mfpnMik6z25
zaiH9MuZlrgXD7F<dfZtUz35uh!W`N%fM}7Rmww`Ai>}P5DYPx+jb@(xj4q1q{_!@^
zq2KV3decb>pV~w^|2(`yj?ms`Z|BeMo7?cv&IgjBMr&)|TywB&-=gEMm3p>or&zbk
zSTyxf@1(f&b^^2|`)r0HXbsL&dP91tb+VkBH?jdwAW6<+l9)V37)Q&h0|^UNL0wr!
z|56&GOfF;@MbtmK4+*wB*F4(Vj+2ew*zw_WE<PkbnZ*N=+7wwhkxYHxm}S=113Gg4
zi5m4D!!6lnEL?}<PJ;j0m+}i<z56(w8K0?|S25?#2l!CqOZc<kbenv2s!;hcxD@A3
zSGXe%4qoE)lXw;Ser9y!Yei065P;Je|BmHHa<%Yp!7ii1bQ0|<h%)?_Zu)gpsj?P0
z9BJt92qNkOW4uiQ@TQz(1R{R1PFp)WnTGc@&3iTCZs`0+sL}Byl-y3|Gviyb9zCK}
zV3SeCwz#-oWHLl_1fn@iwhq*!8}5NTR9$04eQIbJ+|hrE%RBJKMNh7UsS{C5TMHej
zV)lnF-MSg<m~@tN5!3B>(v4f4COdAcoo1dN|FSm<gQlz1nd``*e(^2esVFom;2i-D
zHtMP7RSfO@9)wCqIzPLLdh92x@KcTyFa?g4>66|EaLWd1L=^!eOyh=-@;_TwF1&gX
zP+RX0u?c~#v7@WkY{80B95cg=V74huGqPr=w)UbK*GT?A;PfK_b?992Pb{mPFT1uZ
zZ>p9iVh7_Jl*yDo(~1Z$SxB^SX9w9eE_nB@j0+(M(?wx7U)XXaB=rfLTA_oK&RJ{n
zN``LM$fXb4oJk9)R!O|EH~!6u-cVlV%!%cUO%<b1@@B&_Dh~@9GrscPoxDv>`%uBt
zixzV(i%1$0BkAS!Hvo8yS$K@#CH>nPic<G`9FFRww)zQl@-cQfV<~z;4TYgXmO2o>
z@igsgjjK!UHNM96<mYv{Znb6$UvKg`8~-LSDE$+}r6<P*Pl&$@<pN$TCcuVsO2rR1
zvA5`F`Y&_Z4@~PSV~B#vmi@|I30^1Hpd6XR<s*7o2Yj%0ttsQa;T_jkgSi%acJGEJ
zCK~i&lQGa6gIcv}CA^QI^I|b$CJTE^m4*5)+n{o2x)ZfQ`(Mv<XE^l7o)!59ZRwTP
z$e_^bY3QjvwW}?h)Zc#4pkoqxhW^cGq}VHP=wt$fNAr6?*M1UL+j5A;(~LgGJfBxm
zAn(SFE#lK4FyPwK;?lvq+qP`ElG-UJx@BFnZ-?VExbq4P?!0*<EH5B=3?g9SFyuvF
z^-KX4K{Evigk9iK=L8w+Km1EN?b?-|gIJf397F|i6-Aq@?imleWZCSvS@6foXS_IB
z`rO0bAl@r5(DINI<I~Tm4n_^HbK>k1_{(A(vyU)wCurEp%DO>vRCXZRa>3e4Q?KuV
zzf~&*9T|hdS^Y%KVs*DKggvREa`$NNx$3ypgz$+sGhlpfK0w^y)o^dZrbD+Stfo_w
zWfzst)-T}W677O5W2RQZnGSDG={kyP8u3P;v*?HjGxz=k<c`;&HRl1G<Y))=WS+dD
zT%9wdf1IjqzbY>h^N)*WJ60QkUu$WedX*4z!;6CGf}#SaFLARBo<Z!+8_hK3{9)Pj
z8C<+>XF`<k-@YRE)4MNMH(DRHBBd%Wj>FmVpQ`HW<QobC(jjn6KWX|xY|4}d<@${s
zAu5bxbwN7FR@7Bhr^&BMJNF3g3w>c@nR&u^OUw2!6r3D!Og9_~je>l>-|oTS4uG&F
ziC%E*XGg~~Ik`45#^u0pT8W;dP@>S9eB|(93`*du7cZ{y-g*TzEj&H-p(FC{$BY3?
zVuAgVb`CgPYo=OxyrrW2h}9QeK3Xn14y}*G2@jlq2tM-1=@*dEi2YSe?X&FLHv=s|
z!6yRw`xA~F{YVr~&mWX1>x@g;MC0{!dz=7e%>(FR@7c4~(J|wfh|f=-Cb&toJ;{b6
z%MwGHKo`G$ASy0i;hA0)x104!sGxcxj@Hwl+5NRNX_*N7umTIdKtv?>^PinG=}Ut2
z!psgq9sb$JQ&p~l23a!3%;NpaMjbwP*Wy<CpN*-!jFGipIREH(uuVoK!uo!vbR9D1
z=a;jB!(dywOrhIzWybX2z`A}FV?E`TKrw@v5@<vMtXpS@Dfp{_DNw&ptp!37-u(-M
zJP{;s%~`P|Z^a0<Xxnznhm($8(<o@SIC5iET52kDH`Q%jg(xuKf%0*K#q8|S>cgUE
z{P1C;*C}v$xE4miRDCFYZ_-L8%QSoPjQA!|Xj$z`zKSG})4tcev0>`W7nOZ>enu~?
zG=Dz;TX+V>5c+Am>@Y%zV5;}gnJPwxJ$c3t8xW#=FD><aXi%9-_}NQqGF<`vJ7P+k
zw1GC1RKfm~Ym3ZC#a&~_5c_rOTx|LREOcw|uz`by4}Sp?l$dDE4Yaq@$8w^ui)vPd
zo0|koDNdu?JEq>xH#0L>kNgN^4R<-LqsdTXUkwIg1u<w_fXaLQhNGrKxh9<~_36z5
zT-e!v{@FX$0YaQ$p#?KpXV&$#CXc@%7f+k}w{P@ctGR0k8hT~MsSnY^>~a>U2({?f
zZNf-b!C73V%J{2{9UFVyzmS{E;3CuD?CfkR2<KcPI;h+79i0z6c=*uZJ_Ewc-grU?
zdcCTLyu7&n?>aFo>LFOt4mpnICF7vf*?nZB($@_xqjC>|ATmQ6FcWHnm~RBJsOJtJ
z4o<2KgNCyn7aI%i=Y4=WT=`(A9N)kDd?HD~s)K69#Kfrh1rJ&SV=GF5X<v)UG~bS*
zTsH68DqmwJv0VXU`I!OjJe438Lf#yUu}o@(X*F=5!B2a*msEh9%fwV7=)-1jE8sv)
z##-0>SgUxC1RsboNc+h;-tgE0$k4-8RYPz6<uQrnJtia|0;Cz<%<Rt32gIChL5e*q
zr-boyR@B^@D0#gLL@7n*m0`?fv?56W4JsHq)uKBVAE4-JL<F<O0|P6HvqnG*D(y{T
zDvtu0+?~gd)ig9pgPd@4?HYs$u@{Ji$eYrcIm<L((Ud&&2RCz??~s1u#%(4iAp?yU
zMp!4&qo>yVK%>M(KLvH(rpY(29^i(xB94;#O;+exKapgWm6g?`Ne>8$K!inGvxgm>
z?;Muu=S^U1Va)^p$Z%Tb(|yRxqoTlE<7jeAN^zbAq$`w6r)}|vc!&;%1GNsauo=^)
zJxWd%WLBJIF1$>z?UstL#>r*o%&$Ci8G-VI&<B7J$mte}f5*o24iOO%kkRp97Z*eu
z-5#+7^=?Pfbeo)5L85^e2E!4)anHa1PQ}TS^C-Fp1r_pFWZNxH%!@h7c=ls5jhjNu
z7y;)RK9;8DH+B$guL>eNojr1QewPt;%(w^`McFZMQ;-l&=U@QA1Ipn@w2_SA@Bx;I
zbe@8AbaWMW9s~NbcT`Ks?R?t1$bP@JDc7@MeuMb2K48oNTTH-Irq@G{w~B<?8=Ykk
zztetI8*sKobmHwDC@@8H1IxEzZ|!fK0YSpZmCx|0Oj13J=#fbX@<YdKYdu&*`cT=h
zaqH3W$l__=6(H|B@wg_izm~!OkFhrot8s1P{+Br!c7_ZYGp5K?h9b#WZAt@5!#1lB
z$u47|wuDR#TQng}$dp8bDMJY@rCkzAs7O*$Qoql&V(;hu=l8z%@f^=SP;1@yeO=c%
ze9!OsJwYG8)|T&^d9s!hPl)HeNDMqgi0rXEb;U{{dkyF-CK2Bcrzl7XBqVSpmD|mg
zpdEr&h)ruXS71uP-!Cy%*DjB$N%ikfe{35$aNsoiR_cfG5TlpeAp@1~hmeN%{1{Hf
z(=WQ{zYeRdx&PonRE0d?A%$n0`iyg*-n{ABr;m01&XKNm7(=LBBq=b<GB@m(x~M`r
zd>qbr)(g}aH+S2F-KO$oQMskMFzwbCMTu^wtyenz@@+T9VgosnhCtAO*2PnSdO)%0
z)5Ypr-ds)HCv`s(?(j_Xy!eN%1syI=GL13=S3p_9g55%LMQlRxc(U?zVpfFlvPgT4
zjEwAdNjr-=%Iei0*p>k2LK=%r1cXBL0G#I2WAv@e%+FDqkTM)poJ*w!>08JQ*aI>e
zdYf=8Z$5tfku}3$1{{8B3ZuXv!N&SBBpv5X`Q^fuE9YP-6T)uWx)r(fij46u6L$_u
ztz|+qsWv)HHT1S|^e<o5pi>JXKWddOppYW)4*FIYFrRpzRA3@48+-_h2_jU3Cj*OT
z);o0@@jRGR>Vi7e+UESUsPo{z=*ZsV;{(~{D^?~WBLnmNOf=Ynxr6I{FzX<3)ifif
zFKO>OS4=9x40$NfK?z8DRVwT5Ox(^%`U=3)PMPX;4th^;AGu<8W9H~9-i*73b$PH2
zI1DUPSjdbn@6hTJ_I$;w*w>C%P($1FUCQ30W~!>x##MQeZ8P13)Pn!|HwJfR9yi0p
zaJo?W9_;#*_~j9tY)r{2fPDxFvMX`S|Cqe@M~)s9?0T30%%6C$3;h~`X3Aq6ocU2^
z@^=Z2xNfKk0?W@!H<JnnV}rc0I}xHZ$Qbcww7twc(AWCcEw?TT8X>XKp0vK1?xz1?
zO5bQ?NULaMMvRJYK=o)-A`41tTvJhj_cozT00t7MU6g=;MNK?~`g~L*xi^21#P-0e
z8_#D0Do>hJPr;3>LE5g4K?K%>$bOH03VHet6c8NbO=DwYdT1xDBK<5c*MaZK-c#w0
z*qYOwygW-)uyVgS5Mdq|nO1h`E(tvz`n{X(9&*ZZ#4Kq0#e#8^Mg1FoCH|JkW5Jtx
zDquKjTrv%Or=VXUsdjT{$kru`7teFeWuuq+fHbr1DGgBlsX_V<ElvNe@5$IWN8R*j
zZLuTHN}bV%Jx&w|IZH_Pk@8J$)J(BVX{amXZ4z@jx7j%5VMmC?jv(`_B79mj(;Z)j
zd>1QWd^h#(-M>6N&stm>f~)N-JS^2B`g+$9(TI&>TtFR6Kb6qHcg{`|4Q3K^|J{2C
zf}|Noo(7bpO5+=Q4~Lw7GgMuoI}z5Qdjxb~A+jvy5jQUqOf`h^v2YvPa7J)lWbo&-
zzp;(ck>{;kAt=381TewvsZ>rSyclaI9R$n{Qe+r1{3*cE{+Sy%fxI*h3&Xe0S6G0d
zi_RBM1zOo+=asFYjfiUAm&!_VCT-FKpcxdKl!dU59}NUI#@>JQ$cJjlzI{yG*b3YR
z)-EQoGKS3=X=;h&$vdJLTDuskAS5N)P)!#9j^sQxtl|^ttW6TJ_3Tu3?5_m}PlkLc
zNnFBdaP=mRbNiApUeAk~dEK{f8f)^h?%a8UrNx+_PlB;JSH28+ETTC9{>Wtleqr<g
zNC^_vEibD;gW6(R_4m48T!5N#iV0-d!|GK)x$CHOhHEvsOQ6s>bLZLs6^LP~eY8(a
z1H1q!%6R-(4B`OHYd8Gxv18&zD0{@kRg=vbexI8t=ICUIwhz4bMcrLvI1DGNs;aP$
zoJJ}2KiUsiX_!3wiTSm<i}zCBPndPo8%Xd3ULi*0IXZrVQ$>T5sWA7x8`u)@mo6F3
znX`ZIUQ?}h1{qC!k8o%CP+zF8Gv$!mu2EW}04GS1SM_8i2hF5R%)tZ%Ua@A)i2XvP
zjuMa+-$m_t<GbCvcN?A+%v1)U9cm3NF_YuMgR(Q9!1%i{tTSLde@?Td9<+h+xFQgs
z#6;1Pza@_GR3J4IR-fDEM})X3ab<}*<jl>*X^P6z0n-6J3_guZbOuo{`TR)xlghD{
zl<i@z<4!ykU`m1Ea6#SXC84ya;#9L)yb@PGXsYm~Xh(%H5eP%+0G&Bmj~_cie~|7*
zCseW=AMhTJjWwP<XAbC+si3mH=GoZ%-L{^mEzS_SIgK>MZ{Kpq^JVIw%hS6hRL_5l
zwk>n-UK|2rZL9n+BSVzzwF_t{WWbp69UKTv(u)qyVgfwVG_III%&_SDTl@CNi&29M
z)X=vtJ4DEe?5MoRUj+m1u+6gEgK*{*2_?mj4K?EsA(pxXoDaVyy$_N~v&0MP?06XP
zF{`A_=AtaYsJsY{115q8iX?L<4LEG+2&Iqw0%kB-cv)GQp&%YCpAOsQ)Do~lK}asV
zfBnD%BMXRCyGV;ug*+j~+CzaQrAudolh4}tRhZSP2P4H0ZLpFZM}-KsH`!XiDEGu(
z<z$I(rt<MoaW#nN;syim5u0v=45vID;W^8*>aVA%s8EhAYP4i9sm4FhxqY<g$G7=5
z9Tb>%idNmcx=Ji2x?Ct0!W?<RIS8-GR$NCv4iQQf^CMuV2;7#U=bIOQZe-7#;|^JL
z9=b2pPM}!KtcXwnR6;}h!@a;9z|2mrDsLuvwI7yVVQHyS-@e;9<QxNHho@-7YdKSI
z!6}KxB9Z}Y3gDf&5HH1T6cRmrZemV^guH}Naq1?$I}eXf6nQH-@CRx5URi?B4Cc}W
zGX{&A%J{W>ZWKlT-7+T@942ih@fBtFBi`()fMv<~s(A#Vw`NfjR9D3Ht1Nb>%WZZl
zj&b9?-5q*ef#1y$<9o2eLWq__4}KS=u!NKVuuScBU7Ap2BW{srhLEdqO*+y3t)YaE
zTyUE0<MO~6XLna`*S`Jl`uc~ipMcfEYXQ9o*ItRC6_$+v40g*|?d?$TM135dG%FxY
zz9pavEF^J{s4`{bg5h#!#9+Zihhh4%JE8h<Er6I#0h6hb+hxi)Y7I3*^Y{pS3IT~G
zY&pu$szJgw-8l9Zn@w0%3y%rB=*?6=gKV||$t)eJN!>oZX#--1^7~n;s5l7XPEz|~
zmv1d}dme(%0$D-X1C*Mj^YdvTan1e**L~sCI14g8mx4_ZgT55^u?I_&?+5tK6bC&o
zidPXH&FH4IjdBI4cD{#~z_B3<>*RFt@^9rRi|`Hf^CB=|dn;A(-KS6es#6HX!fz7x
z%_v!gYFV&i^A;^AVdoLE5f*%8^@yfFC4U!cF5!1A7$_N#wV8!|F8&o}4>2&16Lx?v
zLlR}h>*eIQUvYkb%jS7oT*+KWfYGyYr2IFa+8m$kmj|xo+l!_@syX2Oz<<!(E4OR}
zOc1nq2K$kd>OU{;=9<$%obpK_Y#Yu!!8g1a)3u^Wv8uWnd;T1i1pK&NQY%U5@UgIQ
zuB6Oi@#8x*cfTlx$w-G*39`+TgB=u_h33DG>Zf}F?!2c0zHxB9=4dp=RoUHU-y-o)
zcp^ey;&sCwx&_%{WM!+4aS)D~ql61;FE1}<Akk;1u!KV=_<OGly<<p8;1!(Gg65?P
zF~#`S^&l$wROE$*3l6LD6|9bpF5xf8r!ZcK>3{$F0%AbckKrB_U%!^a1SfR{&Hh+i
zY|gCM7k)fy!wZ*}ZIwwFC@BpM(pi(IAvCzmNvdhZ2{?3Uv7KE4n4;Z}h>LM?FGzOu
zSD-WD%0m&?a<RTINxeXf01?fVr&F?~tb_L<R(?Sm@!|#bjJs>QiFX_9M;1u5BizO6
z+!No&RkQaA5Wdycq7|mr1Ih47N64gvIFa0EDhk)GqY&Lj(r`d97gg!(2wUA*;ywUG
z#`rRkY)M?nVYk-KgyUwkrgob+RVg5%gwcXUSQ^2vk;8n=dlMT?axd<jjn516R6q^1
z2cb{flgZ8IhUm~H*7C)(Mamu|xReb#v~O5x`vp}yebKo^+CMzLKwcSKToA>G?V;MC
zf1sB)W#Kcjjwn~+M0TTw(j3UPr#eMhFGNq6B0oJ;{QM_Oh{542H_B5b2;4(aWrEIa
zcXxN-RYc#hv26JTa)*M0lL=Yzt`NS!S6uK#R5>$$Ocgu@$&72PBf!ID%oYolwhJSK
zhv+%cX&G@tS3%ecHezcC)(j_voQCIp;C8vWgkorFAMBT0CNpISzs0)@l>qp69Wiw1
zELDSsS~-GE6J-~-Zv97KbdarVSM`L7&}B@&$q!y69i@gLT5Ig>uMsm0aJhUI$xUqQ
zkl+9AzpZEI&L#y{?)8GE@_OovPdPLIdnmx!6rA=Qc09m^_;@1@$lLc9FI+ezPY`No
zm|j)oOgwEjeQm10j?PjJ8R)=peKX36hkxJlf~rIH(YFK!LdN{DvjMtxRYq42bMiio
z&6vWh2HKm(294qASN^COR1^K?>Vm=dl2j8GtcwlS2ZrPwUV#wG`yxmZZ5$kNP^;6Y
zaob$fOw#Ey0NCHYSJqv0|G)5M&2xXCyaNjmGK8=~94gYXoiq#H*h|rgKcj<$W+_P8
zt4rOQ`S!uY^G7`|OsrZE7NNa(t#isR`Cj|O@D}|Ns&5{>XpVqexSeNwtf8Ty+WEcF
zICofbK&&EjF6=A1tjS>>QCEaq!-+He`_daRuXoL@2sK8y1i2Ipb82{T-K7mG%6}N2
zosSrAO4cQFLSQ!H<{_LiboOM2SH2%89i7XR+9~B5?3i{f=%UGp1NX&PdJj<@eijmz
zn9GYDn-S0}$WXK?Kdw`GtU7F1iABF#)ORfUd2TUx%8xl*WaF2wc6Gtysb}ZAp+Vhm
zTUDkg)6;H3KiP0iO}Zrd^_xP6JNB5E4jKPi;+EHH_eE|S`av`a;k@Y<U}$as-;{dv
zAfIc4?Pbl7+Looj;d~(tZM8IJ<YNHfiB;3RC|a5BV4t9GBB(k4Y#v9&7iVPLnk?0O
z#j<5)bYT#TKqm~S=*k<70)JC+y2a8sN0gB7WmDHw6Rio<ogqeYoQALc&H5<TR^#2^
zkDIr^LWXJ5d>38&sTpwm)SpZn?%}FG@-rfI(;8da<>-bzoo(%o`&B7*a^7+>{JGkJ
z`!k@Rj~&`t^2!c(MwoY<bAYv`g|D=4G?kCbKh6fn7mH)6G6j7_EE`E)_ZLYmfcfxt
zki|<rd^lqTi`h7hUX;e~FB{>Ho5+nuf0CYyN!5;Ck_r<$4JA9HwaU}!+@@$F-9xY`
zlIIK5Oq@vf5WYd*n+!POQ7p-?8GS<6D>6AsCE*nVTnq`S%dqY3Qn$4gg@unfF)>&7
zqfJE*4xmh{*6kdt7O4WQRT&+uiOT+Qb+WazTPg*Z$3cs+7huII4}J&WsjSe~wX?H(
ztYPbN>~&{C$zsTv!PRG0O2HaeCLN4u$XVFq|2%W%=$5&<e#6<E+W&mH@X|Gn|6Kp#
z9+_72si@}sz)-JV-rj{uSC>ZZ@!#Rl-dp}{b9K3^gHP9brgbg5aN}W1%@#SjBW{MY
z3+-gM_G-9S)GMD?240a@FFcy$cKoGF-@ckHEIO8cug*F8J^x+sZ@W+WjLorH`DQi^
zE5dSSPKgq4-bNWKCK7!y^N5(suC=1PC)qXiRrXNy`$csS^KIzUv7|^#lnFRXi_*}w
zl^u0$gq{b;w8Aae(sbZC(I|Rfs4F&-C6|-7=y|bc=AE4Rqim~#gM(d>I5_3m`9J22
zJ^QwdBara6SC1Z9$CZ{ac%@IDAh@i=t&?1KnhiqGY*)Z`Z{qbS&&z5O$e637k1OS)
z{?fkGt7p%o=|`;--j|e^PdnP@UG#?u3zpwYP`z%?e|-Z3l>lP;_Jt>FvpJtq9X0Q(
zR|!NH&f485BY`Rq)XKGO3z=*~Nw4L&KFSL8M?SrKcjjHv(9r0T(o(cC#L0uPBjhAi
z{jiNkw7a^GH(RmdEr^7&#}lbkzHQsrrtKxJM?O1B+}+-kmp8x|pht}sD*w{wplIBO
z=(h#H<e}Ts`xWZ6p)kRD<3<|0s8mt#5b_jeDK~KRxQcel9Oti6qtQ&+L7wsA!!v&w
zi~;Tfw*11nykIp5N(~P1%HS!}0VG)6ZrWlE<&@>+<<ajZhJ=x3Z~zTs*y|z-A*gm*
zj&aE@fqI0#CdCy1d#dj6SNb_BH;>#tW5x{pm0xlfG}p}VE(u*2={mi7gu7c-^0qCa
z+WI^m#tPGJY3tI_3_E{*9V{Jm8l}_dd{}(@FF`4S&;jc59<yF@lpwN`9<Q~dl160S
zc8~G-gbiYz^2Li}xuq~pHs|1v&8)13dpxPHv(W?65{%tL9u%uZ|J@Zaa)=RpZj+bM
z&4DLU)T6Z-iGkQgtw!RTz|M=o`_-pN4rT(E4wPNIic?H3EXvEvqeum2w}C0VqemYa
zt<2kT4=e(n!=DKW7_vu=T^wHwU+}m!miUe3A_iD?fgu)<JpguKWj+kj9<QP@yL`H&
zU;^Qw4&%%eL<3Uk^46^Pylw4X%@Exj7#Gr!=S*@WdLX{^E5B-OV$!*L_Zph|<FIwk
zwQor}xx;qt+7ZrC#m@{k?5;c=wUZ`&01pNDl4jXv$4KyCGuH#h()b6EMd43D4~;I?
zu<rZ!cFF~t%g*xb>3@$JI&>wuvGh-V(V`>4<zZ(pJfp>1gf<+4mv9P49_cJG9*wo#
z%Vc?;hXJ<9-<30^Qf@L}@7{EBKVh|&>WQ7BISY;^-^y%v=(UD!Yaa6oDNo|&Q8Byg
z%GsX@4U9A^1|lQhiS_{C3S9M(E-DhogWRg9>B=o$wdyM61=W5Mi5Vc)A-ov=){T^q
zQ$R!&G{tQ@kUjVZotnO)>?azKN^0>2*70kDXlDabU|&H60R4tFK^N#Cj~?JO<l4ox
z`USJeUC??v0^J@246^b|Vp4Vq56Bj2tBi%{3hFk8LYny?_6K+#8kBr7kxRG`)4eY1
znp<RH@j#JCS)w~<1F5DsB8*+2N)R}es@Tw>Ly?Op*^5hh)nTQB!*!HtfYy}Z-tH#%
zN!-5zfef^oFpuFM>DZ#(-MnBD8%$_aHJ;#MKzjhyP?ks`k|L`N|IFSV=9k9$>S(&*
zL<Ite-~jBV5Lz2Mz>G+{cW)&Do28{?c3{K)@yuOiZ$5&oz(`j@YSQaYdN7|5qbP(Q
z1aISLK2jmE5h7^-&>~11K3PmEAeI7VxCT7z)JlXC#!tI;?~azK2!?1-LZv_OGhwXJ
z(J^$`B(Xck2t-{oLol0<Ph<|f8S4C$IS8-8hSK`T-*8~s$~GeN!{wiZDi6%E2ZR~M
z15x>W^^$PVLDr6#At+ZwjNW_qB9kmdFn-ONkMACd5%VC>)ZULBJqla=52&GbcD4CO
z3BdWVPI^#lKNVjj$cAmO;74#r;1yR&Af5`1&IX3<+P2+P@oH-Bl#TCk&TLTlw_8i3
zgG+8eZF^r@s-wMuHgk3Xs8zy>Wu&>RbD+{NWc^BNMDjjH=lfpxJ^JlPKQc1Xo$mi?
zeWra_C4Fm#<`560Rel(zqR#akBqb{M%K7u6{RWJg;>+@VEqR5Zrw;|bIA<9Lgl;-E
zG9qF;c_SNS%a$#kddf@TvKue`fmkmNlrAba>WGwQ1`ZgYQ(rMHVOlfSHFP*L^tqIM
zpyx#?XFF9+Cj>*Xx^hNTc5_CE0k7^m!t47Ut9XLc)FivaaLeT6hj|oq&_DEDUzzTw
z&YKq2Wn}P|4=+X+P%4%FMp~`<?fYf}j9vP5(KE^!u>M-Bm~t2H*u94jR|93T9m*j%
zWPAcgl&m5K!utwkCaO&)pH%kHSV{vKWz<Y4E<KBAl?pTpGp5Cg!t?Z5v*@oPpAy;)
zteexj<`qhUWGxtLKOUz-UO--I>zihhCrv7xy5XZWGyo1k7W+}w#`)&UDot7ai5G$U
ztO?n<M~z)Pqd_>ejty9bt!U^=(q=DM;KK4@_IQUQRaKo_T#O71ED2XPI5x^jMuuIz
z>dHQ&LW*Lio|mAg{d0cmtle5_jMclHLa&@eqI!=<(W!mY1yh@_OZ-jbRE><aOxK!k
zVsfIVPyj;c5@C#IIDOf(F7Wm7c|^j4b%X+??jhHqgP6S~nBiZwH#NU8C4nrM_?<d;
zvyw2>zF}&G8mqjS(@GL)_pR?lzQR3?!hbshnK;xcDy$HOAK$ul!mY7E=<bx91vNp&
z5{d$(16^H7IK{D7;e?2-P?-1dm>vH*FWxZ(LMA9=R%B<1%}&d+9ow}l6BUuoF|n~J
zO<Ga&=#Y2qCS%u&=aT4#4;wxlo4ArTG_b0YyZ{y-Am`cb+b2N^WoJ6JCk$fF3?@%Z
z!y?!#C@7#N0nAeNBy3lHCZz^)_m4$IIJdqfi}AYHbWs>cKPJzf&ipO|9K_d|?c~MN
zc|tzGv_4H`<*BMk*(~4s^{5A9<94E)E}kq@ipEwErUb=W>20Du@%0G_;Smw(z1rW1
z88CVBHnKFhedxX_%8R*Z6aiEKgAyhGi4ndkR_xl9*M)IR!HmJo;{;1x!HQuAfx30;
z)amuBS2xaD!g|OaJ$9@Z!LoGeQYMBdi_C@7v>K8W<oKe(LfTj{lUdX0UB>tcrS~TO
z)TtCT%IHLz1pAIFRt#~`mFVt2J<vrwtn8{VxQ6K_6yv?RAhM7VO8y1b1e}(XG+9wR
zt5%2J6Dl}O1k7US5N+_LR#u7R&4fw_pVArlAT#p<m=cT(r+Y2?UqTX+f5jS1pD}~v
z$NnzO`W4(fZHIm-C`~W_cbW~E&~APj7y_08KTln$CoO~@K?JE6W+C${+rHzE?$~it
zoM)q8Ql)wrA}_A4pC-q~>%^aX_dXLF>j(=RuS2d2p8OcO<*Y2<Pwkq;j*qk41`tOf
z;{|4t@C5L~V9p$*163wRkf=hTILf?5+?~}#+)VHP<lJ?S9><GgayZZ#JYsw42lh#p
z1_^R7olmg;ot?$(dIAaJ9Zv;D&k<@<N1~^oS(Y4H#Z9^fpkD+TB3VdW68WDV*T};m
zA^rOF`LX)ab8dRh@d=r1X}(UjrCrsL#iJNUJPL!5`Y?v6j7UcGAgHVRYb!}|SCL{k
zIIxj7WBhRc1Qf#9CPx3ycRUU_d{}f-QR4y`FdEAt!kLtol;i?W_M}cJ@nz`o14`z=
zWy&7NFBk#4+`oUd#@1w!l_XXT|MIkvX^yElTw$R7{lB8NN(h8fSwUvzdO||Mn%5pC
zd8Ih**N7sC<Xa=H_&*3?!PL0_;gcDA|DD>`@4=H2$P{EDdZZljG;W!lH>bS6<jsW@
z8A?2KRGUAszycIpb}BfSR6j|ObIfRK8d3ZRm0!(O5BmJtyOJz9DD60HP9Z&h+)|))
z5hyg9rw^eN8-~3s<}y-zn(+go4Cf2Gz~__oOaI{JAbyHb&lompCe%M*P52oMb~Kad
zc9=yo=+CRb8NL{RIR+<#<{4SSagFkHLIMf+13wuQtU8ZJVG0!&q<Q4BdUxq^iAa$D
z>2HC>#|41RK^TSBQMk!O@F~vnrm-y~_Wl3cbFR~f4mf86aa;&rlB@)-Ct0L^!jKga
zeu)qjKfLjBTpXe@T$l>{3!HbFG#H7oNaPt;naGaj4KpOe!WOgnd97dzc8eD)yVw&6
z{?F-i6b(&l@HaSJo+WT9955Cr;rjIhP1%%eH%i<~mn~mjjFetc5vD;@1t}^MII*^J
z%E1g&qID3x20#?HB$0WzNiMQ|1Py$j`|<xa<f}RJjExl(6&00~0{{LS!2``AsGdIu
zkY`8x?E^x?=Gy>H;aa)yF?dIBA0O&?&-vT%Bs>c3bI=f|eif5*^K7JI1S>-wS4iB4
z|Ic?-Bc?%>?h5;#&istfD_8!+EyKp5uX&^MxBKF&Bn<(WT>vOt7mNiIJ`u3wSOZU<
z`ZSs&g`Oi9IW}Kz6lDg5>oN(xQ$%ZtS-%1U5qFB~RU8$zAGGv%czS}Np09Gn#nW-5
z0bH!pR{*o_-7mqlq^-WX8jT=(pb%$gXSh{Ur|wWFB$TDvz(q|0oFKv^%Gt?@3@HAM
zPkTwE6Va3GTj(WJGMGEJV}}j^^-qa+G<MM=LwrF3Q&3<NW_(|O;y@e|Nfc{fF;rG=
zhU<sh<e|*W%;wMcS2%I%)ElBU7Ov{c7ns+KLc?_+brDQ2NPbi^iTVG`N3!Ynf8X~u
zzrk8C5o}i{_7L4fNJ;P{_ylPI=?`oZF3|pM;0stn;;0z73yDXYN&NQyr*vzx3C9H@
zLtMg8s#){q9a;gHk(Hgj5gj0Wqu*%RMCe3+YHNh6Txe!ckP9D^kEhXZ94RJ2G#L$_
zs<%7AHTp~Rr%yHWnM;nqkz~kY0R)Kz(-sodX8(EM#9NFOzKYQ$BCdt#B-{Up3f&+d
z%+0l6VocL{tN4qFV3icSKYxCZk%83CJ|4x}`x-MJ6i!^d`mO1W9!KzpDlMz$><m*c
zUN7vRwx;COU=nCnCDf9m%`PH{Pa)WHS}EdGo5fHTd1K&?cpykQV+)WmLc9g;yP!8W
zEoi|)b|MOwTqq0xYx?ZjlZ!<aMNn}dxY)&HjOcPPjkz~FkgX=(adG%yTzzCqK40Eb
zNG!5YcY6@P(~e=P(v^ce;?o7@yb;Y(>cO+kuV294RJ_wtqC1yZ7HAYum}1aUTt`V~
zam$kBzOspX05sFEOY{SkY>fLi_~S-@27fGpHtPi8fEosP5480m{riVf(Y3T}TomgU
z6x640-}2H@pxbHTCOwsuEbIJ-NZgee%VFlnGpaVYkt1?Td^Rj(ns{$q+6{!QKbGe6
z;1^roKJ01ti7ZEBmneR>ety~R%j%N5@D@%b(MA=UAJS1X4W|cZWP`E?6vVeP><80i
zc1<sgR;X_|M}-?7yV6Ht3A#!`w_&qCBf#%4EDSdbhspIpD9(PhsvmQYmJ30X<kKi!
z!Ns4<jev2c^$}*@RTKI5u{;)glrQ^@;Y^7KmaSPMxM0L*NSG3ozJI?iM}}KPuIJru
z-L?%fJ@C+WG*z*cb5foY)(}FvZrLKb{#g?$Wt^YN)2$@+YSE7Kw$Tm5i4_{}_)FGZ
z$mbI>UF?>EWIq%R8;h8*Lh42R{d8<8O-F|~po&aKSqXYB`1a_!gobQd)ZkDBfERY_
zHvj8M=&!OwV4aiGHL`wveY8YLIOzI{zIci_IEFYlxu#%?(8#603NJ)S(?q4Ko)<zy
zfv<!;8p$B89)0?JEG@Ms&jkUpD>t{KP>7l%MLI~#d}9Q*vhuA+EhWA)_-qP%<ckzK
za3n&z0+003B+873#ioBKNV*Q5PFBVFS-dzbaYr-B;~CW>qK_vfC7I2NG>IZV??Zdq
zi%Rh6)zHcPzD)-&ICCevBAV`fztZ_aZ%Fa8Sw2ev{p$q~$h&ehknTdz5Doe7$`O8G
zOLx=TO5Yrv;QJn5B_pt_glz=(FZ#r;krIg$l?RRs3p&TZptGJzS9!7vKn^HhXx3Rh
zY1y5p`L>cX2RsB&N;MzYX}G$2H@#JMc8mbl27thp5M2=e`Bh)(As#<eiyf{tVFGe?
zB01#UpyzfzE-t&i`zKHjzK~`&4v#_j7=#dsS1Vh$miW%x(LMTrURWf=2}Wd+Lf|_*
z6zI|cC5if$My93b#j~!Y-mz6P(Gn&PI1*-1gYKU+%P)K|RU9D}1IbG?D)c1bv}FDb
zp*s<Sm{@GI8%ICaav8zK@~wBN7#j3KqDfH>wZr{Kf`c1qqhMdc9G)$g3Bu1dr7@HO
z9AxC<vWCdLL$308H%yV9>Id0@h;`}GE<JkujbPXQMGF_AZ*Bu+aM-X1=z(swm1%ob
zC}EzUa*%U>1MuOld-v&6T~&3;8e{FfXHQSC55jKZ8zLqO%R?P4CGI5N7m>0E8MSz)
z%!!eR#C+RHlFb<6-3H+TQcYcOJ4Ot{(vy?jMNyjNC2#^3O5paKS~`dszh@$w9S*o(
zh}cVM>1K`!(0t?5*KjH4le%l>rs-`6kprKXzefdh=0VE>raIXXMir)va3qDH_jpRi
zag_Z?Ynyh%K_pqRgD3@&wD7tRyf#+Kp>9Rm=<S{M@F9Yj2g^r@I6&e$!ot!Lv>Lrt
z<d0|0n1L|{hMApbZerpD1Vj)TU$9xI7!lJWKq6gZ0-SxIbkY5jfFjbF;Z@0sdcTM0
zSj$}?uz^QnU~ygxe-D^Z1*eM#z*uRF8ugxLUf%4yd6|$OC?+oicc#uvI;OK_HIV=r
z6KEmn_fqPlc6Jm0{IIa($|EC=;ykvz=Mt>m<8saM;}@uOH8H<@m+UZn8tmp;vP-wh
z2Sa)B<1{ohkS26?o&?Zqx)+U)>7Q+(%J>Rfd{QNxz<#8Qf3Vubi9lEBVo}~1Sk0FU
zi;2;uzDKFU4OJ;DX*WG|y2YqUGBXUwS&*8&zx6{&Kw$t5kEV!_x70qTZLsXd7?4c`
z(g-yUac&F2-8EJr`SVbqYqkNtIBQC*BPBNCK_@?7Hy&J6MJ1BN6t|o6^eGJ@nRse^
zySZw%=~(s`4@w%x3n1_Uhozi)@X(?4q{86*M+tF{9;E@H*u37fwIp)INJzjRmNgka
zUNdx_)r9=SeS9Er-SGXW2(*C%ma={FfB||@X7&ya>BqW=H8)-ZZ0l>VeD>`7U|{G5
zy(%mF4wJ<0>*<JyHf`F7kN_)17DGmh?>RUc$+{h@F3N3MW%t9e*oDGe_;3<8AwU2N
z)seM9@!9X<3Qa>JBXWKJx%a7yqJ8=1!v`o?E9{v4-N=C0_c(k%9ig^Bl{(yZiZ#4k
zzz<G2NaYo?c8iAP68}s<`;S)jlEqXnK^+jsM?4uXWIfF2vlFG;fonvT>m7WeYU1$k
zwIo#$BIcPuTLu+*^TWS;!Rdeg{5fE<q2R!}f-}E#Yy3fw8JKq(E(D9=ms}>e9(X@E
z>STOun0c&rgug(J5w*PBhcYp&bJEQ@7dFnGO*dNZ_?KHvXH4lTd1a2WHsmL2|Er_Q
z=Z6{7E3_TpbY!{7NX?r<aUvq(9XWsakgEa}M5!;Un=sL?BVb>kZMplezo>usH`G})
zC1~XP170kq;f8Q}$W!{+=wZEdshynMY$Kxsgmr{gh<9XFkK=)0yD|kH9XIMfWV;BY
zl1cj!)Fn2&-_~x^D*I+?W$Jdo9`yF=d11@ur|r!C1TG@jyI>BYysLbN2nx?3^p<&3
z^x;{_tw--J>T%5U=x5tF^4ynb4uX#liGmC?s-uv;h5hE|N3qF{EmHt+g%^eoP)EPF
z$g#S1eHf@2Q*~LCmVVd*B?h!c+b>eRm}BqfXCMb0qoX{Xd=)CA)t+>DWr`!)VT%$}
zislm#OFb_NEFxUMtZ;|PY{0#;-m_Dkzd$!?e0m(jf7RS{)Q>eDFRF8f2=l(x<1wWB
zZ069=Q2rn5LttlgY~0x@k6X8Hku)*gYHpbER=UNgg8+ySR0e6-9adO^`83+7?Ju?{
zNCu^G>8BbHebKguTSKb@MAJio*1wSrpPNY>&p5>;ZtFH@9RX*>TjVThfw({=ZsW!|
zvu7W)sUqT-IAH=<BWWpuXU2erV#U1)9}XNaBCSGX5<(Q?ns5i<*2LIYQeFnF_D6-T
zVu&qut9}=O)fmw;hW$U42}ufigtNK12^al?P-^h^e+Gmt2=llREku`uCKL}}`~Kts
zZ2wS?RrFN?0FpmX-d5)vwW1idU0^L<UG$bK2(2|X1!4AB4Goe37i_UW?G<=o0rIx0
za~CYAA>R=dfDRqRAQpDWq^SPY>;U%qwvy$vGMLWDr4l&B#gkM|UKxsDm9%GY8DI14
z*)vLyaEG<2EN~z_6`=lo1$Iw?&PEoB1zf=n8oBT$kXrO`cr{V^tCb+np^q;VbBR8H
zQ<x3K9bJdJi0!r8T!o^&7}22TMF%^AvG=7?6C<No(kmX(uXGhui$lJ?Rat3*PDH~f
zr62UuG=LVRm|_k!MP*aD^*C-!)ZVmj9hysQdNrjM>@e(!;?G!$KVgq!t;%N4SqB6X
z?jLW`B_Hn7{5OMzKBDmk7L~1oj8Ou=#W4V9k-7rxBBim8#up+`!e&gxrVX;Z*#0Uf
z3z0~2ZvpXv2@re|9v)rcNCJUzhqg{l1m-O<4_b!Hen%l~aG!)0uQG_}T`-L!lfM<R
zrg~nSbb}8Yk)<km|GtN!VjS;AFd8rVpB=}+&(5rUIpr|sbBbF-;_1=n^}>X>G)WkW
zRKxan?b;Q8U@n(Qa}t4bY?T&?aouCLhOv-2K^+L#$@3RXIu;)v9~EU+atI$I>x1^9
zYM)Tv2JGngks|{=(9xJ$d@i40izXTv=T0bk$);8q7E!rpEVP>#DuAp{y+iy9eniYJ
zo;*3p>5?7Y6U-0M_j?wO*P3xD388cuQ4RP!B=9Xh0X0zN>7YWCHcPD8C%%FnNt-s6
zQ;mQVZ-4v1v#I^KoYML*T*E1=G4Goiz3G#*Dmk$USPi=t;NZ#9v1wn1&ms>`kGsXz
z4!O2gcqM|+uZr^R+My$4z4;W-Dk+2Nf_?1N?%lfC_a%bJNlS~iQlq)?C47u8#_TRi
z@x_*}@mA03KL<EdFSP3ChU1$3w9I<R^5tR#uT$!)Ylqia+hsj0QzaHagz!-5T2BS;
z9;|=Orn0q$M*?4gzPoVL$e-<Zs%f6e+4?}_9Il>SyLG#J=MKDM9p;~08y$Iykck3c
zAX=r)Q`Cgbkfa$xKES*~@c|O1xejNcr6st3COOZ+*Pz~U5nc)a1FYr2gFOuv660Z!
z$us;6fB${!mDwkF2<&}05qhys4%7hJQiY-nFA4qH6sPX7_JLcP$tj<j8~@k`)j8eG
zuCRRT>!DRJpYW2QU2DQ#%VF8^kCVT@B>T5J>D<X=(+G=;<dB0$Zu`cwo$9`q++bwV
z{SA!6sNvokFX!C4#qf?o+wO-<^s8^0PYpAsBRT1hod)4dPWW4)5T+(E)iYBeGM`O(
zP4x1(t+O+-b|nMP-nXi}7v?~*zC-eM<ehBlUSmd5AR#)P9R=A43bI4rucg^#tpW-+
zh?1X?<_h&sLDLBhXc90y(3_%{RljDUr*NaH5KxNR?VKy-uQ+?2;5Aq@<omrv{<~+-
zs7;8yn3nAAw>+K=LF2k_UwWP_6I8nrNLLfH`S(TrK;=`)Hme1l&#CPX++<C>9%ZI#
zR|KQ80dj8ekBErGQ$wzTP*+q{;Y6deTDlOSktrW4J2r(CykSVM0D**PekRB$Sx+2B
z%0}gERYB7zlhB>A$U~&wxO!|3SSd|KBQ~0C0v`h$`~CNa^#5aG#4Hjs)%52Z=rIWN
z&u>;S1d+18F});EYTJtGUZBW!B{WowXYflFT&Av%UDtk&nMwIFc=8|^atTK`P$7BS
z|D3*Ipk&VHCmW7^6^+Lf<f|^rZ@%JdapbIXmz(x{{bV}|N7K)>AKBmhj6akuMMd+}
zI^yc>>mzOxC`{S<&A9&dj1xWGz7E)QGdwc)Rd81n1y4yADNiSe1LLs$EM2r8UcF%Z
ze5t_hiIDhADn8RanpWdpN=kWr9FQf=to8<uBZd#>1rQ~;^3arZn@V{S^Dqn%p(nsN
z$s(v0u%R^n)q-#n)X?DN2^Bu7_@H0({70U+1tlbjikbPNf&v}tV{-ErE_B7&!0TH~
zHcTK*LyI*nHYG<bEtjjd2`DuPF$^<i)WaGwcF~}RIa2%EYG$Le;qp1LQ!|o+Ll(U_
zVXOjGhv-p7(RRL7PdCkMAv=&q>vxQFs69c@rt6cu8&6B0JyW-SXt{@c=38Ogk;$_)
ziuk{VYLn@96ja0e38G=58Z(S8S6P2(jB=`Lg=kT&*}h8Pmd*B_NLBbbw8D}_%zw{%
zZ(1s*?l?Pq4EXja900gPzPkH@m?;a0OoQvD65pi7>0vE`Eng4b9?`Tvm0Ybs@%Sg)
zA~5#yWy_!>+@^&E2%UmYvGvzs&}?DiN$Ic*-%YwM=5iAYs9hb-RyE!TafuuStVRKC
zd@HLnJ;#IeqZLkC%fO(FtueA<LWSiR4GnPF|36Um4_Tkv7OWR>*E6EH(n`v0$S@bC
zk4)J*_499%L{*GbbtY{KSFQl+1JeCT1_CJ1ri0QOHu_QHy8}|Y8yy?9_!cBDQjZIG
zdha3IR}@pK@hv+j-atlZSX36L<nyI14Avx0^iWvt7(9=d%_29goI>1)qHX7B-SqYI
ztIqlZ=MS6C@+>UXvpby?H@<t+M|rxylvZt{*wfv}^)vf9cJ^*R`G(fEQ@}A4t!^Tu
zzEcgP#<!+*l@W?PXJ7qhg5CEH@dh`PKWBW?exA%w?(KEFktV7b?-2QOYHf4;X6{cq
zN60aj!5u`Eu)zdDgg1?UBG~+%eil8IPdGh#f=UK^gO8@9G)9DMPwO?Bg^0X>>Lhs^
z0^k%qKT3-L87T{qx{zuFTjla2^tK_F44w=9zNRJxqAYPG$P{kc`CbtmHW;P!mO%a>
znPRC(Z>dqt-@Fev(h=%5WhoHA%jeHWR#i6()%rYm%l$tv=qA&)2$e?L^?OeHm2Bvh
z=ddFAo8dSD%bv)8C@dkq@l(9oTAJ8W-^j@A&rc$;G4YeenrWD)hhJa2Y9=^~?ck{~
zhq+<1=XF`Llr%kjqv=|AY9+Ka%-p}{@0~vOQMv_{bBc4f(KMn$bjm-T)RAdf0ffG^
zG;9jcLZXT!7M^u@&R9|_I#Vc3gjb15xTZ0$0=$=1pmRW>M~}!&A!)?-Fn_6^Vt8sk
ze-4xVB*B_cd{0kTgXqBG3>a_=c--^?{I{Q21`ap(pMT)&1F>>)3^v*L8K45cR$0tH
zL4Sl)({xyRb9bxAWY6}n6S@yy*x!RptP#mR%_7P-(lzBEY{8S6-?b=j6%F%ybBO1z
z32dMo*v`){;dDuU!lkS_4b*9KlLBu_#~+3Y2d3Uh4{Y{JR4q5`wl;OcjQ4b0^&&&9
zkC@0X&3OSCQ{v`)1UynGWamWZS13~Q9-1x6Mds()6FCx7Ur{I&fxyT&QrK$4t5<B_
zbA7*qS^aqGkU^+`0B%7rHXPxIG6`=I^9!Q&dCa+k?7VmH0HMHOCn|gF*fEuvvm6<A
zTFj{NykX<*1i0KHHJ7HkC3O?&RrV;(lR}M*L7{8z+*TIfhF)ZPc}{BTU{KGYLq&W`
zRWp2wufCxn7=)NrK!6ORj5dmPs=8@~xT?Uy5K3Ms98s}Mnm)9<BvP68J4uw(DRnB}
zAs)cWpSnp{ll0}0Hlq*F*vW04PpZijq|2A<zJB~(n2OBrvXv{zzG>4lD|z4`w{6=G
za>jPb!pwrINUtN8QZH)>!Gro5gs-rIX}$Rn^OV%1jvT+s@~BN-j0HWlpCE8SU7?aR
zbsa~HW8wSxAh$LQ{6$aMdWZQNFn6g-3bZiOjgKp1#iRod(S_`+?@Qb|a?R|d6U7%1
zgi3YO&%V(ZotSbHr(_qrgldwa91`?LaB{tMwod5ZU$;(mZtk&H$b9_mAJ3bPtmU9n
zFo65=mR^1$lG?e~8LLBh4HpTY7iOj!9(z+($g41TB7+0K0w$1H(XooO!P{4_LTgh#
za;PyE*4EZ=3I9QgmIU}>cRSy1hy&Dx!DNw_2P4TL7f^k@QsQnut9ry60d$enDNhI4
zExC3>aBbw)vjr$O!BP26EWswg*NAA;%s?Az66#J3WpyUspTlf3&;HH0#c<p&8M_QS
z15Tsqk+2GM@w{83=%wkdM=vpj>j0fQRIB9HzrN*3C7&incqM|nz-Hu<n)pTXx+r7n
zdEu3iyAboQoN@wa<TJ{fK-04MnMUcUNsts;v~GWJG&1~KfP+01z~qlZyT=5<Z$Lfg
z)9csDewWnz(%eR@1Q``k8E0$c(k@m}#cMc}t2U8_yDJGM2{r}*{Ue8mCJf$PID_lj
z(G<)_(ny@oJuo4#;5Z9JtwA)g$<p?E5&bk(MIcq!<=}3JIO){LCWz!Y-P{`Ayjd1!
zX?@p^lU4iS4=U|swGc>DKenMrtyeu_*;t;M8)&CYpFx`p>k=U~O9!I0^$W7XtxSKR
z^iS24pxR$+e#gF(CJY*MYWQB*hV)@1rd`aD;~pqB9|NH#wV6C=66-3+M;vAb>MGxX
zE>KVMHEH90a8;-^9ttE#mzjk)YLp<@vC0<#T`~;A(@b~)0-g~x73AtA)bXQgBdZK!
zhhw{ms5;AV&&~m7uQt|(G<MQMi&(e7$cp|k9xj)@RV?MI%mExJ&K<dztkDVWo{;nB
zM+sJpjpOpwI}OtXOCf97zxD+59-u>u{&<bGy!*mJMgjXBJ=#-2;mPSay?&<5#w83x
z{#0I$*xw=QaDZ<pYtm|B{}oO45lt~48CKQTuK;4|#Em!YsTS#QC^ontt+R|s4rmri
zP0X8+W|HX6+3^SWLomZTcq)iwhU)x^tu&)?v%#a6{)G$W9e_Cj?LzBjOuQH#KIY1*
z?CflC|1;6=HSc29*kX;$8Tj-4lbeun$qq>wupV^$Iif(W7v^feot8F^I$9NLC=kWO
zJcoS=Xameit{JUbC}sf*ryCzn;<Y_n@yYCz_rT#KU7_HYiG&LqO0$N^_^tUC)8U7q
zYyqcOiZ2qQKxWN~0IUT3;+KEm)#<?~?kH@1($%)=BSbD?d?ftz>7V>C1kuNgxfmHa
zTPZ#+j)v<8w90#V8LRqjUDICd>x#Uw4B}e1PEKC_8cqe`2%dN|!SpbL2b2UlblB+R
zL>UgcJ=Gro)0#_rC&hnWV+V>!cHuDRdi7{YqWg&tFH+`-(Oxs7wP`P|268I)X>nhS
znIT(u1HAxx8A9KxOK)Y5it1|QNY?XUg!%W|j1p9NfWPD)U!Oy;)VJOIEIT_0Mk%iC
z&)2tF+3A5OLJWI(&RW}IX>u4~=c(jxL<&@o4{0+1!u=ry$2gEdYRi}vzrOL8FQZuu
z+MVb;aEN$FNx?esDlj$H-{-&qx6((uu_FW&M6cLAYAXI3|F9T<p$%mhi4ttLeoked
z#9e+rtZnG&lXYJeXI78sFJwfL0k2qGW^I?|`lMtJCx_#v$yS9Wfe`kl0~1pASJE2*
zS!(p)!QoY*VPUWN<79Xz$rlH7m(gfEga{B;4=9nogPL~34*lW+Jh_~}yq_LDRQwF6
zQKHmSaad72f%{6vnoWSSK<2Nis;Z_|7L^2k$ny}+(mF8W$CUE!8(2pK@gVgr-`&bR
z?M^%+&ng-7w}_o0;3klt^5Fvza${Y9=KyO1w6TVoh7?&i5peAEK&<Re@v`vsoVG9@
zQA~HzmtmWBd6%PL)j@fByGxhu8pt$24_;n!=o}f&7dI&h7JUO$2PrN>-zGl{VM=|;
z^*&7%1R5CvlB(v*9XfdM2`%7Ib5!rQllY0|l-NlqzO&%-<rsgU2fJzMVbCbjwW)HD
zPUUrIBYtH8vIH<W1zaAftLp#{v>W+uZ*0XEM~>s@)6W)v@nR|G1cfdENPNausWa7@
z%8m#KD=QfRduaSn*{#OP6BLt|4!21ZbasB-2Ei&QHs{Wjr=Rr?3Yxs^z5+rOPJSPo
z>uxkbkTPNHtHFqA+@*(B?gD5YP-Z&qhvfD#_io=_3P7&s#argF?u)+;wMPx!jW^38
zLz@VH*^A=lSDXzPAM)I!Ap1~?;&Kgo^Y-oC)YSbH%o!e3JYRHRx={({U7D{QC5fB>
z3@E#2{?FLcOf?(p-U-eSNj^T<?k>b*Zl@Rp6Y68IZF>ssJdU;{2RDWRv4#Qkd(t$I
z$B7TwUS~%(=*R31RY(j!KlVo1FhC_FQ;;xxl$NGCc`Yxeuy71=M_BfRi?aKy7{Z8;
zbFbv71tLTw1h%=s)cBRnvU>kV{;^Rb&cir#XxB~~_E^b!M(+~dLqvnt_LGI?KHeZT
z#&Iz31rJUul&wJThP7+1+p39#B5umH4^SnPLeJg1KmBvzBnE8kx!71@0yhenU;*?4
zrTwiSe$st>8olSSXjWOou;}MN^O=f3UD7XZh$K<tKiXRC6;d#?AhAfW^?dtc5I1hv
zAeucnLd9va!sm@%=(<EZb$^K12J~8Ca?e>iFx@U;ZwuW7IQHTjxm*Wx-q(O|kc=i#
z9w_;YW8xM6DLtjnviPa>lKmK?Q=+_=3s4#|1$-Kz_OJS^jr+wWhPL>b3U2`*<8Y|B
zg~BxxeK3OPNO_s$jHO++PwX*BU^L&t6S?Hwjp?piAw$*w_%Y@Chp`1MCH>p|e99XR
z=Mq0vFl|RPx>)Uo06h#VVznEgAMN76kYmTT0D?I6kz$Q23%2gxVE*Uvn2SYLexhNE
zBAYAy&QVqK4Gm*J3#a|nz9&o_%)UY)fWJ|O+mXkLIp(?Mw-dznavy(>I-HrRdG=Xb
zE30~T!|79}D78GM&;%h%R12|+1V_>3`pvQw2<(Vy$RH7r%gH<x(b50s=Btob88%Fe
zTmyH8P(xB@b55|r=bx*EnZQaGYY8Q5jAgObo7}YX-L>Jak{~8@tc4qmiLpI5t*O^c
z`;mF>`g3V(0b=MoAbb*ZVMqx+K63@((JFsRhTHAO<_T{%oJ%Vo{77b2=^Qz6qQNcz
zw~zDZm?kH07k(`}Iy^Sk7F2|c2@Nc)J&75?9T%DyIZ>wfpaKKLga5$4+VBd`0a&(;
zlLhmI2kl1Z#yg`np?}fYaQ@1ba)2BREN@gwwr9V^{^xq>W`vtW;Z82I1%#pkxT~C)
z=vFx&Hl2+jku-UTzqYV&>^U8@vjIIO#d}d;Osu*H7m@<?ODaGd0JV|B-4~cs9YszO
zg71aJw_7VuCvXS-Lv&<bhvip)9#Z!}m60Qn>VD@&h_jt7EG-f};g0>T)2bTa&|sLa
zSI2lYWL5Py9Z(GrgxZ=mcF^iKg?RoS8|G(+U-X0paIiq-;5f|MbX(l%jhMMnX7kH;
z3al1I2hz59IuxZvcveD6U@i>P*m2|h%lcMHqD>iv196C+lr5CtVdE7RF0m6zr`$ZV
zQ!;n=+dct%Q@Q<wnYuh-^~RW!2LI1y_?s=k6Q<O5+}ixVX$S9lhL05$N)T|?OjvQj
zUJL!eVFGWZI4@eU+1P0^%Pz6eXNMv2^_YTpWY5fJ&rp7f0R!V`(iKHm$m!IzA+E*h
z2y+ir7q`Hu@D&TlH3$}ZK`o1RwNd>cGoiX2F0#@9AtXr#qG5y^(4^;(XLqo(dvFX~
zE!0YoRG9YWF@f+nB0@Bl2@ODsZ0SKV^JCMKg(p{i8RrnN;?AvGOYrwJHP0i@T;9HQ
z=-VebIYK0zoP$B1M}vZX0JRCFKXO_<FI*;%evf7m`uKoCWAfh>o2rRLqlbvzWd|XN
zLiNwUk$4!C@EVqYG!jQCt6$no#5|E7(FYM;wGLVV-~jn)_@eW&j|eslH$kQ#kytlS
zO5N@`$DS<Ll@EpC?0SyPSoiIlNP^+=VJD@3FvDa2{tVzgwVKI2b*{=Bm!#5g_H5Di
zBM7d$p+a#qsa-6GZU3eNX1YR3_7A6m`b8m$_qI`_kVObe3GL&jC3L&-BWKuq&u`vb
z%s0zA<^ekgQ91#BK@}$J*)xCbKJI~Y7cKhE9~lCMSfvF?zo!E0OtaBl_hv01fT@*P
z{G#eQsj92nP=`j<MaDEE*2KEnQMls-6{A8WF>WjFs!t!dV-PuEeRwFq*L+9G7>$d;
zF7!(irtA@Jm`W+Jr<`(EdC~1dzrq1Lq=`$rP%8-2RM<c+ipXMLEFs(zV_gGnMk&(#
zDLz1Q&{SXl0S7hwBe9`q%lP<wLBVYP!H>X0=x&MR1nIl}9<=-N>eyNF`3d4TLszt=
zlZA9~#fsAkCkU5?mqzD-kVw0``vN~G_RL37?9?d}{cq(v7#>2ncz(`1_V-_3ek3`$
z0l);EDIEs>#3t9J0WQ*!Nq=AJvuA&TtCKbAd0|s2&!SXmQEn{0+Srt_R!bP{4OLvv
z3zQdV;W{VAX?ODqt@otvfR-E=4+ZQtAV0uY)T_W>F~w0$#M%j?#CSe!G!AtAFdpAQ
z-oQCL6`<DR(!@;b-Lkz?i~O(<oC52VBfz-8S!2_Q#<{YSd@*?!%?~FO^v=$Qv*iL7
zp=fdNrzh$^g@((7f!wcI7s8*$`gc>n>!r83zXfR@JBkDRDmxAy;+&rOoS~GuQZ=Zf
zn+7&>{Q=BYAJX{6O$Q!lNf;O|1f)i3%zxpG#P|jAETYGzcG|?>pkI}5WfmcU#;Ke4
z?#+@5GgiUWo*K5Vg?scUY!GmtWgbk0wF?*ilYaJp+7{f~>(sqJ3DaIqnZl}2S4=1p
zFWJ34%=)sDk|;5V8SsrphJ)Ij+;gbb9igNmdsTG9!9#c5Gs9U`Tju}7FG|vu@%I?!
z&7^mPrTG@(FGH`rpf3xDMl+zE986y-T?<9?ZC7I4L>dMFtH|1fur~AOX!>+ItNULw
zf+QE*=73ZdUpj_TeurbpD9yIY?5XjLjiI60_0q$TDJf*xdS2{Aks70JYPH++-xy2W
z1xIE++d*HD92YKJh!CoS-Mj~_LoMwb9K?7k@Hss%a^aDSuAH&j{l(?q9x2)HhSpJc
z{)|3;XFVEGV8X$bqFeIDvHMwB&e%VaKpEPE5PQInh5tp0vR{^D-%C#~6K#Ux>6=`_
zjbky`Z|qQKy-C~aU7>w1pYm(_H2o6$Q<E?v7j}-q2_im{D3Vn7@j=iK!o$NA2I%NC
zusKE+&HJ^#fBjzcF3YpQQ{0j-fBf{xHfH{aO<yGLq>iGqeU01a)b2<x4xjaFM@2t_
zxrCd^ANK3lE1zS$=|WIAf#nwv8L6?H@*R`{30?+yKu@8)Ws5~exFoV)F$*JhA-}=c
z^`7W7y<Aj&WY<x8;S77Rfq*>=MoId^wBrxbD{o_?x}W^_mq{h$l||by6v}_!y8Ce&
zNbvL?3fOi4wOASsUo~!GTTyKo>G2QR&nPXXJc{`BF@8;bLv5Aq>0at{=jR=~>QF;n
z)u5NiPsg{FOmcu(C%p^A)wprYPg;Cvw5aZehU&_VCQTzqYdQns1C}wKnrK8Os@xmm
zmAD5xfFR;hJumJHo&4@br+?jnVoAp(dS0;Ubqfal{CdeIbV)(wO=TL?V0?V`ji=lp
zw$oAh4wP&RdUfH0U-6V`7%?0Tzd|&bK<|jG%hE<4x8tiVvq@$?{H9^ADhJy5U<A$X
z1yr#4^Y1~?zcr<G1=C5mlNesCP>4WEX6EY=m^pVR8l7y3e@YtD3xe9*IexFPg`3NM
z=ZM>W2bY=x5*<D<*ki=Ki?hoQZdg7r-Y?(5VsAIQJ`c1mo$9J*dDysX=3u{bQKtj#
z-`3oF_x(q`&dU{VpK8pR^LcB1b@1bNlRrIn&<RAXM<=!>J)n=4Gu%`66SrkHNpf%(
zdF8wgl&C#hH<$G9G<j;KssEsF*@CequB^R+va@*Y+H?O1*CPq+y>VkTzk=%ad^0l@
zt)Hi`miGNt%F}IaMdP5iPb-OTBJPU#8BQze1s7_}*8c4-exK{rqA!q=qZ!=2GIgeS
zYfrk8EbLJ@?B|zS?4;PIDe=;^CU8PYXO9AEnqlu3N+kanFJI24L(0VBn)1IblBF{?
zZ`R5l1#Y!kwyJYF{WuT_xuEHzaY!ztClN}tKF$+A@Zr5(DdG3<7YF|}KGi$brJxoO
zKOb;FUB7veKmXBo2egQ2(Pt_??uJkB>GyjKhiA8L+qyId#Ga%${Jo0op+ZX-xM%7t
zSD~q<u0F&=MNQ3N)vBh~<9>RUq2XS8>gmJAb(a0G`!zKNh$;~yd+%>4aqlyE4gmRi
z=V@O*=7gR((>`TPQyS=g_pf_JG-_vO`}tj{@o^>H#@B3%+XbLQyk;_cl5IHbXK*R|
zHiUpQ(nWi%3w<Ec>_)m9?b{F#=Q5$i^UhNVYR<_xNc%Pvw9Ydo(DTkTyW{hk-48l_
zdPsI?gGE!`@#NIJY9%@4$Q)xAILcSacH?#do%4NFLPZWR(!7lJauRm4PoJA<tT)l=
zwEx5NA-}Wk7<O-;rkF0dHMip3v01VucsT!k^9Q55C=U$vKsAG|)L~l3W4i>TzaW3&
zw6s;G<<SD3ZPh0@@B6T*-rm$r8TBF`kY4<ymdY0i9xyWTEQh@1?%Rj9JcN|N!Do9g
zdC#8x5gi>(_DZnKbQ2m-VU()ZsF{>H#Y#fwznPGvVt;yoM<Rs|0%Nd5l2(f4RJDL_
zl@N>qEes3{e0aOkHIZBdW{b&4hz3HXf1+pol=p74+O}+7OY4)ko>aVV%=;s=heT=O
zu$*NFw>|fm2-u~qt)?Ywh2}In`s(%v_=Ilb#yCs(8P5oA^L&UOE2t+$)1XjSnyvP=
z0Yi|7A!jx=8Bq5TmV>4}97D;jZ#FdiHTTP&1&J=OT`iP79={`0U6}cLcGoUliave}
zLgDQBcnW>Ccsw>lxWn!zl<~O=NJ|)f0X$EwNbu<Aem;ytCi`jKrp?&y{piawG%%p>
zhdgqV5TAL!8mqTk26rd=G1DyOTr;~@Wzb)($B9}^(LGa992z#Rhh@>eQni8iN@mO(
ztEhY`GV(nrXVQju9l!j+>*u1ij|~Z0_nGS3gK^(@;P+WS5hwS*gjhL?r=Ul9j*&M5
zt{7nz$BY>hc?CHPEPpR`omD1KrWiDS^7QE|)YUS7)Va61*hH4$oiFRux9{9FnT%kD
zsJw;t(z@hA5H1+1ZI#J@Mb=H^w$1iX<=c#2s@HM(Sq~qcS*%|7F)}(@i${TtJb01y
zZ89Y&LZ%<dR_MP@qG*M0n?G-!K+3(nwV+M1_T<%2lHue)ma?rW8~||?{2CI;U=PYJ
zh_K`_*pf=XnKOc(CUA0*&bu{yAO<Zit`<4RXQ#_r1!|H=#ffuA${&rAQzmN!?Z{e|
z-P9x{B6(};$*^+>E?L`e-#(v=i7CU+3$d){H%U*=n+}z2H;F`JBXAm^g}J%8$3dO|
zwc(uQ5uuJ9{(V28Hk@hq^y2NQ=^9z~zN@Y`j2hdq*IRGjii&m7h>Lr*zW#oEA!#JF
zLa)7h2YLWHgF~iG@+I+ucTZYVGLU2s&q=;wgLV>WVO!DDVaGHY!11!q8%RaS+@e;G
zV{@@&Pd!5>_7+pgps257K@c$7tAJqOQhGfIbFWz)8gOq*t0x{*I{tt{VD=rBDBE!D
zw;r5EjemZhAr}=Hi7d0Grp3`?$NCYKK#bPPX8V)He6OqH#N%FIRtGcW7;cO7H+E<;
zqsGFF7vAgN<hq#B>tj>M3g2>?byh_Ux%Z~)o7Vo`6Dz?ILS0%n*6kzYAss>Z5*I)W
zIj4oydeUb?mYl3C(ILlaYGHLqZ{<ru#Bu-3NNI&(VL0k$E34kSZwt~JyJcBl17s3_
zFdur13xtVFh)A<RWB`p)XNq)6I5*+;qq^t`dbL)y{{!?rNO?RIcIdKS7jfqSYMm2)
zZHNvNO*`p<z<n!BZHLHkG)l*dO0pK^p)wKK^GsyqDqzSsrF!xPj9l-I_aJ@vtZy=`
zbf+Jr4oG6jL>|j4t2d#J&~f+4_g;aWm;Kw5d0)@MViQjYEH?$P7000T%A0qeOkIip
zP*YKQ<>ZSjx@xxc$rHh*>hR|a#~rjetzUluDH~ng8<eG}`Y-Ei4*~MTp5>RxR`&H8
z?_>X^wjTWU{?;%O974}|YbYUN`t&E$=QK?dq({i6eNi0dl(;}*tmbswMrk#67a5fA
zwYBp;k{4j0_k5jaZVniGG7r81jRYng8^G*IGCJw;HOuVnEd!b+WwV%F#gv@&>(`SU
zQ@io@3EwmIYg2B_KhC~0d}|DO#6N!|j{)6S1fW9%pL*Ie+hG5(%o=i%wG6^Z+ZqPc
zSXsL@dNPG&|6p91vu8TF;r*>MynBCAlw^7LjtFRdj6=#rQfjt^5cKf1{XItS4347T
zC%os;$M1whXMY8<5-}cYW7{S#&OHQbn9peP)ne=IUod@o%j_NmqIxZA<y*CEd6|^Q
zXP1aC1J~khoWFzNjj=7K=<R$g>CGja7JUWqgW4+7=EBY|gE;aq$1gppxx3||qAKYP
ztnDBT4PSe>y2#frFp0-9)x6IfsHGLCKpi!;=rh~!pIJJXIG)nX+#ErZ$TR!uno42Z
z(o6M!H->JPAqsNn0y+VHaLml-&qv>m7M-V<7qpc!!+!K@zN0^%M@0w22K0|l<gNki
z{&aGRJ}@T+S}xF?7#K<w9zDl!6tCbB!qx`k=skADKC&L)A}ouLnN~Ov9-ewQsR}Pb
z^@s<cno2Mj!yJjyQebPkju`$WpsshO*(~E5f_~s7icug3P}iCy7-_u|;m`KtjMU+j
z&6qhe85|As1bv6w19Qr{*Arp=MCn<jF+pZ3U8QTNZX5;ldJy&;Bl01LHhKN!FFWg@
zZ&!ABTg<_%=g`O?Rq<ro8|o7h6Z3(0QEXw=1?=#;FLYlOn5^{luv$D3r6?qGFm&hR
z<3Dj$CwshXIUs5ZyO)>kg*3^72c6_S`8aY@7xZJ#pEv%)%u0QH|Ni~?n8}l^&CTP8
zy!cmv*ML}`yb)PC*XHTo-n$VI*!J~9&uoDiQzT!g#kvHgB@^^;FrbbO4|<unsp!)u
zBRN{qW73ZUJ&EgySw6*zmoJ6L5_0b_?mz~?aIxRf(T!6+j)E`DCvt}jeBmuotEi`<
zfC3gV+?yWycsSw%=p*!fvQ)HSFI%<hpE!pF0GLP>z%|dZ*9bH2(X;0!Ff}A;Xqtia
zKsK}%Q;#1Ba5_6gTl+ibmKzrF7A3U_y?x*d(F0F|C*|MSj#mbf=M?+^y}`rXPfH_o
zFQvRgNaGtnnt`1YCVT_SW}$G7>^Iue1Wk^jSx`_=@%J{(e!u@qo5KC>qukty6j<|a
zVsJ4hRDi~)tNZAX<8y6-!-8QaavAlV_a$_tmfV8?S<BA-d)9}KA4~eg*zq<=ZHIqm
zBYO3jqN$nv{Q0rD(*}7|)Y3FkPaC1Ty9CUgJKDQ#;NU@n?!ffSn@Zy|P5+sXhynO!
z@cbbmk5~46OdOS-zL(www}yJMZVK3f#^k@(gktNgVm$!EeF?`6NCXP-C7^39n>X8b
z{=|u$_liWj8@-V9FH<={j+5HYq}{i}{$eLA?>GikWYo__9bl5Pcfk>26EXw?`D(y+
z0M?~%{~~zd!m0&N+T?^cqWm8H`AfI%-EFU~drf7NH~Fy0N}aG-M2E~B#d8WKypz87
zL)F6{G#zpkyLW%O214-HM-Mw6M(}Nnt(h`-I0cKe`o6G7xp3JxAlCs@)rG-^gZrUB
z_~KLc3CkToCoQOY?sFOW!`3!LN9|s1w9ldYIj{*JuPprdikbwRf{aNQIj8uR(FbT-
z!|2QiG^}t<#OnghjQWlG5tl$!*|spJ!`_~#^AdD=2KdH~Gb1u)QJ~tO@}}?BrFLrr
z){XZjx-HnuUfsG=<*uXR8{G#&kWJh`!ZtRa*%p8v0OW_4uoh-E!;YLiJL1dU-{p=%
zW{r;@f5<QKboYrJ{f-~EGB=+QM>YO_K?3l#v-YrIdj@~Mg7^ScB*HARf<QX4AHL4^
z4i4^HJ>Dlc*ygrXr>4VKnhhF8usZasFM2f94~G`Bc|l)Kyr9OS{<6^@=+WFcDwi@b
zcSAcc6mivUqu@6a@s1fIeJQ)1JTX?;==l^hzDXCLE09G4MK0$MUOi=HE?TVURGq5+
zTXs9oTWkw~g0OivO~Sx&X=r58(22wWuJi2IyYxl@fL+MD34%}0tq2GcvP{XHjEyT;
zIMH=ZOu%QZ*fXoYLOox_D}DRfwdy9sJ3w4o7ReEayhKfncqzL;rDXn=&6}~I1UpyQ
zyjlzSD1t!}x$ob<v*W_p2}=e>MMu-HT?r2l_~ht4A$sTS4abcGNb}1hmTQ8x_TJ<d
zPoIjm^t_w=KI7{56&JPW@?QX}k1G`N??gl3<HJXc@bmSB!7L^Mz`W7(N=b2}L`0uS
z%==OL;7YeV+eMu**3^t++xhgJoOkEWDTJ=c0U-Er=0bYMpDRG0?)Tr@D^H&`Z7ER%
zD+C~<DAyA3c{4Jv{2~bx1&ayLOE76Uf2VaJ$<UlW_O_gI$P_m^{K3%>DMLY;f_7dW
zN^#Ltv+z3%@Zzj()xnBDC=P<6aUy1aW#>+vE>MZZlj?ba<<X@kN`Md>*~zRMl{%6n
z(CU7gJ{v&&skL;{Llg`pzbOnOVME~=x7Ah-9x~+a%a@IK3qi|x_edyMl0BD|6lLwk
z>pod?!7b2a$&f6<)(b8xPM_QUtzzoiz2g$eubz}WB1<OEz#GdlAi?RG479>c_^Vs1
zW*FmDC}M|qD<uEYf(i&jwnK;gkjAKd5u&Y6$fst`!6c!9YkRFh$E;}2sRlXETa;Jv
z$|Sl*e~%)!>qwx$glkxrcx=6}3e+k{p@`gF`WRk*_KY0@QE`QX1A{Ak$#nw!{2*xw
znGX{0tvYVh;Q5i*16uDpOq2P+&5aF{U*Hl}e0uod#@3UOWD{zP_actPmUs9%a2Xwj
z4i3*p<@^kT{~-3YKox~=gkC{ujsWQWyLT=~FzDS!D1gRX(E>o$C;HbogU;*M+W}MJ
zrWmht4LYb!2=ag9Fy9~r-XqHTCvggJ(%_+8^q`KjCnoaZSe14ycjCo@CU5aqJ$;@E
z3Gkh$XxvQ)5}@ABb8tv}dX0a?7L1G(qsFO}(cCvlc!?NZr{%`qEG;aKUcdew<JVT1
zjm`-m)E0_p^mP$qFgUFf`ZGa6LZkr?&3)*9=}Cb?bnC#~gEmXpf#J7J+PsmyfPOw+
z544#gPZvbFnDj%XBANn)peL}VR5Y+6RC=K<A)QN3ai1A%BS$(STP$taB5vo0Uu2L~
zAHa2|YqCY(_fBKCQQbwVe)n8!Dz{qrDda48wX@|WZmx=?S?%!Q&KsW*RuH(Wbk)+<
zjyQd~vmPXA?o<8BA8XKGP)03v10tAg5T-ci=O3Tk_W}omgvl_xz-hv9q=a^zyOH*K
z9fw2oIr2_Kb2{*&v_BjGF0(E4mpxRybT~39N{s1!SY=ER2x<xFHC2QV)z=A}9dM&d
z?M)yffT*aNIXINruf!!UIJ0nScmd)#P_8n2Ijx^?oL$V`%_u0?4v6=#xx_=^+G>)O
zvB<REv0)>e%L+#e2_EvDhQ-LYFsn*8yZ|YndN4F+3tLbCx^B@f7B#Ma&hOaPdk8@S
zwnI7+yo>qm|B%%DVB$Q~!=f*>Wa%W$i(h6W&ZCPcREe@v-%)?KKP)2Qe)17rZQ*ur
zok+Flbr!e$G%8*+5y4$wxrb9ikt&C2cFgyAc)0K3K|_beT3q_ez?AV7Pe2XcN5?=`
zI0ktUvM^Sdz9Et?NP;y$G4pZ`7i~4aH~Wn!>1K@=KmwcIH){<MmDz11L_mrBw%7Bx
z^kg%L;)q3$yJ>0Ob<bZD%X=K8Z2<pp<mjXk_aaFwBNIsF%gg8H1ihf_3@!m_bb69#
zU?g@+NT?;WggNtVYckY~ID>f503i+;7dc(6att&0+}C>fj|j`Wv;zq!W`~|yD?O4^
zHQ-(ts!%0Y!orldtc168!ST#nY+TlXCu}k7{c<1b;o?eO52+LV1EZNUp=oNyZP*LS
z^UsVGGO5w_db63{i917bPFNrNMRoUumK}=jx^ZA_QIYs6aD%SBd*?$TEHxwfrQS$1
z5NUtW>{==G3AXx7pWgb_c4$pt7pcOMZX3#N`cX%lw_N&PE2I_pLlZ}HGc%|aQ%CxB
z(Gvs${0eqY9Z3O|uDC=L%g9gmlq2HM%>L#ZavWmstegB;3Ske0uPUX$9Xp!E)oVj%
zAaCiU2jMasDE7kR*3f2s<|fg?K}0iQqnLSxV+NV|n^c1DkW(hAhYbSJbV*9~q`r>A
zS|W^)6WecNG%k#ysmOXxJP~XKP+kDbi}~Sf!ysg@8rFCb2N6IA1-+n&F&Pmez55ss
zYA;r6<}Bq=vHSx(09$gdcKmJ0gR|#<f|e59Y4Yvc!>>IzU-JsLM0xjQ9#)2veeSCe
z`PsZT90s8MbFT#(kOAGH`vha3X*O;cS#IK%8Xx<|$HpI+o3#AyC3-ZF<48=Ll&h}%
zj6$Nyl`%1}k&}{ee-pMGN}-Bue=-InnJ%=%yj+O>`x{o#jCI1)@hA-im~NG6^>KP<
zYfU~90869dDP&|2MHo+fB0Ud9>U4p0LhnZqXRwrV$|N`sC+9@7eATQH!{Y>9TRlLn
zcw^aPf}O}oc6#^OFC{Y;_H@RKuT9zZ-9KsUk1l$0QT`q;R(*Dzq@`vJv;)F-LO)U<
zL<G7R_1xW^<wa*{#P$hbWH>|By61-gg3hsc_9FNs0(p3;GBCEZufFLaKR-?Aa~HOZ
zxpw_Jy@31e36P$?^lD9Jw3{~pB(%cb-XKSVrof24%B!5f!0xY)g#2=CL|x4SP0(`Z
z>!(glU)^tq?s=>~0TkPXVFa_^-VkSkONEt3Dg9&~F~Bl6ov%Es$3eJ(7j#S<2iM}{
zATj|WDSc^7<^1&2CUx9w$Xg9ePS(jzMuNfm)>TTBL~l`F2~GZvioeXUdD3nqSp=<^
z%leI-Fu@fZ@Pxyv-W}ilf32N)K#lnu_Ot$CEXg)1RLa(dDQl5ZDpFFB6e5{}7LzDT
zQHc_2v?(M-t5k|2JJEttmMk%iRKm0(;{7~jd*8p`^A9sRr{_G+_j`Zu`?{|Cy1DKq
zqa9Ep)$5I&oyUc2nJdni+Y>w?A&`HSe~xzWq)V4Ha!r;#aZH`l$s_MDH!Ne%r5Dbq
zfF`A_83RPbv>pk$S+WvXK<(F(+~4V!luv51vuv(UUMWmr4vKHJ^5sCzuD8rQ;^vy`
z>0PJV6qiF&7OHZEGxO3V?Zl!N&ef-%i%4ybGf4HZqQcQIM?E^X_o*&z{qKct=*(&<
zpP0?IxR@|GH9~~hi|Ol)c4%|cYzO-iMQDSKccZkpRwdJ4heje<H$`*h&~qn_9s2{6
zGEwEvAxKIE(=aFq&0%Vqno%e96Gmg2WxH@FT7uO>Di;so>*Vg){PoM$(8I#vTy<bl
zNZsS-&zI$_OeG?-F&{dDRN1{6etg%iU05e13IjTd&pZ1=F(f36DVq)<p83!H^%1H6
zN*XR0k5D)*k6gDp*<-u5_Sf>`ot(3u!1wRc();QQx)U#-XB;4NV(`b?<{%NS=Wbl|
z4j-yeWKMp9|K~z8vxb%yM;(hh9e`-`_(-kI6U*Y0lQlQDB*!{(g}6t|x3nB&trq>o
zd2*B>vTdR*H+%2iK5Y$j4h(q1P0>;FIKSm%y6W<~0ZH6yIQXE_z>hNTICUQ8sZX4E
z{PpwnDAXU(qPPBmepg>`3NNjbC8#!yX_4=9V8@Qm3l}aduH={}35_jB>Ah^oa%RC4
z&Nv{dj>+O^Tobd;bJD7x_54Ufvl|XXqH5oXY1Rg>tE;zwqMLt0$1}&!u-~+K;Otm*
zpFFAhmqYww_tvH{Hcpw8v%w`F#N|j6(`|Hw$&7%s`O2na^RHd=5mB1!n+>0S#N<s{
z9Nr;Pwk+EtcTSYYWM|I>0ddW})$08EzDiEfHtD$RTY@P9pPKuhie=zNHIj=-lft%r
z1b~uCwN6D8AFtj7#tH~^-$fm<G8)wRZwNP_(?+#5@7~?naw}Q&QFt50s%zv+2YvEX
zTHES$i-*+uXv9TI=$vr%<l|Ajxf`iAhAff)Q<5HN15aH&T9Rj3ScHfw@bi|t7ohku
zxTNN`&wf68XV2M=LRi>%+-^|F`~?eEykls~K<mJfIDw(`QShOP!aTcd{KSrcAm*Qv
zB1~S3ccYbyk9_Dzfh6y<=lAhCr+cl-t;Oyww%a<7kG>JZ7WdArCPXRz)eGvY>8%_6
zk9O|AUm!1X&3*)|akp<wfW4E`(sgsRMtZ31l~_-JuSy^Y-fNzooRXrb_0K%<ArNm*
zSGmU=E`hZ*R9Z|xj+Fu;q$-FR$`3J7i2Jta27sql8IGV|KGcucJkHemmuF6o!Q46*
z%InrCPF2tD%`I%$A3W$Hy)xo*f_^32RjJY4wRmfCI321fadC=|EmmqjcvEoaPFSfh
z)6cxeC6sBx(1B^6NcwVYR;;I^vVtQQ259t(v&rE-cGLxdaqForjD2SdCull)z?-{*
z%<W1Nn`g;MrAWRLhi<q;4EDZ|KT;c)h25Y=SJ%);Xd&0XUgeE2cD%Ck9(SK@b5`7V
z)mRfN!e^3GGu?I7*WGN67|+RNrKJx&dxZ~{EOJk&+@hFgAT^_9#sIR9)(7UA!`_kA
z^p+eziX7Bb@OzHr6gdIuSpHAYV7Q?5M-swc{z>xmaM~Z!c1<58D<O`s?aHf0K*}1F
zn|YVMJ>1oWfgZr=x;i?uKEWH?WUu#?kk6VZ$_+mKd7k*uuyic{6jTo13)sHFs(zW{
z^!vya$SwPr+w?Hx5M6YeSx(-L3_979-MLUEi|?xJ&8>sB+9?7)N?#adZ{;Iw?Z<W*
zPH~r)j9MNVD3)z%;ri|Oi;1N#Q`NN4RU5Ti#csBE4Fl|beY-VBwF(+lRhz{sFGfOM
zp~HjV#i?Mz><=*dIYnlBgY00v$1Ggb9XAe6O^=Ta_KXsy?xczSq2_$U_kI$RLYaLn
zG|N78tNne)wVO&RR+12o$>X|v_2}`Dw1u)x=nFM7lh4v$#e&h(^Q~@82OAJ7%(qV>
zuwmu#fp{3W+hh|l1Xjo1o<^7|65lnS<qiY`GP8j-wX`S-m;y++1auZTIkE3v3yp@c
zv9w^-p6N#WcYm9WN97s|>_ZP8G#b1?C_?X?rw4lFaQ|mlggru7Q$7@t5J62>cKg1|
zh2Rwmfx|xy?<p5cF2!n!E(b<yFv@orRa9Z=vq8tvhizP%H}`sSk*;Tg;utlx!JqW=
zIe0Ne7MJ6MbVyj<?urTY;|-1Yv9;Cg>mOLQG$BSz+#ueo*T40f00-+n?JN5qx;MiU
z)y;~b)0=GJ0k>8I!MR4B?5xxyqf298O!fIiY1H_LOXD+J*-1d`-1NmeHvw_8S!Rik
zQBlD(&MrZwIMG7M@I-il7ds(1r@o!X0mOL4@ky4)E)H(kYSq2dBiSFiih~NFfpu{S
zmeZ)*X}yxr!C#&zT>(Hm{*GC<k!WH8C6)g20d(YGD%Ev=*(4a=KRx#zlHKm!x}=~|
zkS5SXFHwMMT~FUDi?^O`9WkJ1#F&D*AcF;SDIr@wePYgK%-*E^z#OzVuC>vRKgYGR
zump>a)vLk0cIC$CuIoK?Y7<Eg#X6@es1;}!Ga<z@ylIMIHUK!^p{<Vre5Q0awFY1S
z-wD3G*xDK|^j#8WixwFSPp;e;YPD!8h!N+A+0L<9UuM}<DSgzxB6yuDhs>l<C>PUM
zEQ&IS&<M|7;;7}<IAhVs;Z+ruC3DLIeV~Xu4km<GR7l-B7%?=_qUJWo;m9)_Lg|Ha
z-}X#8jqP*>$J}?5A2EV-BgrC4>#wR_ax1CH^7DJ=Ues!gc#+f8?==NmT-N1&uPGB~
z>+#u7hS-W3?8HyuO*=P%yCvQ*&Z(}m)-jklv(uri1xr+|+nqP&Jj^?4@8FQJvLZcs
zwPA+a04b?jW}ycK$r&pcukMtXp#6gzQ#Y&|D6^)Cr-k<ANd5(oF1uA3<Qb@b13p*u
zuCTvU_&nJ~&P?_7337WxzFR)Es5A@HdZ=S)a)$FLd`y?gu%SbXCd^yARyici!O?ME
zs!9pRe)z!OR@$yeIfoz5Dup_$2PK~`VVEXJ>CMjp38EQ14N%4w+A9pGBg?ocwZ03{
zf63|9kQ!M#citc^j(8k*D}eSpHU>*(BcKU*1t!f5@<KHf$@mgVBGk@Y37~|lXK3$I
zslGY-%0cqGkF-rIkV&)*Pk3`Wr*L6IU~Ev5i@g2qg%c_w%0(ZR?kiIw)HY9AF#eBX
zo`(=>&6CcbBY{SZ4#k*ko4eRHts`R+8<(AvWA^Bbxs4Yn?!6O2o9=-F*IqbNUmQR6
zVE{TsAIArathZaGc()y0V^Jn0IWj_beA0|@l?ek|);`Zk9xC*=ku#RcXTvWbZ=v)e
z(fi}rq^VPL%CCNwo&EC&bn54K)rA$(^Dk1XiK?nX|4L~B+2gQ%5BP<sd`n+S77kRc
zx^cf*$iZD}Q>ebtciT&kl9%5h5)SvKWbTN+zmbK-z~*$UgX8+R<cfe=x#Net3SL3g
z8v?@|@>pYU-%NfoXThxOe)+d=bFR7Iw(fTowW8D3*k@*dT(hy*Zt?TEQh1>a<CEGk
zy{6dR&y9CE<5A-WCoOGpV%Dk+<f+nz3-Y4;Us||)j+D=<iL-S`L=!h&&3uJ|UB%7H
zda^Jham*A+fB&w^;rZKNh-$~%&!{_fZQmMRPL=|z-(1@)Fy1%mNhUDYsNdu0?ynOS
z6@~Ku=uL@%e%aZ^fsrBOC!JY-|8hvDzeca>RoFu1&0e<(ODeU|*S|qCtB%S(X`H<N
z_rC}BN;CHVs(}F28KtPGr>hHQDDA&jPm?)IWR#KRYsQQoz3cWWoR;K$Xuj>cL3vSp
zQqr6=5&LciSX9<74`fXvkD8Z>0hQoq-e~IDLUc>1wqkD(fm_|%DAlS)g`@)RhGuZ&
zp%j2AE-i?Okq_NaCiTvF*)rLuwwyx!jdL0AW6jO>@Zc%slT=Wqr(RkHd7-T_S*A~0
zo0)hYKVAFcv=v_z1`iwvhFfvl79z#5V97vl!>W%)Z-Wc~#+Lo*xIX379kG~)Urld*
zJ>+lyMPu%|W1`cdPcwz%<^5cUB>fqR4fU0?g>#?6HOQ%5{>B~GfS?$ZS%Z2i7r!V<
za07ABSz*b^tpr=?xi@v#CQ>(d_p*mYmo9lZW`t#=+~2OXH2a3HUDcInK&*$GL`(j2
z660n>&nUpbcE3lG#L}|k3%^CWyPE*6DO9BXcsStZwQDOeh%%oBO<lf93l+(fDOSeD
z>%agv$Q+5dc2&9a*g=PM#%53qd8DL(r6Lzf5Bxhk9QJRNjsaCbxP@2*zE3r7B2nVn
z!KjmBq)=xCx0asWHKxt@WPP8D(8(fn*Z7Tx<o;D@Zfbgpxsf>3KnY@lg-y$nw0bB!
z)86##tg_#wUx3&C?VQ`UZY@{yoKy6>vTm`SLq>Xfb<d&+f4g4@-mI{Gre~Ys(^Xy~
z(dUEAEiYbItXbgUpZKD9IJN4j&$}Pgdf#;M_|q%GNLTk5Ijy-MRI7XW3ItY<$9Nk(
zQ-rr>$Q6$4>N9wMZ+GwM`%SH+Ed|scd!)yS+NY8_<izxEQa3n~pPaorU{AJ1pSGxr
z3b39i03@`xZJS>32xo-W9&TD%xd1f*fqvQfv7<qGk39xww^*i7G2sV;f9cE`)Z6CX
zcZBN*kyu~<kDks=bRrSmM%dqD3U$t*{rfMK{EZL@Zhmjris?`8*xm~o`@hkKKrijO
zgxKkYQ+?}(2TDw!yB`!IkWSEY7x=)$%VzsBZs^Ueacbad7u|+lC{767kiEI*wU_JZ
zVob280_1-L@VoX5?;~wsJWkeyO46Hs{{AuLfPks*3U2vQYmq3H4HEClU9+$G{H1Mk
zsKCaN-W)9#2ETsskR3N}f9tWMBjwXpMyA$|2+lcn@r%!f?(yr^&-gUl2(gD&97Edu
zr`wpC%-7KTbGiZb>*j4!{_c=zK<6gt6Z{%C&M(9Lzhs|nFPX{v=UIGHVXPhpn1Y`0
zXgR)yTfTgDCw&L}G`>)B<xGk6gq7k?Pr8IWC%<qNX8kE^!C6_|F8QsSk3{PW+u}{(
zPp?UecZF7E+U&ZvH}h^J_qmi@Y;AnZ=I)oNKXaoCHawfS;kMWvo8f;Rvf0QXyG##Q
z2rN9I1>9-T`fQSb*W0E5%I6#k3(G6{LrE#%rShSz@EA%7cfkH@B#*j!ronNNAB)QY
z0VcWm+e*N+A82yR*_5bISeQcS$Y@%5@s@xOWj;rV8Y&8^+h{VM2t*QYq$0y{bMJL?
zGZUa=NNdPlm9Nk2A%|eoeEceSfT}C5BSy8EltSk`@@r+dZnYcP`Q}$Z*Zp)5ivX7?
zGzYbBhz)t4w~AS;wKf+J+XcZ23JRwNsO{dfC)V@PI2b7Vm$hpun+I47MYUDhqEgsb
z{?8pLE^cwR*d#Y2@-JWBzU{z20?1sd0&Joxtrm8%_1g)%avXV`hf*XbgCO{X{D9O(
zR&Ta;nLmV`TF#R?P@YADa%YgRI#dW#%OE0@ucoW5UJ$T?jB>DHJ#vRI`^!fp8lGS7
zlK9WgSciSD_o_zB6+b%Y#dXp1%;aCRaL*r8|IbZbCP+hBr#Lx~rrTE>G-|y}r=fl(
zTrw%gb+`WFT|rfoKE0f}@$FoPYgh@)EeZXHMQdzg5~gmTuixEb#C@V;c95k8NL=*7
zVNeFuk|$!Sb4zAr9IRef0n-ULGP>1PHOzX&@nwh*Y6@@TLu#lfK|j&EC)ro0o0E;l
z>*Hk|tFxQMUlMD?8u0*6=1~!53lCmv_Q|UxyH=h){jkJ@zpCaUIEe5A&GL?njHFo#
zjqxJOwFv=2A3^YKSne<I5<Uzp2%$1b+w&LtERf$RQ>T8R9cY4|%530f`uDn(A@&N6
z)o6l%PusF@G^-1U<3u?Dec7#^=pMHrZj-x4jhgG9vbHhg$%uq=v?ktd<bkAK6J`>7
z`sgfA*_o1<7_5Ge<^WGm&qTzzns8#>0}}Tl5~_ByvKrD@%2=Mez)VcxHsAc4);Y;r
zzKdc%-w>9?^9Unr>&Oe&;6TF9nUoL)6C(U2O7JRf$(j7^AZb1UmE&5!Ljbp@toM<a
z0AGm0Nl9JxI`Y(k0+JQ$7_bO0N$Fg>3>=SI#<R}b5J07!;2x{NU1bVI$ic~T^5DAj
zB~3s=Qd8CB09gdP#=82Od$QG@Kr$(AIEUGwRyVP(j|3MM;q_l&<YX6lo2CPa-4?ys
z-I5ayF$_SSkcCgv!zXvyG@}$0c3Cb@R)HfGy0+F0+jj;)y}0v9>Ln`n<wJb7y%h`(
zT(i5S2^-S$G>>wZO6msy8`GK$Y7<w7a`L#EtkqYdv}Hf=>>~bj2u9UdQg9au+5na9
zmtHmI=H?a@IOtc<*(0@9m=RF$C@+F5d)m_6OxqrmHD_dgQIY-d6TiZfxN<|NYHah#
zp~rJ+nq9Y$@lzm@DG(pnpQeRQ5rIrzB~Aju=!d#POz6H=H3&$TxOg6k5_(QNa)D$@
z#5t2;vKHYU?&c=IAZwnargTzA;YCVs9$D}bUz+)@YqHSP(?cS4QAmKA?u-j7U}LH5
z%j^H9rR9xvt#v|D(mCkImhtxOQGKczvZt)9<K-~KG5v4ygc)+C8`d{0n85`QXiRa_
zGZ{*{{mjA{dfv`c`SqB@sS`9b;vOTmah*0}#*xG&@{5b&U{72dT$zPIPf=zc*bUHG
zjd`aK7Y>-P0AER8k3F&67YGZUO4-!9$7l9=wCFN52AeTexo<(Jv>3K1LEqhdO6DF-
zKv!S=QfAIi7Sw#^p9scC|6;ZR^9+)Z(9UF+OlHtn%XnJmEK_aUh!-OIg9<nXYy6IE
zd{d50Az$(iK*cZ_8Re<lEG)`|#I#KgQD=B|)`+FVv*RN$q5j>bEvyEjz|KkP=5Ifc
z@8^;C5ep%kY>h)nN(S+-##xXhmTgGl^;eCQL0gbLpm#x<gfIhu4(3GgHph9C`Brbk
zSb9Sa4RRykaAounqx`kBu%I*)_+hMyxIxOF!tXs2*u`ZR2a)q53kMx+XG=)B-@kuv
zf{{q$M?mh06YoP0Qjse9kX<#i@dph(3QyQ%wA$2kKiXg{L5|!}V=e97OAS$vJ{Z3t
z)5;T$xXl8w#BaEPy{7Sz>1`bvfRk{|MMb$pCm4z&m^$O=(BeWuK55w{u|&bGiBN$Y
zNKxpOP4q8#$!y1EP@ZhOB$vS-SdXiAo{a5zaQ#gC){<#Am!b(-YP?7vZq@wd3Zua6
zQ^+?+Z!NJg0SN#bV%5^_jdu~zJv1sRIVJ`+_M)IxwfBKPzqby-aO!&_4+J!^o{wE9
zL@<4PLd({vQ~U3{Vm~kjVigto64i|`#2S6<nHG&zG3U0<P0lLrz6|E^p`n0**duTT
z2o^oyNms7ukT%i03wG7g$^LNazrzflGK|MBf7$V>8}R-x@bEZ*8612n+&V%vYOIv9
za4Kw}Rd(1g9v})8WhJG``b{7=JiTVfy!h#K<6E6|UaqTeF<Ur!zV4XZp;O2&D8R=I
zvDvJ+GXF2V;Kz$E9zoCF@ZWz7GM=(8Pf1P9lMkhxFo(cTjz*(#+LDEP?*+uH8r#P&
z17A(@9UTK5ogGO@YYYqwY;A|_%fl;-U~54M(;hZ?5`eoav*SBo&&vZq0Ta+Qf3&PU
zWQu)QEHv+tb2k-0RhrF7Jw;g!1=L@M6^#4H>z6N4n88ax&C5s&%}<Nb&n5o%2A(<h
z{CSa#GejFz6+AzvtpPs3te1j<-}>}%WBSbJ597-m2s*)*H)}R=V6YL-0_Z|d!`f1N
ziTZ5=5kPT2Np2-xu!7^}gRK(nmC%dA%KE57hu$MLIdEW>N^u@8t1L4L^Oz~uWM>=o
zK5z29UvSF^9Jhm6DhUbhEQhImIGL|EY+*pr<Pfu}>gsUX+_FqyEow@Y=7X5SiXAKG
zAr6cjn~$G)RB*6-O&zg<Of+IPq&D$e(Ow)P62nC<*i^lF9A1egCTa=_KK8{(OZVgt
zkBL2gT%ZnB>lX!5zx(;k#w$9rd_Tfc2))9B0%^KXv}G~)%b}~n#_n%DI^|i^9IdL0
z9m3GAW?-I6Et=*4oQaG@b>gvjm_l-O1kH!l|1`^7fWoo#g3Vm8R`R=npSr-qp^&Sp
zt5eQN+LU=Nud*Kg(hWscS}~Kep~dD?c0Nmpazoe$-8laZ%N0PYL~+xhs3>~qN4s6Z
z*?5f7B7rbEcP?NUQ>O<#{W4dICsz%<Q0-E?W=<w`GQ(dL$^j^1ZdeE|KwR?$n7_KG
z?11p*k;33utc(2LSiRqDVU5WHExUdXgKzQG31mEf+-&3BMD$m>)+{MUOTbA5rZBc<
zF`2_Ne74A;VtXWKHCj9!k-e>L>YO6s=JSb`t-pukf>&2rIbyL*czf=E5_ugR3nZc`
zZh}S(A)lml8GI*Eu@Y=)|9;u2Bbx`(s!jL8JS{yvaTn&ird%>U`p#nU;)B(N`VeR>
zBwgXNx#h(Bk6SLReg)!*w}freS#8;eWUvsEvrJqj%g}a(9%%QMI8Hw4L4))&U(#o^
z@^}m?DmKvFBS{Alb&ycn<U0-5%dbHJi~My(NnfQ~__CuFoG1S1)bcJF`qSFCmi7Wy
zRCfgQ{yKscE3GJce)p;c+SIm%{?o~yz8**2;zG%1=<up2@(d3j)(9Fstrx?tqK_SG
z1c9%bXm95S2{h!7o#prS4^W9^9vAd4s5=&vm@)taU4e4Ff&74;2tHB4%`85&ZZzvr
z@R-C-CAJ?8I&+=mXhw^LA;F!esxeoc?1xZtE+;2FuaWbC=^ff;nrwG;Rs!UaS-5bF
zQ!|PUt3hp)yWtU+N!K2O_vpQ!9)pG0G9U+`%iArgwGWJ1iM_WTm>Uy(bW0wk4r@E%
zjQOjFmgNAm$Zu!$bL$5zYo4*$kff5emA2Mk3PgFXo|WLySY=E<1$z>ga(Ey?LYtPL
zH{lNr4Zzm95Qn^wd{9`+&04td4EZIbqyR`AK5UBv`@{G8vu2qZo+icyjcjK86oO?&
z=nzT}<jmI7qfSkTj`q6xf{Cy1Ys=OUwZUkWolqygZ)_w^G3*NN<=^$$U_e|LDh=v4
zq|HWi=KS5@-B(H-=YeXNM3O3FL&F#Av#ECIx0V72#{d9Z!fPW>S{yriG>syMXm3jn
z#epzwTI8Kql!llRBh1Oabt{1j=S$al6XnsHJ<iJ;HDbgH`lvMSKUrta7i0k)K5(EE
zp^TH0Q`%Pigvs3A3ld$mrDy`>7~26mPyT>qRjElPK}taWgUtfNGR~YiLeQa;h!T(*
zNNG&7rJOKQoFf_45Jm&k8KK`{SiUCTfYA}c$d&w~oCnS{ilgae+X7#rCvwhS!byly
z3P(MZQo^~=Y#BE{?4!|zpwg#wq$3C3O7}fKO$tZb0hCudSslC)CtmQnLV^z)bu4WM
zL=Tb|bNS?;p!wwa$a<IrlCVF%HlEu_+!tEyhxYHU>l>St^odS0Y?Pi|zC5$e8Z;9z
ze)aR`&bV$P(W7-VF(Cn?X%Rd$zlc+6-Sd62OG^sP)fuEh=89ylfwYA9Zf@_&8IHgV
zCV;FfN=sV0<FJdq%vh7HAk&~xJi_3nrC*#-%$MMbK(Zl(P3{5Rv7*ND_{O}u@QGjK
zh@P4IRnm90qvJNz#Oy2{@f%1%4hZUaPB&?o3wCI@-Y&)K8Tjd~(gdkMMaxkF)?0v{
ze5A?YC6%%b|GaoH9y3{7XOZgC;gN<!1UQNyM<Rh&TY6erg5~Zm|NfTwy-_aO_GVg(
zih8fUefy3*dY8GzB$EDpfJUBM`;~XpJ^yLUd}D2TK$Pi3<Q^#9SACn={R`{P8g=jZ
z&NLSwiaC#&%RY%KFPyvg9hO|}{QaMVKc&=uz)@mi00f8&WqkyvK=g{mFMj<=b=yRL
zEZe@l2HYWi<yjTa=YM$pP7Oh0X#2lKpZssBwAkwP4@aq%{!sjT96fn*o<Lt=QXsSw
zV^UD_qJES4G55wQp=VZjMZc{cdZzko9W8S6$SKT8`UB#mf8^QGwx)9=J8zFZecHS@
zP560rE&L74z1t>f3I8P~W=u>NR)%ELti3V#>=M<o=uxU^zcdEZ-4ZEUrXtuUXm@XN
z@~HN-?6_ui8=|K9G3uzapi7hN5PAzMjHxjJ0l#g%i<Q;Xvz*u6ZgdZn$sMU{vcxW7
zqQSWKUrOCsBuGD5Ss)MeyPohAK2oHjp%DVSTV|AoKb-I?6=;MqG{~0U+LjYpwaQNq
zP?&pP>u4tL_(8D}T3DOd_Dr_FdgaQ1Z~fC=GQUen5%079yjKMbzQC2Pe@XPW>_K68
z#K#8TIBC(HZy(YAhq@}5aH-lR8mVH0erw_N?=dn-pZ(<c3@=d<y1nb^zXnScm*b>d
z`EK_QDXH+&UN;o!OcK#2HTqkpvzU8L#l;zAC_T5^jp!t{|6h_CbMM3H3coaR@kZ@R
zov+6oNHxDdTWwqHRTA`>g3<oA_9iIIu|soD1e=ad{<=x{ZQozoW7(iY2CcAyvSPZ*
zU(w6yA2XsuE4<&^-@hjg+ax1!KboFj(EeK#_v<9~c{uMP03nb?NKbCF>d0}^AMB^_
z+0p$V4zMf<qhciq4(b@{A-1$P>ifjc>uhbGAy6AIl*v>Zh^Nrk3O<5=_l;3q|DVq(
zhWtuSOvI6HzN>7<Rj>bxc{a?k)*(LW(q%S~kGb^q#XtWve5hZcbCW(jBKpH=BmS=o
z>UgVI?IF|Ab@x*qb7Dd1>FDYf6%`E}+K=~>(&MEwK*N~S{lUYf*`4gZ_YHn~D}Q)7
zk--L^J2y=ZDdXEm8MB35``Hun%3Q-*bTF}>=tn2v&o^o7($Fq2QS{o&{Y%{BoSg4E
zOH52*;zT!ca-E|>Apj8$i<Vli^1Xfj=Lhh&-ZO1%wt_^NZze8w-maZij~isy&KzHf
z2i}1C#2Mx){@}`fd8b$R%BrgSbSLQ;Ao&J55N`RF*UWwz!cidJF@`0i!N$luNA;Jt
zefz6+7lc@+GBW!2^yMhy7+J?02o{HzlQ|R(gC{`ec)r~5oqdLmeJMTv#~qiF%98xK
z&pw3G18^Jtv4okq`DrE;v#j)HcNMFM;k@Q7#V}t&XAtIETWeK*u5I;GbWb7E8xJW`
zy#43Zd0oM(8DG)u5_H&P(AKKw*M*Pb?g@4>J`$WpWWV=obAQ|rubqu7@gmN6&JxlU
zmZquecN~omj{cp91oF!n<0HZ0Pj)tTs=U~TEPQvrw5xo%#sBNp4KtMowQqj;*n7a$
z6!MZf^lWHpYHrdz{C(@RU+(ql$7kMgrpGgVAqmB1!oy8s&mX%`MwpnGBnlF!_i%Js
zBYuM8QuAnKBk5bQcI{koRBB5}65ZXiW4wP^i`T>1F(fNJ<k*drgkY&=ET{jPH=_Y0
zWuf@%A&0>vvF7jP5<gBHZEq2>U4WO9$ByZW?*@{f4}h-Kj?Z4bnpROh@4F3wc0Gfv
zXE@xJ(J`>HdW49X=^MwZcZoe;Gl<c5=;z@~b%eR}B-|>GC;xI!NPyhPj!7|f3>d{g
z0l|d~94ZWp)4rNb){g*N@EsY@^SfJx*ACh>+NdiaLPq&OOyGiuFk;Nq(PAH_3KTJD
zBng<01Y&+_$uUX=;rdC~1g>)5`TgXT^`%?`{-*gb1_>KTFiybaNnncRu1kc6(VWCe
zg?b{KpVOA*%IXM9WN;l<#@60JImJlhDL8vFUqn^{x?gG9w9Sl(n&7|~2J;10Ry7PA
zXBsbRL-7bCBINDpnN|*y_yLPX|4u6-;O9PO2%>!%Glog*$LT9+PalJ0bcHPuKbUMr
zXl<fcZ5DKdQR7#1|5D$vTeQVd98yS-gKu+nRhLu17#;l<Zc&g!{(X9j9X!w1!zGtg
zb%C0YuGT#q52Bs3C&5Q0Q23s_w6`PE5k@4EHO^Oq2oZpDz>DkpLM|Y?l%^BbBeG_$
zQQik>Bgl2T2}4H+@X~+98Oy=~IP#Go<D-J9ysRg-Kf-kMc_0P$0(Eo`Ir@elQ_ryy
zUr(R#BXiKcOnHON3y#4<L=ifKEqamYTv)-v9xzmj3-FRb^y~;r$H5q9OKT98F*e*J
z|G*ACb#$=@OdZ>f=7RVz$fBp|_5qa9cE>t<jih{=^z7L)O0XDPZV4lDn%`9{RrUTE
z?4^9EgJBRFLF-Bj=%{micxq-^JD6EIA0C`cmBLa*LR?&qL<+v!8k`J-uH)&5iLEZ>
z?$JAkR?#GvF}nZ+CEP9!jMRsh#G(xWUU=|#s6(qYBKR8$j5E{;4LMzZ+=J+}=k=Qe
zcP;38aXDaDd}B<7h>tW(LcA-^B7#pb9hTgxcyEG#b3+4)-e|iO9jjoq4#P2Xp=oIj
zFjHe!&IUPR&n>^Y6QdL*b#<}Td%AYMOfUl%?$5AQD=WjH>bQMDWWe~3saW&V;zcS9
zH%}IV@nOwxQS_!@gAZtncB!c!js#$OXV0E>o-EU?d&hRVI{@Zq=#=#<*&d|VNBd^2
zd2kz#I1*yyk5@c1#k}sknn7LN-tVlSrFCdJGrrNEWMX7Puj{S0n4j?=btVNDVWz1K
z)Bwn6&4%6Zbd=wVbFYH~f(y2Op&blD)G}-}Q=^%tl=5uHW<{+hN;NNV2LgUPyRhVH
zZm?~aCrK>SigO$HiJ+<(#mX2GV{&>+Z{f!B!WN|se@%MY4h98X*1Y|~`NF5S!jx5*
z7enkPQQ9&>j)Qi-OK0sa5<PvFsGh-od&Uf*V+@HJ%K~7xa5|+a6JS6FagaZGV%*Q1
zc4-%O9z}^^#YGAUp<TR8QLv$g4PBi3lGYB0?yw7AQA*|oN-s>BQ^>zj>12BR_BN!+
zIW^Yr|N2_Jol^w}=Jo4oOo?Kh+Nqg$e2*!K$;pD>3fLeyX`+33Cou^fh;!I#3~0tV
zKAFsp_s9(u<?j7iBaj;#4<VQ32;67)jiy<D0tXMFOZ4xN<ZH}U!xwCZdxHXYdFkn9
z#Ya1NUBLl@5^@771hxPbdh^1%tkw<ERTDZcg}9ktT+IBr3nlNvme*g$L5R~S(<6W)
zGo^KnNOZqNk{Um=*2Fng)aA#s8rJcBABeqAq~^%{?iN()Pas3<l9BO;Tr6=6k1s-g
zx39n1yL7tXDAQ;5JI@XHg=5-)DzW$QousR4KP3Hf^nJf5>Jhzs3ZySf&$-QI&s-XJ
x^Wtl(>T_LxYB0qv_5P8K@V2r4U;iVq(`U(>F;AVW_6k>Is5fucNu6ao{tqt&R7d~-

diff --git a/tools/ep_kernels/install_python_libraries.sh b/tools/ep_kernels/install_python_libraries.sh
index 5ea543f4cb1e8..77af3f68a0505 100755
--- a/tools/ep_kernels/install_python_libraries.sh
+++ b/tools/ep_kernels/install_python_libraries.sh
@@ -1,94 +1,79 @@
 #!/usr/bin/env bash
 set -ex
 
-# prepare workspace directory
-WORKSPACE=$1
-if [ -z "$WORKSPACE" ]; then
-    export WORKSPACE=$(pwd)/ep_kernels_workspace
-fi
+# usage: ./build.sh [workspace_dir] [mode]
+#   mode: "install" (default) → install directly into current Python env
+#         "wheel"              → build wheels into WORKSPACE/dist
 
-if [ ! -d "$WORKSPACE" ]; then
-    mkdir -p $WORKSPACE
-fi
+WORKSPACE=${1:-$(pwd)/ep_kernels_workspace}
+MODE=${2:-install}
+mkdir -p "$WORKSPACE"
+
+WHEEL_DIR="$WORKSPACE/dist"
+mkdir -p "$WHEEL_DIR"
+NVSHMEM_VER=3.3.9
+
+pushd "$WORKSPACE"
 
-# configurable pip command (default: pip3)
-PIP_CMD=${PIP_CMD:-pip3}
 CUDA_HOME=${CUDA_HOME:-/usr/local/cuda}
 
 # install dependencies if not installed
-$PIP_CMD install cmake torch ninja
-
-# build nvshmem
-pushd $WORKSPACE
-mkdir -p nvshmem_src
-wget https://developer.download.nvidia.com/compute/redist/nvshmem/3.2.5/source/nvshmem_src_3.2.5-1.txz
-tar -xvf nvshmem_src_3.2.5-1.txz -C nvshmem_src --strip-components=1
-pushd nvshmem_src
-wget https://github.com/deepseek-ai/DeepEP/raw/main/third-party/nvshmem.patch
-git init
-git apply -vvv nvshmem.patch
-
-# assume CUDA_HOME is set correctly
-if [ -z "$CUDA_HOME" ]; then
-    echo "CUDA_HOME is not set, please set it to your CUDA installation directory."
-    exit 1
+if [ -z "$VIRTUAL_ENV" ]; then
+  uv pip install --system cmake torch ninja
+else
+  uv pip install cmake torch ninja
 fi
 
-# assume TORCH_CUDA_ARCH_LIST is set correctly
-if [ -z "$TORCH_CUDA_ARCH_LIST" ]; then
-    echo "TORCH_CUDA_ARCH_LIST is not set, please set it to your desired architecture."
+# fetch nvshmem
+ARCH=$(uname -m)
+case "${ARCH,,}" in
+  x86_64|amd64)
+    NVSHMEM_SUBDIR="linux-x86_64"
+    NVSHMEM_FILE="libnvshmem-linux-x86_64-${NVSHMEM_VER}_cuda12-archive.tar.xz"
+    ;;
+  aarch64|arm64)
+    NVSHMEM_SUBDIR="linux-sbsa"
+    NVSHMEM_FILE="libnvshmem-linux-sbsa-${NVSHMEM_VER}_cuda12-archive.tar.xz"
+    ;;
+  *)
+    echo "Unsupported architecture: ${ARCH}" >&2
     exit 1
-fi
+    ;;
+esac
 
-# disable all features except IBGDA
-export NVSHMEM_IBGDA_SUPPORT=1
-
-export NVSHMEM_SHMEM_SUPPORT=0
-export NVSHMEM_UCX_SUPPORT=0
-export NVSHMEM_USE_NCCL=0
-export NVSHMEM_PMIX_SUPPORT=0
-export NVSHMEM_TIMEOUT_DEVICE_POLLING=0
-export NVSHMEM_USE_GDRCOPY=0
-export NVSHMEM_IBRC_SUPPORT=0
-export NVSHMEM_BUILD_TESTS=0
-export NVSHMEM_BUILD_EXAMPLES=0
-export NVSHMEM_MPI_SUPPORT=0
-export NVSHMEM_BUILD_HYDRA_LAUNCHER=0
-export NVSHMEM_BUILD_TXZ_PACKAGE=0
-export NVSHMEM_TIMEOUT_DEVICE_POLLING=0
-
-cmake -G Ninja -S . -B $WORKSPACE/nvshmem_build/ -DCMAKE_INSTALL_PREFIX=$WORKSPACE/nvshmem_install
-cmake --build $WORKSPACE/nvshmem_build/ --target install
+NVSHMEM_URL="https://developer.download.nvidia.com/compute/nvshmem/redist/libnvshmem/${NVSHMEM_SUBDIR}/${NVSHMEM_FILE}"
 
+pushd "$WORKSPACE"
+echo "Downloading NVSHMEM ${NVSHMEM_VER} for ${NVSHMEM_SUBDIR} ..."
+curl -fSL "${NVSHMEM_URL}" -o "${NVSHMEM_FILE}"
+tar -xf "${NVSHMEM_FILE}"
+mv "${NVSHMEM_FILE%.tar.xz}" nvshmem
+rm -f "${NVSHMEM_FILE}"
+rm -rf nvshmem/lib/bin nvshmem/lib/share
 popd
 
-export CMAKE_PREFIX_PATH=$WORKSPACE/nvshmem_install:$CMAKE_PREFIX_PATH
+export CMAKE_PREFIX_PATH=$WORKSPACE/nvshmem/lib/cmake:$CMAKE_PREFIX_PATH
 
 is_git_dirty() {
     local dir=$1
     pushd "$dir" > /dev/null
-
-    if [ -d ".git" ] && [ -n "$(git status --porcelain 2>/dev/null)" ]; then
+    if [ -d ".git" ] && [ -n "$(git status --porcelain 3>/dev/null)" ]; then
         popd > /dev/null
-        return 0  # dirty (true)
+        return 0
     else
         popd > /dev/null
-        return 1  # clean (false)
+        return 1
     fi
 }
 
-# Function to handle git repository cloning with dirty/incomplete checks
 clone_repo() {
     local repo_url=$1
     local dir_name=$2
     local key_file=$3
     local commit_hash=$4
-
     if [ -d "$dir_name" ]; then
-        # Check if directory has uncommitted changes (dirty)
         if is_git_dirty "$dir_name"; then
             echo "$dir_name directory is dirty, skipping clone"
-        # Check if clone failed (directory exists but not a valid git repo or missing key files)
         elif [ ! -d "$dir_name/.git" ] || [ ! -f "$dir_name/$key_file" ]; then
             echo "$dir_name directory exists but clone appears incomplete, cleaning up and re-cloning"
             rm -rf "$dir_name"
@@ -99,7 +84,7 @@ clone_repo() {
                 cd ..
             fi
         else
-            echo "$dir_name directory exists and appears complete; manually update if needed"
+            echo "$dir_name directory exists and appears complete"
         fi
     else
         git clone "$repo_url"
@@ -111,17 +96,44 @@ clone_repo() {
     fi
 }
 
-# build and install pplx, require pytorch installed
-pushd $WORKSPACE
-clone_repo "https://github.com/ppl-ai/pplx-kernels" "pplx-kernels" "setup.py" "c336faf"
-cd pplx-kernels
-$PIP_CMD install --no-build-isolation -vvv -e .
-popd
+do_build() {
+    local repo=$1
+    local name=$2
+    local key=$3
+    local commit=$4
+    local extra_env=$5
 
-# build and install deepep, require pytorch installed
-pushd $WORKSPACE
-clone_repo "https://github.com/deepseek-ai/DeepEP" "DeepEP" "setup.py" "73b6ea4"
-cd DeepEP
-export NVSHMEM_DIR=$WORKSPACE/nvshmem_install
-$PIP_CMD install --no-build-isolation -vvv -e .
-popd
+    pushd "$WORKSPACE"
+    clone_repo "$repo" "$name" "$key" "$commit"
+    cd "$name"
+
+    if [ "$MODE" = "install" ]; then
+        echo "Installing $name into environment"
+        eval "$extra_env" uv pip install --no-build-isolation -vvv .
+    else
+        echo "Building $name wheel into $WHEEL_DIR"
+        eval "$extra_env" uv build --wheel --no-build-isolation -vvv --out-dir "$WHEEL_DIR" .
+    fi
+    popd
+}
+
+# build pplx-kernels
+do_build \
+    "https://github.com/ppl-ai/pplx-kernels" \
+    "pplx-kernels" \
+    "setup.py" \
+    "12cecfd" \
+    ""
+
+# build DeepEP
+do_build \
+    "https://github.com/deepseek-ai/DeepEP" \
+    "DeepEP" \
+    "setup.py" \
+    "73b6ea4" \
+    "export NVSHMEM_DIR=$WORKSPACE/nvshmem; "
+
+if [ "$MODE" = "wheel" ]; then
+    echo "All wheels written to $WHEEL_DIR"
+    ls -l "$WHEEL_DIR"
+fi
diff --git a/tools/install_deepgemm.sh b/tools/install_deepgemm.sh
index 4f2cd302c3eff..ee9a5dd4aa643 100755
--- a/tools/install_deepgemm.sh
+++ b/tools/install_deepgemm.sh
@@ -1,12 +1,13 @@
 #!/bin/bash
-# Script to install DeepGEMM from source
-# This script can be used both in Docker builds and by users locally
-
+# Script to build and/or install DeepGEMM from source
+# Default: build and install immediately
+# Optional: build wheels to a directory for later installation (useful in multi-stage builds)
 set -e
 
 # Default values
 DEEPGEMM_GIT_REPO="https://github.com/deepseek-ai/DeepGEMM.git"
 DEEPGEMM_GIT_REF="594953acce41793ae00a1233eb516044d604bcb6"
+WHEEL_DIR=""
 
 # Parse command line arguments
 while [[ $# -gt 0 ]]; do
@@ -27,11 +28,20 @@ while [[ $# -gt 0 ]]; do
             CUDA_VERSION="$2"
             shift 2
             ;;
+        --wheel-dir)
+            if [[ -z "$2" || "$2" =~ ^- ]]; then
+                echo "Error: --wheel-dir requires a directory path." >&2
+                exit 1
+            fi
+            WHEEL_DIR="$2"
+            shift 2
+            ;;
         -h|--help)
             echo "Usage: $0 [OPTIONS]"
             echo "Options:"
             echo "  --ref REF          Git reference to checkout (default: $DEEPGEMM_GIT_REF)"
             echo "  --cuda-version VER CUDA version (auto-detected if not provided)"
+            echo "  --wheel-dir PATH   If set, build wheel into PATH but do not install"
             echo "  -h, --help         Show this help message"
             exit 0
             ;;
@@ -57,16 +67,15 @@ fi
 CUDA_MAJOR="${CUDA_VERSION%%.*}"
 CUDA_MINOR="${CUDA_VERSION#${CUDA_MAJOR}.}"
 CUDA_MINOR="${CUDA_MINOR%%.*}"
-
 echo "CUDA version: $CUDA_VERSION (major: $CUDA_MAJOR, minor: $CUDA_MINOR)"
 
 # Check CUDA version requirement
 if [ "$CUDA_MAJOR" -lt 12 ] || { [ "$CUDA_MAJOR" -eq 12 ] && [ "$CUDA_MINOR" -lt 8 ]; }; then
-    echo "Skipping DeepGEMM installation (requires CUDA 12.8+ but got ${CUDA_VERSION})"
+    echo "Skipping DeepGEMM build/installation (requires CUDA 12.8+ but got ${CUDA_VERSION})"
     exit 0
 fi
 
-echo "Installing DeepGEMM from source..."
+echo "Preparing DeepGEMM build..."
 echo "Repository: $DEEPGEMM_GIT_REPO"
 echo "Reference: $DEEPGEMM_GIT_REF"
 
@@ -76,23 +85,31 @@ trap 'rm -rf "$INSTALL_DIR"' EXIT
 
 # Clone the repository
 git clone --recursive --shallow-submodules "$DEEPGEMM_GIT_REPO" "$INSTALL_DIR/deepgemm"
-
-echo "🏗️  Building DeepGEMM"
 pushd "$INSTALL_DIR/deepgemm"
 
 # Checkout the specific reference
 git checkout "$DEEPGEMM_GIT_REF"
 
-# Build DeepGEMM
+# Clean previous build artifacts
 # (Based on https://github.com/deepseek-ai/DeepGEMM/blob/main/install.sh)
-rm -rf build dist
-rm -rf *.egg-info
+rm -rf build dist *.egg-info
+
+# Build wheel
+echo "🏗️  Building DeepGEMM wheel..."
 python3 setup.py bdist_wheel
 
-# Install the wheel
+# If --wheel-dir was specified, copy wheels there and exit
+if [ -n "$WHEEL_DIR" ]; then
+    mkdir -p "$WHEEL_DIR"
+    cp dist/*.whl "$WHEEL_DIR"/
+    echo "✅ Wheel built and copied to $WHEEL_DIR"
+    popd
+    exit 0
+fi
+
+# Default behaviour: install built wheel
 if command -v uv >/dev/null 2>&1; then
     echo "Installing DeepGEMM wheel using uv..."
-    # Use --system in Docker contexts, respect user's environment otherwise
     if [ -n "$VLLM_DOCKER_BUILD_CONTEXT" ]; then
         uv pip install --system dist/*.whl
     else
@@ -104,5 +121,4 @@ else
 fi
 
 popd
-
 echo "✅ DeepGEMM installation completed successfully"

From 7df331c66b242a3109a95fb434a1badd196966d7 Mon Sep 17 00:00:00 2001
From: Nick Hill <nhill@redhat.com>
Date: Sat, 22 Nov 2025 13:07:18 -0800
Subject: [PATCH 64/83] [BugFix] Fix chunked prompt logprobs + preemption
 (#29071)

---
 tests/conftest.py                  | 27 +++++++++--
 tests/v1/sample/test_logprobs.py   | 76 ++++++++++++++++++++++++++++++
 vllm/v1/worker/gpu_input_batch.py  | 14 ------
 vllm/v1/worker/gpu_model_runner.py | 20 ++++++--
 vllm/v1/worker/tpu_input_batch.py  | 10 ----
 vllm/v1/worker/tpu_model_runner.py | 11 +++++
 6 files changed, 127 insertions(+), 31 deletions(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index 5afdb225b8923..163593eb3f14f 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -853,6 +853,7 @@ class VllmRunner:
     @staticmethod
     def _final_steps_generate_w_logprobs(
         req_outputs: list[RequestOutput],
+        include_prompt_token_ids: bool = False,
     ) -> list[TokensTextLogprobsPromptLogprobs]:
         outputs: list[TokensTextLogprobsPromptLogprobs] = []
         for req_output in req_outputs:
@@ -861,9 +862,26 @@ class VllmRunner:
                 output_str = sample.text
                 output_ids = list(sample.token_ids)
                 output_logprobs = sample.logprobs
-            outputs.append(
-                (output_ids, output_str, output_logprobs, req_output.prompt_logprobs)
-            )
+            if include_prompt_token_ids:
+                outputs.append(
+                    (  # type: ignore[arg-type]
+                        output_ids,
+                        output_str,
+                        output_logprobs,
+                        req_output.prompt_token_ids,
+                        req_output.prompt_logprobs,
+                    )
+                )
+            else:
+                outputs.append(
+                    (
+                        output_ids,
+                        output_str,
+                        output_logprobs,
+                        req_output.prompt_logprobs,
+                    )
+                )
+
         return outputs
 
     def generate_w_logprobs(
@@ -873,6 +891,7 @@ class VllmRunner:
         images: PromptImageInput | None = None,
         audios: PromptAudioInput | None = None,
         videos: PromptVideoInput | None = None,
+        include_prompt_token_ids: bool = False,
         **kwargs: Any,
     ) -> list[TokensTextLogprobs] | list[TokensTextLogprobsPromptLogprobs]:
         inputs = self.get_inputs(prompts, images=images, videos=videos, audios=audios)
@@ -882,7 +901,7 @@ class VllmRunner:
         )
 
         toks_str_logsprobs_prompt_logprobs = self._final_steps_generate_w_logprobs(
-            req_outputs
+            req_outputs, include_prompt_token_ids
         )
         # Omit prompt logprobs if not required by sampling params
         return (
diff --git a/tests/v1/sample/test_logprobs.py b/tests/v1/sample/test_logprobs.py
index c0b0e1ea226ed..c89c33be80c10 100644
--- a/tests/v1/sample/test_logprobs.py
+++ b/tests/v1/sample/test_logprobs.py
@@ -605,3 +605,79 @@ def test_spec_decode_logprobs(
         )
         assert ref_logprob.rank == spec_logprob.rank
         assert ref_logprob.decoded_token == spec_logprob.decoded_token
+
+
+def test_prompt_logprobs_with_chunking_and_preemption():
+    """Test that prompt logprobs are correctly returned when using
+    both chunked prefill and preemption.
+
+    This test ensures that the num_prompt_logprobs tracking persists
+    across preemptions and prefill chunks.
+    """
+
+    # Create prompts that will trigger chunking and preemption
+    prompts = [
+        "The following numbers of the sequence "
+        + ", ".join(str(i) for i in range(10))
+        + " are:",
+        "In one word, the capital of France is ",
+    ] + [f"Tell me about the number {i}: " for i in range(32)]
+
+    sampling_params = SamplingParams(
+        temperature=0.0,
+        max_tokens=40,
+        min_tokens=20,
+        prompt_logprobs=2,  # Request prompt logprobs
+    )
+
+    with VllmRunner(
+        "Qwen/Qwen3-0.6B",
+        max_model_len=512,
+        enable_chunked_prefill=True,
+        max_num_batched_tokens=48,  # Force prefill chunking
+        num_gpu_blocks_override=32,  # Force preemptions
+        disable_log_stats=False,
+        gpu_memory_utilization=0.25,
+    ) as vllm_model:
+        metrics_before = vllm_model.llm.get_metrics()
+
+        # Generate with prompt logprobs using generate_w_logprobs which
+        # returns (output_ids, output_str, output_logprobs, prompt_logprobs)
+        outputs = vllm_model.generate_w_logprobs(
+            prompts, sampling_params=sampling_params, include_prompt_token_ids=True
+        )
+
+        # Verify that all outputs have prompt logprobs
+        for i, output in enumerate(outputs):
+            _, _, _, prompt_token_ids, prompt_logprobs = output
+            assert prompt_logprobs is not None and len(prompt_logprobs) > 0, (
+                f"Output {i} missing prompt logprobs"
+            )
+            assert len(prompt_logprobs) == len(prompt_token_ids), (
+                "Unexpected number of prompt logprob positions"
+            )
+
+            # Each position should have the requested number of logprobs
+            for pos, logprobs_dict in enumerate(prompt_logprobs):
+                if logprobs_dict is not None:  # First token may be None
+                    assert (
+                        sampling_params.prompt_logprobs
+                        <= len(logprobs_dict)
+                        <= sampling_params.prompt_logprobs + 1
+                    ), (
+                        f"Output {i} position {pos} has {len(logprobs_dict)} "
+                        f"logprobs, expected {sampling_params.prompt_logprobs}"
+                    )
+
+        # Check that we actually had preemptions
+        metrics_after = vllm_model.llm.get_metrics()
+        preemptions_before = next(
+            (m.value for m in metrics_before if m.name == "vllm:num_preemptions"), 0
+        )
+        preemptions_after = next(
+            (m.value for m in metrics_after if m.name == "vllm:num_preemptions"), 0
+        )
+        preemptions = preemptions_after - preemptions_before
+        assert preemptions > 0, "Test did not trigger any preemptions"
+
+        print(f"Test passed with {preemptions} preemptions")
diff --git a/vllm/v1/worker/gpu_input_batch.py b/vllm/v1/worker/gpu_input_batch.py
index 7b4bc1d2a2241..d6fef450c028a 100644
--- a/vllm/v1/worker/gpu_input_batch.py
+++ b/vllm/v1/worker/gpu_input_batch.py
@@ -219,9 +219,6 @@ class InputBatch:
         self.generators: dict[int, torch.Generator] = {}
 
         self.num_logprobs: dict[str, int] = {}
-        # NOTE(rob): num_prompt_logprobs only includes reqs
-        # that are currently in the prefill phase.
-        self.num_prompt_logprobs: dict[str, int] = {}
 
         # To accumulate prompt logprobs tensor chunks across prefill steps.
         self.in_progress_prompt_logprobs_cpu: dict[str, LogprobsTensors] = {}
@@ -385,12 +382,6 @@ class InputBatch:
                     if sampling_params.logprobs == -1
                     else sampling_params.logprobs
                 )
-            if sampling_params.prompt_logprobs is not None:
-                self.num_prompt_logprobs[req_id] = (
-                    self.vocab_size
-                    if sampling_params.prompt_logprobs == -1
-                    else sampling_params.prompt_logprobs
-                )
 
             if sampling_params.allowed_token_ids:
                 self.has_allowed_token_ids.add(req_id)
@@ -488,7 +479,6 @@ class InputBatch:
         self.repetition_penalties_reqs.discard(req_id)
         self.generators.pop(req_index, None)
         self.num_logprobs.pop(req_id, None)
-        self.num_prompt_logprobs.pop(req_id, None)
         self.in_progress_prompt_logprobs_cpu.pop(req_id, None)
 
         self.has_allowed_token_ids.discard(req_id)
@@ -972,10 +962,6 @@ class InputBatch:
     def max_num_logprobs(self) -> int | None:
         return max(self.num_logprobs.values()) if self.num_logprobs else None
 
-    @property
-    def no_prompt_logprob(self) -> bool:
-        return not self.num_prompt_logprobs
-
     @property
     def no_allowed_token_ids(self) -> bool:
         return len(self.has_allowed_token_ids) == 0
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 979f977587038..49285a7b8e0ad 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -393,6 +393,9 @@ class GPUModelRunner(
 
         # Request states.
         self.requests: dict[str, CachedRequestState] = {}
+        # NOTE(rob): num_prompt_logprobs only includes reqs
+        # that are currently in the prefill phase.
+        self.num_prompt_logprobs: dict[str, int] = {}
         self.comm_stream = torch.cuda.Stream()
 
         # Input Batch
@@ -687,6 +690,7 @@ class GPUModelRunner(
         # Remove finished requests from the cached states.
         for req_id in scheduler_output.finished_req_ids:
             self.requests.pop(req_id, None)
+            self.num_prompt_logprobs.pop(req_id, None)
         # Remove the finished requests from the persistent batch.
         # NOTE(woosuk): There could be an edge case where finished_req_ids and
         # scheduled_req_ids overlap. This happens when a request is aborted and
@@ -755,6 +759,13 @@ class GPUModelRunner(
             )
             self.requests[req_id] = req_state
 
+            if sampling_params and sampling_params.prompt_logprobs is not None:
+                self.num_prompt_logprobs[req_id] = (
+                    self.input_batch.vocab_size
+                    if sampling_params.prompt_logprobs == -1
+                    else sampling_params.prompt_logprobs
+                )
+
             # Only relevant for models using M-RoPE (e.g, Qwen2-VL)
             if self.uses_mrope:
                 self._init_mrope_positions(req_state)
@@ -2671,7 +2682,7 @@ class GPUModelRunner(
                         scheduler_output, self.vllm_config
                     )
                 if self.cache_config.kv_sharing_fast_prefill:
-                    assert not self.input_batch.num_prompt_logprobs, (
+                    assert not self.num_prompt_logprobs, (
                         "--kv-sharing-fast-prefill produces incorrect "
                         "logprobs for prompt tokens, tokens, please disable "
                         "it when the requests need prompt logprobs"
@@ -3436,7 +3447,7 @@ class GPUModelRunner(
         hidden_states: torch.Tensor,
         num_scheduled_tokens: dict[str, int],
     ) -> dict[str, LogprobsTensors | None]:
-        num_prompt_logprobs_dict = self.input_batch.num_prompt_logprobs
+        num_prompt_logprobs_dict = self.num_prompt_logprobs
         if not num_prompt_logprobs_dict:
             return {}
 
@@ -3447,7 +3458,10 @@ class GPUModelRunner(
         # maintainable loop over optimal performance.
         completed_prefill_reqs = []
         for req_id, num_prompt_logprobs in num_prompt_logprobs_dict.items():
-            num_tokens = num_scheduled_tokens[req_id]
+            num_tokens = num_scheduled_tokens.get(req_id)
+            if num_tokens is None:
+                # This can happen if the request was preempted in prefill stage.
+                continue
 
             # Get metadata for this request.
             request = self.requests[req_id]
diff --git a/vllm/v1/worker/tpu_input_batch.py b/vllm/v1/worker/tpu_input_batch.py
index 6bf4f91931849..2ed65ca9d31cd 100644
--- a/vllm/v1/worker/tpu_input_batch.py
+++ b/vllm/v1/worker/tpu_input_batch.py
@@ -149,9 +149,6 @@ class InputBatch:
         self.generators: dict[int, torch.Generator] = {}
 
         self.num_logprobs: dict[str, int] = {}
-        # NOTE(rob): num_prompt_logprobs only includes reqs
-        # that are currently in the prefill phase.
-        self.num_prompt_logprobs: dict[str, int] = {}
 
         # To accumulate prompt logprobs tensor chunks across prefill steps.
         self.in_progress_prompt_logprobs_cpu: dict[str, LogprobsTensors] = {}
@@ -256,8 +253,6 @@ class InputBatch:
 
         if sampling_params.logprobs is not None:
             self.num_logprobs[req_id] = sampling_params.logprobs
-        if sampling_params.prompt_logprobs is not None:
-            self.num_prompt_logprobs[req_id] = sampling_params.prompt_logprobs
         if sampling_params.logit_bias is not None:
             self.logit_bias[req_index] = sampling_params.logit_bias
 
@@ -317,7 +312,6 @@ class InputBatch:
         self.repetition_penalties_reqs.discard(req_id)
         self.generators.pop(req_index, None)
         self.num_logprobs.pop(req_id, None)
-        self.num_prompt_logprobs.pop(req_id, None)
         self.in_progress_prompt_logprobs_cpu.pop(req_id, None)
 
         # LoRA
@@ -584,10 +578,6 @@ class InputBatch:
     def max_num_logprobs(self) -> int | None:
         return max(self.num_logprobs.values()) if self.num_logprobs else None
 
-    @property
-    def no_prompt_logprob(self) -> bool:
-        return not self.num_prompt_logprobs
-
     @property
     def no_allowed_token_ids(self) -> bool:
         return len(self.has_allowed_token_ids) == 0
diff --git a/vllm/v1/worker/tpu_model_runner.py b/vllm/v1/worker/tpu_model_runner.py
index 5f6012ec614c2..72d4474b89627 100644
--- a/vllm/v1/worker/tpu_model_runner.py
+++ b/vllm/v1/worker/tpu_model_runner.py
@@ -247,6 +247,9 @@ class TPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
 
         # Request states.
         self.requests: dict[str, CachedRequestState] = {}
+        # NOTE(rob): num_prompt_logprobs only includes reqs
+        # that are currently in the prefill phase.
+        self.num_prompt_logprobs: dict[str, int] = {}
 
         # Initialize input batch early to avoid AttributeError in _update_states
         self.input_batch = InputBatch(
@@ -420,6 +423,7 @@ class TPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         # Remove finished requests from the cached states.
         for req_id in scheduler_output.finished_req_ids:
             self.requests.pop(req_id, None)
+            self.num_prompt_logprobs.pop(req_id, None)
 
         # Remove the finished requests from the persistent batch.
         # NOTE(woosuk): There could be an edge case where finished_req_ids and
@@ -477,6 +481,13 @@ class TPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                 lora_request=new_req_data.lora_request,
             )
 
+            if sampling_params and sampling_params.prompt_logprobs is not None:
+                self.num_prompt_logprobs[req_id] = (
+                    self.input_batch.vocab_size
+                    if sampling_params.prompt_logprobs == -1
+                    else sampling_params.prompt_logprobs
+                )
+
             req_ids_to_add.append(req_id)
 
         # Update the states of the running/resumed requests.

From df78aeef084cf35eecc6ba52640de8c390c99543 Mon Sep 17 00:00:00 2001
From: Yizhou <136800916+yiz-liu@users.noreply.github.com>
Date: Sun, 23 Nov 2025 05:10:31 +0800
Subject: [PATCH 65/83] Refactor: Move CUDA graph dispatch logic earlier
 (#27382)

Signed-off-by: Yizhou Liu <liu_yizhou@outlook.com>
---
 vllm/v1/worker/gpu_model_runner.py | 50 +++++++++++++++---------------
 1 file changed, 25 insertions(+), 25 deletions(-)

diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
index 49285a7b8e0ad..6a54e02f861e9 100644
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -3740,6 +3740,31 @@ class GPUModelRunner(
             dp_rank = self.parallel_config.data_parallel_rank
             num_tokens_after_padding = int(num_tokens_across_dp[dp_rank])
 
+        # filter out the valid batch descriptor
+        _cg_mode, batch_descriptor = (
+            self.cudagraph_dispatcher.dispatch(
+                BatchDescriptor(
+                    num_tokens=num_tokens_after_padding,
+                    uniform_decode=uniform_decode,
+                    has_lora=activate_lora and self.lora_config is not None,
+                )
+            )
+            if not is_profile
+            else (CUDAGraphMode.NONE, None)
+        )
+        if cudagraph_runtime_mode is not None:
+            # we allow forcing NONE when the dispatcher disagrees to support
+            # warm ups for cudagraph capture
+            assert (
+                cudagraph_runtime_mode == CUDAGraphMode.NONE
+                or cudagraph_runtime_mode == _cg_mode
+            ), (
+                f"Cudagraph runtime mode mismatch at dummy_run. "
+                f"Expected {_cg_mode}, but got {cudagraph_runtime_mode}."
+            )
+        else:
+            cudagraph_runtime_mode = _cg_mode
+
         attn_metadata: PerLayerAttnMetadata | None = None
 
         # If force_attention is True, we always capture attention. Otherwise,
@@ -3814,31 +3839,6 @@ class GPUModelRunner(
                     num_tokens_after_padding, None, False
                 )
 
-            # filter out the valid batch descriptor
-            _cg_mode, batch_descriptor = (
-                self.cudagraph_dispatcher.dispatch(
-                    BatchDescriptor(
-                        num_tokens=num_tokens_after_padding,
-                        uniform_decode=uniform_decode,
-                        has_lora=activate_lora and self.lora_config is not None,
-                    )
-                )
-                if not is_profile
-                else (CUDAGraphMode.NONE, None)
-            )
-            if cudagraph_runtime_mode is not None:
-                # we allow forcing NONE when the dispatcher disagrees to support
-                # warm ups for cudagraph capture
-                assert (
-                    cudagraph_runtime_mode == CUDAGraphMode.NONE
-                    or cudagraph_runtime_mode == _cg_mode
-                ), (
-                    f"Cudagraph runtime mode mismatch at dummy_run. "
-                    f"Expected {_cg_mode}, but got {cudagraph_runtime_mode}."
-                )
-            else:
-                cudagraph_runtime_mode = _cg_mode
-
             if ubatch_slices is not None:
                 # Adjust values to reflect a single ubatch.
                 # TODO(sage,lucas): this is cruft that should be addressed in

From 472fdee97472cae444635508fcf73ebe28f79980 Mon Sep 17 00:00:00 2001
From: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Date: Sat, 22 Nov 2025 16:50:02 -0500
Subject: [PATCH 66/83] [Chore] Update batch invariant code owner (#29246)

Signed-off-by: yewentao256 <zhyanwentao@126.com>
---
 .github/CODEOWNERS | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/.github/CODEOWNERS b/.github/CODEOWNERS
index 0e834c057c401..3247408e1163e 100644
--- a/.github/CODEOWNERS
+++ b/.github/CODEOWNERS
@@ -9,6 +9,7 @@
 /vllm/model_executor/layers/quantization @mgoin @robertgshaw2-redhat @tlrmchlsmth @yewentao256 @pavanimajety
 /vllm/model_executor/layers/mamba @tdoublep
 /vllm/model_executor/model_loader @22quinn
+/vllm/model_executor/layers/batch_invariant.py @yewentao256 
 /vllm/multimodal @DarkLight1337 @ywang96 @NickLucche @tjtanaa
 /vllm/vllm_flash_attn @LucasWilkinson
 /vllm/lora @jeejeelee
@@ -59,6 +60,7 @@ CMakeLists.txt @tlrmchlsmth @LucasWilkinson
 /tests/v1/kv_connector/nixl_integration @NickLucche
 /tests/v1/kv_connector @ApostaC
 /tests/v1/offloading @ApostaC
+/tests/v1/determinism @yewentao256 
 
 # Transformers modeling backend
 /vllm/model_executor/models/transformers @hmellor

From 4587063267d2751ac183c16421aeda3f335cee39 Mon Sep 17 00:00:00 2001
From: Qidong Su <soodoshll@gmail.com>
Date: Sat, 22 Nov 2025 18:25:13 -0500
Subject: [PATCH 67/83] Patch DeepEP when building docker image with CUDA 13
 (#29154)

Signed-off-by: Qidong Su <soodoshll@gmail.com>
---
 tools/ep_kernels/install_python_libraries.sh | 11 +++++++++++
 1 file changed, 11 insertions(+)

diff --git a/tools/ep_kernels/install_python_libraries.sh b/tools/ep_kernels/install_python_libraries.sh
index 77af3f68a0505..1cea1bef8dbc9 100755
--- a/tools/ep_kernels/install_python_libraries.sh
+++ b/tools/ep_kernels/install_python_libraries.sh
@@ -96,6 +96,13 @@ clone_repo() {
     fi
 }
 
+deepep_cuda13_patch() {
+    cuda_version_major=$(${CUDA_HOME}/bin/nvcc --version | egrep -o "release [0-9]+" | cut -d ' ' -f 2)
+    if [ ${cuda_version_major} -ge 13 ]; then
+        sed -i "s|f'{nvshmem_dir}/include']|f'{nvshmem_dir}/include', '${CUDA_HOME}/include/cccl']|" "setup.py"
+    fi
+}
+
 do_build() {
     local repo=$1
     local name=$2
@@ -107,6 +114,10 @@ do_build() {
     clone_repo "$repo" "$name" "$key" "$commit"
     cd "$name"
 
+    if [ "$name" == "DeepEP" ]; then
+        deepep_cuda13_patch
+    fi
+
     if [ "$MODE" = "install" ]; then
         echo "Installing $name into environment"
         eval "$extra_env" uv pip install --no-build-isolation -vvv .

From 5f96c00c557fc68c352d1b9bb1d6f9c9bb9f133d Mon Sep 17 00:00:00 2001
From: jiahanc <173873397+jiahanc@users.noreply.github.com>
Date: Sat, 22 Nov 2025 16:39:30 -0800
Subject: [PATCH 68/83] [Fix] Add SM check to flashinfer MOE backend (#29144)

Signed-off-by: jiahanc <173873397+jiahanc@users.noreply.github.com>
Signed-off-by: mgoin <mgoin64@gmail.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
---
 .../layers/quantization/utils/flashinfer_utils.py      | 10 ++++++++++
 1 file changed, 10 insertions(+)

diff --git a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
index 7eba8359b92f6..eef7a0896c375 100644
--- a/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
+++ b/vllm/model_executor/layers/quantization/utils/flashinfer_utils.py
@@ -282,6 +282,16 @@ def get_flashinfer_moe_backend() -> FlashinferMoeBackend:
 
     flashinfer_moe_backend = envs.VLLM_FLASHINFER_MOE_BACKEND
     if flashinfer_moe_backend in backend_map:
+        if (
+            flashinfer_moe_backend == "latency"
+            and not current_platform.is_device_capability(100)
+        ):
+            logger.info_once(
+                "Flashinfer TRTLLM MOE backend is only supported on "
+                "SM100 and later, using CUTLASS backend instead",
+                scope="local",
+            )
+            return FlashinferMoeBackend.CUTLASS
         return backend_map[flashinfer_moe_backend]
     elif current_platform.is_device_capability(90):
         return FlashinferMoeBackend.CUTLASS

From 3ed767ec064fbebbf5d8de829d390fa4a1bf0a0b Mon Sep 17 00:00:00 2001
From: Michael Act <michael.a.c.tulenan@gdplabs.id>
Date: Sun, 23 Nov 2025 09:58:28 +0700
Subject: [PATCH 69/83] docs: fixes distributed executor backend config for
 multi-node vllm (#29173)

Signed-off-by: Michael Act <michael.a.c.tulenan@gdplabs.id>
Co-authored-by: Michael Goin <mgoin64@gmail.com>
---
 docs/serving/parallelism_scaling.md | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/docs/serving/parallelism_scaling.md b/docs/serving/parallelism_scaling.md
index 14cd3b057791c..a32840ea73b9a 100644
--- a/docs/serving/parallelism_scaling.md
+++ b/docs/serving/parallelism_scaling.md
@@ -118,14 +118,16 @@ The common practice is to set the tensor parallel size to the number of GPUs in
 ```bash
 vllm serve /path/to/the/model/in/the/container \
     --tensor-parallel-size 8 \
-    --pipeline-parallel-size 2
+    --pipeline-parallel-size 2 \
+    --distributed-executor-backend ray
 ```
 
 Alternatively, you can set `tensor_parallel_size` to the total number of GPUs in the cluster:
 
 ```bash
 vllm serve /path/to/the/model/in/the/container \
-     --tensor-parallel-size 16
+     --tensor-parallel-size 16 \
+     --distributed-executor-backend ray
 ```
 
 ## Optimizing network communication for tensor parallelism

From 389aa1b2ebf3726fef6aac737e0020075324d138 Mon Sep 17 00:00:00 2001
From: Cyrus Leung <tlleungac@connect.ust.hk>
Date: Sun, 23 Nov 2025 10:58:48 +0800
Subject: [PATCH 70/83] [Doc] Update more docs with respect to V1 (#29188)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
---
 docs/configuration/conserving_memory.md       |   3 -
 docs/configuration/optimization.md            |   4 +-
 docs/usage/reproducibility.md                 |  34 ++---
 docs/usage/v1_guide.md                        | 136 +++++++++---------
 examples/offline_inference/reproducibility.py |   5 +-
 .../models/language/generation/test_common.py |   7 -
 6 files changed, 89 insertions(+), 100 deletions(-)

diff --git a/docs/configuration/conserving_memory.md b/docs/configuration/conserving_memory.md
index 5ce43c7984057..0aa89a89eae5c 100644
--- a/docs/configuration/conserving_memory.md
+++ b/docs/configuration/conserving_memory.md
@@ -49,9 +49,6 @@ llm = LLM(model="adept/fuyu-8b", max_model_len=2048, max_num_seqs=2)
 
 By default, we optimize model inference using CUDA graphs which take up extra memory in the GPU.
 
-!!! warning
-    CUDA graph capture takes up more memory in V1 than in V0.
-
 You can adjust `compilation_config` to achieve a better balance between inference speed and memory usage:
 
 ??? code
diff --git a/docs/configuration/optimization.md b/docs/configuration/optimization.md
index b0d390d7e1cbb..fdd9c317b022f 100644
--- a/docs/configuration/optimization.md
+++ b/docs/configuration/optimization.md
@@ -31,9 +31,7 @@ In vLLM V1, the default preemption mode is `RECOMPUTE` rather than `SWAP`, as re
 
 Chunked prefill allows vLLM to process large prefills in smaller chunks and batch them together with decode requests. This feature helps improve both throughput and latency by better balancing compute-bound (prefill) and memory-bound (decode) operations.
 
-In vLLM V1, **chunked prefill is always enabled by default**. This is different from vLLM V0, where it was conditionally enabled based on model characteristics.
-
-With chunked prefill enabled, the scheduling policy prioritizes decode requests. It batches all pending decode requests before scheduling any prefill operations. When there are available tokens in the `max_num_batched_tokens` budget, it schedules pending prefills. If a pending prefill request cannot fit into `max_num_batched_tokens`, it automatically chunks it.
+In V1, **chunked prefill is enabled by default whenever possible**. With chunked prefill enabled, the scheduling policy prioritizes decode requests. It batches all pending decode requests before scheduling any prefill operations. When there are available tokens in the `max_num_batched_tokens` budget, it schedules pending prefills. If a pending prefill request cannot fit into `max_num_batched_tokens`, it automatically chunks it.
 
 This policy has two benefits:
 
diff --git a/docs/usage/reproducibility.md b/docs/usage/reproducibility.md
index afc25b63902e2..a8e49d0a3398f 100644
--- a/docs/usage/reproducibility.md
+++ b/docs/usage/reproducibility.md
@@ -1,21 +1,23 @@
 # Reproducibility
 
 vLLM does not guarantee the reproducibility of the results by default, for the sake of performance. To achieve
-reproducible results, you need to turn off multiprocessing to make the scheduling deterministic by setting `VLLM_ENABLE_V1_MULTIPROCESSING=0`.
+reproducible results:
+
+- In offline mode, you can either set `VLLM_ENABLE_V1_MULTIPROCESSING=0` which makes scheduling deterministic,
+  or enable [batch invariance](../features/batch_invariance.md) to make the outputs insensitive to scheduling.
+- In online mode, you can only enable [batch invariance](../features/batch_invariance.md).
 
 Example: [examples/offline_inference/reproducibility.py](../../examples/offline_inference/reproducibility.py)
 
 !!! warning
 
-    Applying the above settings [changes the random state in user code](#locality-of-random-state).
+    Setting `VLLM_ENABLE_V1_MULTIPROCESSING=0` will change the random state of user code 
+    (i.e. the code that constructs [LLM][vllm.LLM] class).
 
 !!! note
 
     Even with the above settings, vLLM only provides reproducibility
     when it runs on the same hardware and the same vLLM version.
-    Also, the online serving API (`vllm serve`) does not support reproducibility
-    because it is almost impossible to make the scheduling deterministic in the
-    online setting.
 
 ## Setting the global seed
 
@@ -23,25 +25,17 @@ The `seed` parameter in vLLM is used to control the random states for various ra
 
 If a specific seed value is provided, the random states for `random`, `np.random`, and `torch.manual_seed` will be set accordingly.
 
-However, in some cases, setting the seed will also [change the random state in user code](#locality-of-random-state).
-
 ### Default Behavior
 
 In V1, the `seed` parameter defaults to `0` which sets the random state for each worker, so the results will remain consistent for each vLLM run even if `temperature > 0`.
 
+It is impossible to un-specify a seed for V1 because different workers need to sample the same outputs
+for workflows such as speculative decoding. For more information, see: <https://github.com/vllm-project/vllm/pull/17929>
+
 !!! note
 
-    It is impossible to un-specify a seed for V1 because different workers need to sample the same outputs
-    for workflows such as speculative decoding.
-    
-    For more information, see: <https://github.com/vllm-project/vllm/pull/17929>
+    The random state in user code (i.e. the code that constructs [LLM][vllm.LLM] class) is updated by vLLM 
+    only if the workers are run in the same process as user code, i.e.: `VLLM_ENABLE_V1_MULTIPROCESSING=0`.
 
-### Locality of random state
-
-The random state in user code (i.e. the code that constructs [LLM][vllm.LLM] class) is updated by vLLM under the following conditions:
-
-- For V0: The seed is specified.
-- For V1: The workers are run in the same process as user code, i.e.: `VLLM_ENABLE_V1_MULTIPROCESSING=0`.
-
-By default, these conditions are not active so you can use vLLM without having to worry about
-accidentally making deterministic subsequent operations that rely on random state.
+    By default, `VLLM_ENABLE_V1_MULTIPROCESSING=1` so you can use vLLM without having to worry about
+    accidentally making deterministic subsequent operations that rely on random state.
diff --git a/docs/usage/v1_guide.md b/docs/usage/v1_guide.md
index 22f4e6761ea9a..5f647aafd61d4 100644
--- a/docs/usage/v1_guide.md
+++ b/docs/usage/v1_guide.md
@@ -4,9 +4,7 @@
 
     We have fully deprecated V0. Please read [RFC #18571](https://github.com/vllm-project/vllm/issues/18571) for more details.
 
-V1 is now enabled by default for all supported use cases, and we will gradually enable it for every use case we plan to support. Please share any feedback on [GitHub](https://github.com/vllm-project/vllm) or in the [vLLM Slack](https://inviter.co/vllm-slack).
-
-## Why vLLM V1?
+    If you have a use case that works on V0 Engine but not V1, please share it on [GitHub](https://github.com/vllm-project/vllm) or in the [vLLM Slack](https://inviter.co/vllm-slack).
 
 vLLM V0 successfully supported a wide range of models and hardware, but as new features were developed independently, the system grew increasingly complex. This complexity made it harder to integrate new capabilities and introduced technical debt, revealing the need for a more streamlined and unified design.
 
@@ -32,16 +30,44 @@ Upgrade to vLLM’s Core Architecture](https://blog.vllm.ai/2025/01/27/v1-alpha-
 
 This living user guide outlines a few known **important changes and limitations** introduced by vLLM V1. The team has been working actively to bring V1 as the default engine, therefore this guide will be updated constantly as more features get supported on vLLM V1.
 
-## Current Status
+## Differences from V0
 
-For each item, our progress towards V1 support falls into one of the following states:
+This section lists some differences in behavior between V0 and V1.
 
-- **🚀 Optimized**: Nearly fully optimized, with no further work currently planned.
-- **🟢 Functional**: Fully operational, with ongoing optimizations.
-- **🚧 WIP**: Under active development.
-- **🟡 Planned**: Scheduled for future implementation (some may have open PRs/RFCs).
-- **🟠 Delayed**: Temporarily dropped in V1 but planned to be re-introduced later.
-- **🔴 Deprecated**: Not planned for V1 unless there is strong demand.
+### Chunked Prefill
+
+Chunked prefill is enabled by default whenever possible, unlike in V0 where it was conditionally enabled based on model characteristics.
+
+### CUDA Graphs
+
+CUDA graph capture takes up more memory in V1 than in V0.
+
+### Semantic Changes to Logprobs
+
+#### Logprobs Calculation
+
+By default, logprobs in V1 are now returned immediately once computed from the model’s raw output (i.e.
+before applying any logits post-processing such as temperature scaling or penalty
+adjustments). As a result, the returned logprobs do not reflect the final adjusted
+probabilities used during sampling.
+
+You can adjust this behavior by setting the `--logprobs-mode` flag.
+Four modes are supported: `raw_logprobs` (default), `processed_logprobs`, `raw_logits`, `processed_logits`.
+Raw means the values before applying any logit processors, like bad words.
+Processed means the values after applying all processors, including temperature and top_k/top_p.
+
+#### Prompt Logprobs with Prefix Caching
+
+While V1 supports passing prompt logprobs with prefix caching enabled, it no longer caches the logprobs.
+For a request requiring prompt logprobs, the engine will ignore the prefix cache and recompute the prefill of full prompt to generate the logprobs.
+
+## Feature Support
+
+For each item, its support in vLLM V1 falls into one of the following states:
+
+- **🟢 Functional**: Fully operational with optimizations comparable to or better than V0.
+- **🟡 In Progress**: Planned to be in vLLM V1, with open PRs/RFCs.
+- **🔴 Removed**: Dropped from vLLM V1. Will only consider re-introducing if there is strong demand.
 
 !!! note
     vLLM V1’s unified scheduler treats both prompt and output tokens the same
@@ -57,13 +83,13 @@ based on assigned priority, with FCFS as a tie-breaker), configurable via the
 
 ### Hardware
 
-| Hardware   | Status                                        |
-|------------|-----------------------------------------------|
-| **NVIDIA** | <nobr>🚀</nobr>                               |
-| **AMD**    | <nobr>🟢</nobr>                               |
+| Hardware         | Status                                        |
+|------------------|-----------------------------------------------|
+| **NVIDIA**       | <nobr>🟢</nobr>                               |
+| **AMD**          | <nobr>🟢</nobr>                               |
 | **INTEL GPU**    | <nobr>🟢</nobr>                               |
-| **TPU**    | <nobr>🟢</nobr>                               |
-| **CPU**    | <nobr>🟢 (x86\_64/aarch64) 🟡 (MacOS) </nobr> |
+| **TPU**          | <nobr>🟢</nobr>                               |
+| **CPU**          | <nobr>🟢</nobr>                               |
 
 !!! note
 
@@ -78,23 +104,21 @@ based on assigned priority, with FCFS as a tie-breaker), configurable via the
 
 ### Models
 
-| Model Type                  | Status                                                                             |
-|-----------------------------|------------------------------------------------------------------------------------|
-| **Decoder-only Models**     | <nobr>🚀 Optimized</nobr>                                                          |
-| **Encoder-Decoder Models**  | <nobr>🟢 Whisper only</nobr>                                                       |
-| **Embedding Models**        | <nobr>🟢 Functional</nobr>                                                         |
-| **Mamba Models**            | <nobr>🟢 (Mamba-2), 🟢 (Mamba-1)</nobr>                                            |
-| **Multimodal Models**       | <nobr>🟢 Functional</nobr>                                                         |
+| Model Type                  | Status                                                                  |
+|-----------------------------|-------------------------------------------------------------------------|
+| **Decoder-only Models**     | <nobr>🟢</nobr>                                                         |
+| **Encoder-Decoder Models**  | <nobr>🟢 (Whisper), 🔴 (Others) </nobr>                                |
+| **Pooling Models**          | <nobr>🟢</nobr>                                                         |
+| **Mamba Models**            | <nobr>🟢</nobr>                                                         |
+| **Multimodal Models**       | <nobr>🟢</nobr>                                                         |
 
 See below for the status of models that are not yet supported or have more features planned in V1.
 
-#### Embedding Models
+#### Pooling Models
 
-The initial basic support is now functional.
+Now fully supported, with prefix caching and chunked prefill newly available for last-pooling models.
 
-Later, we will consider using [hidden states processor](https://github.com/vllm-project/vllm/issues/12249),
-which is based on [global logits processor](https://github.com/vllm-project/vllm/pull/13360)
-to enable simultaneous generation and embedding using the same engine instance in V1.
+We are working on enabling prefix caching and chunked prefill for more categories of pooling models.
 
 #### Mamba Models
 
@@ -112,24 +136,25 @@ Please note that prefix caching is not yet supported for any of the above models
 
 Whisper is supported. Other models requiring cross-attention between separate
 encoder and decoder (e.g., `BartForConditionalGeneration`,
-`MllamaForConditionalGeneration`) are not supported.
+`MllamaForConditionalGeneration`) are no longer supported.
 
 ### Features
 
 | Feature                                     | Status                                                                            |
 |---------------------------------------------|-----------------------------------------------------------------------------------|
-| **Prefix Caching**                          | <nobr>🚀 Optimized</nobr>                                                         |
-| **Chunked Prefill**                         | <nobr>🚀 Optimized</nobr>                                                         |
-| **LoRA**                                    | <nobr>🚀 Optimized</nobr>                                                         |
+| **Prefix Caching**                          | <nobr>🟢 Functional</nobr>                                                        |
+| **Chunked Prefill**                         | <nobr>🟢 Functional</nobr>                                                        |
+| **LoRA**                                    | <nobr>🟢 Functional</nobr>                                                        |
 | **Logprobs Calculation**                    | <nobr>🟢 Functional</nobr>                                                        |
-| **FP8 KV Cache**                            | <nobr>🟢 Functional on Hopper devices (<https://github.com/vllm-project/vllm/pull/15191>)</nobr>|
-| **Spec Decode**                             | <nobr>🚀 Optimized</nobr>                                                         |
-| **Prompt Logprobs with Prefix Caching**     | <nobr>🟡 Planned ([RFC #13414](https://github.com/vllm-project/vllm/issues/13414))</nobr>|
+| **FP8 KV Cache**                            | <nobr>🟢 Functional</nobr>                                                        |
+| **Spec Decode**                             | <nobr>🟢 Functional</nobr>                                                        |
+| **Prompt Logprobs with Prefix Caching**     | <nobr>🟢 Functional</nobr>                                                        |
 | **Structured Output Alternative Backends**  | <nobr>🟢 Functional</nobr>                                                        |
-| **Request-level Structured Output Backend** | <nobr>🔴 Deprecated</nobr>                                                        |
-| **best_of**                                 | <nobr>🔴 Deprecated ([RFC #13361](https://github.com/vllm-project/vllm/issues/13361))</nobr>|
-| **Per-Request Logits Processors**           | <nobr>🔴 Deprecated ([RFC #13360](https://github.com/vllm-project/vllm/pull/13360))</nobr> |
-| **GPU <> CPU KV Cache Swapping**            | <nobr>🔴 Deprecated</nobr>                                                        |
+| **Concurrent Partial Prefills**             | <nobr>🟡 [In Progress](https://github.com/vllm-project/vllm/issues/14003)</nobr>  |
+| **best_of**                                 | <nobr>🔴 [Removed](https://github.com/vllm-project/vllm/issues/13361)</nobr>      |
+| **Per-Request Logits Processors**           | <nobr>🔴 [Removed](https://github.com/vllm-project/vllm/pull/13360)</nobr>        |
+| **GPU <> CPU KV Cache Swapping**            | <nobr>🔴 Removed</nobr>                                                           |
+| **Request-level Structured Output Backend** | <nobr>🔴 Removed</nobr>                                                           |
 
 !!! note
 
@@ -139,37 +164,16 @@ encoder and decoder (e.g., `BartForConditionalGeneration`,
     prefix caching, and speculative decoding without a strict separation between prefill
     and decode phases.
 
-#### Semantic Changes to Logprobs
+#### Removed Features
 
-vLLM V1 supports logprobs and prompt logprobs. However, there are some important semantic
-differences compared to V0:
-
-##### Logprobs Calculation
-
-By default, logprobs in V1 are now returned immediately once computed from the model’s raw output (i.e.
-before applying any logits post-processing such as temperature scaling or penalty
-adjustments). As a result, the returned logprobs do not reflect the final adjusted
-probabilities used during sampling.
-
-You can adjust this behavior by setting the `--logprobs-mode` flag.
-Four modes are supported: `raw_logprobs` (default), `processed_logprobs`, `raw_logits`, `processed_logits`.
-Raw means the values before applying any logit processors, like bad words.
-Processed means the values after applying all processors, including temperature and top_k/top_p.
-
-##### Prompt Logprobs with Prefix Caching
-
-Logprobs are not cached. For a request requiring prompt logprobs, the engine will ignore the prefix cache and recompute the prefill of full prompt to generate the logprobs.
-
-#### Deprecated Features
-
-As part of the major architectural rework in vLLM V1, several legacy features have been deprecated.
+As part of the major architectural rework in vLLM V1, several legacy features have been removed.
 
 ##### Sampling features
 
-- **best_of**: This feature has been deprecated due to limited usage. See details at [RFC #13361](https://github.com/vllm-project/vllm/issues/13361).
+- **best_of**: This feature has been removed due to limited usage. See details at [RFC #13361](https://github.com/vllm-project/vllm/issues/13361).
 - **Per-Request Logits Processors**: In V0, users could pass custom
   processing functions to adjust logits on a per-request basis. In vLLM V1, this
-  feature has been deprecated. Instead, we now support **global logits processors**
+  feature has been removed. Instead, we now support **global logits processors**
   which are set at startup time, see [RFC #17799](https://github.com/vllm-project/vllm/issues/17799).
 
 ##### KV Cache features
@@ -179,4 +183,4 @@ to handle request preemptions.
 
 ##### Structured Output features
 
-- **Request-level Structured Output Backend**: Deprecated, alternative backends (outlines, guidance) with fallbacks is supported now.
+- **Request-level Structured Output Backend**: Removed; alternative backends (outlines, guidance) with fallbacks are supported now.
diff --git a/examples/offline_inference/reproducibility.py b/examples/offline_inference/reproducibility.py
index e135bc1b2abb7..72c1e841dca45 100644
--- a/examples/offline_inference/reproducibility.py
+++ b/examples/offline_inference/reproducibility.py
@@ -11,8 +11,11 @@ import random
 
 from vllm import LLM, SamplingParams
 
-# Turn off multiprocessing to make the scheduling deterministic.
+# Either:
+## Turn off multiprocessing to make the scheduling deterministic, or
 os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"] = "0"
+## Enable batch invariance to get consistent results regardless of scheduling.
+os.environ["VLLM_BATCH_INVARIANT"] = "1"
 
 prompts = [
     "Hello, my name is",
diff --git a/tests/models/language/generation/test_common.py b/tests/models/language/generation/test_common.py
index 0cdb7c9a603f2..df6c2cab7814b 100644
--- a/tests/models/language/generation/test_common.py
+++ b/tests/models/language/generation/test_common.py
@@ -10,13 +10,6 @@ from ....utils import large_gpu_mark
 from ...registry import HF_EXAMPLE_MODELS
 from ...utils import check_logprobs_close
 
-# These have unsupported head_dim for FA. We do not
-# have a clean way to fall back, so we fail with
-# a clear msg when it happens.
-# https://github.com/vllm-project/vllm/issues/14524
-# NOTE(woosuk): Skipping these tests until V1 supports them.
-# REQUIRES_V0 = ["microsoft/phi-2", "stabilityai/stablelm-3b-4e1t"]
-
 # This list contains the model that are using AITER kernel.
 # Skip model that are not using AITER tests.
 # When more AITER kernels are added, this list will not be

From 20ee418adc279f29e76e7770c4f688c4fc070274 Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Sat, 22 Nov 2025 20:12:50 -0800
Subject: [PATCH 71/83] [Model Runner V2] Minor fix for cudagraph_utils
 (#29256)

---
 vllm/v1/worker/gpu/cudagraph_utils.py | 19 +++++--------------
 vllm/v1/worker/gpu/model_runner.py    |  1 +
 2 files changed, 6 insertions(+), 14 deletions(-)

diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
index 763bd61834625..654bd60e558b1 100644
--- a/vllm/v1/worker/gpu/cudagraph_utils.py
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import gc
-from contextlib import contextmanager
+from unittest.mock import patch
 
 import numpy as np
 import torch
@@ -140,6 +139,7 @@ class CudaGraphManager:
             attn_metadata,
             self.vllm_config,
             num_tokens=batch_size,
+            cudagraph_runtime_mode=CUDAGraphMode.NONE,
             num_tokens_across_dp=num_tokens_across_dp,
         ):
             hidden_states = model(
@@ -148,15 +148,16 @@ class CudaGraphManager:
             )
             if self.hidden_states is None:
                 self.hidden_states = torch.empty_like(hidden_states)
-        torch.cuda.synchronize()
 
         # Capture the graph.
         graph = torch.cuda.CUDAGraph()
         with (
+            patch("torch.cuda.empty_cache", lambda: None),
             set_forward_context(
                 attn_metadata,
                 self.vllm_config,
                 num_tokens=batch_size,
+                cudagraph_runtime_mode=CUDAGraphMode.NONE,
                 num_tokens_across_dp=num_tokens_across_dp,
             ),
             torch.cuda.graph(graph, self.pool),
@@ -183,7 +184,7 @@ class CudaGraphManager:
         if is_global_first_rank():
             sizes_to_capture = tqdm(sizes_to_capture, desc="Capturing CUDA graphs")
 
-        with freeze_gc(), graph_capture(device=self.device):
+        with graph_capture(device=self.device):
             for batch_size in sizes_to_capture:
                 self.capture_graph(
                     batch_size,
@@ -199,13 +200,3 @@ class CudaGraphManager:
         self.graphs[batch_size].replay()
         assert self.hidden_states is not None
         return self.hidden_states[:batch_size]
-
-
-@contextmanager
-def freeze_gc():
-    gc.collect()
-    gc.freeze()
-    try:
-        yield
-    finally:
-        gc.unfreeze()
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
index 9ca37ff282d82..9d6e2cf92a8cc 100644
--- a/vllm/v1/worker/gpu/model_runner.py
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -298,6 +298,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             return 0
 
         start_time = time.perf_counter()
+        torch.cuda.empty_cache()
         start_free_gpu_memory = torch.cuda.mem_get_info()[0]
 
         with self.maybe_setup_dummy_loras(self.lora_config):

From 71362ffab4ef3f5f99ecae2f345f8c689e903f7d Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Sat, 22 Nov 2025 22:42:49 -0600
Subject: [PATCH 72/83] [CI/Build][AMD] Skip
 test_multi_shared_storage_connector_consistency  in test_multi_connector.py
 due to hipErrorLaunchFailure  when calling .cpu() (#29253)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/v1/kv_connector/unit/test_multi_connector.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/tests/v1/kv_connector/unit/test_multi_connector.py b/tests/v1/kv_connector/unit/test_multi_connector.py
index 1c1ac915c758e..ffa7d884d2762 100644
--- a/tests/v1/kv_connector/unit/test_multi_connector.py
+++ b/tests/v1/kv_connector/unit/test_multi_connector.py
@@ -20,6 +20,7 @@ from vllm.distributed.kv_transfer.kv_connector.v1.multi_connector import (
 from vllm.distributed.kv_transfer.kv_connector.v1.nixl_connector import (
     NixlKVConnectorStats,
 )
+from vllm.platforms import current_platform
 
 MODEL_NAME = "meta-llama/Llama-3.2-1B-Instruct"
 
@@ -69,6 +70,13 @@ def _compare_directories(dir1: Path, dir2: Path) -> bool:
     return True
 
 
+@pytest.mark.skipif(
+    current_platform.is_rocm(),
+    reason=(
+        "hipErrorLaunchFailure when running this test, see issue:"
+        "https://github.com/ROCm/pytorch/issues/2822"
+    ),
+)
 def test_multi_shared_storage_connector_consistency():
     """
     Tests that MultiConnector with two SharedStorageConnectors saves

From 3999442f1c1d091dda370bc8cb2022f54b7d805b Mon Sep 17 00:00:00 2001
From: rasmith <Randall.Smith@amd.com>
Date: Sat, 22 Nov 2025 22:45:08 -0600
Subject: [PATCH 73/83] [CI/Build][AMD] Add check for flash_att_varlen_func to
 test_tree_attention.py (#29252)

Signed-off-by: Randall Smith <ransmith@amd.com>
Co-authored-by: Randall Smith <ransmith@amd.com>
---
 tests/v1/spec_decode/test_tree_attention.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/tests/v1/spec_decode/test_tree_attention.py b/tests/v1/spec_decode/test_tree_attention.py
index 6958d62dc7e90..a4ee53008ce82 100644
--- a/tests/v1/spec_decode/test_tree_attention.py
+++ b/tests/v1/spec_decode/test_tree_attention.py
@@ -3,6 +3,7 @@
 
 import math
 
+import pytest
 import torch
 
 from tests.v1.attention.utils import (
@@ -11,9 +12,16 @@ from tests.v1.attention.utils import (
     try_get_attention_backend,
 )
 from vllm.attention.backends.registry import AttentionBackendEnum
+from vllm.attention.utils.fa_utils import is_flash_attn_varlen_func_available
 from vllm.config import ParallelConfig, SpeculativeConfig
 from vllm.v1.attention.backends.utils import CommonAttentionMetadata
 
+if not is_flash_attn_varlen_func_available():
+    pytest.skip(
+        "This test requires flash_attn_varlen_func, but it's not available.",
+        allow_module_level=True,
+    )
+
 
 class MockAttentionLayer(torch.nn.Module):
     _q_scale = torch.tensor(1.0, dtype=torch.float32, device="cuda")

From 55c21c88363811feb2aeb5aecac3cd48683e4705 Mon Sep 17 00:00:00 2001
From: Micah Williamson <micah.williamson@amd.com>
Date: Sat, 22 Nov 2025 23:05:00 -0600
Subject: [PATCH 74/83] [ROCm][CI] Fix "Cannot re-initialize CUDA in forked
 subprocess" in test_pynccl.py  (#29119)

Signed-off-by: Micah Williamson <micah.williamson@amd.com>
---
 requirements/rocm-test.txt       | 3 +++
 tests/distributed/test_pynccl.py | 8 +++++---
 2 files changed, 8 insertions(+), 3 deletions(-)

diff --git a/requirements/rocm-test.txt b/requirements/rocm-test.txt
index eabb5065bfceb..2d57e7e167869 100644
--- a/requirements/rocm-test.txt
+++ b/requirements/rocm-test.txt
@@ -40,5 +40,8 @@ mteb[bm25s]>=1.38.11, <2
 # Required for eval tests
 lm-eval[api] @ git+https://github.com/EleutherAI/lm-evaluation-harness.git@206b7722158f58c35b7ffcd53b035fdbdda5126d
 
+# Required for multiprocessed tests that use spawn method
+multiprocess==0.70.16
+
 # Plugins test
 terratorch @ git+https://github.com/IBM/terratorch.git@07184fcf91a1324f831ff521dd238d97fe350e3e
diff --git a/tests/distributed/test_pynccl.py b/tests/distributed/test_pynccl.py
index c3085beeb3564..c7c9d0602def0 100644
--- a/tests/distributed/test_pynccl.py
+++ b/tests/distributed/test_pynccl.py
@@ -1,9 +1,9 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import multiprocessing
 import os
 
+import multiprocess as mp
 import numpy as np
 import pytest
 import torch
@@ -20,10 +20,12 @@ from vllm.distributed.parallel_state import (
 )
 from vllm.utils.system_utils import update_environment_variables
 
+mp.set_start_method("spawn", force=True)
+
 
 def distributed_run(fn, world_size):
     number_of_processes = world_size
-    processes: list[multiprocessing.Process] = []
+    processes: list[mp.Process] = []
     for i in range(number_of_processes):
         env: dict[str, str] = {}
         env["RANK"] = str(i)
@@ -32,7 +34,7 @@ def distributed_run(fn, world_size):
         env["LOCAL_WORLD_SIZE"] = str(number_of_processes)
         env["MASTER_ADDR"] = "localhost"
         env["MASTER_PORT"] = "12345"
-        p = multiprocessing.Process(target=fn, args=(env,))
+        p = mp.Process(target=fn, args=(env,))
         processes.append(p)
         p.start()
 

From 6fb0215eee44cf5e4b28f57e6739ef4a51945127 Mon Sep 17 00:00:00 2001
From: Luke <yq0536@gmail.com>
Date: Sun, 23 Nov 2025 06:43:21 -0500
Subject: [PATCH 75/83] [Bugfix] Use lazy string reference for DeepseekV3Config
 in config registry (#28958)

Signed-off-by: Luke <yq0536@gmail.com>
Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>
---
 vllm/transformers_utils/config.py           | 4 ++--
 vllm/transformers_utils/configs/__init__.py | 6 ++++++
 2 files changed, 8 insertions(+), 2 deletions(-)

diff --git a/vllm/transformers_utils/config.py b/vllm/transformers_utils/config.py
index db7bf228f411d..3d282da8c6112 100644
--- a/vllm/transformers_utils/config.py
+++ b/vllm/transformers_utils/config.py
@@ -27,7 +27,7 @@ from huggingface_hub.utils import (
     RevisionNotFoundError,
 )
 from packaging.version import Version
-from transformers import DeepseekV3Config, GenerationConfig, PretrainedConfig
+from transformers import GenerationConfig, PretrainedConfig
 from transformers.configuration_utils import ALLOWED_LAYER_TYPES
 from transformers.models.auto.image_processing_auto import get_image_processor_config
 from transformers.models.auto.modeling_auto import (
@@ -84,7 +84,7 @@ _CONFIG_REGISTRY: dict[str, type[PretrainedConfig]] = LazyConfigDict(
     afmoe="AfmoeConfig",
     chatglm="ChatGLMConfig",
     deepseek_vl_v2="DeepseekVLV2Config",
-    deepseek_v32=DeepseekV3Config,
+    deepseek_v32="DeepseekV3Config",
     flex_olmo="FlexOlmoConfig",
     kimi_linear="KimiLinearConfig",
     kimi_vl="KimiVLConfig",
diff --git a/vllm/transformers_utils/configs/__init__.py b/vllm/transformers_utils/configs/__init__.py
index dcae05a15fec3..d28fd8d033373 100644
--- a/vllm/transformers_utils/configs/__init__.py
+++ b/vllm/transformers_utils/configs/__init__.py
@@ -5,8 +5,13 @@ Model configs may be defined in this directory for the following reasons:
 
 - There is no configuration file defined by HF Hub or Transformers library.
 - There is a need to override the existing config to support vLLM.
+- The HF model_type isn't recognized by the Transformers library but can
+  be mapped to an existing Transformers config, such as
+  deepseek-ai/DeepSeek-V3.2-Exp.
 """
 
+from transformers import DeepseekV3Config
+
 from vllm.transformers_utils.configs.afmoe import AfmoeConfig
 from vllm.transformers_utils.configs.chatglm import ChatGLMConfig
 from vllm.transformers_utils.configs.deepseek_vl2 import DeepseekVLV2Config
@@ -44,6 +49,7 @@ __all__ = [
     "AfmoeConfig",
     "ChatGLMConfig",
     "DeepseekVLV2Config",
+    "DeepseekV3Config",
     "DotsOCRConfig",
     "EAGLEConfig",
     "FlexOlmoConfig",

From 7f12c82fa62cee7e815332c1ab2714bdee2a075e Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Sun, 23 Nov 2025 09:42:52 -0800
Subject: [PATCH 76/83] [Model Runner V2] Change bookkeeping logic in
 preparation for spec decoding (#29194)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/async_utils.py     |   7 +-
 vllm/v1/worker/gpu/attn_utils.py      |  14 +-
 vllm/v1/worker/gpu/cudagraph_utils.py |   8 +-
 vllm/v1/worker/gpu/input_batch.py     | 174 ++++++++++++++++-------
 vllm/v1/worker/gpu/model_runner.py    | 193 ++++++++++++++++----------
 vllm/v1/worker/gpu/states.py          |  13 +-
 6 files changed, 269 insertions(+), 140 deletions(-)

diff --git a/vllm/v1/worker/gpu/async_utils.py b/vllm/v1/worker/gpu/async_utils.py
index e523090aa2172..421fb29a7f87f 100644
--- a/vllm/v1/worker/gpu/async_utils.py
+++ b/vllm/v1/worker/gpu/async_utils.py
@@ -2,7 +2,6 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 from contextlib import contextmanager
 
-import numpy as np
 import torch
 
 from vllm.v1.outputs import (
@@ -18,7 +17,7 @@ class AsyncOutput(AsyncModelRunnerOutput):
         self,
         model_runner_output: ModelRunnerOutput,
         sampler_output: SamplerOutput,
-        num_sampled_tokens: np.ndarray,
+        num_sampled_tokens: torch.Tensor,
         copy_stream: torch.cuda.Stream,
         copy_event: torch.cuda.Event,
     ):
@@ -52,6 +51,7 @@ class AsyncOutput(AsyncModelRunnerOutput):
                 )
             else:
                 self.logprobs_tensors = None
+            self.num_sampled_tokens = num_sampled_tokens.to("cpu", non_blocking=True)
             self.prompt_logprobs_dict: dict[str, LogprobsTensors | None] = {}
             if self.model_runner_output.prompt_logprobs_dict:
                 for k, v in self.model_runner_output.prompt_logprobs_dict.items():
@@ -63,6 +63,7 @@ class AsyncOutput(AsyncModelRunnerOutput):
 
     def get_output(self) -> ModelRunnerOutput:
         self.copy_event.synchronize()
+        num_sampled_tokens_np = self.num_sampled_tokens.numpy()
 
         # NOTE(woosuk): The following code is to ensure compatibility with
         # the existing model runner.
@@ -71,7 +72,7 @@ class AsyncOutput(AsyncModelRunnerOutput):
         sampled_token_ids: list[list[int]] = self.sampled_token_ids.tolist()
         num_reqs = len(sampled_token_ids)
         for i in range(num_reqs):
-            del sampled_token_ids[i][self.num_sampled_tokens[i] :]
+            del sampled_token_ids[i][num_sampled_tokens_np[i] :]
         self.model_runner_output.sampled_token_ids = sampled_token_ids
 
         if self.logprobs_tensors is not None:
diff --git a/vllm/v1/worker/gpu/attn_utils.py b/vllm/v1/worker/gpu/attn_utils.py
index 222db565dff17..4510a1c5ca1e9 100644
--- a/vllm/v1/worker/gpu/attn_utils.py
+++ b/vllm/v1/worker/gpu/attn_utils.py
@@ -3,6 +3,7 @@
 from collections.abc import Sequence
 from typing import Any, cast
 
+import numpy as np
 import torch
 
 from vllm.attention.backends.abstract import AttentionBackend
@@ -145,8 +146,9 @@ def build_attn_metadata(
     num_reqs: int,
     num_tokens: int,
     query_start_loc: CpuGpuBuffer,
-    seq_lens: CpuGpuBuffer,
-    num_computed_tokens_cpu: torch.Tensor,
+    seq_lens: torch.Tensor,
+    seq_lens_np: np.ndarray,
+    num_computed_tokens_cpu: torch.Tensor | None,
     block_tables: Sequence[torch.Tensor],
     slot_mappings: torch.Tensor,
     kv_cache_config: KVCacheConfig,
@@ -154,9 +156,9 @@ def build_attn_metadata(
     query_start_loc_gpu = query_start_loc.gpu[: num_reqs + 1]
     query_start_loc_cpu = query_start_loc.cpu[: num_reqs + 1]
     max_query_len = int(query_start_loc.np[: num_reqs + 1].max())
-    seq_lens_gpu = seq_lens.gpu[:num_reqs]
-    seq_lens_cpu = seq_lens.cpu[:num_reqs]
-    max_seq_len = int(seq_lens.np[:num_reqs].max())
+    seq_lens = seq_lens[:num_reqs]
+    seq_lens_cpu = torch.from_numpy(seq_lens_np)
+    max_seq_len = int(seq_lens_np.max())
 
     attn_metadata: dict[str, Any] = {}
     kv_cache_groups = kv_cache_config.kv_cache_groups
@@ -167,7 +169,7 @@ def build_attn_metadata(
         common_attn_metadata = CommonAttentionMetadata(
             query_start_loc=query_start_loc_gpu,
             query_start_loc_cpu=query_start_loc_cpu,
-            seq_lens=seq_lens_gpu,
+            seq_lens=seq_lens,
             seq_lens_cpu=seq_lens_cpu,
             max_seq_len=max_seq_len,
             num_computed_tokens_cpu=num_computed_tokens_cpu,
diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
index 654bd60e558b1..dccf747369e4e 100644
--- a/vllm/v1/worker/gpu/cudagraph_utils.py
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -101,14 +101,13 @@ class CudaGraphManager:
 
         # Prepare dummy inputs.
         input_ids = input_buffers.input_ids.gpu[:batch_size]
-        positions = input_buffers.positions.gpu[:batch_size]
+        positions = input_buffers.positions[:batch_size]
 
         input_buffers.query_start_loc.np[: batch_size + 1] = np.arange(batch_size + 1)
         input_buffers.query_start_loc.np[batch_size:] = batch_size
         input_buffers.query_start_loc.copy_to_gpu()
-        input_buffers.seq_lens.np[:batch_size] = self.max_model_len
-        input_buffers.seq_lens.np[batch_size:] = 0
-        input_buffers.seq_lens.copy_to_gpu()
+        input_buffers.seq_lens[:batch_size] = self.max_model_len
+        input_buffers.seq_lens[batch_size:] = 0
 
         input_block_tables = [x[:batch_size] for x in block_tables.input_block_tables]
         slot_mappings = block_tables.slot_mappings[:, :batch_size]
@@ -119,6 +118,7 @@ class CudaGraphManager:
             num_tokens=batch_size,
             query_start_loc=input_buffers.query_start_loc,
             seq_lens=input_buffers.seq_lens,
+            seq_lens_np=np.full(batch_size, self.max_model_len, dtype=np.int32),
             num_computed_tokens_cpu=None,  # FIXME
             block_tables=input_block_tables,
             slot_mappings=slot_mappings,
diff --git a/vllm/v1/worker/gpu/input_batch.py b/vllm/v1/worker/gpu/input_batch.py
index 8313b32d29797..b671c093113ba 100644
--- a/vllm/v1/worker/gpu/input_batch.py
+++ b/vllm/v1/worker/gpu/input_batch.py
@@ -32,9 +32,9 @@ class InputBuffers:
 
         self.idx_mapping = self._make_buffer(max_num_reqs, dtype=torch.int32)
         self.input_ids = self._make_buffer(max_num_tokens, dtype=torch.int32)
-        self.positions = self._make_buffer(max_num_tokens, dtype=torch.int64)
+        self.positions = torch.zeros(max_num_tokens, dtype=torch.int64, device=device)
         self.query_start_loc = self._make_buffer(max_num_reqs + 1, dtype=torch.int32)
-        self.seq_lens = self._make_buffer(max_num_reqs, dtype=torch.int32)
+        self.seq_lens = torch.zeros(max_num_reqs, dtype=torch.int32, device=device)
 
         # Structured outputs.
         self.bitmask_indices = self._make_buffer(max_num_reqs, dtype=torch.int32)
@@ -107,13 +107,15 @@ class InputBatch:
         query_start_loc_np = input_buffers.query_start_loc.np[: num_reqs + 1]
         query_start_loc = input_buffers.query_start_loc.copy_to_gpu()[: num_reqs + 1]
         # seq_len equals to query_len
-        input_buffers.seq_lens.np[:num_reqs] = num_scheduled_tokens
-        input_buffers.seq_lens.np[num_reqs:] = 0
-        seq_lens_np = input_buffers.seq_lens.np[:num_reqs]
-        seq_lens = input_buffers.seq_lens.copy_to_gpu()[:num_reqs]
+        seq_lens_np = np.full(num_reqs, num_tokens // num_reqs, dtype=np.int32)
+        seq_lens_np[-1] += num_tokens % num_reqs
+        input_buffers.seq_lens[:num_reqs] = num_tokens // num_reqs
+        input_buffers.seq_lens[num_reqs - 1] += num_tokens % num_reqs
+        input_buffers.seq_lens[num_reqs:] = 0
+        seq_lens = input_buffers.seq_lens[:num_reqs]
 
         input_ids = input_buffers.input_ids.copy_to_gpu(num_tokens)
-        positions = input_buffers.positions.copy_to_gpu(num_tokens)
+        positions = input_buffers.positions[:num_tokens]
         # attn_metadata = defaultdict(lambda: None)
         logits_indices = query_start_loc[1:] - 1
         return cls(
@@ -141,27 +143,25 @@ class InputBatch:
     [
         types.none(
             types.int32[:],  # idx_mapping
-            types.int32[:, :],  # token_ids
-            types.int32[:],  # num_computed_tokens
             types.int32[:],  # num_scheduled_tokens
+            types.int32[:, :],  # prefill_token_ids
+            types.int32[:],  # num_computed_prefill_tokens
+            types.int32[:],  # prefill_len
             types.int32[:],  # input_ids
-            types.int64[:],  # positions
             types.int32[:],  # query_start_loc
-            types.int32[:],  # seq_lens
         )
     ],
     nopython=True,
     cache=True,
 )
-def _prepare_inputs(
+def _prepare_prefill_inputs(
     idx_mapping: np.ndarray,  # batch_idx -> req_idx
-    token_ids: np.ndarray,  # [N, max_model_len]
-    num_computed_tokens: np.ndarray,  # [N]
     num_scheduled_tokens: np.ndarray,  # [B]
+    prefill_token_ids: np.ndarray,  # [N, max_model_len]
+    num_computed_prefill_tokens: np.ndarray,  # [N]
+    prefill_len: np.ndarray,  # [N]
     input_ids: np.ndarray,  # [num_input_tokens]
-    positions: np.ndarray,  # [num_input_tokens]
     query_start_loc: np.ndarray,  # [B + 1]
-    seq_lens: np.ndarray,  # [B]
 ) -> None:
     num_reqs = num_scheduled_tokens.shape[0]
     query_start_loc[0] = 0
@@ -170,62 +170,112 @@ def _prepare_inputs(
     for i in range(num_reqs):
         req_idx = idx_mapping[i]
         query_len = num_scheduled_tokens[i]
-        start = num_computed_tokens[req_idx]
-        end = start + query_len
-        seq_lens[i] = end
+
+        start = num_computed_prefill_tokens[req_idx]
+        end = min(start + query_len, prefill_len[req_idx])
+        n = end - start
 
         start_idx = cu_num_tokens
-        end_idx = start_idx + query_len
-        input_ids[start_idx:end_idx] = token_ids[req_idx, start:end]
-        positions[start_idx:end_idx] = np.arange(start, end, dtype=np.int64)
+        input_ids[start_idx : start_idx + n] = prefill_token_ids[req_idx, start:end]
 
-        cu_num_tokens = end_idx
+        cu_num_tokens = start_idx + query_len
         query_start_loc[i + 1] = cu_num_tokens
 
     # Pad the inputs for CUDA graphs.
     # Note: pad query_start_loc to be non-decreasing, as kernels
     # like FlashAttention requires that
     query_start_loc[num_reqs + 1 :].fill(cu_num_tokens)
-    # Fill unused with 0 for full cuda graph mode.
-    seq_lens[num_reqs:].fill(0)
 
 
-def prepare_inputs(
+def prepare_prefill_inputs(
     idx_mapping: np.ndarray,
-    prefill_token_ids: np.ndarray,
-    num_computed_tokens: np.ndarray,
     num_scheduled_tokens: np.ndarray,
+    total_num_tokens: int,
+    prefill_token_ids: np.ndarray,
+    num_computed_prefill_tokens: np.ndarray,
+    prefill_len: np.ndarray,
     input_ids: CpuGpuBuffer,
-    positions: CpuGpuBuffer,
     query_start_loc: CpuGpuBuffer,
-    seq_lens: CpuGpuBuffer,
-    num_tokens: int,
 ) -> None:
-    _prepare_inputs(
+    _prepare_prefill_inputs(
         idx_mapping,
-        prefill_token_ids,
-        num_computed_tokens,
         num_scheduled_tokens,
+        prefill_token_ids,
+        num_computed_prefill_tokens,
+        prefill_len,
         input_ids.np,
-        positions.np,
         query_start_loc.np,
-        seq_lens.np,
     )
-    input_ids.copy_to_gpu(num_tokens)
-    positions.copy_to_gpu(num_tokens)
+    input_ids.copy_to_gpu(total_num_tokens)
     # NOTE(woosuk): We should copy the whole query_start_loc and seq_lens
     # tensors from CPU to GPU, because they may include paddings needed
     # for full CUDA graph mode.
     query_start_loc.copy_to_gpu()
-    seq_lens.copy_to_gpu()
-    return
 
 
 @triton.jit
-def _combine_last_token_ids_kernel(
+def _prepare_pos_seq_lens_kernel(
+    pos_ptr,
+    seq_lens_ptr,
+    idx_mapping_ptr,
+    query_start_loc_ptr,
+    num_computed_tokens_ptr,
+    max_num_reqs,
+    BLOCK_SIZE: tl.constexpr,
+):
+    req_id = tl.program_id(0)
+    num_reqs = tl.num_programs(0) - 1
+    if req_id == num_reqs:
+        # Pad unused seq_lens as 0 for full CUDA graphs.
+        for i in tl.range(num_reqs, max_num_reqs, BLOCK_SIZE):
+            block = i + tl.arange(0, BLOCK_SIZE)
+            mask = block < max_num_reqs
+            tl.store(seq_lens_ptr + block, 0, mask=mask)
+        return
+
+    req_state_idx = tl.load(idx_mapping_ptr + req_id)
+    num_computed_tokens = tl.load(num_computed_tokens_ptr + req_state_idx)
+
+    start = tl.load(query_start_loc_ptr + req_id)
+    end = tl.load(query_start_loc_ptr + req_id + 1)
+    query_len = end - start
+
+    seq_len = num_computed_tokens + query_len
+    tl.store(seq_lens_ptr + req_id, seq_len)
+
+    for i in tl.range(0, query_len, BLOCK_SIZE):
+        block = i + tl.arange(0, BLOCK_SIZE)
+        mask = block < query_len
+        pos = num_computed_tokens + block
+        tl.store(pos_ptr + start + block, pos, mask=mask)
+
+
+def prepare_pos_seq_lens(
+    idx_mapping: torch.Tensor,
+    query_start_loc: torch.Tensor,
+    num_computed_tokens: torch.Tensor,
+    pos: torch.Tensor,
+    seq_lens: torch.Tensor,
+) -> None:
+    num_reqs = idx_mapping.shape[0]
+    # NOTE(woosuk): We do +1 because the last thread block is used
+    # to pad unused seq_lens as 0 for full CUDA graphs.
+    _prepare_pos_seq_lens_kernel[(num_reqs + 1,)](
+        pos,
+        seq_lens,
+        idx_mapping,
+        query_start_loc,
+        num_computed_tokens,
+        seq_lens.shape[0],
+        BLOCK_SIZE=1024,
+    )
+
+
+@triton.jit
+def _combine_sampled_and_draft_tokens_kernel(
     input_ids_ptr,
     idx_mapping_ptr,
-    last_token_ids_ptr,
+    last_sampled_tokens_ptr,
     query_start_loc_ptr,
     seq_lens_ptr,
     prefill_len_ptr,
@@ -239,26 +289,56 @@ def _combine_last_token_ids_kernel(
         # Handling prefill tokens.
         return
 
-    last_token_id = tl.load(last_token_ids_ptr + req_state_idx)
+    last_token_id = tl.load(last_sampled_tokens_ptr + req_state_idx)
     end = tl.load(query_start_loc_ptr + batch_idx + 1)
     tl.store(input_ids_ptr + end - 1, last_token_id)
 
 
-def combine_last_token_ids(
+def combine_sampled_and_draft_tokens(
     input_ids: torch.Tensor,
     idx_mapping: torch.Tensor,
-    last_token_ids: torch.Tensor,
+    last_sampled_tokens: torch.Tensor,
     query_start_loc: torch.Tensor,
     seq_lens: torch.Tensor,
     prefill_len: torch.Tensor,
 ) -> torch.Tensor:
     num_reqs = seq_lens.shape[0]
-    _combine_last_token_ids_kernel[(num_reqs,)](
+    _combine_sampled_and_draft_tokens_kernel[(num_reqs,)](
         input_ids,
         idx_mapping,
-        last_token_ids,
+        last_sampled_tokens,
         query_start_loc,
         seq_lens,
         prefill_len,
     )
     return input_ids
+
+
+@triton.jit
+def _update_num_computed_tokens_kernel(
+    idx_mapping_ptr,
+    num_computed_tokens_ptr,
+    query_start_loc_ptr,
+):
+    req_id = tl.program_id(0)
+    req_state_idx = tl.load(idx_mapping_ptr + req_id)
+
+    start = tl.load(query_start_loc_ptr + req_id)
+    end = tl.load(query_start_loc_ptr + req_id + 1)
+    query_len = end - start
+
+    n = tl.load(num_computed_tokens_ptr + req_state_idx)
+    tl.store(num_computed_tokens_ptr + req_state_idx, n + query_len)
+
+
+def update_num_computed_tokens(
+    idx_mapping: torch.Tensor,
+    num_computed_tokens: torch.Tensor,
+    query_start_loc: torch.Tensor,
+) -> None:
+    num_reqs = idx_mapping.shape[0]
+    _update_num_computed_tokens_kernel[(num_reqs,)](
+        idx_mapping,
+        num_computed_tokens,
+        query_start_loc,
+    )
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
index 9d6e2cf92a8cc..bacfbd6c2f465 100644
--- a/vllm/v1/worker/gpu/model_runner.py
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -39,8 +39,10 @@ from vllm.v1.worker.gpu.dp_utils import get_batch_metadata_across_dp
 from vllm.v1.worker.gpu.input_batch import (
     InputBatch,
     InputBuffers,
-    combine_last_token_ids,
-    prepare_inputs,
+    combine_sampled_and_draft_tokens,
+    prepare_pos_seq_lens,
+    prepare_prefill_inputs,
+    update_num_computed_tokens,
 )
 from vllm.v1.worker.gpu.sampler import Sampler, compute_prompt_logprobs
 from vllm.v1.worker.gpu.states import RequestState, SamplingMetadata
@@ -179,6 +181,9 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             self.vllm_config,
             self.device,
         )
+        # TODO(woosuk): Support other backends.
+        if not all(b.get_name() == "FLASH_ATTN" for b in self.attn_backends.values()):
+            raise NotImplementedError("Only FLASH_ATTN backend is supported currently.")
 
         self.kv_caches: list[torch.Tensor] = []
         init_kv_cache(
@@ -196,8 +201,8 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         slot_mappings = self.block_tables.get_dummy_slot_mappings(
             input_batch.num_tokens
         )
-        num_computed_tokens_cpu = torch.zeros(
-            input_batch.num_reqs, dtype=torch.int32, device="cpu"
+        num_computed_tokens = torch.zeros(
+            input_batch.num_reqs, dtype=torch.int32, device=self.device
         )
         attn_metadata = build_attn_metadata(
             attn_metadata_builders=self.attn_metadata_builders,
@@ -205,7 +210,8 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             num_tokens=input_batch.num_tokens,
             query_start_loc=self.input_buffers.query_start_loc,
             seq_lens=self.input_buffers.seq_lens,
-            num_computed_tokens_cpu=num_computed_tokens_cpu,
+            seq_lens_np=input_batch.seq_lens_np,
+            num_computed_tokens_cpu=num_computed_tokens,
             block_tables=block_tables,
             slot_mappings=slot_mappings,
             kv_cache_config=self.kv_cache_config,
@@ -368,6 +374,9 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                 cu_num_new_blocks[i].append(x + len(block_ids))
                 new_block_ids[i].extend(block_ids)
             overwrite.append(True)
+        # Update the GPU tensors for request states.
+        if scheduler_output.scheduled_new_reqs:
+            self.req_states.prefill_len.copy_to_gpu()
 
         # Add new blocks for the existing requests.
         cached_reqs = scheduler_output.scheduled_cached_reqs
@@ -421,46 +430,60 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         # Block tables: num_kv_cache_groups x [num_reqs, max_num_blocks]
         block_tables = self.block_tables.gather_block_tables(idx_mapping)
 
-        prepare_inputs(
+        # Copy prefill tokens from CPU to GPU and get query_start_loc.
+        prepare_prefill_inputs(
             idx_mapping_np,
-            self.req_states.prefill_token_ids,
-            self.req_states.num_computed_tokens,
             num_scheduled_tokens,
-            self.input_buffers.input_ids,
-            self.input_buffers.positions,
-            self.input_buffers.query_start_loc,
-            self.input_buffers.seq_lens,
             num_tokens,
+            self.req_states.prefill_token_ids,
+            self.req_states.num_computed_prefill_tokens,
+            self.req_states.prefill_len.np,
+            self.input_buffers.input_ids,
+            self.input_buffers.query_start_loc,
         )
-
         query_start_loc = self.input_buffers.query_start_loc
         query_start_loc_gpu = query_start_loc.gpu[: num_reqs + 1]
         query_start_loc_np = query_start_loc.np[: num_reqs + 1]
-        seq_lens_gpu = self.input_buffers.seq_lens.gpu[:num_reqs]
-        seq_lens_np = self.input_buffers.seq_lens.np[:num_reqs]
 
-        # Some input token ids are directly read from the last sampled tokens.
-        combine_last_token_ids(
+        # Prepare positions and seq_lens.
+        prepare_pos_seq_lens(
+            idx_mapping,
+            query_start_loc_gpu,
+            self.req_states.num_computed_tokens,
+            self.input_buffers.positions,
+            self.input_buffers.seq_lens,
+        )
+        seq_lens = self.input_buffers.seq_lens[:num_reqs]
+
+        # Some input token ids are directly read from the last sampled tokens
+        # and draft tokens.
+        combine_sampled_and_draft_tokens(
             self.input_buffers.input_ids.gpu,
             idx_mapping,
             self.req_states.last_sampled_tokens,
             query_start_loc_gpu,
-            seq_lens_gpu,
-            self.req_states.prefill_len.copy_to_gpu(),
+            seq_lens,
+            self.req_states.prefill_len.gpu,
         )
 
         # Compute slot mappings: [num_kv_cache_groups, num_tokens]
         slot_mappings = self.block_tables.compute_slot_mappings(
-            query_start_loc_gpu, self.input_buffers.positions.gpu[:num_tokens]
-        )
-
-        num_computed_tokens_cpu = torch.from_numpy(
-            self.req_states.num_computed_tokens[idx_mapping_np]
+            query_start_loc_gpu, self.input_buffers.positions[:num_tokens]
         )
 
         # Logits indices to sample next token from.
         logits_indices = query_start_loc_gpu[1:] - 1
 
+        # Get num_computed_tokens.
+        # HACK(woosuk): Here, we use num_computed_tokens on GPU instead of
+        # num_computed_tokens_cpu. This works for most cases.
+        num_computed_tokens = self.req_states.num_computed_tokens[idx_mapping]
+        # HACK(woosuk): Only GPU has the exact seq_lens because at this point
+        # CPU does not know how many draft tokens are accepted/rejected in the
+        # previous step. Therefore, we use max_model_len to be safe.
+        # NOTE(woosuk): This only works for FA3 backend.
+        seq_lens_np = np.full(num_reqs, self.max_model_len, dtype=np.int32)
+
         # Layer name -> attention metadata.
         attn_metadata = build_attn_metadata(
             attn_metadata_builders=self.attn_metadata_builders,
@@ -468,14 +491,15 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             num_tokens=num_tokens,
             query_start_loc=self.input_buffers.query_start_loc,
             seq_lens=self.input_buffers.seq_lens,
-            num_computed_tokens_cpu=num_computed_tokens_cpu,
+            seq_lens_np=seq_lens_np,
+            num_computed_tokens_cpu=num_computed_tokens,
             block_tables=block_tables,
             slot_mappings=slot_mappings,
             kv_cache_config=self.kv_cache_config,
         )
 
         input_ids = self.input_buffers.input_ids.gpu[:num_tokens_after_padding]
-        positions = self.input_buffers.positions.gpu[:num_tokens_after_padding]
+        positions = self.input_buffers.positions[:num_tokens_after_padding]
         return InputBatch(
             req_ids=req_ids,
             num_reqs=num_reqs,
@@ -486,7 +510,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             num_tokens_after_padding=num_tokens_after_padding,
             query_start_loc=query_start_loc_gpu,
             query_start_loc_np=query_start_loc_np,
-            seq_lens=seq_lens_gpu,
+            seq_lens=seq_lens,
             seq_lens_np=seq_lens_np,
             input_ids=input_ids,
             positions=positions,
@@ -500,11 +524,12 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         input_batch: InputBatch,
         sampling_metadata: SamplingMetadata,
         grammar_output: GrammarOutput | None,
-    ) -> SamplerOutput:
+    ) -> tuple[SamplerOutput, torch.Tensor]:
         sample_hidden_states = hidden_states[input_batch.logits_indices]
         logits = self.model.compute_logits(sample_hidden_states)
         if grammar_output is not None:
             # Apply grammar bitmask to the logits in-place.
+            # TODO(woosuk): Make compatible with spec decoding.
             with async_barrier(self.structured_outputs_event):
                 apply_grammar_bitmask(
                     logits,
@@ -513,8 +538,14 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                     grammar_output.grammar_bitmask,
                     self.input_buffers,
                 )
+
         sampler_output = self.sampler(logits, sampling_metadata)
-        return sampler_output
+        # Get the number of sampled tokens.
+        # 0 if chunked-prefilling, 1 if not.
+        prefill_len = self.req_states.prefill_len.gpu[input_batch.idx_mapping]
+        is_chunked_prefilling = input_batch.seq_lens < prefill_len
+        num_sampled = (~is_chunked_prefilling).int()
+        return sampler_output, num_sampled
 
     def compute_prompt_logprobs(
         self,
@@ -527,11 +558,11 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             # No request asks for prompt logprobs.
             return {}
 
-        num_computed_tokens = self.req_states.num_computed_tokens[idx_mapping_np]
         prompt_lens = self.req_states.prompt_len[idx_mapping_np]
         # NOTE(woosuk): -1 because the last prompt token's hidden state is not
         # needed for prompt logprobs.
-        includes_prompt = num_computed_tokens < prompt_lens - 1
+        computed_prefill = self.req_states.num_computed_prefill_tokens[idx_mapping_np]
+        includes_prompt = computed_prefill < prompt_lens - 1
         # NOTE(woosuk): If the request was resumed after preemption, its prompt
         # logprobs must have been computed before preemption. Skip.
         resumed_after_prompt = (
@@ -550,8 +581,8 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         token_ids[n - 1] = 0
 
         # Handle chunked prompts.
-        seq_lens = self.input_buffers.seq_lens.np[: input_batch.num_reqs]
-        is_prompt_chunked = seq_lens < prompt_lens
+        pos_after_step = computed_prefill + input_batch.num_scheduled_tokens
+        is_prompt_chunked = pos_after_step < prompt_lens
         prefill_token_ids = self.req_states.prefill_token_ids
         query_start_loc = self.input_buffers.query_start_loc.np
         for i, req_id in enumerate(input_batch.req_ids):
@@ -561,7 +592,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                 continue
             # The prompt is chunked. Get the next prompt token.
             req_idx = input_batch.idx_mapping_np[i]
-            next_prompt_token = int(prefill_token_ids[req_idx, seq_lens[i]])
+            next_prompt_token = int(prefill_token_ids[req_idx, pos_after_step[i]])
             idx = int(query_start_loc[i + 1] - 1)
             # Set the next prompt token.
             # NOTE(woosuk): This triggers a GPU operation.
@@ -617,48 +648,27 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
 
     def postprocess(
         self,
-        sampler_output: SamplerOutput,
-        prompt_logprobs_dict: dict[str, LogprobsTensors],
         input_batch: InputBatch,
-    ) -> AsyncOutput | ModelRunnerOutput:
-        # Store the last sampled token ids.
-        self.req_states.last_sampled_tokens[input_batch.idx_mapping] = (
-            sampler_output.sampled_token_ids
+        sampled_tokens: torch.Tensor,
+        num_sampled: torch.Tensor,
+    ) -> None:
+        # Update the number of computed tokens.
+        update_num_computed_tokens(
+            input_batch.idx_mapping,
+            self.req_states.num_computed_tokens,
+            input_batch.query_start_loc,
         )
-        # Get the number of sampled tokens.
-        # 0 if chunked-prefilling, 1 if not.
         idx_mapping_np = input_batch.idx_mapping_np
-        is_chunked_prefilling = (
-            input_batch.seq_lens_np < self.req_states.num_tokens[idx_mapping_np]
-        )
-        num_sampled_tokens = (~is_chunked_prefilling).astype(np.int32)
-        # Increment the number of tokens.
-        self.req_states.num_tokens[idx_mapping_np] += num_sampled_tokens
-        # Increment the number of computed tokens.
-        self.req_states.num_computed_tokens[idx_mapping_np] += (
-            input_batch.num_scheduled_tokens
+        computed_prefill = self.req_states.num_computed_prefill_tokens
+        # TODO(woosuk): Simplify this.
+        computed_prefill[idx_mapping_np] = np.minimum(
+            computed_prefill[idx_mapping_np] + input_batch.num_scheduled_tokens,
+            self.req_states.prefill_len.np[idx_mapping_np],
         )
 
-        model_runner_output = ModelRunnerOutput(
-            req_ids=input_batch.req_ids,
-            req_id_to_index={req_id: i for i, req_id in enumerate(input_batch.req_ids)},
-            sampled_token_ids=None,  # type: ignore
-            logprobs=None,
-            prompt_logprobs_dict=prompt_logprobs_dict,  # type: ignore
-            pooler_output=[],
-            kv_connector_output=None,
-            num_nans_in_logits=None,
-        )
-        async_output = AsyncOutput(
-            model_runner_output=model_runner_output,
-            sampler_output=sampler_output,
-            num_sampled_tokens=num_sampled_tokens,
-            copy_stream=self.output_copy_stream,
-            copy_event=self.output_copy_event,
-        )
-        if self.use_async_scheduling:
-            return async_output
-        return async_output.get_output()
+        # Store the last sampled token ids.
+        last_sampled = sampled_tokens
+        self.req_states.last_sampled_tokens[input_batch.idx_mapping] = last_sampled
 
     def get_cudagraph_and_dp_padding(
         self,
@@ -782,6 +792,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             )
         else:
             # Run PyTorch model in eager mode.
+            # TODO(woosuk): Support piecewise CUDA graph.
             with set_forward_context(
                 input_batch.attn_metadata,
                 self.vllm_config,
@@ -807,13 +818,41 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         self.execute_model_state = None  # type: ignore
         assert sampling_metadata is not None
 
-        sampler_output = self.sample(
+        sampler_output, num_sampled_tokens = self.sample(
             hidden_states, input_batch, sampling_metadata, grammar_output
         )
         prompt_logprobs_dict = self.compute_prompt_logprobs(hidden_states, input_batch)
-        output = self.postprocess(
-            sampler_output,
-            prompt_logprobs_dict,
-            input_batch,
+
+        # Prepare the model runner output.
+        model_runner_output = ModelRunnerOutput(
+            req_ids=input_batch.req_ids,
+            # NOTE(woosuk): req_id_to_index is unused in this model runner.
+            # Only for compatibility with the existing model runner and scheduler.
+            req_id_to_index={req_id: i for i, req_id in enumerate(input_batch.req_ids)},
+            sampled_token_ids=None,  # type: ignore
+            logprobs=None,
+            prompt_logprobs_dict=prompt_logprobs_dict,  # type: ignore
+            pooler_output=[],
+            kv_connector_output=None,
+            num_nans_in_logits=None,
         )
-        return output
+        async_output = AsyncOutput(
+            model_runner_output=model_runner_output,
+            sampler_output=sampler_output,
+            num_sampled_tokens=num_sampled_tokens,
+            copy_stream=self.output_copy_stream,
+            copy_event=self.output_copy_event,
+        )
+
+        # Postprocess results and update request states.
+        # NOTE: This is intentionally done after creating the AsyncOutput,
+        # ensuring that `copy_event` is recorded before calling postprocess.
+        # This sequencing may slightly reduce latency as async D2H copy does not
+        # need to wait for the postprocess to finish.
+        self.postprocess(
+            input_batch, sampler_output.sampled_token_ids, num_sampled_tokens
+        )
+
+        if self.use_async_scheduling:
+            return async_output
+        return async_output.get_output()
diff --git a/vllm/v1/worker/gpu/states.py b/vllm/v1/worker/gpu/states.py
index 5d05c3f57790a..e8a3207a3a53e 100644
--- a/vllm/v1/worker/gpu/states.py
+++ b/vllm/v1/worker/gpu/states.py
@@ -85,8 +85,12 @@ class RequestState:
             dtype=np.int32,
         )
         self.prefill_len = self._make_buffer(self.max_num_reqs, dtype=torch.int32)
-        self.num_tokens = np.zeros(self.max_num_reqs, dtype=np.int32)
-        self.num_computed_tokens = np.zeros(self.max_num_reqs, dtype=np.int32)
+
+        # Number of computed tokens.
+        self.num_computed_prefill_tokens = np.zeros(self.max_num_reqs, dtype=np.int32)
+        self.num_computed_tokens = torch.zeros(
+            self.max_num_reqs, dtype=torch.int32, device=device
+        )
 
         # Last sampled tokens.
         self.last_sampled_tokens = torch.zeros(
@@ -145,7 +149,10 @@ class RequestState:
         )
         self.prefill_len.np[req_idx] = prefill_len
         self.prefill_token_ids[req_idx, :prefill_len] = prefill_token_ids
-        self.num_tokens[req_idx] = prefill_len
+
+        self.num_computed_prefill_tokens[req_idx] = num_computed_tokens
+        # FIXME(woosuk): This triggers a GPU operation whenever adding a new request.
+        # Optimize this.
         self.num_computed_tokens[req_idx] = num_computed_tokens
 
         if lora_request is not None:

From b004c00418268daa61b3526358b661165a360f7d Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Sun, 23 Nov 2025 10:09:06 -0800
Subject: [PATCH 77/83] [Model Runner V2] Support spec decoding [1/N] (#29274)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/input_batch.py             | 122 ++++++++++++++++--
 vllm/v1/worker/gpu/model_runner.py            |  86 ++++++++++--
 vllm/v1/worker/gpu/spec_decode/__init__.py    |   0
 .../gpu/spec_decode/rejection_sample.py       |  71 ++++++++++
 vllm/v1/worker/gpu/states.py                  |  94 ++++++++++++++
 5 files changed, 347 insertions(+), 26 deletions(-)
 create mode 100644 vllm/v1/worker/gpu/spec_decode/__init__.py
 create mode 100644 vllm/v1/worker/gpu/spec_decode/rejection_sample.py

diff --git a/vllm/v1/worker/gpu/input_batch.py b/vllm/v1/worker/gpu/input_batch.py
index b671c093113ba..7675cb45170b5 100644
--- a/vllm/v1/worker/gpu/input_batch.py
+++ b/vllm/v1/worker/gpu/input_batch.py
@@ -35,6 +35,7 @@ class InputBuffers:
         self.positions = torch.zeros(max_num_tokens, dtype=torch.int64, device=device)
         self.query_start_loc = self._make_buffer(max_num_reqs + 1, dtype=torch.int32)
         self.seq_lens = torch.zeros(max_num_reqs, dtype=torch.int32, device=device)
+        self.cu_num_logits = self._make_buffer(max_num_reqs + 1, dtype=torch.int32)
 
         # Structured outputs.
         self.bitmask_indices = self._make_buffer(max_num_reqs, dtype=torch.int32)
@@ -64,6 +65,7 @@ class InputBatch:
     # sum(num_scheduled_tokens)
     num_tokens: int
     num_tokens_after_padding: int
+    num_draft_tokens: int
 
     # [num_reqs + 1]
     query_start_loc: torch.Tensor
@@ -80,8 +82,10 @@ class InputBatch:
     # layer_name -> Metadata
     attn_metadata: dict[str, Any]
 
-    # [num_reqs]
+    # [total_num_logits]
     logits_indices: torch.Tensor
+    # [num_reqs + 1]
+    cu_num_logits: torch.Tensor
 
     @classmethod
     def make_dummy(
@@ -118,6 +122,7 @@ class InputBatch:
         positions = input_buffers.positions[:num_tokens]
         # attn_metadata = defaultdict(lambda: None)
         logits_indices = query_start_loc[1:] - 1
+        cu_num_logits = torch.arange(num_reqs + 1, device=device, dtype=torch.int32)
         return cls(
             req_ids=req_ids,
             num_reqs=num_reqs,
@@ -126,6 +131,7 @@ class InputBatch:
             num_scheduled_tokens=num_scheduled_tokens,
             num_tokens=num_tokens,
             num_tokens_after_padding=num_tokens,
+            num_draft_tokens=0,
             query_start_loc=query_start_loc,
             query_start_loc_np=query_start_loc_np,
             seq_lens=seq_lens,
@@ -134,6 +140,7 @@ class InputBatch:
             positions=positions,
             attn_metadata=None,  # type: ignore
             logits_indices=logits_indices,
+            cu_num_logits=cu_num_logits,
         )
 
 
@@ -279,19 +286,53 @@ def _combine_sampled_and_draft_tokens_kernel(
     query_start_loc_ptr,
     seq_lens_ptr,
     prefill_len_ptr,
+    draft_tokens_ptr,
+    draft_tokens_stride,
+    cu_num_logits_ptr,
+    logits_indices_ptr,
+    BLOCK_SIZE: tl.constexpr,
 ):
     batch_idx = tl.program_id(0)
     req_state_idx = tl.load(idx_mapping_ptr + batch_idx)
 
+    # Get the number of logits and draft tokens.
+    cu_num_logits_start = tl.load(cu_num_logits_ptr + batch_idx)
+    cu_num_logits_end = tl.load(cu_num_logits_ptr + batch_idx + 1)
+    num_logits = cu_num_logits_end - cu_num_logits_start
+    num_draft_tokens = num_logits - 1
+
+    # Compute the logits indices.
+    block = tl.arange(0, BLOCK_SIZE)
+    query_end = tl.load(query_start_loc_ptr + batch_idx + 1)
+    logits_start = query_end - num_logits
+    tl.store(
+        logits_indices_ptr + cu_num_logits_start + block,
+        logits_start + block,
+        mask=block < num_logits,
+    )
+
     seq_len = tl.load(seq_lens_ptr + batch_idx)
     prefill_len = tl.load(prefill_len_ptr + req_state_idx)
     if seq_len <= prefill_len:
-        # Handling prefill tokens.
+        # Handling prefill tokens. No sampled or draft tokens.
         return
 
+    # Write the last sampled token ID to input_ids.
     last_token_id = tl.load(last_sampled_tokens_ptr + req_state_idx)
-    end = tl.load(query_start_loc_ptr + batch_idx + 1)
-    tl.store(input_ids_ptr + end - 1, last_token_id)
+    tl.store(input_ids_ptr + query_end - num_logits, last_token_id)
+
+    # Write the draft tokens (if any) to input_ids.
+    if num_draft_tokens > 0:
+        mask = block < num_draft_tokens
+        draft_tokens = tl.load(
+            draft_tokens_ptr + req_state_idx * draft_tokens_stride + block,
+            mask=mask,
+        )
+        tl.store(
+            input_ids_ptr + query_end - num_draft_tokens + block,
+            draft_tokens,
+            mask=mask,
+        )
 
 
 def combine_sampled_and_draft_tokens(
@@ -301,8 +342,18 @@ def combine_sampled_and_draft_tokens(
     query_start_loc: torch.Tensor,
     seq_lens: torch.Tensor,
     prefill_len: torch.Tensor,
+    draft_tokens: torch.Tensor,
+    cu_num_logits: torch.Tensor,
+    num_logits: int,
 ) -> torch.Tensor:
     num_reqs = seq_lens.shape[0]
+    num_speculative_steps = draft_tokens.shape[-1]
+
+    logits_indices = torch.empty(
+        num_logits,
+        dtype=torch.int64,
+        device=input_ids.device,
+    )
     _combine_sampled_and_draft_tokens_kernel[(num_reqs,)](
         input_ids,
         idx_mapping,
@@ -310,35 +361,80 @@ def combine_sampled_and_draft_tokens(
         query_start_loc,
         seq_lens,
         prefill_len,
+        draft_tokens,
+        draft_tokens.stride(0),
+        cu_num_logits,
+        logits_indices,
+        # NOTE(woosuk): Add 1 to ensure the block can cover the last sampled token
+        # in addition to all draft tokens.
+        BLOCK_SIZE=triton.next_power_of_2(num_speculative_steps + 1),
     )
-    return input_ids
+    return logits_indices
 
 
 @triton.jit
-def _update_num_computed_tokens_kernel(
+def _post_update_kernel(
     idx_mapping_ptr,
     num_computed_tokens_ptr,
+    last_sampled_tokens_ptr,
+    sampled_tokens_ptr,
+    sampled_tokens_stride,
+    num_sampled_ptr,
     query_start_loc_ptr,
+    cu_num_logits_ptr,
 ):
     req_id = tl.program_id(0)
     req_state_idx = tl.load(idx_mapping_ptr + req_id)
 
-    start = tl.load(query_start_loc_ptr + req_id)
-    end = tl.load(query_start_loc_ptr + req_id + 1)
-    query_len = end - start
+    num_sampled = tl.load(num_sampled_ptr + req_id)
+    if num_sampled > 0:
+        token_id = tl.load(
+            sampled_tokens_ptr + req_id * sampled_tokens_stride + num_sampled - 1
+        )
+        tl.store(last_sampled_tokens_ptr + req_state_idx, token_id)
 
-    n = tl.load(num_computed_tokens_ptr + req_state_idx)
-    tl.store(num_computed_tokens_ptr + req_state_idx, n + query_len)
+    query_start = tl.load(query_start_loc_ptr + req_id)
+    query_end = tl.load(query_start_loc_ptr + req_id + 1)
+    query_len = query_end - query_start
+
+    num_computed = tl.load(num_computed_tokens_ptr + req_state_idx)
+    num_computed += query_len
+    # Consider the rejected tokens in spec decoding.
+    if num_sampled > 0:
+        # NOTE(woosuk): We must skip num_sampled == 0 to account for chunked prefills.
+        logits_start = tl.load(cu_num_logits_ptr + req_id)
+        logits_end = tl.load(cu_num_logits_ptr + req_id + 1)
+        num_logits = logits_end - logits_start
+        num_rejected = num_logits - num_sampled
+        num_computed -= num_rejected
+    tl.store(num_computed_tokens_ptr + req_state_idx, num_computed)
 
 
-def update_num_computed_tokens(
+def post_update(
+    # [num_reqs]
     idx_mapping: torch.Tensor,
+    # [max_num_reqs]
     num_computed_tokens: torch.Tensor,
+    # [max_num_reqs]
+    last_sampled_tokens: torch.Tensor,
+    # [num_reqs, num_speculative_steps + 1]
+    sampled_tokens: torch.Tensor,
+    # [num_reqs]
+    num_sampled: torch.Tensor,
+    # [num_reqs + 1]
     query_start_loc: torch.Tensor,
+    # [num_reqs + 1]
+    cu_num_logits: torch.Tensor,
 ) -> None:
     num_reqs = idx_mapping.shape[0]
-    _update_num_computed_tokens_kernel[(num_reqs,)](
+    _post_update_kernel[(num_reqs,)](
         idx_mapping,
         num_computed_tokens,
+        last_sampled_tokens,
+        sampled_tokens,
+        sampled_tokens.stride(0),
+        num_sampled,
         query_start_loc,
+        cu_num_logits,
+        num_warps=1,
     )
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
index bacfbd6c2f465..4b4ee92176f2c 100644
--- a/vllm/v1/worker/gpu/model_runner.py
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -40,11 +40,12 @@ from vllm.v1.worker.gpu.input_batch import (
     InputBatch,
     InputBuffers,
     combine_sampled_and_draft_tokens,
+    post_update,
     prepare_pos_seq_lens,
     prepare_prefill_inputs,
-    update_num_computed_tokens,
 )
 from vllm.v1.worker.gpu.sampler import Sampler, compute_prompt_logprobs
+from vllm.v1.worker.gpu.spec_decode.rejection_sample import rejection_sample
 from vllm.v1.worker.gpu.states import RequestState, SamplingMetadata
 from vllm.v1.worker.gpu.structured_outputs import apply_grammar_bitmask
 from vllm.v1.worker.kv_connector_model_runner_mixin import KVConnectorModelRunnerMixin
@@ -100,10 +101,18 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             self.input_prep_event = None
             self.structured_outputs_event = None
 
+        if self.speculative_config is not None:
+            self.do_spec_decode = True
+            self.num_speculative_steps = self.speculative_config.num_speculative_tokens
+        else:
+            self.do_spec_decode = False
+            self.num_speculative_steps = 0
+
         self.req_states = RequestState(
             max_num_reqs=self.max_num_reqs,
             max_model_len=self.max_model_len,
             max_num_batched_tokens=self.max_num_tokens,
+            num_speculative_steps=self.num_speculative_steps,
             vocab_size=self.vocab_size,
             device=self.device,
             pin_memory=self.pin_memory,
@@ -427,6 +436,32 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         idx_mapping_np = idx_mapping.np[:num_reqs]
         idx_mapping = idx_mapping.copy_to_gpu(num_reqs)
 
+        # Get the number of draft tokens for each request.
+        if not scheduler_output.scheduled_spec_decode_tokens:
+            # No draft token scheduled (common case).
+            total_num_draft_tokens = 0
+            total_num_logits = num_reqs
+            cu_num_logits = torch.arange(
+                num_reqs + 1, device=self.device, dtype=torch.int32
+            )
+        else:
+            draft_tokens = scheduler_output.scheduled_spec_decode_tokens
+            num_draft_tokens = np.array(
+                [
+                    len(draft_tokens[req_id]) if req_id in draft_tokens else 0
+                    for req_id in req_ids
+                ],
+                dtype=np.int32,
+            )
+            total_num_draft_tokens = int(num_draft_tokens.sum())
+            total_num_logits = num_reqs + total_num_draft_tokens
+
+            np.cumsum(
+                num_draft_tokens + 1,
+                out=self.input_buffers.cu_num_logits.np[1 : num_reqs + 1],
+            )
+            cu_num_logits = self.input_buffers.cu_num_logits.copy_to_gpu(num_reqs + 1)
+
         # Block tables: num_kv_cache_groups x [num_reqs, max_num_blocks]
         block_tables = self.block_tables.gather_block_tables(idx_mapping)
 
@@ -456,14 +491,17 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         seq_lens = self.input_buffers.seq_lens[:num_reqs]
 
         # Some input token ids are directly read from the last sampled tokens
-        # and draft tokens.
-        combine_sampled_and_draft_tokens(
+        # and draft tokens. Also, get the logits indices to sample tokens from.
+        logits_indices = combine_sampled_and_draft_tokens(
             self.input_buffers.input_ids.gpu,
             idx_mapping,
             self.req_states.last_sampled_tokens,
             query_start_loc_gpu,
             seq_lens,
             self.req_states.prefill_len.gpu,
+            self.req_states.draft_tokens,
+            cu_num_logits,
+            total_num_logits,
         )
 
         # Compute slot mappings: [num_kv_cache_groups, num_tokens]
@@ -471,9 +509,6 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             query_start_loc_gpu, self.input_buffers.positions[:num_tokens]
         )
 
-        # Logits indices to sample next token from.
-        logits_indices = query_start_loc_gpu[1:] - 1
-
         # Get num_computed_tokens.
         # HACK(woosuk): Here, we use num_computed_tokens on GPU instead of
         # num_computed_tokens_cpu. This works for most cases.
@@ -508,6 +543,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             num_scheduled_tokens=num_scheduled_tokens,
             num_tokens=num_tokens,
             num_tokens_after_padding=num_tokens_after_padding,
+            num_draft_tokens=total_num_draft_tokens,
             query_start_loc=query_start_loc_gpu,
             query_start_loc_np=query_start_loc_np,
             seq_lens=seq_lens,
@@ -516,6 +552,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             positions=positions,
             attn_metadata=attn_metadata,
             logits_indices=logits_indices,
+            cu_num_logits=cu_num_logits,
         )
 
     def sample(
@@ -530,6 +567,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         if grammar_output is not None:
             # Apply grammar bitmask to the logits in-place.
             # TODO(woosuk): Make compatible with spec decoding.
+            assert input_batch.num_draft_tokens == 0
             with async_barrier(self.structured_outputs_event):
                 apply_grammar_bitmask(
                     logits,
@@ -539,12 +577,28 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                     self.input_buffers,
                 )
 
+        # Sample tokens and compute logprobs (if needed).
         sampler_output = self.sampler(logits, sampling_metadata)
+
         # Get the number of sampled tokens.
-        # 0 if chunked-prefilling, 1 if not.
         prefill_len = self.req_states.prefill_len.gpu[input_batch.idx_mapping]
         is_chunked_prefilling = input_batch.seq_lens < prefill_len
-        num_sampled = (~is_chunked_prefilling).int()
+        if input_batch.num_draft_tokens == 0:
+            # No draft tokens (common case).
+            # 0 if chunked-prefilling, 1 if not.
+            num_sampled = (~is_chunked_prefilling).int()
+        else:
+            # Draft tokens for spec decoding.
+            input_ids = input_batch.input_ids[input_batch.logits_indices]
+            sampled_tokens, num_sampled = rejection_sample(
+                sampler_output.sampled_token_ids,
+                input_ids,
+                input_batch.cu_num_logits,
+                self.num_speculative_steps,
+            )
+            num_sampled *= ~is_chunked_prefilling
+            sampler_output.sampled_token_ids = sampled_tokens
+            # TODO(woosuk): Support logprobs with spec decoding.
         return sampler_output, num_sampled
 
     def compute_prompt_logprobs(
@@ -653,11 +707,17 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
         num_sampled: torch.Tensor,
     ) -> None:
         # Update the number of computed tokens.
-        update_num_computed_tokens(
+        post_update(
             input_batch.idx_mapping,
             self.req_states.num_computed_tokens,
+            self.req_states.last_sampled_tokens,
+            sampled_tokens,
+            num_sampled,
             input_batch.query_start_loc,
+            input_batch.cu_num_logits,
         )
+
+        # Update the number of computed prefill tokens.
         idx_mapping_np = input_batch.idx_mapping_np
         computed_prefill = self.req_states.num_computed_prefill_tokens
         # TODO(woosuk): Simplify this.
@@ -666,10 +726,6 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             self.req_states.prefill_len.np[idx_mapping_np],
         )
 
-        # Store the last sampled token ids.
-        last_sampled = sampled_tokens
-        self.req_states.last_sampled_tokens[input_batch.idx_mapping] = last_sampled
-
     def get_cudagraph_and_dp_padding(
         self,
         scheduler_output: SchedulerOutput,
@@ -761,6 +817,10 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
                 sampling_metadata = self.req_states.make_sampling_metadata(
                     input_batch.idx_mapping_np, pos
                 )
+                if input_batch.num_draft_tokens > 0:
+                    sampling_metadata = self.req_states.expand_sampling_metadata(
+                        sampling_metadata, input_batch.cu_num_logits
+                    )
 
                 if self.lora_config:
                     # Activate LoRA adapters.
diff --git a/vllm/v1/worker/gpu/spec_decode/__init__.py b/vllm/v1/worker/gpu/spec_decode/__init__.py
new file mode 100644
index 0000000000000..e69de29bb2d1d
diff --git a/vllm/v1/worker/gpu/spec_decode/rejection_sample.py b/vllm/v1/worker/gpu/spec_decode/rejection_sample.py
new file mode 100644
index 0000000000000..8a7bf28bacbd4
--- /dev/null
+++ b/vllm/v1/worker/gpu/spec_decode/rejection_sample.py
@@ -0,0 +1,71 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+import torch
+
+from vllm.triton_utils import tl, triton
+
+
+@triton.jit
+def _rejection_sample_kernel(
+    sampled_ptr,  # [num_reqs, num_speculative_steps + 1]
+    sampled_stride,
+    num_sampled_ptr,  # [num_reqs]
+    target_sampled_ptr,  # [num_draft_tokens + num_reqs]
+    input_ids_ptr,  # [num_draft_tokens + num_reqs]
+    cu_num_logits_ptr,  # [num_reqs + 1]
+):
+    req_idx = tl.program_id(0)
+    start_idx = tl.load(cu_num_logits_ptr + req_idx)
+    end_idx = tl.load(cu_num_logits_ptr + req_idx + 1)
+    num_tokens = end_idx - start_idx
+
+    num_sampled = 0
+    rejected = False
+    for i in range(num_tokens - 1):
+        if not rejected:
+            target_sampled = tl.load(target_sampled_ptr + start_idx + i)
+            draft_sampled = tl.load(input_ids_ptr + start_idx + i + 1)
+            tl.store(sampled_ptr + req_idx * sampled_stride + i, target_sampled)
+            num_sampled += 1
+            if target_sampled != draft_sampled:
+                rejected = True
+    if not rejected:
+        target_sampled = tl.load(target_sampled_ptr + start_idx + num_tokens - 1)
+        tl.store(
+            sampled_ptr + req_idx * sampled_stride + num_tokens - 1, target_sampled
+        )
+        num_sampled += 1
+    tl.store(num_sampled_ptr + req_idx, num_sampled)
+
+
+def rejection_sample(
+    # [num_draft_tokens + num_reqs]
+    target_sampled: torch.Tensor,
+    # [num_draft_tokens + num_reqs]
+    input_ids: torch.Tensor,
+    # [num_reqs + 1]
+    cu_num_logits: torch.Tensor,
+    num_speculative_steps: int,
+) -> tuple[torch.Tensor, torch.Tensor]:
+    num_reqs = cu_num_logits.shape[0] - 1
+    sampled = torch.empty(
+        num_reqs,
+        num_speculative_steps + 1,
+        dtype=target_sampled.dtype,
+        device=target_sampled.device,
+    )
+    num_sampled = torch.empty(
+        num_reqs,
+        dtype=torch.int32,
+        device=target_sampled.device,
+    )
+    _rejection_sample_kernel[(num_reqs,)](
+        sampled,
+        sampled.stride(0),
+        num_sampled,
+        target_sampled,
+        input_ids,
+        cu_num_logits,
+        num_warps=1,
+    )
+    return sampled, num_sampled
diff --git a/vllm/v1/worker/gpu/states.py b/vllm/v1/worker/gpu/states.py
index e8a3207a3a53e..513d45d95d7cd 100644
--- a/vllm/v1/worker/gpu/states.py
+++ b/vllm/v1/worker/gpu/states.py
@@ -7,6 +7,7 @@ import torch
 
 from vllm.lora.request import LoRARequest
 from vllm.sampling_params import SamplingParams
+from vllm.triton_utils import tl, triton
 from vllm.v1.outputs import LogprobsTensors
 from vllm.v1.utils import CpuGpuBuffer
 
@@ -63,6 +64,7 @@ class RequestState:
         max_num_reqs: int,
         max_model_len: int,
         max_num_batched_tokens: int,
+        num_speculative_steps: int,
         vocab_size: int,
         device: torch.device,
         pin_memory: bool,
@@ -70,6 +72,7 @@ class RequestState:
         self.max_num_reqs = max_num_reqs
         self.max_model_len = max_model_len
         self.max_num_batched_tokens = max_num_batched_tokens
+        self.num_speculative_steps = num_speculative_steps
         self.vocab_size = vocab_size
         self.device = device
         self.pin_memory = pin_memory
@@ -100,6 +103,14 @@ class RequestState:
             device=device,
         )
 
+        # Draft tokens.
+        self.draft_tokens = torch.zeros(
+            self.max_num_reqs,
+            self.num_speculative_steps,
+            dtype=torch.int64,
+            device=device,
+        )
+
         # LoRA.
         self.lora_ids = np.zeros(self.max_num_reqs, dtype=np.int32)
         self.lora_ids.fill(NO_LORA_ID)
@@ -226,6 +237,17 @@ class RequestState:
             max_num_logprobs=max_num_logprobs,
         )
 
+    def expand_sampling_metadata(
+        self,
+        sampling_metadata: SamplingMetadata,
+        cu_num_logits: torch.Tensor,
+    ) -> SamplingMetadata:
+        # For draft tokens, we need to expand the sampling param tensors as
+        # each request samples multiple tokens in each step.
+        return expand_sampling_metadata(
+            sampling_metadata, cu_num_logits, self.num_speculative_steps
+        )
+
     def make_lora_inputs(
         self,
         req_ids: list[str],
@@ -270,3 +292,75 @@ class Param:
 class ExtraData:
     lora_request: LoRARequest | None
     in_progress_prompt_logprobs: list[LogprobsTensors] = field(default_factory=list)
+
+
+# NOTE(woosuk): Re-compilation can happen at runtime since top_p and top_k can be None.
+@triton.jit
+def _expand_sampling_metadata_kernel(
+    temp_ptr,
+    expanded_temp_ptr,
+    top_p_ptr,
+    expanded_top_p_ptr,
+    top_k_ptr,
+    expanded_top_k_ptr,
+    seeds_ptr,
+    expanded_seeds_ptr,
+    cu_num_logits_ptr,
+    BLOCK_SIZE: tl.constexpr,
+):
+    req_idx = tl.program_id(0)
+    start_idx = tl.load(cu_num_logits_ptr + req_idx)
+    end_idx = tl.load(cu_num_logits_ptr + req_idx + 1)
+    num_tokens = end_idx - start_idx
+
+    block = tl.arange(0, BLOCK_SIZE)
+    mask = block < num_tokens
+
+    temp = tl.load(temp_ptr + req_idx)
+    tl.store(expanded_temp_ptr + start_idx + block, temp, mask=mask)
+
+    if top_p_ptr is not None:
+        top_p = tl.load(top_p_ptr + req_idx)
+        tl.store(expanded_top_p_ptr + start_idx + block, top_p, mask=mask)
+
+    if top_k_ptr is not None:
+        top_k = tl.load(top_k_ptr + req_idx)
+        tl.store(expanded_top_k_ptr + start_idx + block, top_k, mask=mask)
+
+    seed = tl.load(seeds_ptr + req_idx)
+    tl.store(expanded_seeds_ptr + start_idx + block, seed, mask=mask)
+
+
+def expand_sampling_metadata(
+    sampling_metadata: SamplingMetadata,
+    cu_num_logits: torch.Tensor,
+    num_speculative_steps: int,
+) -> SamplingMetadata:
+    total_num_logits = sampling_metadata.pos.shape[0]
+    create_empty = lambda x: x.new_empty(total_num_logits) if x is not None else None
+    expanded_temp = create_empty(sampling_metadata.temperature)
+    expanded_top_p = create_empty(sampling_metadata.top_p)
+    expanded_top_k = create_empty(sampling_metadata.top_k)
+    expanded_seeds = create_empty(sampling_metadata.seeds)
+
+    num_reqs = cu_num_logits.shape[0] - 1
+    _expand_sampling_metadata_kernel[(num_reqs,)](
+        sampling_metadata.temperature,
+        expanded_temp,
+        sampling_metadata.top_p,
+        expanded_top_p,
+        sampling_metadata.top_k,
+        expanded_top_k,
+        sampling_metadata.seeds,
+        expanded_seeds,
+        cu_num_logits,
+        BLOCK_SIZE=triton.next_power_of_2(num_speculative_steps + 1),
+    )
+    return SamplingMetadata(
+        temperature=expanded_temp,
+        top_p=expanded_top_p,
+        top_k=expanded_top_k,
+        seeds=expanded_seeds,
+        pos=sampling_metadata.pos,
+        max_num_logprobs=sampling_metadata.max_num_logprobs,
+    )

From 62d54ba46db25b95de2d21e46f4b57b5502ed747 Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Sun, 23 Nov 2025 11:15:32 -0800
Subject: [PATCH 78/83] [Model Runner V2] Optimize CUDA graph capture time
 (#29275)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/cudagraph_utils.py | 5 ++++-
 vllm/v1/worker/gpu/model_runner.py    | 1 +
 2 files changed, 5 insertions(+), 1 deletion(-)

diff --git a/vllm/v1/worker/gpu/cudagraph_utils.py b/vllm/v1/worker/gpu/cudagraph_utils.py
index dccf747369e4e..ba783e2d0c6fb 100644
--- a/vllm/v1/worker/gpu/cudagraph_utils.py
+++ b/vllm/v1/worker/gpu/cudagraph_utils.py
@@ -106,7 +106,10 @@ class CudaGraphManager:
         input_buffers.query_start_loc.np[: batch_size + 1] = np.arange(batch_size + 1)
         input_buffers.query_start_loc.np[batch_size:] = batch_size
         input_buffers.query_start_loc.copy_to_gpu()
-        input_buffers.seq_lens[:batch_size] = self.max_model_len
+        # HACK(woosuk): To optimize warmup time, we use 1 (instead of max_model_len)
+        # for seq_lens. This leads to a mismatch between seq_lens (GPU) and
+        # seq_lens_np (CPU), which might cause issues in some attention backends.
+        input_buffers.seq_lens[:batch_size] = 1
         input_buffers.seq_lens[batch_size:] = 0
 
         input_block_tables = [x[:batch_size] for x in block_tables.input_block_tables]
diff --git a/vllm/v1/worker/gpu/model_runner.py b/vllm/v1/worker/gpu/model_runner.py
index 4b4ee92176f2c..6e332ee4b75b8 100644
--- a/vllm/v1/worker/gpu/model_runner.py
+++ b/vllm/v1/worker/gpu/model_runner.py
@@ -313,6 +313,7 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
             return 0
 
         start_time = time.perf_counter()
+        gc.collect()
         torch.cuda.empty_cache()
         start_free_gpu_memory = torch.cuda.mem_get_info()[0]
 

From 3e1ad406559c3b520eeda0e681ea68d33daf1be1 Mon Sep 17 00:00:00 2001
From: Woosuk Kwon <woosuk.kwon@berkeley.edu>
Date: Sun, 23 Nov 2025 14:13:00 -0800
Subject: [PATCH 79/83] [Model Runner V2] Add apply_temperature option to
 gumbel_sample (#29276)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
---
 vllm/v1/worker/gpu/sampler.py | 21 +++++++++++++++------
 1 file changed, 15 insertions(+), 6 deletions(-)

diff --git a/vllm/v1/worker/gpu/sampler.py b/vllm/v1/worker/gpu/sampler.py
index 499e9d3b1538d..c48ed2d8ca167 100644
--- a/vllm/v1/worker/gpu/sampler.py
+++ b/vllm/v1/worker/gpu/sampler.py
@@ -68,9 +68,10 @@ class Sampler:
 
         sampled = gumbel_sample(
             logits,
-            is_greedy,
+            sampling_metadata.temperature,
             sampling_metadata.seeds,
             sampling_metadata.pos,
+            apply_temperature=False,
         )
         return sampled, logits if return_logits else None
 
@@ -85,9 +86,10 @@ def _gumbel_sample_kernel(
     logits_stride,
     seeds_ptr,
     pos_ptr,
-    is_greedy_ptr,
+    temp_ptr,
     vocab_size,
     BLOCK_SIZE: tl.constexpr,
+    APPLY_TEMPERATURE: tl.constexpr,
 ):
     req_idx = tl.program_id(0)
     block_idx = tl.program_id(1)
@@ -99,8 +101,8 @@ def _gumbel_sample_kernel(
         other=float("-inf"),
     )
 
-    is_greedy = tl.load(is_greedy_ptr + req_idx)
-    if not is_greedy:
+    temp = tl.load(temp_ptr + req_idx)
+    if temp != 0.0:
         # Calculate the seed for gumbel noise.
         seed = tl.load(seeds_ptr + req_idx)
         pos = tl.load(pos_ptr + req_idx)
@@ -111,6 +113,11 @@ def _gumbel_sample_kernel(
         gumbel_noise = -tl.log(-tl.log(r + 1e-20) + 1e-20)
         gumbel_noise = gumbel_noise.to(tl.float32)
 
+        # Apply temperature.
+        if APPLY_TEMPERATURE:
+            # NOTE(woosuk): Use div_rn to match the behavior of torch.
+            logits = tl.div_rn(logits, temp.to(tl.float32))
+
         # Apply gumbel noise.
         logits = tl.where(mask, logits + gumbel_noise, float("-inf"))
 
@@ -123,9 +130,10 @@ def _gumbel_sample_kernel(
 
 def gumbel_sample(
     logits: torch.Tensor,  # [num_reqs, vocab_size]
-    is_greedy: torch.Tensor,  # [num_reqs]
+    temperature: torch.Tensor,  # [num_reqs]
     seed: torch.Tensor,  # [num_reqs]
     pos: torch.Tensor,  # [num_reqs]
+    apply_temperature: bool,
 ) -> torch.Tensor:
     num_reqs, vocab_size = logits.shape
     BLOCK_SIZE = 1024
@@ -151,9 +159,10 @@ def gumbel_sample(
         logits.stride(0),
         seed,
         pos,
-        is_greedy,
+        temperature,
         vocab_size,
         BLOCK_SIZE=BLOCK_SIZE,
+        APPLY_TEMPERATURE=apply_temperature,
     )
     # NOTE(woosuk): Use int64 for later indexing.
     max_block_idx = local_max.argmax(dim=-1, keepdim=True)

From c309bb5245b6d05228c9d2f9c8f3e769c08d9194 Mon Sep 17 00:00:00 2001
From: Josh Moore <joshiemoore98@gmail.com>
Date: Sun, 23 Nov 2025 19:47:54 -0500
Subject: [PATCH 80/83] [Bugfix] Update Gradio OpenAI Chatbot Webserver example
 to new Gradio message history format (#29249)

Signed-off-by: joshiemoore <joshiemoore98@gmail.com>
---
 .../gradio_openai_chatbot_webserver.py        | 20 ++++++-------------
 1 file changed, 6 insertions(+), 14 deletions(-)

diff --git a/examples/online_serving/gradio_openai_chatbot_webserver.py b/examples/online_serving/gradio_openai_chatbot_webserver.py
index d5d0a07a29183..c76c60cc4472d 100644
--- a/examples/online_serving/gradio_openai_chatbot_webserver.py
+++ b/examples/online_serving/gradio_openai_chatbot_webserver.py
@@ -25,25 +25,17 @@ import gradio as gr
 from openai import OpenAI
 
 
-def format_history_to_openai(history):
-    history_openai_format = [
-        {"role": "system", "content": "You are a great AI assistant."}
-    ]
-    for human, assistant in history:
-        history_openai_format.append({"role": "user", "content": human})
-        history_openai_format.append({"role": "assistant", "content": assistant})
-    return history_openai_format
-
-
 def predict(message, history, client, model_name, temp, stop_token_ids):
-    # Format history to OpenAI chat format
-    history_openai_format = format_history_to_openai(history)
-    history_openai_format.append({"role": "user", "content": message})
+    messages = [
+        {"role": "system", "content": "You are a great AI assistant."},
+        *history,
+        {"role": "user", "content": message},
+    ]
 
     # Send request to OpenAI API (vLLM server)
     stream = client.chat.completions.create(
         model=model_name,
-        messages=history_openai_format,
+        messages=messages,
         temperature=temp,
         stream=True,
         extra_body={

From 1073ba68b0a741de6de0a7230795acba151084f2 Mon Sep 17 00:00:00 2001
From: Jee Jee Li <pandaleefree@gmail.com>
Date: Mon, 24 Nov 2025 10:27:23 +0800
Subject: [PATCH 81/83] [LoRA] Optimize 3D MoE logic (#29222)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
---
 tests/lora/test_gptoss_tp.py                 |   7 +-
 vllm/lora/layers/__init__.py                 |   3 +-
 vllm/lora/layers/base.py                     |   4 +-
 vllm/lora/layers/base_linear.py              |   6 +-
 vllm/lora/layers/column_parallel_linear.py   |   4 +-
 vllm/lora/layers/fused_moe.py                | 353 +++++++++++++++----
 vllm/lora/layers/logits_processor.py         |   6 +-
 vllm/lora/layers/vocal_parallel_embedding.py |   7 +-
 vllm/lora/models.py                          |  99 ++++--
 vllm/lora/utils.py                           |  12 +-
 vllm/model_executor/models/gpt_oss.py        |   1 +
 11 files changed, 397 insertions(+), 105 deletions(-)

diff --git a/tests/lora/test_gptoss_tp.py b/tests/lora/test_gptoss_tp.py
index 711d514a39eb3..f4269750feb6b 100644
--- a/tests/lora/test_gptoss_tp.py
+++ b/tests/lora/test_gptoss_tp.py
@@ -1,6 +1,8 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
+import pytest
+
 import vllm
 from vllm.lora.request import LoRARequest
 
@@ -84,14 +86,17 @@ def test_gpt_oss_lora(gptoss20b_lora_files):
 
 
 @multi_gpu_test(num_gpus=2)
-def test_gpt_oss_lora_tp2(gptoss20b_lora_files):
+@pytest.mark.parametrize("fully_sharded_loras", [False, True])
+def test_gpt_oss_lora_tp2(gptoss20b_lora_files, fully_sharded_loras):
     llm = vllm.LLM(
         MODEL_PATH,
         max_model_len=1024,
         enable_lora=True,
         max_loras=2,
         max_lora_rank=8,
+        max_num_seqs=16,
         tensor_parallel_size=2,
+        fully_sharded_loras=fully_sharded_loras,
         compilation_config=vllm.config.CompilationConfig(  # Avoid OOM
             cudagraph_specialize_lora=False,
         ),
diff --git a/vllm/lora/layers/__init__.py b/vllm/lora/layers/__init__.py
index 8a4f5ff175d4f..25364a5881364 100644
--- a/vllm/lora/layers/__init__.py
+++ b/vllm/lora/layers/__init__.py
@@ -11,7 +11,7 @@ from vllm.lora.layers.column_parallel_linear import (
     QKVParallelLinearWithLoRA,
     QKVParallelLinearWithShardedLoRA,
 )
-from vllm.lora.layers.fused_moe import FusedMoEWithLoRA
+from vllm.lora.layers.fused_moe import FusedMoE3DWithLoRA, FusedMoEWithLoRA
 from vllm.lora.layers.logits_processor import LogitsProcessorWithLoRA
 from vllm.lora.layers.replicated_linear import ReplicatedLinearWithLoRA
 from vllm.lora.layers.row_parallel_linear import (
@@ -38,4 +38,5 @@ __all__ = [
     "ReplicatedLinearWithLoRA",
     "LoRAMapping",
     "FusedMoEWithLoRA",
+    "FusedMoE3DWithLoRA",
 ]
diff --git a/vllm/lora/layers/base.py b/vllm/lora/layers/base.py
index 62326c05b2bd1..3bfb88c007622 100644
--- a/vllm/lora/layers/base.py
+++ b/vllm/lora/layers/base.py
@@ -42,8 +42,8 @@ class BaseLayerWithLoRA(nn.Module):
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
         """Overwrites lora tensors at index."""
         ...
diff --git a/vllm/lora/layers/base_linear.py b/vllm/lora/layers/base_linear.py
index e85c5bd70b072..06ecc8d2f634c 100644
--- a/vllm/lora/layers/base_linear.py
+++ b/vllm/lora/layers/base_linear.py
@@ -94,13 +94,15 @@ class BaseLinearLayerWithLoRA(BaseLayerWithLoRA):
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
         # Except for QKVParallelLinearWithLoRA and
         # MergedColumnParallelLinearWithLoRA, all other linear LoRA layers
         # store weights in a tuple of size 1. These two layers will
         # override this function.
+        assert isinstance(lora_a, torch.Tensor)
+        assert isinstance(lora_b, torch.Tensor)
         assert (
             len(self.lora_a_stacked) == len(self.lora_b_stacked) == self.n_slices == 1
         )
diff --git a/vllm/lora/layers/column_parallel_linear.py b/vllm/lora/layers/column_parallel_linear.py
index 273c4950e3239..3e21d426c304a 100644
--- a/vllm/lora/layers/column_parallel_linear.py
+++ b/vllm/lora/layers/column_parallel_linear.py
@@ -246,8 +246,8 @@ class MergedColumnParallelLinearWithLoRA(ColumnParallelLinearWithLoRA):
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
         self.reset_lora(index)
 
diff --git a/vllm/lora/layers/fused_moe.py b/vllm/lora/layers/fused_moe.py
index 5aeaca8de5e53..0eb6562bec6cd 100644
--- a/vllm/lora/layers/fused_moe.py
+++ b/vllm/lora/layers/fused_moe.py
@@ -42,7 +42,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
         self.tp_size = get_tensor_model_parallel_world_size()
         self.tp_rank = get_tensor_model_parallel_rank()
         self.device = base_layer.w2_weight.device
-        self.w13_slices = 2
+        self._w13_slices = 2
         self._inject_lora_into_fused_moe()
 
     def _normalize_keys(self, config: dict[str, int | None]) -> dict[str, int | None]:
@@ -160,7 +160,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                     op_prefix="w13",
                     num_loras=self.max_loras,
                     rank=max_lora_rank,
-                    num_slices=self.w13_slices,
+                    num_slices=self._w13_slices,
                     M=M,
                     layer=layer,
                     top_k=top_k,
@@ -230,7 +230,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 CHUNK_SIZE = envs.VLLM_FUSED_MOE_CHUNK_SIZE
                 num_tokens = hidden_states.size(0)
                 M = min(num_tokens, CHUNK_SIZE)
-                max_lora_rank = self.w2_lora_a_stacked.shape[-2]
+                max_lora_rank = self.w2_lora_a_stacked[0].shape[-2]
                 shrink_config, expand_config = self._get_lora_moe_configs(
                     op_prefix="w2",
                     num_loras=self.max_loras,
@@ -258,8 +258,8 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 self.punica_wrapper.add_lora_fused_moe(
                     intermediate_cache3,
                     intermediate_cache2,
-                    (self.w2_lora_a_stacked,),
-                    (self.w2_lora_b_stacked,),
+                    self.w2_lora_a_stacked,
+                    self.w2_lora_b_stacked,
                     topk_weights,
                     sorted_token_ids_lora,
                     expert_ids_lora,
@@ -292,22 +292,12 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
             self.base_layer.quant_method, m_fused_moe_fn
         )
 
-    def create_lora_weights(
+    def _create_lora_a_weights(
         self,
         max_loras: int,
         lora_config: LoRAConfig,
-        model_config: PretrainedConfig | None = None,
-    ) -> None:
-        """Initializes lora matrices."""
-        assert self.w13_slices == 2
-        self.max_loras = lora_config.max_loras
-        self.fully_sharded = lora_config.fully_sharded_loras
-
-        self.adapter_enabled = torch.tensor(
-            [0] * (max_loras + 1), dtype=torch.int, device=self.device
-        )
-
-        self.w13_lora_a_stacked = tuple(
+    ):
+        self.w13_lora_a_stacked: tuple[torch.Tensor, ...] = tuple(
             torch.zeros(
                 (
                     max_loras,
@@ -320,10 +310,23 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 dtype=lora_config.lora_dtype,
                 device=self.device,
             )
-            for _ in range(self.w13_slices)
+            for _ in range(self._w13_slices)
+        )
+        self.w2_lora_a_stacked: tuple[torch.Tensor, ...] = (
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    lora_config.max_lora_rank,
+                    self.base_layer.intermediate_size_per_partition,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            ),
         )
 
-        self.w13_lora_b_stacked = tuple(
+    def _create_lora_b_weights(self, max_loras: int, lora_config: LoRAConfig):
+        self.w13_lora_b_stacked: tuple[torch.Tensor, ...] = tuple(
             torch.zeros(
                 (
                     max_loras,
@@ -334,34 +337,42 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 dtype=lora_config.lora_dtype,
                 device=self.device,
             )
-            for _ in range(self.w13_slices)
+            for _ in range(self._w13_slices)
+        )
+        self.w2_lora_b_stacked: tuple[torch.Tensor, ...] = (
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    self.base_layer.hidden_size
+                    if not self.fully_sharded
+                    else divide(self.base_layer.hidden_size, self.tp_size),
+                    lora_config.max_lora_rank,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            ),
         )
 
-        self.w2_lora_a_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                lora_config.max_lora_rank,
-                self.base_layer.intermediate_size_per_partition,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
-        )
-        self.w2_lora_b_stacked = torch.zeros(
-            (
-                max_loras,
-                self.base_layer.local_num_experts,
-                self.base_layer.hidden_size
-                if not self.fully_sharded
-                else divide(self.base_layer.hidden_size, self.tp_size),
-                lora_config.max_lora_rank,
-            ),
-            dtype=lora_config.lora_dtype,
-            device=self.device,
+    def create_lora_weights(
+        self,
+        max_loras: int,
+        lora_config: LoRAConfig,
+        model_config: PretrainedConfig | None = None,
+    ) -> None:
+        """Initializes lora matrices."""
+        self.max_loras = lora_config.max_loras
+        self.fully_sharded = lora_config.fully_sharded_loras
+
+        self.adapter_enabled = torch.tensor(
+            [0] * (max_loras + 1), dtype=torch.int, device=self.device
         )
 
+        self._create_lora_a_weights(max_loras, lora_config)
+        self._create_lora_b_weights(max_loras, lora_config)
         # They will be used by 'LoRALayerWeights.create_dummy_lora_weights'
         # to create a dummy LoRA weights.
+        # TODO Optimize this section
         self.lora_a_stacked = []
         self.lora_b_stacked = []
         for lora_id in range(max_loras):
@@ -370,36 +381,43 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 self.lora_a_stacked.append(
                     self.w13_lora_a_stacked[0][lora_id][experts_id]
                 )
-                self.lora_a_stacked.append(self.w2_lora_a_stacked[lora_id][experts_id])
                 self.lora_a_stacked.append(
-                    self.w13_lora_a_stacked[1][lora_id][experts_id]
+                    self.w2_lora_a_stacked[0][lora_id][experts_id]
                 )
 
                 self.lora_b_stacked.append(
                     self.w13_lora_b_stacked[0][lora_id][experts_id]
                 )
-                self.lora_b_stacked.append(self.w2_lora_b_stacked[lora_id][experts_id])
+                self.lora_b_stacked.append(
+                    self.w2_lora_b_stacked[0][lora_id][experts_id]
+                )
+
+                self.lora_a_stacked.append(
+                    self.w13_lora_a_stacked[1][lora_id][experts_id]
+                )
                 self.lora_b_stacked.append(
                     self.w13_lora_b_stacked[1][lora_id][experts_id]
                 )
 
     def reset_lora(self, index: int):
         """Resets the lora weights at index back to 0."""
-        for pos in range(self.w13_slices):
+        for pos in range(self._w13_slices):
             self.w13_lora_a_stacked[pos][index] = 0
             self.w13_lora_b_stacked[pos][index] = 0
 
-        self.w2_lora_a_stacked[index] = 0
-        self.w2_lora_b_stacked[index] = 0
+        self.w2_lora_a_stacked[0][index] = 0
+        self.w2_lora_b_stacked[0][index] = 0
         self.adapter_enabled[index] = 0
 
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
         """Overwrites lora tensors at index."""
+        assert isinstance(lora_a, list)
+        assert isinstance(lora_b, list)
         self.reset_lora(index)
         self.adapter_enabled[index] = 1
         for eid in range(len(lora_a) // 3):
@@ -432,7 +450,7 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                     w1_lora_a = w1_lora_a[w13_start_idx:w13_end_idx, :]
                     w3_lora_a = w3_lora_a[w13_start_idx:w13_end_idx, :]
 
-                    w2_shard_size = self.w2_lora_b_stacked[index, eid].shape[0]
+                    w2_shard_size = self.w2_lora_b_stacked[0][index, eid].shape[0]
                     w2_start_idx = self.tp_rank * w2_shard_size
                     w2_end_idx = (self.tp_rank + 1) * w2_shard_size
                     w2_lora_b = w2_lora_b[w2_start_idx:w2_end_idx, :]
@@ -454,26 +472,14 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
                 index, eid, : w3_lora_b.shape[0], : w3_lora_b.shape[1]
             ].copy_(w3_lora_b, non_blocking=True)
 
-            self.w2_lora_a_stacked[
+            self.w2_lora_a_stacked[0][
                 index, eid, : w2_lora_a.shape[0], : w2_lora_a.shape[1]
             ].copy_(w2_lora_a, non_blocking=True)
 
-            self.w2_lora_b_stacked[
+            self.w2_lora_b_stacked[0][
                 index, eid, : w2_lora_b.shape[0], : w2_lora_b.shape[1]
             ].copy_(w2_lora_b, non_blocking=True)
 
-    @classmethod
-    def can_replace_layer(
-        cls,
-        source_layer: nn.Module,
-        lora_config: LoRAConfig,
-        packed_modules_list: list,
-        model_config: PretrainedConfig | None,
-    ) -> bool:
-        """Returns True if the layer can be replaced by this LoRA layer."""
-        # return type(source_layer) is FusedMoE
-        return isinstance(source_layer, FusedMoE)
-
     def forward(self, *args, **kwargs):
         return self.base_layer.forward(*args, **kwargs)
 
@@ -491,3 +497,220 @@ class FusedMoEWithLoRA(BaseLayerWithLoRA):
     @property
     def is_internal_router(self) -> bool:
         return self.base_layer.is_internal_router
+
+    @classmethod
+    def can_replace_layer(
+        cls,
+        source_layer: nn.Module,
+        lora_config: LoRAConfig,
+        packed_modules_list: list,
+        model_config: PretrainedConfig | None,
+    ) -> bool:
+        """Returns True if the layer can be replaced by this LoRA layer."""
+        # return type(source_layer) is FusedMoE
+
+        return type(source_layer) is FusedMoE and len(packed_modules_list) == 2
+
+
+class FusedMoE3DWithLoRA(FusedMoEWithLoRA):
+    def __init__(self, base_layer):
+        super().__init__(base_layer)
+        self._w13_slices = 1
+
+    def _create_lora_b_weights(self, max_loras, lora_config):
+        self.w13_lora_b_stacked: tuple[torch.Tensor] = tuple(
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    self.base_layer.intermediate_size_per_partition * 2,
+                    lora_config.max_lora_rank,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            )
+            for _ in range(self._w13_slices)
+        )
+        self.w2_lora_b_stacked: tuple[torch.Tensor] = (
+            torch.zeros(
+                (
+                    max_loras,
+                    self.base_layer.local_num_experts,
+                    self.base_layer.hidden_size
+                    if not self.fully_sharded
+                    else divide(self.base_layer.hidden_size, self.tp_size),
+                    lora_config.max_lora_rank,
+                ),
+                dtype=lora_config.lora_dtype,
+                device=self.device,
+            ),
+        )
+
+    def create_lora_weights(
+        self,
+        max_loras: int,
+        lora_config: LoRAConfig,
+        model_config: PretrainedConfig | None = None,
+    ) -> None:
+        """Initializes lora matrices."""
+        self.max_loras = lora_config.max_loras
+        self.fully_sharded = lora_config.fully_sharded_loras
+
+        self.adapter_enabled = torch.tensor(
+            [0] * (max_loras + 1), dtype=torch.int, device=self.device
+        )
+
+        self._create_lora_a_weights(max_loras, lora_config)
+        self._create_lora_b_weights(max_loras, lora_config)
+
+    def _slice_w13_a(self, w13_lora_a: torch.Tensor) -> torch.Tensor:
+        if self.tp_size == 1 or not self.fully_sharded:
+            return w13_lora_a
+
+        # w13_lora_a shape (num_experts,rank,input_size)
+        current_lora_rank = w13_lora_a.shape[1]
+        assert current_lora_rank % self.tp_size == 0
+
+        sliced_rank = current_lora_rank // self.tp_size
+        start_idx = self.tp_rank * sliced_rank
+        end_idx = (self.tp_rank + 1) * sliced_rank
+        return w13_lora_a[:, start_idx:end_idx, :]
+
+    def _slice_w13_b(self, w13_lora_b: torch.Tensor, is_interleave: bool = True):
+        if self.tp_size == 1:
+            return w13_lora_b
+
+        # w13_lora_b shape (num_experts,output_size,rank)
+        shard_size = self.base_layer.intermediate_size_per_partition
+        start_idx = self.tp_rank * shard_size
+        end_idx = (self.tp_rank + 1) * shard_size
+        if is_interleave:
+            # For models like GPT-OSS, the weights of w1 (gate_proj) and w3 (up_proj)
+            # in the interleaved order, and corresponding LoRA need to be processed.
+            w1_lora_b = w13_lora_b[:, ::2, :]
+            w3_lora_b = w13_lora_b[:, 1::2, :]
+            sliced_w1_lora_b = w1_lora_b[:, start_idx:end_idx, :]
+            sliced_w3_lora_b = w3_lora_b[:, start_idx:end_idx, :]
+
+            return torch.stack([sliced_w1_lora_b, sliced_w3_lora_b], dim=2).flatten(
+                1, 2
+            )
+        else:
+            slice_size = w13_lora_b.shape[1] // 2
+            w1_lora_b = w13_lora_b[:, :slice_size, :]
+            w3_lora_b = w13_lora_b[:, slice_size:, :]
+            sliced_w1_lora_b = w1_lora_b[:, start_idx:end_idx, :]
+            sliced_w3_lora_b = w3_lora_b[:, start_idx:end_idx, :]
+
+            return torch.cat([sliced_w1_lora_b, sliced_w3_lora_b], dim=1)
+
+    def _slice_w2_a(self, w2_lora_a: torch.Tensor) -> torch.Tensor:
+        if self.tp_size == 1:
+            return w2_lora_a
+        # w2_lora_a shape (num_experts,rank,input_size)
+        shard_size = self.base_layer.intermediate_size_per_partition
+        start_idx = self.tp_rank * shard_size
+        end_idx = (self.tp_rank + 1) * shard_size
+
+        return w2_lora_a[:, :, start_idx:end_idx]
+
+    def _slice_w2_b(self, w2_lora_b: torch.Tensor) -> torch.Tensor:
+        if self.tp_size == 1 or not self.fully_sharded:
+            return w2_lora_b
+        # Based on S-LoRA, we slice W2 B along the hidden_size dim.
+        # w2_lora_b shape (num_experts,output_size,rank)
+        current_lora_size = w2_lora_b.shape[1]
+
+        sliced_size = current_lora_size // self.tp_size
+        start_idx = self.tp_rank * sliced_size
+        end_idx = (self.tp_rank + 1) * sliced_size
+        return w2_lora_b[:, start_idx:end_idx, :]
+
+    def set_lora(
+        self,
+        index: int,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
+    ):
+        """Overwrites lora tensors at index."""
+        # Make mypy happy
+        assert isinstance(lora_a, list)
+        assert isinstance(lora_b, list)
+        assert len(lora_a) == len(lora_b) == 2
+
+        self.reset_lora(index)
+        self.adapter_enabled[index] = 1
+
+        num_experts = self.w13_lora_a_stacked[0].shape[1]
+        w13_lora_a, w2_lora_a = lora_a
+        w13_lora_b, w2_lora_b = lora_b
+
+        # (num_experts,rank,input_size)
+        w13_lora_a = w13_lora_a.reshape(num_experts, -1, w13_lora_a.shape[-1])
+        w2_lora_a = w2_lora_a.reshape(num_experts, -1, w2_lora_a.shape[-1])
+        # (output_size,num_experts,rank)
+        w13_lora_b = w13_lora_b.reshape(w13_lora_b.shape[0], num_experts, -1)
+        w2_lora_b = w2_lora_b.reshape(w2_lora_b.shape[0], num_experts, -1)
+        # (num_experts,output_size,rank)
+        w13_lora_b = w13_lora_b.permute(1, 0, 2)
+        w2_lora_b = w2_lora_b.permute(1, 0, 2)
+
+        sliced_w13_lora_a = self._slice_w13_a(w13_lora_a)
+        sliced_w13_lora_b = self._slice_w13_b(w13_lora_b, is_interleave=True)
+
+        sliced_w2_lora_a = self._slice_w2_a(w2_lora_a)
+        sliced_w2_lora_b = self._slice_w2_b(w2_lora_b)
+
+        self.w13_lora_a_stacked[0][
+            index, :, : sliced_w13_lora_a.shape[1], : sliced_w13_lora_a.shape[2]
+        ].copy_(sliced_w13_lora_a, non_blocking=True)
+        self.w2_lora_a_stacked[0][
+            index, :, : sliced_w2_lora_a.shape[1], : sliced_w2_lora_a.shape[2]
+        ].copy_(sliced_w2_lora_a, non_blocking=True)
+
+        self.w13_lora_b_stacked[0][
+            index, :, : sliced_w13_lora_b.shape[1], : sliced_w13_lora_b.shape[2]
+        ].copy_(sliced_w13_lora_b, non_blocking=True)
+        self.w2_lora_b_stacked[0][
+            index, :, : sliced_w2_lora_b.shape[1], : sliced_w2_lora_b.shape[2]
+        ].copy_(sliced_w2_lora_b, non_blocking=True)
+
+    @property
+    def w13_input_size(self):
+        """
+        Full size
+        """
+        return self.w13_lora_a_stacked[0].shape[-1]
+
+    @property
+    def w13_output_size(self):
+        """
+        Full size
+        """
+        return self.w13_lora_b_stacked[0].shape[-2] * self.tp_size
+
+    @property
+    def w2_input_size(self):
+        """
+        Full size
+        """
+        return self.w2_lora_a_stacked[0].shape[-1] * self.tp_size
+
+    @property
+    def w2_output_size(self):
+        """
+        Full size
+        """
+        return self.w2_lora_a_stacked[0].shape[-2]
+
+    @classmethod
+    def can_replace_layer(
+        cls,
+        source_layer: nn.Module,
+        lora_config: LoRAConfig,
+        packed_modules_list: list,
+        model_config: PretrainedConfig | None,
+    ) -> bool:
+        """Returns True if the layer can be replaced by this LoRA layer."""
+
+        return type(source_layer) is FusedMoE and len(packed_modules_list) == 1
diff --git a/vllm/lora/layers/logits_processor.py b/vllm/lora/layers/logits_processor.py
index 06f92652031e1..c01984db4e64c 100644
--- a/vllm/lora/layers/logits_processor.py
+++ b/vllm/lora/layers/logits_processor.py
@@ -128,9 +128,11 @@ class LogitsProcessorWithLoRA(BaseLayerWithLoRA):
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
+        assert isinstance(lora_a, torch.Tensor)
+        assert isinstance(lora_b, torch.Tensor)
         self.reset_lora(index)
         self.lora_a_stacked[index, 0, : lora_a.shape[0], : lora_a.shape[1]].copy_(
             lora_a, non_blocking=True
diff --git a/vllm/lora/layers/vocal_parallel_embedding.py b/vllm/lora/layers/vocal_parallel_embedding.py
index 5b1f7886bc238..c87ca9e24dece 100644
--- a/vllm/lora/layers/vocal_parallel_embedding.py
+++ b/vllm/lora/layers/vocal_parallel_embedding.py
@@ -77,12 +77,15 @@ class VocabParallelEmbeddingWithLoRA(BaseLayerWithLoRA):
     def set_lora(
         self,
         index: int,
-        lora_a: torch.Tensor,
-        lora_b: torch.Tensor,
+        lora_a: torch.Tensor | list[torch.Tensor],
+        lora_b: torch.Tensor | list[torch.Tensor],
     ):
+        assert isinstance(lora_a, torch.Tensor)
+        assert isinstance(lora_b, torch.Tensor)
         self.reset_lora(index)
         # NOTE self.lora_a_stacked is row-major, and lora_a is col-major,
         # so we need transpose here
+
         self.lora_a_stacked[index, : lora_a.shape[1], : lora_a.shape[0]].copy_(
             lora_a.T, non_blocking=True
         )
diff --git a/vllm/lora/models.py b/vllm/lora/models.py
index eb11cd0afc487..636f062feb7b0 100644
--- a/vllm/lora/models.py
+++ b/vllm/lora/models.py
@@ -22,11 +22,13 @@ from vllm.lora.utils import (
     from_layer_logits_processor,
     get_supported_lora_modules,
     is_base_embeddding_weights,
+    is_moe_model,
     is_regex_target_modules,
     parse_fine_tuned_lora_name,
     process_packed_modules_mapping,
     replace_submodule,
 )
+from vllm.model_executor.layers.fused_moe import FusedMoE
 from vllm.model_executor.model_loader.tensorizer import TensorizerConfig
 from vllm.model_executor.models import SupportsLoRA, supports_multimodal
 from vllm.model_executor.models.interfaces import is_pooling_model
@@ -356,7 +358,11 @@ class LoRAModelManager:
         self.modules: dict[str, BaseLayerWithLoRA] = {}
         # Dict instead of a set for compatibility with LRUCache.
         self._last_mapping: LoRAMapping | None = None
+        self._is_3d_moe_model = is_moe_model(self.model) and hasattr(
+            self.model, "is_3d_moe_weight"
+        )
         self._create_lora_modules()
+
         self.model.lora_manager = self
 
     def __len__(self) -> int:
@@ -400,22 +406,36 @@ class LoRAModelManager:
         self.lora_index_to_id[index] = lora_model.id
         for module_name, module in self.modules.items():
             module_lora = self._get_lora_layer_weights(lora_model, module_name)
-            if module_lora:
-                # Note (gnovack) - If MOE lora weights are not split into
-                # num_experts chunks, we split them here
-                if isinstance(module, FusedMoEWithLoRA) and torch.is_tensor(
-                    module_lora.lora_a
-                ):
-                    # Handle FSDP file format where experts.base_layer is the
-                    # gate_up_proj and experts is the down_proj
-                    gate_up_proj_lora = self._get_lora_layer_weights(
-                        lora_model, module_name + ".base_layer"
-                    )
-
-                    assert gate_up_proj_lora is not None
-                    assert module_lora is not None
-
-                    down_proj_lora = module_lora
+            if not module_lora:
+                module.reset_lora(index)
+                continue
+            # Note (gnovack) - If MOE lora weights are not split into
+            # num_experts chunks, we split them here
+            if isinstance(module, FusedMoEWithLoRA) and torch.is_tensor(
+                module_lora.lora_a
+            ):
+                # Handle PEFT file format where experts.base_layer is the
+                # gate_up_proj and experts is the down_proj
+                gate_up_proj_lora = self._get_lora_layer_weights(
+                    lora_model, module_name + ".base_layer"
+                )
+                down_proj_lora = module_lora
+                # FIXME Edge case where LoRA is not added to gate_up_proj
+                # or down_proj
+                assert gate_up_proj_lora is not None
+                assert down_proj_lora is not None
+                if self._is_3d_moe_model:
+                    module_lora.lora_a = [
+                        gate_up_proj_lora.lora_a,
+                        down_proj_lora.lora_a,
+                    ]
+                    module_lora.lora_b = [
+                        gate_up_proj_lora.lora_b,
+                        down_proj_lora.lora_b,
+                    ]
+                else:
+                    # Some 3D MoE models haven't added the `is_3d_moe_weight`
+                    # attribute yet, so fallback here
                     num_experts = module_lora.lora_a.shape[0] // module_lora.rank
 
                     gate_proj_a = gate_up_proj_lora.lora_a.chunk(num_experts, dim=0)
@@ -444,14 +464,12 @@ class LoRAModelManager:
 
                     module_lora.lora_a = lora_a
                     module_lora.lora_b = lora_b
+            module.set_lora(
+                index,
+                module_lora.lora_a,
+                module_lora.lora_b,
+            )
 
-                module.set_lora(
-                    index,
-                    module_lora.lora_a,
-                    module_lora.lora_b,
-                )
-            else:
-                module.reset_lora(index)
         return True
 
     def _deactivate_adapter(self, lora_id: int):
@@ -512,6 +530,13 @@ class LoRAModelManager:
                 continue
             parts = module_name.split(".")[-1]
             packed_moduled_lst = self.packed_modules_mapping.get(parts, [])
+            if isinstance(module, FusedMoE):
+                # packed_moduled_lst is used here to just determine whether to
+                # instantiate FusedMoE3DWithLoRA or FusedMoEWithLoRA, and the
+                # difference between these two LoRA layers is whether the
+                # LoRA weights of w1 and w3 have already been fused on disk.
+
+                packed_moduled_lst = ["w13"] if self._is_3d_moe_model else ["w1", "w3"]
             new_module = replace_submodule(
                 self.model,
                 module_name,
@@ -560,6 +585,7 @@ class LoRAModelManager:
             self._register_packed_modules(module_name)
             # All lora layers share the same punica_wrapper based on reference.
             new_module.set_mapping(self.punica_wrapper)
+        pass
 
     def register_module(self, module_name: str, module: "BaseLayerWithLoRA"):
         assert isinstance(module, BaseLayerWithLoRA), (
@@ -605,6 +631,30 @@ class LoRAModelManager:
                         module.lora_a_stacked[0].dtype,
                         "cpu",
                     )
+                    model.loras[module_name] = lora
+                elif module.__class__.__name__ == "FusedMoE3DWithLoRA":
+                    # Case for 3D moe model
+                    # w2
+                    lora = LoRALayerWeights.create_dummy_lora_weights(
+                        module_name,
+                        module.w2_input_size,
+                        module.w2_output_size,
+                        rank * module.w2_lora_a_stacked[0].shape[1],  # rank*num_experts
+                        module.w2_lora_a_stacked[0].dtype,
+                        "cpu",
+                    )
+                    model.loras[module_name] = lora
+                    # w13
+                    lora = LoRALayerWeights.create_dummy_lora_weights(
+                        module_name,
+                        module.w13_input_size,
+                        module.w13_output_size,
+                        rank
+                        * module.w13_lora_a_stacked[0].shape[1],  # rank*num_experts
+                        module.w13_lora_a_stacked[0].dtype,
+                        "cpu",
+                    )
+                    model.loras[module_name + ".base_layer"] = lora
                 else:
                     lora = LoRALayerWeights.create_dummy_lora_weights(
                         module_name,
@@ -614,6 +664,7 @@ class LoRAModelManager:
                         module.lora_a_stacked[0].dtype,
                         "cpu",
                     )
+                    model.loras[module_name] = lora
             else:
                 parts = module_name.split(".")
                 replacements = self.packed_modules_mapping[parts[-1]]
@@ -629,7 +680,7 @@ class LoRAModelManager:
                     )
                     subloras.append(lora)
                 lora = PackedLoRALayerWeights.pack(subloras)
-            model.loras[module_name] = lora
+                model.loras[module_name] = lora
         return model
 
     def _match_target_modules(self, module_name: str):
diff --git a/vllm/lora/utils.py b/vllm/lora/utils.py
index a49a7d9d1669d..12524994d4968 100644
--- a/vllm/lora/utils.py
+++ b/vllm/lora/utils.py
@@ -23,6 +23,7 @@ from vllm.lora.layers import (
     BaseLayerWithLoRA,
     ColumnParallelLinearWithLoRA,
     ColumnParallelLinearWithShardedLoRA,
+    FusedMoE3DWithLoRA,
     FusedMoEWithLoRA,
     LogitsProcessorWithLoRA,
     MergedColumnParallelLinearWithLoRA,
@@ -62,6 +63,7 @@ _all_lora_classes: set[type[BaseLayerWithLoRA]] = {
     MergedQKVParallelLinearWithShardedLoRA,
     RowParallelLinearWithShardedLoRA,
     FusedMoEWithLoRA,
+    FusedMoE3DWithLoRA,
 }
 
 
@@ -288,10 +290,12 @@ def process_packed_modules_mapping(model: nn.Module) -> dict[str, list[str]]:
             # the expert indices are expanded based on the configured number
             # of routed experts.
             packed_modules_mapping = get_packed_modules_mapping(model)
-
-            packed_modules_mapping["experts"] = [
-                weight_name.rstrip(".") for _, weight_name, _, _ in moe_packed_mapping
-            ]
+            if not hasattr(model, "is_3d_moe_weight"):
+                # 3D MoE LoRA does not need `packed_modules_mapping`
+                packed_modules_mapping["experts"] = [
+                    weight_name.rstrip(".")
+                    for _, weight_name, _, _ in moe_packed_mapping
+                ]
 
             return packed_modules_mapping
         else:
diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
index 8835acb8ec65c..1bc0ad38765d5 100644
--- a/vllm/model_executor/models/gpt_oss.py
+++ b/vllm/model_executor/models/gpt_oss.py
@@ -656,6 +656,7 @@ class GptOssModel(nn.Module):
 
 
 class GptOssForCausalLM(nn.Module, SupportsPP, SupportsEagle3, SupportsLoRA):
+    is_3d_moe_weight: bool = True
     packed_modules_mapping = {"qkv_proj": ["q_proj", "k_proj", "v_proj"]}
 
     hf_to_vllm_mapper = WeightsMapper(

From 30854783add03ef4d669e3a0041f60d89061172e Mon Sep 17 00:00:00 2001
From: Zero <rockmanzero@naver.com>
Date: Mon, 24 Nov 2025 11:27:55 +0900
Subject: [PATCH 82/83] [Model] Add OpenCUA-7B support (#29068)

Signed-off-by: lim4349 <rockmanzero@naver.com>
Signed-off-by: Zero <rockmanzero@naver.com>
Co-authored-by: Cloud User <ubuntu@a100-80g-4.novalocal>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>
---
 docs/models/supported_models.md        |   1 +
 tests/models/registry.py               |   3 +
 vllm/model_executor/models/opencua.py  | 271 +++++++++++++++++++++++++
 vllm/model_executor/models/registry.py |   4 +
 4 files changed, 279 insertions(+)
 create mode 100644 vllm/model_executor/models/opencua.py

diff --git a/docs/models/supported_models.md b/docs/models/supported_models.md
index 626904a974155..404519f887dc6 100644
--- a/docs/models/supported_models.md
+++ b/docs/models/supported_models.md
@@ -701,6 +701,7 @@ These models primarily accept the [`LLM.generate`](./generative_models.md#llmgen
 | `Mistral3ForConditionalGeneration` | Mistral3 (HF Transformers) | T + I<sup>+</sup> | `mistralai/Mistral-Small-3.1-24B-Instruct-2503`, etc. | ✅︎ | ✅︎ |
 | `MolmoForCausalLM` | Molmo | T + I<sup>+</sup> | `allenai/Molmo-7B-D-0924`, `allenai/Molmo-7B-O-0924`, etc. | ✅︎ | ✅︎ |
 | `NVLM_D_Model` | NVLM-D 1.0 | T + I<sup>+</sup> | `nvidia/NVLM-D-72B`, etc. | | ✅︎ |
+| `OpenCUAForConditionalGeneration` | OpenCUA-7B | T + I<sup>E+</sup> | `xlangai/OpenCUA-7B` | ✅︎ | ✅︎ |
 | `Ovis` | Ovis2, Ovis1.6 | T + I<sup>+</sup> | `AIDC-AI/Ovis2-1B`, `AIDC-AI/Ovis1.6-Llama3.2-3B`, etc. | | ✅︎ |
 | `Ovis2_5` | Ovis2.5 | T + I<sup>+</sup> + V | `AIDC-AI/Ovis2.5-9B`, etc. | | |
 | `PaddleOCRVLForConditionalGeneration` | Paddle-OCR | T + I<sup>+</sup> | `PaddlePaddle/PaddleOCR-VL`, etc. | | |
diff --git a/tests/models/registry.py b/tests/models/registry.py
index b088e16756d7a..758ec54493aa3 100644
--- a/tests/models/registry.py
+++ b/tests/models/registry.py
@@ -725,6 +725,9 @@ _MULTIMODAL_EXAMPLE_MODELS = {
     "NemotronH_Nano_VL_V2": _HfExamplesInfo(
         "nano_vl_dummy", is_available_online=False, trust_remote_code=True
     ),
+    "OpenCUAForConditionalGeneration": _HfExamplesInfo(
+        "xlangai/OpenCUA-7B", trust_remote_code=True
+    ),
     "Ovis": _HfExamplesInfo(
         "AIDC-AI/Ovis2-1B",
         trust_remote_code=True,
diff --git a/vllm/model_executor/models/opencua.py b/vllm/model_executor/models/opencua.py
new file mode 100644
index 0000000000000..121bf896fa6ba
--- /dev/null
+++ b/vllm/model_executor/models/opencua.py
@@ -0,0 +1,271 @@
+# SPDX-License-Identifier: Apache-2.0
+# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
+#
+# Adapted from Qwen2.5-VL implementation
+# Copyright 2025 The vLLM team.
+# Copyright 2025 XLANG Lab, The University of Hong Kong
+
+"""Inference-only OpenCUA-7B model compatible with HuggingFace weights."""
+
+from collections.abc import Mapping, Sequence
+from typing import Any
+
+import torch
+import torch.nn as nn
+from transformers import BatchFeature
+from transformers.models.qwen2_vl import (
+    Qwen2VLImageProcessor,
+    Qwen2VLProcessor,
+    Qwen2VLVideoProcessor,
+)
+
+from vllm.config import VllmConfig
+from vllm.multimodal import MULTIMODAL_REGISTRY
+from vllm.multimodal.inputs import (
+    MultiModalFieldConfig,
+    MultiModalKwargs,
+)
+from vllm.multimodal.parse import MultiModalDataItems, MultiModalDataParser
+from vllm.multimodal.processing import (
+    BaseMultiModalProcessor,
+    PromptReplacement,
+    PromptUpdate,
+)
+from vllm.transformers_utils.tokenizer import AnyTokenizer
+
+from .qwen2_5_vl import (
+    Qwen2_5_VisionTransformer as OpenCUAVisionTransformer,
+)
+from .qwen2_5_vl import (
+    Qwen2_5_VLForConditionalGeneration,
+)
+from .qwen2_vl import (
+    Qwen2VLDummyInputsBuilder,
+    Qwen2VLMultiModalDataParser,
+    Qwen2VLProcessingInfo,
+    _create_qwen2vl_field_factory,
+)
+from .utils import (
+    WeightsMapper,
+    init_vllm_registered_model,
+    maybe_prefix,
+)
+
+
+class OpenCUAProcessingInfo(Qwen2VLProcessingInfo):
+    def get_hf_config(self):
+        return self.ctx.get_hf_config()
+
+    def get_supported_mm_limits(self) -> Mapping[str, int | None]:
+        return {"image": None}
+
+    def get_hf_processor(self, **kwargs: object):
+        """Load OpenCUA processor."""
+        tokenizer = self.get_tokenizer()
+        vision_config = self.ctx.get_hf_image_processor_config()
+        return OpenCUAProcessor(
+            vision_config=vision_config,
+            tokenizer=tokenizer,
+            **kwargs,
+        )
+
+
+class OpenCUAProcessor(Qwen2VLProcessor):
+    def check_argument_for_proper_class(self, attribute_name: str, arg: object) -> None:
+        if attribute_name == "tokenizer":
+            return
+        return super().check_argument_for_proper_class(attribute_name, arg)
+
+    def __init__(
+        self,
+        vision_config: dict,
+        tokenizer: AnyTokenizer,
+        **kwargs,
+    ):
+        image_processor = Qwen2VLImageProcessor(**vision_config)
+        video_processor = Qwen2VLVideoProcessor(**vision_config)
+        chat_template = kwargs.pop("chat_template", None)
+
+        super().__init__(
+            image_processor=image_processor,
+            tokenizer=tokenizer,
+            video_processor=video_processor,
+            chat_template=chat_template,
+            **kwargs,
+        )
+
+        self.image_token = "<|media_placeholder|>"
+
+    def __call__(
+        self,
+        text=None,
+        images=None,
+        return_tensors=None,
+        **kwargs,
+    ):
+        if text is not None:
+            if not isinstance(text, list):
+                text = [text]
+            text_inputs = self.tokenizer(text, **kwargs)
+        else:
+            text_inputs = {}
+
+        image_inputs = {}
+        if images is not None:
+            if not isinstance(images, list):
+                images = [images]
+            if len(images) > 0:
+                image_inputs = self.image_processor(
+                    images, return_tensors=return_tensors or "pt"
+                )
+
+        combined_inputs = {**text_inputs, **image_inputs}
+
+        return BatchFeature(combined_inputs, tensor_type=return_tensors)
+
+
+class OpenCUAMultiModalProcessor(BaseMultiModalProcessor[OpenCUAProcessingInfo]):
+    def _get_data_parser(self) -> MultiModalDataParser:
+        return Qwen2VLMultiModalDataParser(
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )
+
+    def _get_mm_fields_config(
+        self,
+        hf_inputs: BatchFeature,
+        hf_processor_mm_kwargs: Mapping[str, object],
+    ) -> Mapping[str, MultiModalFieldConfig]:
+        return _create_qwen2vl_field_factory(
+            self.info.get_hf_config().vision_config.spatial_merge_size
+        )(hf_inputs)
+
+    def _hf_processor_applies_updates(
+        self,
+        prompt_text: str,
+        mm_items: MultiModalDataItems,
+        hf_processor_mm_kwargs: Mapping[str, object],
+        tokenization_kwargs: Mapping[str, object],
+    ) -> bool:
+        """vLLM이 prompt 업데이트를 처리하도록 False 반환."""
+        return False
+
+    def _get_prompt_updates(
+        self,
+        mm_items: MultiModalDataItems,
+        hf_processor_mm_kwargs: Mapping[str, Any],
+        out_mm_kwargs: MultiModalKwargs,
+    ) -> Sequence[PromptUpdate]:
+        hf_processor = self.info.get_hf_processor(**hf_processor_mm_kwargs)
+        image_processor = self.info.get_image_processor(**hf_processor_mm_kwargs)
+        tokenizer = self.info.get_tokenizer()
+        vocab = tokenizer.get_vocab()
+        hf_config = self.info.get_hf_config()
+
+        image_token_str = getattr(hf_processor, "image_token", "<|media_placeholder|>")
+        image_token_id = vocab.get(
+            image_token_str,
+            getattr(hf_config, "media_placeholder_token_id", 151664),
+        )
+
+        merge_length = image_processor.merge_size**2
+
+        def get_replacement_opencua(item_idx: int):
+            out_item = out_mm_kwargs["image"][item_idx]
+            grid_thw = out_item["image_grid_thw"].data
+            assert isinstance(grid_thw, torch.Tensor)
+
+            num_tokens = int(grid_thw.prod()) // merge_length
+            return [image_token_id] * num_tokens
+
+        return [
+            PromptReplacement(
+                modality="image",
+                target=[image_token_id],
+                replacement=get_replacement_opencua,
+            )
+        ]
+
+
+class OpenCUADummyInputsBuilder(Qwen2VLDummyInputsBuilder):
+    def get_dummy_text(self, mm_counts: Mapping[str, int]) -> str:
+        num_images = mm_counts.get("image", 0)
+
+        image_token = "<|media_placeholder|>"
+
+        return image_token * num_images
+
+
+@MULTIMODAL_REGISTRY.register_processor(
+    OpenCUAMultiModalProcessor,
+    info=OpenCUAProcessingInfo,
+    dummy_inputs=OpenCUADummyInputsBuilder,
+)
+class OpenCUAForConditionalGeneration(Qwen2_5_VLForConditionalGeneration):
+    merge_by_field_config = True
+    multimodal_cpu_fields = {"image_grid_thw"}
+
+    packed_modules_mapping = {
+        "qkv_proj": ["q_proj", "k_proj", "v_proj"],
+        "gate_up_proj": ["gate_proj", "up_proj"],
+    }
+
+    hf_to_vllm_mapper = WeightsMapper(
+        orig_to_new_prefix={
+            "model.language_model.": "language_model.model.",
+            "model.visual.": "visual.",
+            "vision_tower.": "visual.",
+            "lm_head.": "language_model.lm_head.",
+            "model.": "language_model.model.",
+        }
+    )
+
+    supports_encoder_tp_data = True
+
+    @classmethod
+    def get_placeholder_str(cls, modality: str, i: int) -> str | None:
+        if modality.startswith("image"):
+            return "<|media_placeholder|>"
+        raise ValueError("Only image modality is supported")
+
+    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
+        nn.Module.__init__(self)
+        config = vllm_config.model_config.hf_config
+        quant_config = vllm_config.quant_config
+        multimodal_config = vllm_config.model_config.multimodal_config
+
+        self.use_data_parallel = multimodal_config.mm_encoder_tp_mode == "data"
+        self.config = config
+        self.vllm_config = vllm_config
+        self.multimodal_config = multimodal_config
+        self.quant_config = quant_config
+        self.is_multimodal_pruning_enabled = (
+            multimodal_config.is_multimodal_pruning_enabled()
+        )
+
+        if multimodal_config.get_limit_per_prompt("image"):
+            attn_backend_override = (
+                multimodal_config.mm_encoder_attn_backend
+                if multimodal_config is not None
+                else None
+            )
+            self.visual = OpenCUAVisionTransformer(
+                vision_config=config.vision_config,
+                norm_eps=getattr(config, "rms_norm_eps", 1e-6),
+                quant_config=self.quant_config,
+                prefix=maybe_prefix(prefix, "visual"),
+                use_data_parallel=self.use_data_parallel,
+                attn_backend_override=attn_backend_override,
+            )
+        else:
+            self.visual = None
+
+        self.language_model = init_vllm_registered_model(
+            vllm_config=vllm_config,
+            hf_config=config.text_config,
+            prefix=maybe_prefix(prefix, "language_model"),
+            architectures=["Qwen2ForCausalLM"],
+        )
+
+        self.make_empty_intermediate_tensors = (
+            self.language_model.make_empty_intermediate_tensors
+        )
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
index 4943987606201..b3da64af750c7 100644
--- a/vllm/model_executor/models/registry.py
+++ b/vllm/model_executor/models/registry.py
@@ -289,6 +289,10 @@ _MULTIMODAL_MODELS = {
     "H2OVLChatModel": ("h2ovl", "H2OVLChatModel"),
     "InternVLChatModel": ("internvl", "InternVLChatModel"),
     "NemotronH_Nano_VL_V2": ("nano_nemotron_vl", "NemotronH_Nano_VL_V2"),
+    "OpenCUAForConditionalGeneration": (
+        "opencua",
+        "OpenCUAForConditionalGeneration",
+    ),
     "InternS1ForConditionalGeneration": (
         "interns1",
         "InternS1ForConditionalGeneration",

From 5253f4276f333474f43d7f1cdaad6104d8f88f1f Mon Sep 17 00:00:00 2001
From: tongqiu <toqiu@amd.com>
Date: Mon, 24 Nov 2025 11:26:00 +0800
Subject: [PATCH 83/83] [ROCm] Support for Whisper v1 with Aiter Unified
 Attention and Aiter Flash Attention (#28376)

Signed-off-by: apinge <Tong.Qiu2@amd.com>
---
 vllm/v1/attention/backends/rocm_aiter_fa.py   | 22 ++++++++++++-------
 .../backends/rocm_aiter_unified_attn.py       | 14 ++++++++++--
 vllm/v1/attention/backends/rocm_attn.py       |  7 ++----
 3 files changed, 28 insertions(+), 15 deletions(-)

diff --git a/vllm/v1/attention/backends/rocm_aiter_fa.py b/vllm/v1/attention/backends/rocm_aiter_fa.py
index c8742e9835203..ea911af3d19ce 100644
--- a/vllm/v1/attention/backends/rocm_aiter_fa.py
+++ b/vllm/v1/attention/backends/rocm_aiter_fa.py
@@ -517,12 +517,9 @@ class AiterFlashAttentionImpl(AttentionImpl):
         assert self.num_heads % self.num_kv_heads == 0
         self.num_queries_per_kv = self.num_heads // self.num_kv_heads
 
-        if attn_type != AttentionType.DECODER:
+        if attn_type not in [AttentionType.DECODER, AttentionType.ENCODER_DECODER]:
             raise NotImplementedError(
-                "Encoder self-attention and "
-                "encoder/decoder cross-attention "
-                "are not implemented for "
-                "FlashAttentionImpl"
+                "Encoder self-attention is not implemented for FlashAttentionImpl"
             )
 
     def extend_forward(
@@ -678,7 +675,14 @@ class AiterFlashAttentionImpl(AttentionImpl):
         # performance to make sure it does not introduce any overhead.
         num_actual_tokens = attn_metadata.num_actual_tokens
         key_cache, value_cache = kv_cache.unbind(0)
-        if self.kv_sharing_target_layer_name is None:
+        # key and value may be None in the case of cross attention. They are
+        # calculated once based on the output from the encoder and then cached
+        # in KV cache.
+        if (
+            self.kv_sharing_target_layer_name is None
+            and key is not None
+            and value is not None
+        ):
             # Reshape the input keys and values and store them in the cache.
             # Skip this if sharing KV cache with an earlier attention layer.
             # NOTE(woosuk): Here, key and value are padded while slot_mapping
@@ -704,8 +708,10 @@ class AiterFlashAttentionImpl(AttentionImpl):
 
         # decode:extend:prefill
         query = query[:num_actual_tokens]
-        key = key[:num_actual_tokens]
-        value = value[:num_actual_tokens]
+        if key is not None:
+            key = key[:num_actual_tokens]
+        if value is not None:
+            value = value[:num_actual_tokens]
 
         output_actual_tokens = output[:num_actual_tokens]
 
diff --git a/vllm/v1/attention/backends/rocm_aiter_unified_attn.py b/vllm/v1/attention/backends/rocm_aiter_unified_attn.py
index b2639c0df0412..16fb52ab501c1 100644
--- a/vllm/v1/attention/backends/rocm_aiter_unified_attn.py
+++ b/vllm/v1/attention/backends/rocm_aiter_unified_attn.py
@@ -142,7 +142,14 @@ class RocmAiterUnifiedAttentionImpl(RocmAttentionImpl):
 
         key_cache, value_cache = kv_cache.unbind(0)
 
-        if self.kv_sharing_target_layer_name is None:
+        # key and value may be None in the case of cross attention. They are
+        # calculated once based on the output from the encoder and then cached
+        # in KV cache.
+        if (
+            self.kv_sharing_target_layer_name is None
+            and key is not None
+            and value is not None
+        ):
             # Reshape the input keys and values and store them in the cache.
             # Skip this if sharing KV cache with an earlier attention layer.
             ops.reshape_and_cache_flash(
@@ -169,7 +176,10 @@ class RocmAiterUnifiedAttentionImpl(RocmAttentionImpl):
         max_seqlen_k = attn_metadata.max_seq_len
         block_table = attn_metadata.block_table
 
-        descale_shape = (cu_seqlens_q.shape[0] - 1, key.shape[1])
+        descale_shape = (
+            cu_seqlens_q.shape[0] - 1,
+            key.shape[1] if key is not None else self.num_kv_heads,
+        )
 
         self.unified_attention(
             q=query[:num_actual_tokens],
diff --git a/vllm/v1/attention/backends/rocm_attn.py b/vllm/v1/attention/backends/rocm_attn.py
index 6dfdfc19ccba1..868143cc192e7 100644
--- a/vllm/v1/attention/backends/rocm_attn.py
+++ b/vllm/v1/attention/backends/rocm_attn.py
@@ -238,12 +238,9 @@ class RocmAttentionImpl(AttentionImpl):
 
         RocmAttentionBackend.validate_head_size(head_size)
 
-        if attn_type != AttentionType.DECODER:
+        if attn_type not in [AttentionType.DECODER, AttentionType.ENCODER_DECODER]:
             raise NotImplementedError(
-                "Encoder self-attention and "
-                "encoder/decoder cross-attention "
-                "are not implemented for "
-                "RocmAttentionImpl"
+                "Encoder self-attention is not implemented for RocmAttentionImpl"
             )
 
         self.fp8_dtype = current_platform.fp8_dtype()