diff --git a/2025-W48-LLM.md b/2025-W48-LLM.md index 01ff07c..73eee71 100644 --- a/2025-W48-LLM.md +++ b/2025-W48-LLM.md @@ -2,7 +2,8 @@ ## VLLM v0.11.1 -[Github的发行版说明](https://github.com/vllm-project/vllm/releases/tag/v0.11.1) +- [v0.11.1发行版说明](https://github.com/vllm-project/vllm/releases/tag/v0.11.1) +- 最新版本(4个bug修复)[v0.11.2](https://github.com/vllm-project/vllm/releases/tag/v0.11.2) ### 核心特性 @@ -20,8 +21,6 @@ Qwen3-VL 多模态推理、DeepSeek 系列模型 MoE/MLA 内核与权重加载 - 使用 vLLM 类型替代 OpenAI 类型进行流式响应,提升类型一致性与兼容性 - 修复 DP/EP 模式下使用 Marlin 内核运行 gpt-oss 的支持问题 -> 💡最新版本 [v0.11.2](https://github.com/vllm-project/vllm/releases/tag/v0.11.2) - ## Spring AI 1.1.0 版本解读