AI 日刊 20251104

Nov 04, 2025

① OpenAI 与 AWS 达成 380 亿美元合作，以获取更多 Nvidia GPU。OpenAI CEO Sam Altman 宣布与亚马逊 AWS 合作，以获取更多 NVIDIA 芯片来支持 OpenAI 的持续扩展。这项价值 380 亿美元的多年战略合作伙伴关系，将使 OpenAI 能够立即并持续增加对 AWS 基础设施的使用。消息来源

② 阿里巴巴发布 Qwen3-Max-Thinking 模型预览版。阿里通义千问发布了尚在训练中的 Qwen3-Max-Thinking 模型的早期预览版。即使在当前阶段，结合工具使用和扩展测试时计算，该模型在 AIME 2025 和 HMMT 等挑战性推理基准上已实现 100% 的准确率。用户可在 Qwen Chat 和阿里云 API 中试用。消息来源

③ 百度网盘发布了官方 MCP，允许用户通过自然语言指令在 Cursor 等工具中实现文件的上传、下载、搜索和分享，可用于自动化工作流。消息来源

④ 利用 Gemini 和个人风格（Gem）快速生成文章。一个简单的文章生成流程：首先，将自己或喜欢的文章风格提炼并设置为 Gemini 的“Gem”；然后，将 YouTube 视频链接直接丢给 Gemini，即可生成带有该风格的文章，甚至可以提取视频时间戳。消息来源

⑤ Gemini Docs MCP Server：本地化的 Gemini API 文档搜索工具。一个本地 STDIO 服务器，用于搜索和检索 Google Gemini API 文档。它通过本地 SQLite 数据库实现全文搜索，帮助开发者在使用 Cursor、Gemini CLI 等工具时，快速获取最新的 SDK 和模型信息。消息来源

⑥ AI 视频工具 Wan 2.2 Animate 可一键替换影片演员。新发布的视频工具 Wan 2.2 Animate with Nano Banana 展示了其强大的能力，可以一键替换任意影片中的演员，显示出 AI 在视频制作领域的快速进步。消息来源

⑦ MiniMax 的 M2 模型支持 Interleaved Thinking，这意味着在多轮对话中交替使用显式推理和工具使用，同时在前一轮推理的基础上继续推理。这种过程显著增强了规划、自我纠正和长期工作流程的可靠性。社区反馈表明，M2 在多轮对话中经常出现推理状态丢失的问题，原因是 OpenAI Chat Completion API 不支持在后续请求中传递推理内容。虽然 Anthropic API 原生支持这个功能，但社区对其他模型的支持较少，许多应用程序在 Anthropic API 实现中忽略了传递前一轮的推理状态。这个问题导致了新模型对 Interleaved Thinking 的支持不足。为了完全解锁 M2 的能力，保持推理过程在多轮对话中的连续性是至关重要的。消息来源

ModelWatch

Discussion about this post

Ready for more?