AI 日刊 20251104
① OpenAI 与 AWS 达成 380 亿美元合作,以获取更多 Nvidia GPU。OpenAI CEO Sam Altman 宣布与亚马逊 AWS 合作,以获取更多 NVIDIA 芯片来支持 OpenAI 的持续扩展。这项价值 380 亿美元的多年战略合作伙伴关系,将使 OpenAI 能够立即并持续增加对 AWS 基础设施的使用。消息来源
② 阿里巴巴发布 Qwen3-Max-Thinking 模型预览版。阿里通义千问发布了尚在训练中的 Qwen3-Max-Thinking 模型的早期预览版。即使在当前阶段,结合工具使用和扩展测试时计算,该模型在 AIME 2025 和 HMMT 等挑战性推理基准上已实现 100% 的准确率。用户可在 Qwen Chat 和阿里云 API 中试用。消息来源
③ 百度网盘发布了官方 MCP,允许用户通过自然语言指令在 Cursor 等工具中实现文件的上传、下载、搜索和分享,可用于自动化工作流。消息来源
④ 利用 Gemini 和个人风格(Gem)快速生成文章。一个简单的文章生成流程:首先,将自己或喜欢的文章风格提炼并设置为 Gemini 的“Gem”;然后,将 YouTube 视频链接直接丢给 Gemini,即可生成带有该风格的文章,甚至可以提取视频时间戳。消息来源
⑤ Gemini Docs MCP Server:本地化的 Gemini API 文档搜索工具。一个本地 STDIO 服务器,用于搜索和检索 Google Gemini API 文档。它通过本地 SQLite 数据库实现全文搜索,帮助开发者在使用 Cursor、Gemini CLI 等工具时,快速获取最新的 SDK 和模型信息。消息来源
⑥ AI 视频工具 Wan 2.2 Animate 可一键替换影片演员。新发布的视频工具 Wan 2.2 Animate with Nano Banana 展示了其强大的能力,可以一键替换任意影片中的演员,显示出 AI 在视频制作领域的快速进步。消息来源
⑦ MiniMax 的 M2 模型支持 Interleaved Thinking,这意味着在多轮对话中交替使用显式推理和工具使用,同时在前一轮推理的基础上继续推理。这种过程显著增强了规划、自我纠正和长期工作流程的可靠性。社区反馈表明,M2 在多轮对话中经常出现推理状态丢失的问题,原因是 OpenAI Chat Completion API 不支持在后续请求中传递推理内容。虽然 Anthropic API 原生支持这个功能,但社区对其他模型的支持较少,许多应用程序在 Anthropic API 实现中忽略了传递前一轮的推理状态。这个问题导致了新模型对 Interleaved Thinking 的支持不足。为了完全解锁 M2 的能力,保持推理过程在多轮对话中的连续性是至关重要的。消息来源


