AI 日刊 20251107
① Kimi 发布并开源新模型 K2-Thinking,多平台已集成。月之暗面 (Moonshot AI) 发布了新模型 kimi-k2-thinking 及其 turbo 版本,该模型在 HLE (44.9%) 和 IMO (76.8%) 等基准测试中取得了 SOTA (State-of-the-Art) 成绩。新模型现已在 Kimi Chat 和 API 中可用,并已上线 OpenRouter、Cline 等多个第三方平台。消息来源 1 消息来源 2 消息来源 3 消息来源 5
② Google 在 Gemini API 中内置了一个全托管的 RAG 系统。开发者可将私有数据(如 PDF, DOCX, TXT, JSON 等)轻松接入 Gemini,以提供更准确、可验证的响应,并自动包含来源引用。该服务简化了 RAG 流程,索引费用为每百万 token 0.15 美元,查询时的存储和嵌入生成免费。消息来源
③ OpenRouter 平台上架了一款名为 “Polaris Alpha” 的神秘新模型。该模型是一个通用模型,具有 256k 的上下文窗口,在编码、工具调用和指令遵循方面表现出色。有用户测试发现,该模型自称是 “openai o3-mini”。消息来源
④ Gemini API 支持更复杂的结构化输出。Gemini API 中新的 response_json_schema 参数现在支持深度嵌套的 Pydantic Schema,能够处理包含联合(Union)、可选(Optional)和递归结构的复杂数据,从而实现更强大的结构化输出能力。消息来源 文章地址
⑤ 让 Claude Code 具备浏览器控制能力。通过使用 browserbase 插件,可以使 Claude Code 能够实际操作用户的浏览器(携带 cookies),从而通过自然语言执行网页上的具体动作,将其变为一个通用 Agent。消息来源
⑥ SmartResume:智能简历解析系统。阿里发布了一款智能简历解析系统,能将 PDF、图片、Office 文档等格式的简历快速转换为结构化数据。该系统融合了 OCR、版面检测(YOLOv10)和 LLM(微调版 Qwen3-0.6B),可本地部署。消息来源




