AI 日刊 20251016

Oct 16, 2025

① Anthropic 发布 Claude Haiku 4.5，主打性价比与速度。Anthropic 发布了其最新的小型模型 Claude Haiku 4.5。官方称其编码性能与 Sonnet 4 相当，但成本仅为三分之一，速度是 Sonnet 4.5 的 2-5 倍。该模型在 SWE-bench 上的得分从 40% (Haiku 3.5) 跃升至 72%，尤其在计算机操作和多智能体协作任务上表现优于 Sonnet 4。目前，Haiku 4.5 已在 Claude 官网、Claude Code、Cursor、OpenRouter、Warp、Windsurf、Augment Code、Cline 等多个平台和应用中上线。消息来源

② Google 发布文生视频模型 Veo 3.1。Google DeepMind 更新了其视频生成模型 Veo，推出 Veo 3.1 和 Veo 3.1 Fast。新版本在叙事理解、真实感纹理、以及画面真实性上均有提升。主要新功能包括：更丰富的原生音频（对话和音效）、支持最多 3 张参考图像进行视频生成、视频扩展（可达 1 分钟以上）、通过定义首尾帧生成过渡动画、视频修复（In-painting）等。Veo 3.1 和 Veo 3.1 Fast 现已在 Gemini API 和 Google Flow 中向美国用户提供预览。消息来源

③ OpenAI Sora 2 迎来重要更新。1) Pro 用户现在可以在网页端使用“故事板”功能，以实现对分镜和画面的精确控制。2) 视频生成时长提升，所有用户（包括免费用户）可在 App 和网页端生成最长 15 秒的视频，Pro 用户在网页端可生成长达 25 秒的视频。消息来源

④ Gemini CLI 支持伪终端（PTY）。Gemini CLI 增加了对伪终端（PTY）的支持，允许用户在 CLI 会话中直接运行复杂的交互式命令，如 vim, top, git rebase -i，而无需退出。消息来源

⑤ Andrej Karpathy 发布了名为 nanochat 的新开源项目，这是一个极简的、从零开始的、全栈的 ChatGPT 克隆训练/推理管道。该项目代码约 8000 行，依赖极少，旨在提供一个完整的“强大基线”堆栈，让开发者可以在几个小时内用约 100 美元的成本训练出自己的小型 LLM。仓库地址

⑥ ChatGPT 即将放宽限制，恢复个性化并支持成人内容。Sam Altman 宣布，由于在心理健康问题上取得了进展，将在未来几周内推出新版 ChatGPT，允许用户设置更像 GPT-4o 的人性化个性。此外，作为“将成年人视为成年人”原则的一部分，计划在 12 月份为通过年龄验证的成年用户提供情色文学（erotica）等内容。消息来源

⑦ 微软推出了自家的图像生成模型 MAI-Image-1，并在 LMArena 排行榜上进入前九名。消息来源

⑧ OpenAI API 出现新的 GPT-5 搜索模型。据报道，OpenAI 平台 API 中出现了名为 gpt-5-search-api 的新模型。这些模型被指基于 GPT-5，价格便宜 60%，并支持域名过滤功能。消息来源

⑨ 一位开发者让 Cursor Agent 连续运行 24 小时，任务是“构建一个项目管理工具”。最终，Agent 成功构建了一个功能完整的应用程序，展示了 AI Agent 在软件开发领域的巨大潜力。消息来源

ModelWatch

Discussion about this post

Ready for more?