AI 日刊 20251016
① Anthropic 发布 Claude Haiku 4.5,主打性价比与速度。Anthropic 发布了其最新的小型模型 Claude Haiku 4.5。官方称其编码性能与 Sonnet 4 相当,但成本仅为三分之一,速度是 Sonnet 4.5 的 2-5 倍。该模型在 SWE-bench 上的得分从 40% (Haiku 3.5) 跃升至 72%,尤其在计算机操作和多智能体协作任务上表现优于 Sonnet 4。目前,Haiku 4.5 已在 Claude 官网、Claude Code、Cursor、OpenRouter、Warp、Windsurf、Augment Code、Cline 等多个平台和应用中上线。消息来源
② Google 发布文生视频模型 Veo 3.1。Google DeepMind 更新了其视频生成模型 Veo,推出 Veo 3.1 和 Veo 3.1 Fast。新版本在叙事理解、真实感纹理、以及画面真实性上均有提升。主要新功能包括:更丰富的原生音频(对话和音效)、支持最多 3 张参考图像进行视频生成、视频扩展(可达 1 分钟以上)、通过定义首尾帧生成过渡动画、视频修复(In-painting)等。Veo 3.1 和 Veo 3.1 Fast 现已在 Gemini API 和 Google Flow 中向美国用户提供预览。消息来源
③ OpenAI Sora 2 迎来重要更新。1) Pro 用户现在可以在网页端使用“故事板”功能,以实现对分镜和画面的精确控制。2) 视频生成时长提升,所有用户(包括免费用户)可在 App 和网页端生成最长 15 秒的视频,Pro 用户在网页端可生成长达 25 秒的视频。消息来源
④ Gemini CLI 支持伪终端(PTY)。Gemini CLI 增加了对伪终端(PTY)的支持,允许用户在 CLI 会话中直接运行复杂的交互式命令,如 vim
, top
, git rebase -i
,而无需退出。消息来源
⑤ Andrej Karpathy 发布了名为 nanochat
的新开源项目,这是一个极简的、从零开始的、全栈的 ChatGPT 克隆训练/推理管道。该项目代码约 8000 行,依赖极少,旨在提供一个完整的“强大基线”堆栈,让开发者可以在几个小时内用约 100 美元的成本训练出自己的小型 LLM。仓库地址
⑥ ChatGPT 即将放宽限制,恢复个性化并支持成人内容。Sam Altman 宣布,由于在心理健康问题上取得了进展,将在未来几周内推出新版 ChatGPT,允许用户设置更像 GPT-4o 的人性化个性。此外,作为“将成年人视为成年人”原则的一部分,计划在 12 月份为通过年龄验证的成年用户提供情色文学(erotica)等内容。消息来源
⑦ 微软推出了自家的图像生成模型 MAI-Image-1,并在 LMArena 排行榜上进入前九名。消息来源
⑧ OpenAI API 出现新的 GPT-5 搜索模型。据报道,OpenAI 平台 API 中出现了名为 gpt-5-search-api
的新模型。这些模型被指基于 GPT-5,价格便宜 60%,并支持域名过滤功能。消息来源
⑨ 一位开发者让 Cursor Agent 连续运行 24 小时,任务是“构建一个项目管理工具”。最终,Agent 成功构建了一个功能完整的应用程序,展示了 AI Agent 在软件开发领域的巨大潜力。消息来源