AI 日刊 20250806
① OpenAI 发布 gpt-oss 系列开源模型。OpenAI 发布开源权重模型,推出了 gpt-oss-120b 和 gpt-oss-20b,采用 Apache 2.0 许可。这两个模型在推理、代码能力和安全性上都有显著提升,具备强大的工具调用和链式思考能力。1)gpt-oss-120b 性能与 o4-mini 相当,可在单个 H100 GPU 上运行;2)gpt-oss-20b 更轻量,可在高端笔记本电脑上本地运行。模型具备工具调用、网络浏览和代码执行等智能体能力,并可在 Hugging Face 下载。OpenAI 同时发布了在线体验 Playground 和演示视频。官方公告, Sam Altman 的声明, 技术细节, 游戏构建演示
② Anthropic 推出了 Claude Opus 4.1。这是对其旗舰模型的一次重要升级,特别增强了在 Agent 任务、真实世界编码和推理方面的能力。根据 SWE-Bench 的数据显示,其性能已超越 Gemini 2.5 Pro 和 OpenAI o3。该模型已在 Claude 官网、API 以及包括 Cursor, Warp, Perplexity, Cline, OpenRouter 在内的多个第三方平台上线。官方公告, 性能提升说明
③ Claude Code 已升级使用 Claude Opus 4.1 模型,Cursor、Warp、Perplexity、Cline 等多款 AI 开发工具已集成 Claude Opus 4.1。消息来源
④ OpenRouter 已上线 gpt-oss 和 Claude Opus 4.1 模型。消息来源
⑤ Unsloth 发布了 gpt-oss 模型的 GGUF 格式,120b 模型需 66GB 显存,20b 模型需 14GB 显存即可运行。消息来源
⑥ Google 发布了开创性的世界模型 Genie 3,它能够根据单个文本提示创建可交互、可游玩的虚拟环境。Genie 3 支持高达 720p 分辨率和 24fps 的帧率,并引入了“世界记忆”(World Memory)和“可提示事件”(Promptable Events)等新功能,允许用户在探索过程中通过文本动态改变世界,为 AI 游戏和仿真训练开辟了新的可能性。官方公告, 详细介绍
⑦ 阿里通义千问发布了 Qwen3-Coder 和 Qwen3-2507 的 Flash 系列 API,均支持 1M Token 的上下文长度。同时,Qwen-Plus-Latest 模型也已支持 1M Token 上下文。官方公告
⑧ Perplexity 发布学习模式(Study mode)。该模式下,AI 助手将以更具互动性的形式引导用户完成学习过程。消息来源
⑨ JetBrains 宣布推出 AI 驱动的“Vibe Coding”平台 "Kineto",用于构建 Web 应用,目前已开放候补名单。 消息来源
⑩ YC 创始人 Paul Graham 认为,与其问哪些职业会被 AI 取代,不如思考 AI 擅长哪种工作方式。他指出,目前形式的 AI 尤其擅长处理“事务性工作”(scutwork),因此人们应避免从事这类工作。 消息来源
⑪ Claude Code 实用技巧。1)使用 UserPromptSubmit
钩子可以阻止 Claude Code 回复“You're absolutely right!”这类客套话。链接 2)新版本会自动从上下文中移除旧的工具调用,以延长有效上下文窗口。链接 3)可以通过执行 /model claude-opus-4-1-20250805
手动切换到最新的 Opus 4.1 模型。链接