AI 日刊 20250919

Sep 19, 2025

① OpenAI 内部详细揭秘了 Codex（AI 编程智能体）的七大应用场景，包括理解代码、重构迁移、性能优化、提升测试覆盖率、加速开发、保持心流以及探索构思。消息来源原始 PDF

② Anthropic Claude 为 Python 和 Typescript SDK 推出了 Tool Helpers（测试版），以简化工具的创建和执行，支持自动输入验证和工具运行器。消息来源文档地址

③ 吴恩达（Andrew Ng）分享了在 AI 辅助编程时代，自动化“智能体测试”（Agentic testing）的重要性。他指出，尽管编程智能体能加速开发，但其不可靠性也带来了新的挑战，例如引入隐蔽的 bug 或安全漏洞，因此让 AI 编写测试来检查 AI 生成的代码至关重要。消息来源

④ Mistral AI 发布 Magistral Small 1.2 和 Magistral Medium 1.2 模型更新。新版本加入了视觉编码器，支持图文多模态；在数学和编码基准测试上性能提升 15%；并优化了工具使用和响应的自然度。消息来源

⑤ Gemini in Chrome 功能现已向美国所有符合条件的 Mac 和 Windows 用户推出，后续将支持 iOS。用户可利用当前标签页的上下文进行内容总结、概念解释和问题回答。未来将开发更高级的智能体功能，以执行多步骤任务。消息来源

⑥ ElevenLabs 推出一站式音视频制作工具 Studio 3.0，集成 AI 语音、配乐、音效、字幕生成和降噪等功能。消息来源

⑦ tldraw 推出 tldraw SDK 4.0，新增 Agent 和 Workflow 支持，允许开发者构建基于画布的 AI 应用，并通过对话操作画布。消息来源

⑧ Cursor 与 CodeRabbit 深度集成，提供了从 AI 编码、AI 审查到 AI 修复的完整工作流。消息来源

⑨ GLM Coding Plan 进行更新，增加了更多编码工具支持，并为 Pro 和 Max 用户提供 Vision 及 Web 搜索功能。消息来源

⑩ Vercel CEO 指出，随着 AI 大幅提升代码编写速度，代码审查（Reviewing）而非编码（Coding）正在成为新的开发瓶颈。消息来源

ModelWatch