AI 日刊 20250919
① OpenAI 内部详细揭秘了 Codex(AI 编程智能体)的七大应用场景,包括理解代码、重构迁移、性能优化、提升测试覆盖率、加速开发、保持心流以及探索构思。 消息来源 原始 PDF
② Anthropic Claude 为 Python 和 Typescript SDK 推出了 Tool Helpers(测试版),以简化工具的创建和执行,支持自动输入验证和工具运行器。 消息来源 文档地址
③ 吴恩达(Andrew Ng)分享了在 AI 辅助编程时代,自动化“智能体测试”(Agentic testing)的重要性。他指出,尽管编程智能体能加速开发,但其不可靠性也带来了新的挑战,例如引入隐蔽的 bug 或安全漏洞,因此让 AI 编写测试来检查 AI 生成的代码至关重要。 消息来源
④ Mistral AI 发布 Magistral Small 1.2 和 Magistral Medium 1.2 模型更新。新版本加入了视觉编码器,支持图文多模态;在数学和编码基准测试上性能提升 15%;并优化了工具使用和响应的自然度。消息来源
⑤ Gemini in Chrome 功能现已向美国所有符合条件的 Mac 和 Windows 用户推出,后续将支持 iOS。用户可利用当前标签页的上下文进行内容总结、概念解释和问题回答。未来将开发更高级的智能体功能,以执行多步骤任务。 消息来源
⑥ ElevenLabs 推出一站式音视频制作工具 Studio 3.0,集成 AI 语音、配乐、音效、字幕生成和降噪等功能。 消息来源
⑦ tldraw 推出 tldraw SDK 4.0,新增 Agent 和 Workflow 支持,允许开发者构建基于画布的 AI 应用,并通过对话操作画布。 消息来源
⑧ Cursor 与 CodeRabbit 深度集成,提供了从 AI 编码、AI 审查到 AI 修复的完整工作流。 消息来源
⑨ GLM Coding Plan 进行更新,增加了更多编码工具支持,并为 Pro 和 Max 用户提供 Vision 及 Web 搜索功能。 消息来源
⑩ Vercel CEO 指出,随着 AI 大幅提升代码编写速度,代码审查(Reviewing)而非编码(Coding)正在成为新的开发瓶颈。 消息来源