AI 日刊 20251007
① OpenAI DevDay 2025 重点汇总。1)ChatGPT 内置应用 (Apps in ChatGPT):推出 Apps SDK 预览版,基于模型上下文协议 (MCP),允许开发者创建能在 ChatGPT 中直接交互的应用,相关链接 2)智能体开发工具集 (AgentKit):Agent Builder: 提供可视化界面,通过拖拽方式快速创建复杂的多智能体工作流。ChatKit: 用于开发个性化聊天式智能体的工具包。Evals 升级: 支持更丰富的数据集、自动化提示词优化和第三方模型评估。相关链接 3)新模型与 API 更新:GPT-5-Pro: 正式上线,专为金融、法律等高精度场景设计,输出价格为 $120/百万 Token。Sora-2 和 Sora-2-Pro: 视频生成 API 进入预览阶段,支持丰富音效和视频同步,Sora-2 Pro 最高分辨率价格为 $0.50/秒。GPT-Realtime-Mini 和 GPT-Audio-Mini: 实时对话和音频模型,成本降低约 70%。相关链接 4)Codex 正式商用:AI 编码工具 Codex 进入全面商用阶段,推出全新 Slack 集成和企业级管理工具。相关链接
② Google DeepMind 发布了一款名为 CodeMender 的新型 AI 智能体,它使用 Gemini Deep Think 来自动发现和修补软件中的关键安全漏洞。目前,它已成功向多个开源项目提交了 72 个安全修复补丁,并能处理高达 450 万行代码的大型代码库。消息来源
③ OpenAI 正式发布 Sora 2 及配套社交应用 Sora App。1)Sora 2 模型在物理世界理解、角色一致性、长时间视频生成等方面有显著提升。2)Sora App 是一个全新的 iOS 应用,定位为“创造力的 ChatGPT 时刻”。用户可以在应用内创作、混剪(Remix)视频,并通过“客串(Cameos)”功能将自己或朋友融入 AI 生成的场景中。3)Sora App 目前已在美国和加拿大通过邀请制在 iOS 平台推出。消息来源
④ 智谱 AI 发布新一代旗舰模型 GLM-4.6。新模型在代码、长文本处理(200K 上下文)、推理、搜索和智能体应用方面有显著提升。官方称其代码能力较 GLM-4.5 提升 27%,对标 Claude Sonnet 4。目前已在智谱 MaaS 平台、Hugging Face、ModelScope 上线,并作为 Coding Plan 用户的默认模型。消息来源
⑤ Google 发布了 Jules SWE Agent 的命令行工具 (CLI),开发者可以通过终端直接在本地文件夹中启动和管理 Jules 任务。 消息来源
⑥ 如何高效利用 AI 编程工具。一篇详尽的帖子,从业内人士的视角分享了最大化利用 AI 编程工具的经验,涵盖了提示(Prompting)、上下文(Context)、自我验证(Self verification)、模型选择、后台代理(Background Agents)和并行代理(Parallel Agents)等关键主题。消息来源
⑦ FactoryAI 的 Droid 为新用户提供 4000 万免费 tokens。消息来源 链接地址
⑧ Google 发布了 Jules SWE Agent 的命令行工具 (CLI),开发者可以通过终端直接在本地文件夹中启动和管理 Jules 任务,安装方法:npm install -g @google/jules。消息来源
⑨ 一位创作者分享了其工作流,结合使用 nano banana, Midjourney, Kling 2.5, Suno, Elevenlabs 等多种 AI 工具,在 8 天内创作出一部高质量短片。消息来源
⑩ Codex CLI 0.44.0 版本发布。新版本带来了全新的 TUI 界面,支持在自定义提示词中使用命名参数,并增加了在命令行管理云端任务的功能。消息来源
⑪ Google 正在为其 Jules Agent 开发一种「完全自主模式」,该模式可以完全自主地生成和执行计划,包括分支发布、PR 创建和合并,无需人工干预。消息来源
⑫ Opera 发布 agentic AI 浏览器 Neon。Neon 是一个集成了 AI 功能的浏览器,支持四种模式:传统浏览、AI 聊天、agentic 任务执行和应用/图像生成。消息来源
⑬ 一位谷歌高级工程师发布了一份长达 424 页的文档,系统性地介绍了 AI 系统的前沿技术,每个章节都有代码支持,内容涵盖提示链、路由、记忆、多智能体协调、护栏、推理和规划等,被认为是一份免费的 AI 系统课程。消息来源
⑭ 有人分享了使用 Codex 修复 Bug 的几点经验:1. 通过截图或日志复现问题;2. 让其打印关键路径日志并提供反馈;3. 告知相关代码文件以缩小范围;4. 让其使用测试工具收集反馈;5. 提供可正常运行的参考代码。消息来源
⑮ ElevenLabs 发布了 Workflows,这是一个用于构建 AI Agent 的全新可视化编辑器。它允许用户通过路由到专门的子代理 (Subagents) 来处理更复杂的业务逻辑,支持多智能体协作和必要时的人工介入。消息来源