AI 日刊 20251114
① OpenAI 发布 GPT-5.1,并更新 API。Sam Altman 宣布 GPT-5.1 现已通过 API 提供,价格与 GPT-5 相同。同时发布了专为长时编码任务设计的 gpt-5.1-codex 和 gpt-5.1-codex-mini。此外,提示词缓存(Prompt caching)时间延长至 24 小时。GPT-5.1 在 SWE-bench Verified 上的得分达到 76.3%,展现了显著的性能飞跃。各大应用已迅速集成 GPT-5.1,包括 Cursor, Perplexity, Warp, Windsurf, Cline, Augment Code 等。Sam Altman 的公告 API 和 Playground 中的具体模型 SWE-bench 评分
② Google DeepMind 推出虚拟 3D 世界 AI 代理 SIMA 2。由 Gemini 驱动的 SIMA 2 是 DeepMind 迄今最强大的虚拟 3D 世界 AI 代理。它不仅能遵循指令,还能在交互式环境中思考、理解和采取行动,支持文本、语音甚至图像进行交互。SIMA 2 能够在未经训练的游戏环境中展现出泛化能力,并在由世界模型 Genie 3 创建的 3D 世界中进行测试,展示了前所未有的适应性。消息来源
③ AI 编程助手 Cursor 完成 23 亿美元 D 轮融资。Cursor 宣布完成由 Accel、a16z 等知名机构投资的 23 亿美元 D 轮融资。该公司透露其年化收入已超过 10 亿美元,并声称其 AI Agent 产生的代码量已超过世界上任何其他同类产品。消息来源
④ Google 在 YouTube 上推出了一门名为《Vibe Coding in AI Studio》的课程,旨在教授用户如何更高效、更有创意地使用 AI Studio。消息来源
⑤ SWE-fficiency 挑战语言模型在真实工作负载下优化 Python 代码库的运行时,包含 498 个任务。评估结果显示,当前最先进的模型性能显著不足,平均仅达到专家加速的 0.15 倍,在定位优化机会、跨函数推理和保持正确性方面存在困难。官网地址
⑥ pi 是一个简洁且固执己见的编码代理,支持多模型(包括会话中切换)。提供一个简单而强大的CLI,用于无头编码任务,并具备其他编码代理常见的便利功能。仓库地址 消息来源
⑦ 一个基于 Claude Agents SDK 的 Deep Research 实现 Demo。仓库地址
⑧ AI Glossary 提供了一个交互式的方式来理解人工智能的核心概念。消息来源



