AI 日刊 20250827

Aug 27, 2025

① Google 发布其最先进的图像生成与编辑模型 Gemini 2.5 Flash Image (代号 nano-banana)。该模型在角色一致性、创意编辑和结合 Gemini 的世界知识方面表现出色。目前已在 Gemini 应用、Google AI Studio 和 Gemini API 中免费向所有人推出。核心功能包括：1）角色一致性：可在多张图片中保持角色的外观、服装和姿势不变。2）创意编辑：支持通过自然语言进行特定编辑，如“更换背景”、“修复旧照片”等。3）多图融合：可将最多三张不同图像的元素融合成一个新作品。4）风格迁移：能将一张图片的风格、纹理或图案应用到另一张图片上。API 定价为每张图片约 0.039 美元。相关链接：消息来源 1, 消息来源 2, 功能演示

② Anthropic 推出 Claude for Chrome 浏览器智能体。该插件允许用户在浏览器中直接使用 Claude 的 AI 能力，目前处于研究预览阶段，首批向 1000 名 Claude Max 订阅用户开放。相关链接：消息来源, 详情

③ Claude Code 的 GitHub 集成功能现已正式可用 (GA)。新版本提供了简化的 API、即用型模板，并支持更多 GitHub 事件（如新建 issue、CI 失败等）来触发 Claude。相关链接：消息来源

④ Cursor 1.5 版本发布，主要更新包括：1) 优化了 Agent 终端的用户体验。2) 新增原生操作系统通知。3) 支持 MCP elicitation，允许 Agent 请求结构化的用户输入。4) 改进了对 Jupyter Notebook 的支持。相关链接：消息来源

⑤ OpenRouter 平台新增多款 AI 模型：1）上线首个图像模型 Gemini 2.5 Image Preview，并提供为期一周的免费试用。消息来源 2）上线 xAI 的 Grok Code Fast 模型，拥有 256k 上下文窗口。消息来源 3）上线 NousResearch 的 Hermes 4 模型。消息来源

⑥ xAI 的 Grok Code Fast 1 模型上线。现已在 Windsurf 和 OpenRouter 等平台上线，并提供限时免费使用。该模型拥有 256k 的上下文窗口，生成速度快，是目前最快的编码模型之一。Windsurf 公告, OpenRouter 公告

⑦ 阿里巴巴发布了一款名为 Wan 2.2-S2V 的模型，可以将语音音频转换为电影级别的视频。该模型由音频驱动，支持姿态控制，能够实现较好的口型同步和情感表达。相关链接：消息来源

⑧ Anthropic 对 74,000 次真实对话进行了隐私保护分析，揭示了教师和教授在工作中使用 AI 的趋势和方式。分析报告

ModelWatch

Discussion about this post

Ready for more?