AI 日刊 20250827
① Google 发布其最先进的图像生成与编辑模型 Gemini 2.5 Flash Image (代号 nano-banana)。该模型在角色一致性、创意编辑和结合 Gemini 的世界知识方面表现出色。目前已在 Gemini 应用、Google AI Studio 和 Gemini API 中免费向所有人推出。核心功能包括:1)角色一致性:可在多张图片中保持角色的外观、服装和姿势不变。2)创意编辑:支持通过自然语言进行特定编辑,如“更换背景”、“修复旧照片”等。3)多图融合:可将最多三张不同图像的元素融合成一个新作品。4)风格迁移:能将一张图片的风格、纹理或图案应用到另一张图片上。API 定价为每张图片约 0.039 美元。相关链接:消息来源 1, 消息来源 2, 功能演示
② Anthropic 推出 Claude for Chrome 浏览器智能体。该插件允许用户在浏览器中直接使用 Claude 的 AI 能力,目前处于研究预览阶段,首批向 1000 名 Claude Max 订阅用户开放。相关链接:消息来源, 详情
③ Claude Code 的 GitHub 集成功能现已正式可用 (GA)。新版本提供了简化的 API、即用型模板,并支持更多 GitHub 事件(如新建 issue、CI 失败等)来触发 Claude。相关链接:消息来源
④ Cursor 1.5 版本发布,主要更新包括:1) 优化了 Agent 终端的用户体验。2) 新增原生操作系统通知。3) 支持 MCP elicitation,允许 Agent 请求结构化的用户输入。4) 改进了对 Jupyter Notebook 的支持。相关链接:消息来源
⑤ OpenRouter 平台新增多款 AI 模型:1)上线首个图像模型 Gemini 2.5 Image Preview,并提供为期一周的免费试用。 消息来源 2)上线 xAI 的 Grok Code Fast 模型,拥有 256k 上下文窗口。 消息来源 3)上线 NousResearch 的 Hermes 4 模型。 消息来源
⑥ xAI 的 Grok Code Fast 1 模型上线。现已在 Windsurf 和 OpenRouter 等平台上线,并提供限时免费使用。该模型拥有 256k 的上下文窗口,生成速度快,是目前最快的编码模型之一。Windsurf 公告, OpenRouter 公告
⑦ 阿里巴巴发布了一款名为 Wan 2.2-S2V 的模型,可以将语音音频转换为电影级别的视频。该模型由音频驱动,支持姿态控制,能够实现较好的口型同步和情感表达。相关链接:消息来源
⑧ Anthropic 对 74,000 次真实对话进行了隐私保护分析,揭示了教师和教授在工作中使用 AI 的趋势和方式。分析报告