AI 日刊 20251121
① Google 正式发布了基于 Gemini 3 的新一代图像生成和编辑模型 Nano Banana Pro (即 Gemini 3 Pro Image)。其主要特性包括:业界领先的文本渲染能力、利用搜索增强的世界知识库、支持高达 4K 分辨率、多语言支持、精确的角色一致性和工作室级别的创意控制。该模型已在 Gemini API、Google AI Studio、Vertex AI 及 Gemini App 中提供。相关链接
② Claude Agent SDK 支持结构化输出,现在可以在 Claude Agent SDK 中定义最终的输出模式 (schema),从而构建更可靠的 Agentic 工作流。相关链接
③ Qwen 发布新的多模态智能体 Jan-v2-VL。专为长序列任务设计,能够连续执行 49 个步骤而不会失败,远超其他模型。相关链接
④ Claude Code 命令行小技巧。在命令行中使用 & 符号,可以将一个会话直接发送到网页版或移动版的 Claude Code 中继续操作。相关链接
⑤ Nano Banana Pro 保持商品和角色的一致性。多位用户测试发现,Nano Banana Pro 在生成多张包含相同商品或角色的图片时,能保持极高的一致性,甚至能将多个不同风格的家具照片无缝融合到一个场景中。相关链接
⑥ Vercel AI SDK 推出的 Tools Registry 是一系列即用型工具的集合,开发者只需最少的设置就能为他们的 AI Agents 添加新功能。相关链接
⑦ cline-bench:真实世界 Agentic 编码任务的开源基准。这是一个开源的基准测试项目,它将来自开源仓库的真实且困难的编码任务转化为容器化的强化学习环境,旨在弥补现有基准与实际工程开发之间的差距。相关链接
⑧ ytb2bili:YouTube 视频到 B 站的自动化处理工具。这是一个开源工具,可自动从 YouTube 下载视频,利用 AI 生成字幕、翻译、撰写标题简介,并定时上传到 Bilibili,实现了内容搬运的全流程自动化。相关链接
⑨ 一篇关于如何有效利用大型语言模型(LLMs)进行编程的指南。相关链接
⑩ 使用 Nano Banana Pro 将长文转化为杂志风格图片。作者分享了一个效果出色的提示词,可以将文章内容通过 Nano Banana Pro 快速生成具有杂志排版风格的图片,且对中文支持良好。相关链接


