AI 日刊 20251203
① DeepSeek 发布了 DeepSeek-V3.2 和专为 Agent 打造的 DeepSeek-V3.2-Speciale 模型。V3.2 是其前序实验版的正式继承者,已在 App、网页和 API 上线。V3.2-Speciale 则进一步提升了推理能力,目前仅通过 API 提供。新模型首次实现了“思考融入工具使用”的双模式,在智能体评测中达到开源模型最高水平。消息来源
② Gemini (Nano Banana Pro) 实用技巧合集。1)信息图总结:在与 Gemini 进行多轮深度对话后,可以让它生成一张信息图来整理和提炼核心观点,有助于将文本模态的思考转化为视觉模态,加深理解。链接 2)风格迁移:可以提供几张具有统一风格的图片(如 Midjourney 生成的),让 Nano Banana Pro 参考该风格生成全新内容,例如地中海饮食示意图。链接 3)专业资产制作指南:有用户整理了《Nano Banana Pro 完全指南》,包含文本渲染、角色一致性、高级编辑、2D/3D 转换、分镜与概念艺术等10个专业技巧。链接
③ Anthropic 宣布已收购流行的 JavaScript/TypeScript 运行时 Bun 的开发团队。此次合作旨在加速 Claude Code 的发展。Bun 将继续保持开源和 MIT 许可。消息来源
④ Mistral AI 发布 Mistral 3 模型家族。Mistral 3 模型系列全部基于 Apache 2.0 许可证开源。该系列包括:Mistral Large 3 一个拥有 675B 总参数(激活 41B)的稀疏专家混合(MoE)模型,支持图像输入、多语言对话、256K 上下文窗口和原生函数调用。Ministral 3 系列包括 3B、8B、14B 三个尺寸的稠密模型,适用于端侧设备,并提供 base、instruct 和 reasoning 三种变体。消息来源
⑤ 关于代码模型和 Agent 的 300 页重磅论文。来自字节跳动、阿里巴巴、腾讯等机构的 50 位 AI 研究员联合发表了一篇长达 300 页的论文,分享了关于代码模型和 Agent 的重要经验。关键结论包括:1)小模型可胜过巨头。通过高质量的强化学习(RLVR),14B 模型在推理上能匹敌 OpenAI 的 o3。2)Python 学习难度高。Python 的动态类型特性使其比静态类型语言更难学习。3)MoE 模型更脆弱。MoE 模型虽然容量大,但在微调时比稠密模型更不稳定。4)代码模型默认不安全。模型会从公共代码库中学习不安全的编码模式。5)推理训练重结构轻内容。微调 CoT 时,模型学习的是分步推理的“认知模板”,而非事实本身。6)安全对齐会降低编码能力。安全对齐存在“对齐税”,可能会损害模型的通用编码能力。消息来源
⑥ Anthropic 内部研究:AI 如何改变工程师的工作。Anthropic 对 132 名工程师的调查、53 次深度访谈和 20 万次内部 Claude Code 会话的分析,探讨了 AI 对其内部工作流程的影响,并展望了其对更广泛劳动力市场的可能效应。消息来源
⑦ AI + 3D 打印:1 分钟设计扶手椅。用户展示了结合 Gemini 3 Pro、Nano Banana Pro 和 Veo 3.1,仅用 1 分钟就能设计出一款独特的扶手椅,并可通过 3D 打印变为现实。消息来源
⑧ 清理 AI 生成内容的实用工具。1)Trimmy:一款常驻菜单栏的小工具,可以自动移除从 Claude、Codex 等终端界面复制的文本中多余的换行、空格等,方便直接粘贴命令。消息来源 2)Cursor “Remove Slop” 命令:一个在 Cursor 编辑器内部常用的斜杠命令,用于清理 AI 生成代码中的冗余内容。消息来源
⑨ 推荐的 AI 开发工具栈。一位开发者分享了他心目中的“终极 AI 驱动开发栈”,为不同开发任务推荐了不同的模型,例如使用 Grok 4.1 进行搜索,用 Gemini 3 Pro 编写前端代码和测试,用 Claude Opus 4.5 进行调试等。消息来源
⑩ next-ai-draw-io:用自然语言生成复杂图表。这是一款将 AI 融入 draw.io 的实用工具,可以仅用一句话就生成架构图、流程图等复杂图表,或上传图片让 AI 自动复刻为可编辑的图表,对程序员等需要快速制图的专业人士非常有用。消息来源 仓库地址
⑪ AI Agent 自主注册域名和社交账号。开发者 Peter Steinberger 的 AI Agent “Clawd🦞” 不仅自主注册了域名,还给自己开通了 Twitter 账号,展示了 Agent 的自主执行能力。消息来源, 链接 2


