AI 日刊 20251119

Nov 19, 2025

① 谷歌发布其最强大的多模态大模型 Gemini 3。1）官方称 Gemini 3 是其最智能的模型，具备顶尖的推理能力、世界领先的多模态理解能力，并带来了全新的 Agentic 编程体验。2）技术细节：拥有 1M token 上下文窗口和 64k 输出，知识截止日期为 2025 年 1 月。相比 2.5 Pro，在代码能力、世界知识、工具使用及多模态理解方面均有显著提升。3）性能表现：在多个基准测试中表现出色，例如在 LMArena 排行榜上得分超过 1500，位列第一。在 Humanity’s Last Exam 等高难度测试中也展现了博士级的推理能力。4）获取方式：Gemini 3 Pro 已在 Google AI Studio、Gemini API、Gemini App、Google Cloud 和 Google 搜索等多个平台上线。官方公告 1, 官方公告 2, 技术细节

② 谷歌同步推出 Agentic 开发平台 Google Antigravity。这是一个以 Agent 为核心的 IDE，旨在帮助开发者与 AI Agent 协作，自主地规划、编码，并在编辑器、终端和浏览器中执行端到端的复杂软件开发任务。它利用 Gemini 3 Pro 进行问题推理，利用 Gemini 2.5 Computer Use 进行端到端执行，并集成了 Nano Banana 进行图像生成。官方介绍, 功能概览

③ Gemini 3 Deep Think 模型发布。这是一个比 Gemini 3 Pro 更强大的版本，会花费更多时间进行推理，专为解决极其复杂的问题而设计。在 HLE 和 ARC_AGI-2 等高难度基准测试中表现优于 Pro 版本。Deep Think 介绍, 基准测试表现

④ xAI 发布 Grok 4.1，Web 和移动端免费可用，主打情感智能。xAI 推出了其前沿模型 Grok 4.1，宣称在对话智能、情感理解和现实世界实用性方面设立了新标准。目前该模型已在 Web、𝕏 平台及移动应用上免费提供。Grok 4.1 在 LMArena 上排名第一，Elo 分数达到 1483。消息来源

⑤ Anthropic 与微软、英伟达达成重磅合作，Claude 登陆 Azure。Anthropic 宣布与 NVIDIA 和微软建立合作伙伴关系，NVIDIA 和微软将分别向 Anthropic 投资高达 100 亿美元和 50 亿美元。Claude 系列模型（Sonnet 4.5, Haiku 4.5, Opus 4.1）现已在 Microsoft Azure 上提供公共预览，使其成为唯一在三大主流云服务（AWS, GCP, Azure）上均可使用的前沿模型。消息来源

⑥ Google DeepMind 与 Google Research 联合开发了 WeatherNext 2，这是其迄今最先进的天气预测系统。它能够生成更准确、更高分辨率的全球天气预报，速度比以往快 8 倍，可在单个 TPU 上于一分钟内完成。消息来源

⑦ 处理无字幕视频的高效工作流。使用 Podwise 或 Get笔记等工具获取 B 站或 YouTube 视频的转录文本，然后将文本导入 NotebookLM 等工具中，即可对视频内容进行任意提问和分析。消息来源

⑧ Andrej Karpathy 分享了他的阅读习惯：第一遍手动阅读，第二遍让 LLM 解释和总结，第三遍进行问答。他认为这能带来更深刻的理解，并可能成为 LLM 的顶级用例之一。这种与 AI 一起“拆书”的方法，能有效解决浅层阅读后“雁过无痕”的问题，将阅读效率和效果提升数倍。消息来源

⑨ 如何上手使用 Claude Skill。分享了一个三步上手法：首先通过插件市场安装 document-skill 和 example-skill，然后直接与 Claude 对话，让它引导你一步步创建自己的第一个 Skill。消息来源

⑩ Cloudflare 发生严重故障，导致包括 X、ChatGPT 在内的全球大量网站和 AI 服务中断。此次事件凸显了关键基础设施对 AI 生态系统的重要性。事件也引发了社区的创作灵感，一篇关于 Cloudflare 宕机背后是 AI 觉醒的科幻短文在网络上流传。消息来源

⑪ Manus AI 发布了一款名为 Browser Operator 的浏览器扩展，允许用户在任何浏览器中执行 Agentic 任务。消息来源

ModelWatch

Discussion about this post

Ready for more?