AI 日刊 20251119
① 谷歌发布其最强大的多模态大模型 Gemini 3。1)官方称 Gemini 3 是其最智能的模型,具备顶尖的推理能力、世界领先的多模态理解能力,并带来了全新的 Agentic 编程体验。2)技术细节:拥有 1M token 上下文窗口和 64k 输出,知识截止日期为 2025 年 1 月。相比 2.5 Pro,在代码能力、世界知识、工具使用及多模态理解方面均有显著提升。3)性能表现:在多个基准测试中表现出色,例如在 LMArena 排行榜上得分超过 1500,位列第一。在 Humanity’s Last Exam 等高难度测试中也展现了博士级的推理能力。4)获取方式:Gemini 3 Pro 已在 Google AI Studio、Gemini API、Gemini App、Google Cloud 和 Google 搜索等多个平台上线。官方公告 1, 官方公告 2, 技术细节
② 谷歌同步推出 Agentic 开发平台 Google Antigravity。这是一个以 Agent 为核心的 IDE,旨在帮助开发者与 AI Agent 协作,自主地规划、编码,并在编辑器、终端和浏览器中执行端到端的复杂软件开发任务。它利用 Gemini 3 Pro 进行问题推理,利用 Gemini 2.5 Computer Use 进行端到端执行,并集成了 Nano Banana 进行图像生成。官方介绍, 功能概览
③ Gemini 3 Deep Think 模型发布。这是一个比 Gemini 3 Pro 更强大的版本,会花费更多时间进行推理,专为解决极其复杂的问题而设计。在 HLE 和 ARC_AGI-2 等高难度基准测试中表现优于 Pro 版本。Deep Think 介绍, 基准测试表现
④ xAI 发布 Grok 4.1,Web 和移动端免费可用,主打情感智能。xAI 推出了其前沿模型 Grok 4.1,宣称在对话智能、情感理解和现实世界实用性方面设立了新标准。目前该模型已在 Web、𝕏 平台及移动应用上免费提供。Grok 4.1 在 LMArena 上排名第一,Elo 分数达到 1483。消息来源
⑤ Anthropic 与微软、英伟达达成重磅合作,Claude 登陆 Azure。Anthropic 宣布与 NVIDIA 和微软建立合作伙伴关系,NVIDIA 和微软将分别向 Anthropic 投资高达 100 亿美元和 50 亿美元。Claude 系列模型(Sonnet 4.5, Haiku 4.5, Opus 4.1)现已在 Microsoft Azure 上提供公共预览,使其成为唯一在三大主流云服务(AWS, GCP, Azure)上均可使用的前沿模型。消息来源
⑥ Google DeepMind 与 Google Research 联合开发了 WeatherNext 2,这是其迄今最先进的天气预测系统。它能够生成更准确、更高分辨率的全球天气预报,速度比以往快 8 倍,可在单个 TPU 上于一分钟内完成。消息来源
⑦ 处理无字幕视频的高效工作流。使用 Podwise 或 Get笔记 等工具获取 B 站或 YouTube 视频的转录文本,然后将文本导入 NotebookLM 等工具中,即可对视频内容进行任意提问和分析。消息来源
⑧ Andrej Karpathy 分享了他的阅读习惯:第一遍手动阅读,第二遍让 LLM 解释和总结,第三遍进行问答。他认为这能带来更深刻的理解,并可能成为 LLM 的顶级用例之一。这种与 AI 一起“拆书”的方法,能有效解决浅层阅读后“雁过无痕”的问题,将阅读效率和效果提升数倍。消息来源
⑨ 如何上手使用 Claude Skill。分享了一个三步上手法:首先通过插件市场安装 document-skill 和 example-skill,然后直接与 Claude 对话,让它引导你一步步创建自己的第一个 Skill。消息来源
⑩ Cloudflare 发生严重故障,导致包括 X、ChatGPT 在内的全球大量网站和 AI 服务中断。此次事件凸显了关键基础设施对 AI 生态系统的重要性。事件也引发了社区的创作灵感,一篇关于 Cloudflare 宕机背后是 AI 觉醒的科幻短文在网络上流传。消息来源
⑪ Manus AI 发布了一款名为 Browser Operator 的浏览器扩展,允许用户在任何浏览器中执行 Agentic 任务。消息来源



