AI 日刊 20251022
① OpenAI 发布全新 AI 浏览器 —— ChatGPT Atlas。1)OpenAI 正式发布了其首款以 AI 为核心的浏览器 Atlas,目前已在 macOS 平台上线。它将 ChatGPT 的能力深度集成到浏览体验中,用户可以直接在侧边栏就当前网页内容进行提问、总结和获取建议。2)Atlas 具备记忆功能,可以记住用户浏览过的关键内容。同时,其核心亮点是“智能体模式”(Agent Mode),能自动帮助用户在网页上执行多步任务,如研究分析、规划活动、填写表单甚至下单购物。3)该浏览器目前向 Free, Plus, Pro, Go 和 Business 用户开放,Windows, iOS 和 Android 版本正在开发中。消息来源
② Claude 桌面版更新,新版本支持截屏、点击窗口分享上下文,以及通过按 Caps Lock 键与 Claude 进行语音对话。消息来源
③ 阿里通义千问升级 Deep Research 功能。现在,它不仅能生成研究报告,还能一键生成配套的网页和播客(Podcast),由 Qwen3-Coder、Qwen-Image 和 Qwen3-TTS 提供支持,让研究成果的呈现方式更加多样化。消息来源
④ OpenRouter 推出专注于图像理解的新模型 Andromeda Alpha。这是一个经过特殊训练的小型模型,非常擅长图像理解。消息来源
⑤ CLI 编码小技巧。在使用命令行 Agent 时,由于换行符的存在,直接复制粘贴输出内容可能很困难。可以让 Agent 将输出通过管道(pipe)直接发送到剪贴板(如 pipe it to pbcopy
),从而获得格式完美的文本。消息来源
⑥ Andrej Karpathy 发布了一个长达 3.5 小时的免费课程,深入讲解了 ChatGPT 的工作原理。消息来源
⑦ OpenAI 发表了一篇关于如何编写优秀技术文档的指南,核心观点是“写文档是一种同理心的体现”。指南强调了文档应易于“扫读”、语言简单、提供通俗易懂的帮助,并优先解决常见问题。原文链接
⑧ Soniox 发布了 v3 语音 AI 基础模型,在 60 多种语言的实时转录、语言检测切换、翻译以及处理复杂音频环境(如口音、噪音、多人重叠对话)方面实现了突破性的准确度提升。送 $200 API credits。消息来源
⑨ Skill_Seekers 是一个自动化工具,可以将任何文档网站抓取、组织并转换为 Claude AI 技能文件,支持大规模文档(10K-40K+ 页面)的智能处理,并提供 MCP 服务器集成和命令行两种使用方式。仓库地址