① Claude Sonnet 4.5 正式发布。1) 宣称其为目前全球最强的编程模型,在软件工程基准测试 SWE-bench Verified 中得分达到 82%,2) 模型在构建复杂的 AI 智能体(Agent)方面有显著提升,能够长时间自主运行(官方称超过 30 小时),并在计算机使用、金融分析及科学研究等领域表现卓越。3) 新增了上下文感知能力,模型可以追踪自身的 Token 使用情况。4) 目前 Sonnet 4.5 已成为 Claude 网站、iOS/Android 应用及 API 的默认模型,定价与 Sonnet 4 保持一致。5)多平台已集成 Claude Sonnet 4.5,包括 Cursor, OpenRouter, Perplexity, Warp, Windsurf, Augment Code, v0, Cline 等。
AI 日刊 20250930
① Claude Sonnet 4.5 正式发布。1) 宣称其为目前全球最强的编程模型,在软件工程基准测试 SWE-bench Verified 中得分达到 82%,2) 模型在构建复杂的 AI 智能体(Agent)方面有显著提升,能够长时间自主运行(官方称超过 30 小时),并在计算机使用、金融分析及科学研究等领域表现卓越。3) 新增了上下文感知能力,模型可以追踪自身的 Token 使用情况。4) 目前 Sonnet 4.5 已成为 Claude 网站、iOS/Android 应用及 API 的默认模型,定价与 Sonnet 4 保持一致。5)多平台已集成 Claude Sonnet 4.5,包括 Cursor, OpenRouter, Perplexity, Warp, Windsurf, Augment Code, v0, Cline 等。