AI 日刊 20250923
① 通义千问(Qwen)密集发布多款新模型。1)发布了首个原生端到端全模态 AI 模型 Qwen3-Omni,能在一个模型中统一处理文本、图像、音频和视频,官方称在多项音视频基准测试中达到 SOTA 水平。已开源 Qwen3-Omni-30B-A3B 系列模型。 消息来源 2)Qwen-Image-Edit-2509:全新的图像编辑模型,支持多图像编辑、保持人脸和产品一致性、编辑文字内容及样式,并内置 ControlNet 支持。 消息来源 3)Qwen3-TTS-Flash:发布新的文本转语音(TTS)模型,支持 17 种音色、10 种语言及 9 种以上中文方言,首包响应时间仅 97 毫秒。 消息来源 4)Qwen3-Next-80B-A3B-Instruct-FP8:发布了 FP8 精度的模型版本,以实现更快的推理速度,并与 Transformers、vLLM 和 SGLang 完全兼容。 消息来源
② DeepSeek 发布 DeepSeek-V3.1-Terminus 模型,该版本优化了语言一致性,减少了中英混用问题,并提升了代码和搜索智能体的性能。 消息来源
③ Augment Code Agent UI 升级。新的 Agent Tabs UI 将线程、任务、编辑等功能置于聊天头部的标签页中,提供了更大的垂直空间,提升了可读性和专注度。 消息来源
④ 在 Cursor 中,可以使用 @ 菜单添加 Git 分支等上下文信息,以获得更精准的代码生成。 消息来源