① 通义千问(Qwen)密集发布多款新模型。1)发布了首个原生端到端全模态 AI 模型 Qwen3-Omni,能在一个模型中统一处理文本、图像、音频和视频,官方称在多项音视频基准测试中达到 SOTA 水平。已开源 Qwen3-Omni-30B-A3B 系列模型。 消息来源 2)Qwen-Image-Edit-2509:全新的图像编辑模型,支持多图像编辑、保持人脸和产品一致性、编辑文字内容及样式,并内置 ControlNet 支持。 消息来源 3)Qwen3-TTS-Flash:发布新的文本转语音(TTS)模型,支持 17 种音色、10 种语言及 9 种以上中文方言,首包响应时间仅 97 毫秒。
AI 日刊 20250923
① 通义千问(Qwen)密集发布多款新模型。1)发布了首个原生端到端全模态 AI 模型 Qwen3-Omni,能在一个模型中统一处理文本、图像、音频和视频,官方称在多项音视频基准测试中达到 SOTA 水平。已开源 Qwen3-Omni-30B-A3B 系列模型。 消息来源 2)Qwen-Image-Edit-2509:全新的图像编辑模型,支持多图像编辑、保持人脸和产品一致性、编辑文字内容及样式,并内置 ControlNet 支持。 消息来源 3)Qwen3-TTS-Flash:发布新的文本转语音(TTS)模型,支持 17 种音色、10 种语言及 9 种以上中文方言,首包响应时间仅 97 毫秒。