在科技迅猛发展的今天,阿里巴巴于4月29日凌晨正式开源了新一代的通义千问模型Qwen3(简称千问3),标志着国内AI领域的一次重要突破。千问3不仅是国内首个“混合推理模型”,更是将“快思考”与“慢思考”巧妙融合于同一模型,为用户更好的提供了全新的智能体验。
千问3的设计理念在于以最小的算力消耗实现最佳的推理效果。对于简单的问题,千问3能够在瞬间给出答案,而在面对复杂问题时,则能够最终靠多步骤的深度思考做多元化的分析。其创新的混合专家(MoE)架构,搭载了高达235B的参数量,但却仅需22B的激活,极大地降低了算力需求。
在国际评测中,千问3的表现堪称亮眼。在LiveCodeBench评测榜单中,它的性能超越了R1、OpenAI-o1等众多全球顶尖模型,成功登顶,成为全世界最强开源模型。尤其是在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,突破70分大关,甚至超越了Grok3;而在评估人类偏好对齐的ArenaHard测评中,以95.6分的成绩超越了OpenAI-o1及DeepSeek-R1。
除了卓越的性能,千问3的部署成本也得到了显著降低,用户只需4张H20即可部署其满血版,显存占用仅为同类高性能模型的三分之一。此外,千问3还提供了丰富的模型版本,包括2款30B和235B的MoE模型,以及多款密集模型,确保用户都能够根据需求灵活选择。
千问3的语言支持能力也不可以小看,首次支持119种语言,用户可在魔搭社区、HuggingFace等平台免费下载并商用,甚至通过阿里云百炼调用其API服务。个人用户还能够最终靠通义APP直接体验千问3的强大功能。
随着千问3的推出,阿里通义已开源200余个模型,全球下载量超3亿次,衍生模型数超过10万个,超越了美国的Llama,成为全世界第一的开源模型。这一成就不仅是阿里巴巴在AI领域的一次成功尝试,更是推动整个行业发展的重要里程碑。
从经济、社会到文化,千问3的推出无疑将引发广泛的讨论与应用。随着人工智能技术的慢慢的提升,我们期待看到它在更多领域的深度应用,助力各行各业的数字化转型。在这个充满变革的时代,千问3无疑是推动AI发展的新引擎,让我们拭目以待!返回搜狐,查看更加多