Qwen3登顶全球最强，中国开源模型杀疯了

学知识 • 2025年5月1日下午9:36 • 今日资讯 • 阅读 886662

引言：凌晨四点的“技术核爆”

2025年的AI圈真刺激！这边Meta刚喊出“LlamaCon开发者大会”，那边阿里反手甩出一张王炸——Qwen3开源。结果呢？GitHub服务器直接挤爆，英伟达工程师蹲守抢代码的场面堪比双十一秒杀，联发科工程师甚至用手机测出了“勾股定理100种证明法”这种魔鬼题（手机：我谢谢你啊）。

这波操作有多炸？简单来说就是：参数量砍掉DeepSeek-R1的三分之二，性能却暴打OpenAI-o1，还自带“快慢双模式”——简单问题秒回，复杂问题能当奥数老师，甚至能用手机跑满血版模型！网友辣评：“这哪是AI啊，分明是《三体》里的智子成精了！”(✧∇✧)╯

Qwen3登顶全球最强开源模型

2025 年 4 月 29 日凌晨 5 点，阿里巴巴带着 Qwen3 横空出世，直接把整个 AI 圈炸了个底朝天！这个参数量仅为 DeepSeek-R1 三分之一的 “小家伙”，性能却全面超越 R1、OpenAI-o1 等全球顶尖模型，成功登顶全球最强开源模型的宝座！（此处应有掌声👏）

Qwen3 这次可是带着 “全家桶” 来的，包含 2 个 MoE 和 6 个密集模型，阿里云直接把两个 MoE 模型的权重和六个 Dense 模型全部开源了！从 Qwen3-32B 到 Qwen3-0.6B，覆盖了各种不同的应用场景，无论是企业级的复杂任务，还是个人用户的日常使用，都能找到最适合的模型。而且，这些模型都在 Apache 2.0 许可下开源，这意味着开发者和企业可以免费使用，简直不要太香！

说到性能，Qwen3 的表现那叫一个 “杀疯了”！在奥数水平的 AIME25 测评中，Qwen3 斩获 81.5 分，刷新了开源纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3 突破 70 分大关，表现甚至超过了 Grok3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3 以 95.6 分超越了 OpenAI-o1 和 DeepSeek-R1。这一系列的成绩，直接让Qwen3 成为了开源模型领域的 “扛把子”

更让人惊喜的是，Qwen3 的部署成本还大幅下降，仅需 4 张 H20 即可部署千问 3 满血版，显存占用仅为性能相近模型的三分之一。这对于开发者和企业来说，简直是天大的好消息，大大降低了使用成本。而且，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现却更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。这意味着，即使是资源有限的开发者，也能轻松使用到高性能的模型。

大模型趋势

Qwen3 的发布，不仅是性能上的突破，更是大模型发展趋势的一个重要转折点。现在，大模型厂商们都在集体转向 “混合推理模型” 和 “Agent”，而 Qwen3 在这两个方面都走在了前列。

混合推理模型

Qwen3 是国内首个 “混合推理模型”，它将 “快思考” 与 “慢思考” 集成进同一个模型。对简单需求，Qwen3 可以低算力 “秒回” 答案；对复杂问题，Qwen3 可以多步骤 “深度思考”，大大节省算力消耗。用户可以通过滑动 “思考预算” 的按钮，来控制思考的最大长度，从而匹配合适的推理质量和成本。

这种混合推理模型的设计，不仅提高了模型的效率，还让用户能够根据具体任务控制模型进行 “思考” 的程度。比如，在处理简单的问答时，用户可以选择非思考模式，快速得到答案；而在处理复杂的数据分析时，用户可以选择思考模式，让模型进行深入的推理。这种灵活性，使得 Qwen3 能够更好地满足不同场景下的需求。

Agent 能力

随着 AI 技术的发展，模型的 Agent 能力越来越受到重视。Qwen3 正在迈向以训练 Agent 为中心的阶段，当前 Qwen3 优化了 Agent 和代码能力，同时也加强了对 MCP 的支持。Qwen3 原生支持 MCP 协议，并具备强大的工具调用能力，结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架，将大大降低编码复杂性，实现高效的手机及电脑 Agent 操作等任务。

例如，Qwen3 可以思考并自主调用工具到 Github 数开源模型获得的 star，继续思考并调用绘图工具制作图片，并调用工具保存。这种能力，使得 Qwen3 能够更好地与实际应用场景结合，为开发者和企业提供更强大的支持。

开源模型新一轮竞赛

Qwen3 的发布，正式拉开了开源模型领域新一轮 “三国杀” 的序幕。在开源模型领域，Llama、Qwen 和 DeepSeek 是目前最有竞争力的玩家。虽然新一代模型能力的强弱，还要等待 Llama 和 DeepSeek 的发布，但 Qwen3 已经凭借其卓越的性能和开源生态，成为了当前最受关注的模型。

Qwen3 的 “秘密武器”

Qwen3 的开源生态建设得非常完善。阿里通义已开源 200 余个模型，全球下载量超 3 亿次，千问衍生模型数超 10 万个，已经超越 Llama 位居全球开源模型的第一。这意味着，开发者和企业可以基于 Qwen3 进行二次开发，构建自己的 AI 应用。

此外，Qwen3 还提供了丰富的工具链支持，与 KTransformers 等推理系统实现 Day-0 支持，开源 AMX 高性能算子库，降低本地部署门槛。开发者可以通过魔搭社区、HuggingFace 等平台下载模型并商用，或通过阿里云百炼调用 Qwen3 的 API 服务。这种完善的生态，使得 Qwen3 能够更好地满足开发者和企业的需求。

Qwen3 的 “独特优势”

Qwen3 与 DeepSeek、Llama、OpenAI 等竞争对手最大的不同，在于其对 ToB 服务生态的重视。阿里的 AI 战略里除了追求 AGI，也同样重视 AI 基础设施建设，以及更上层的与阿里的电商、钉钉、夸克等 AI 应用的结合。Qwen3 的多尺寸模型、混合推理能力和 Agent 能力，都能更好地满足企业级用户的需求。

例如，Qwen3 的 32B 模型适合企业大规模部署，而 4B 模型则是手机端的绝佳尺寸。这种差异化的策略，使得 Qwen3 在开源模型领域中脱颖而出。