阿里巴巴再上大分,该公司正式发布新一代推理模型QwQ-32B,该模型以320亿参数的轻量级架构,在多项核心指标上超越6710亿参数的行业标杆DeepSeek-R1,引发资本市场对阿里AI生态价值的重估。
截至发稿,阿里港股涨7.08%,报收139.1港元,而隔夜美股收盘涨8.61%,报收141.03美元。
QwQ-32B的突破性在于其开创性地将强化学习(RL)引入中小规模模型训练体系,构建起三大核心技术壁垒:
真实验证式RL框架:摒弃传统奖励模型机制,通过数学答案验证器和代码执行服务器构建动态反馈系统。以代码生成为例,系统自动运行测试用例验证代码有效性,让模型在真实场景中实现了编码-测试-优化的闭环进化。两阶段能力跃迁:基于预训练模型检查点启动,第一阶段聚焦数学推导与代码生成专项突破,第二阶段通过多任务微调实现通用能力扩展。测试数据显示,模型在GSM8K数学基准测试中准确率达到83.7%,较传统训Kaiyun平台 开云体育官方入口练方式提升19个百分点。动态推理代理系统:首创环境感知型推理机制,可自主调用计算器、API接口等工具链。在解决复杂数学问题时,模型能动态分解问题、检索公式库并交叉验证结果,形成类似人类的推演逻辑。
阿里同时宣布以Apache 2.0协议向全球开源QwQ-32B,构建技术-场景双轮驱动模式:
企业级部署优势:支持本地私有化部署,满足金融、医疗等行业数据安全需求。实测显示,模型在国产昇腾910B芯片上推理速度达到156token/秒,较同参数规模模型提升2.3倍。
该成果恰逢阿里宣布未来三年投入3800亿元加码云与AI基建,券商普遍认为这印证了三大战略路径:
算力网络全球化:依托全球29个地域的87个可用区,构建弹性算力供给网络。IDC数据显示,阿里云AI相关收入连续6季度保持三位数增长,2023年Q4算力租赁业务同比增长217%。开源生态规模化:通义千问系列衍生模型在Hugging Face平台下载量突破120万次,形成涵盖7B-72B参数的完整工具链。开源中国研究院指出,QwQ的RL框架为学界提供了中小模型训练新范式。场景渗透多元化:B端:钉钉智能助手已服务170万企业用户,知识库检索效率提升300%;C端:夸克APP转型AI生活管家,00后用户占比突破53%。
国泰君安测算显示,QwQ技术路径若得到普及,企业AI部署成本可降低70%-80%。中信建投王雪提醒道,当前需警惕技术路线切换风险,部分依赖堆叠参数的标的面临估值重构。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
阿里32B新模型比肩满血DeepSeek-R1!苹果Mac本地可跑,网友已玩疯
央行行长潘功胜:房贷利率下调,每年可让超5000万户家庭省下1500亿元
今日!东契奇+詹姆斯剑指8连胜,NBA湖人VS尼克斯,CCTV5无直播
最新!上海开云网址 kaiyun官方入口知名女主持人作为全国人大代表赴京参会,直呼“这件事很迫切!”
“再生材料” 首入政府工作报告 已组建百亿央企集团 25年循环经济产业产值将达5万亿
北控加时险胜浙江:余嘉豪25+24 里勒46+8+8约克48+10+11+10三分
15分大逆转!深圳男篮险胜江苏,贺希宁30+9周鹏19+4,威姆斯全能
FreeBSD继续开发面向802.11n/802.11ac Wi-Fi以及其他笔记本电脑的改进功能