再度霸屏,它从周一到周五连续开源了多项infra技术细节——这些软件大体上只有开发者们能看得懂,不过紧接着它在周六公布的高达545%的成本利润率,所有人都看懂了。
DeepSeek在其官方知乎账号上发布的《DeepSeek-V3/R1推理系统概览》一文中称,如果所有tokens全部按照R1模型的定价计算,那么理论上DeepSeek一天的总收入为56.2027万美元(约合410万元人民币),理论成本利润率(即理论收入÷成本)为545%。
545%是将收入与成本直接比较得出的数字,如果按照毛利率计算公式(即(收入-成本)÷成本)来算,DeepSeek的模型毛利率也高达近82%,比英伟达还高——刚刚过去的财季,英伟达的毛利率同比下降了3%,但仍有73%。
而且,DeepSeek 82%的毛利率还是基于它在API定价上的极低价格实现的。目前,使用DeepSeek R1模型的百万tokens输入和输出价格分别为0.55美元和2.19美元。差不多只有OpenAI O3模型的3%到5%。
当然,这种毛利率主要是靠提升GPU芯片的利用率实现的。公布毛利率之前,DeepSeek连续5天开源的一系列软件就是为了使其模型更好地适配英伟达的低端芯片、提升其计算效率而开发的。
「现在很多供应商还做不到这个水平(注:指实现82%的毛利率),主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert(专家)组成,导致瞄准其他主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。」硅基流动创始人袁进辉在DeepSeek知乎账号上回复称。
如果没有对芯片做足够好的适配,销售DeepSeek API的云服务商还可能亏钱。就在周末,潞晨科技创始人尤洋与硅基流动创始开云网址 kaiyun官方入口人袁进辉在社交媒体上吵了起来,因为潞晨科技此前曾对外声称,按照DeepSeek的API定价部署并销售模型,「如果每日输出1000亿tokens,基于DeepSeek的服务每月的机器成本是4.5亿元,亏损4亿元」。潞晨科技和硅基流动都是第三方AI云服务提供商(MaaS),为模型与芯片之间的适配提供软件工具,被称为infra(基础设施)层。
潞晨科技的经历表明,AI infra其实没那么好做,既需要深刻理解模型,也要深刻理解芯片,如果两边都没那么懂,结果就会相当糟糕。但反过来,如果AI infra供应商能将两端彻底搞懂并开源,离颠覆英伟达的CUDA生态进而颠覆英伟达就不远了——DeepSeek本周的一系列软件开源在做的其实就是这个事。
DeepSeek尚未取得最终胜利。同样在本周,OpenAI发布了最后一个预训练模型——GPT-4.5,它像DeepSeek V3一样是个专家模型(MoE),总参数量比GPT-4更多。虽然在基本能力上不一定有外界期待的大跨越,但基于一个比GPT-4更强的基础模型,OpenAI有望再用强化学习「后训练」出一个比o3更强大的推理模型。
继周一(2月24日)开源了一款用于英伟达Hopper GPU的高效型MLA解码加速器FlashMLA,周二(2月25日)开源了首个用于MoE模型训练和推理的EP通信库DeepEP后,周三至周五,DeepSeek又分别开源了通用矩阵运算代码DeepGEMM、DualPipe和EPLB等代码库,以及Fire-Flyer文件系统(3FS)。
DeepSeek相当于把它在V3和R1模型的论文中没有说明的训练细节都开源了。这些训练细节基本都是为适配英伟达不够先进的芯片所做的创新,相当于帮助其他开发者基于英伟达的低端芯片训练和部署高性能的模型,同时提升阿里云等云计算平台的芯片使用效率。另外,这种开源也可以为国产GPU厂商提升其芯片设计水平提供思路。
一系列软件开源之外,2月26日,DeepSeek又进一步降低了其API价格:它规定每日00:30至08:30为优惠时段,标准时段内,deepseek-chat(V3)的输入、输出价格分别为0.5元和8元,deepseek-reasoner(R1)的分别为1元和16元;优惠时段价格均调降至原价的50%(V3)和25%(R1)。此前因服务器紧张,DeepSeek曾于2月6日暂停充值,经过19天调整后于2月25日恢复充值。
2月27日,OpenAI正式推出GPT-4.5,并称其为「规模最大且性能最佳的聊天模型」。但OpenAI首席执行官Sam Altman特别指出,GPT-4.5不是推理模型,不会在基准测试中远超其他模型。作为OpenAI最后一个非推理模型,GPT-4.5是个在120T tokens数据上训练的MoE模型,拥有1万亿个激活参数。这意味着GPT-4.5的总参数量远大于1万亿,相较而言,GPT-4的总参数量为1.8万亿。OpenAI认为,像GPT-4.5这样「通用性更强、本质上更智能」的模型通过预训练变得更智能、知识更丰富,将为推理模型的开发奠定更坚实的基础。DeepSeek的推理模型R1,就是在其非推理模型V3的基础上,经过进一步的后训练——强化学习得到的。可以预期,基于比GPT-4更强的基础模型GPT-4.5,再加上强化学习后训练出的推理模型性能可能超过OpenAI的o3模型。o3模型是OpenAI基于GPT-4加上强化学习作为后训练后得到的推理模型,能力与DeepSeek的R1相当。
2月25日,特斯拉官方宣布已经开始为中国客户分批次更新软件,主要更新内容为推出包含城市道路自动辅助驾驶的FSD功能。基于该功能,车辆会根据导航路线引导车辆驶出匝道和交叉口,在路口识别交通信号灯并提示驾驶者做出直行、左转、右转、掉头等操作,根据速度和路线自动变道,在未设置导航路线时则会根据道路实际情况选择最优道路行驶。
但目前来看,这个FSD依然不是完全版。不少特斯拉车主在社交媒体上对国内版FSD对能力表示失望。斯拉也在更新中将中国版FSD称为「智能辅助驾驶功能」,而非「完全自动驾驶」。有观点认为,中国版FSD不如美国版FSD先进的主要原因,可能是中国道路和交通规则数据培训不足。
2月26日,亚马逊在2025 AI Alexa活动中发布了名为「Alexa+」的新版语音助手。这是Alexa自2014年发布以来首次重大更新。Alexa+由亚马逊Bedrock平台提供的大模型提供支持,包括了亚马逊自研的Nova模型,也包括了Anthropic的Claude大语言模型。用户仍需通过「Alexa」这个唤醒词来启动语音助手,Alexa+可以执行购买演唱会门票、预订晚餐以及定制食谱等日常功能,也具有视觉功能,能够拍照和分析图像,从手写文档中调用相关信息。不过,该服务目前还没有上线,预计未来几周内在美国推出,随后在未来几个月内开始在Echo Show 8、10、15和21等设备中推出。亚马逊将开云网址 kaiyun官方入口首次向用户收取Alexa的订阅费用,价格为19.99美元/月。亚马逊Prime用户可以免费使用,Prime会员的月费则为14.99美元。
2月25日,AI语音生成公司ElevenLabs宣布推出ElevenReader平台,允许作者在ElevenReader应用程序上发布AI朗读的有声书。ElevenLabs为作者和出版商提供每月11美元至330美元不等的付费计划。作者只需将书籍上传至平台并进行排版,几秒后即可预览生成的音频效果,并可从数千种人工智能语音中任选其一作为朗读声音。经平台审核后有声书即可发布。当听众收听某本有声书11分钟及以上时,ElevenLabs会向作者支付约1.10美元的「报酬和版税」。2月20日,ElevenLabs宣布与Spotify旗下的Findaway Voices达成合作,在ElevenLabs平台上由AI生成的有声书能够直接上线Spotify平台。
2月24日,阿里巴巴CEO吴泳铭宣布未来3年阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去10年总和。几天前,在阿里巴巴2025财年第三财季财报会议上,CEO吴泳铭表示,未来3年,阿里将围绕AI战略核心,在AI和云计算基础设施、AI基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。但当时没有公布具体数字。
2月24日,苹果宣布将在未来4年内在美国投资超过5000亿美元,并新增约2万个就业岗位,特朗普在社交平台上对库克与苹果表示了感谢。具体来说,制造方面,苹果将与合作伙伴于今年晚些时候在休斯敦开设一家新的先进制造工厂,生产支持Apple Intelligence的服务器。此外,苹果公司还将把其美国先进制造基金从50亿美元翻倍至100亿美元,这个kaiyun体育全站 Kaiyun登录网页扩张计划包括了向台积电位于亚利桑那州的工厂投资数十亿美元的承诺,这笔投资将被用于生产先进芯片。教育方面,苹果计划在密歇根州建立一所学院,并增加在美国的研发投资,为尖端领域提供支持。
当地时间2月26日,英伟达公布2025财年第四季度(截至2025年1月26日)和2025整个财年的业绩报告。2025财年,英伟达全年营收达1304.97亿美元,同比增长114%;净利润达728.80亿美元,同比增长145%。其中:数据中心业务全年营收达到创纪录的1152亿美元,同比增长142%;游戏和AI PC业务营收为114亿美元,同比增长9%;专业可视化业务营收为19亿美元,同比增长21%;汽车和机器人业务营收为17亿美元,同比增长55%。
尽管营收和利润均超出市场预期,但英伟达的营收增速在放缓。第四财季公司营收为393.31亿美元,环比增长12%,同比增长78%,告别了连续5个季度的3位数增长。英伟达的营收增速在2024财年第四财季曾达到265%的历史峰值,随后逐步放缓。此外,DeepSeek本周的开源软件库也正在冲击英伟达构建的CUDA软件生态。财报发布后,英伟达股价在次日跌超8%,总市值跌至2.94万亿美元。