胡泳对DeepSeek的三个判断

  公司新闻     |      2025-02-28 14:07

  胡泳教授对DeepSeek的技术路线表示肯定,认为其在模型建构、减少算力需求和大面积应用等方面具有强大实力与潜力。

  2.然而,DeepSeek在数据稀少的领域仍面临挑战,如幻觉严重,可能将生手引入歧途。

  3.胡泳指出,DeepSeek的推理和思维链模型带来飞跃,具有可访问性优势,对科学研究具有颠覆性影响。

  4.其次,DeepSeek的创建方式减弱了硅谷的AI发展模式,对硅谷人工智能领头羊OpenAI构成严峻挑战。

  5.最后,DeepSeek将人工智能真正从象牙塔带到大众手中,有望加剧美中之间的技术竞争和战略对抗。

  DeepSeek的技术路线在模型建构、减少算力需求以及大面积应用等方面,都展现了强大的实力与潜力。然而,这条主流的技术路线仍充满挑战,比如在数据稀少的领域幻觉非常严重,能把生手引入歧途。本研讨会将探讨AGI的未来形态以及DeepSeek近期可以在哪些方面发力以更有效地协助科学家和人文学者探索非常困难的研究领域,比如直觉和意识。

  1月31日,智酷 407 期,邀请武汉大学计算机学院教授蔡恒进分享《DeepSeek的成就和AGI的未来》,中国人民大学哲学院教授刘晓力、Futurelabs未来实验室首席专家胡延平、北京大学新闻与传播学院教授胡泳、北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟点评,北京信息社会研究所所长王俊秀主持。

  因为时间已经超了,所以我就非常简要地讲一下我对DeepSeek的三个判断。一般来说,我们会把DeepSeek当做是中国的ChatGPT,或者说中国对OpenAI的一个回应。但其实它的影响要远大得多。下面我就简单谈三点。

  第一点,思维链模型带来的推理飞跃。我们在使用DeepSeek时,会觉得它的回答质量非常高,而且它的推理过程是展现在我们眼前的。当然,严格来讲要承认,这方面的开山鼻祖仍然是OpenAI。因为OpenAI 的o1其实就开启了这条道路。DeepSeek的R1一直在跟o1进行对比,这也意味着我们其实还是在国外那条创新路径上走,这是必须承认的。

  但是,R1很核心的一点优势在于它的可访问性。它不仅免费,而且开发者可以把它下载并整Kaiyun体育官方网站 开云登录网站合到自己的业务中,科学家可以用,个人也可以用,不用担心成本。刚才蔡恒进老师特别提到,这对科学研究有潜在的颠覆性影响。在Nature这样的期刊上,科学家们都在欢呼这种模式,他们成群结队地下载模型到自己的服务器上,进行各种研究。而从商业角度来讲,这显然会开启更多的模型构建过程。

  Anthropic的两个联合创始人这两天都对DeepSeek发表了看法,很有意思。创始人之一克拉克承认,现在任何强大的基础模型都可以通过DeepSeek变成一个 AI 推理器,也就是说全球的AI能力实现了一次不可逆的进步。而另一位创始人阿莫迪写了一篇Kaiyun体育官方网站 开云登录网站很长的文章,说这背后是范式改变——以前那种“扩展是唯一之路”的想法被打断了。通过强化学习来验证大规模语言模型的推理能力,这正是DeepSeek带来的巨大突破。某种意义上,这不仅在人工智能界引发震动,也在普通人当中掀起了使用热潮。原因之一是它的“界面”比较友善,就像2022年ChatGPT的聊天界面,让人工智能第一次触手可及一样,DeepSeek 可以视为它的一个“升级版”,但以推理为主导。

  第二点,为什么硅谷会震惊?因为DeepSeek的创建方式减弱了硅谷的AI发展模式。美国主导的这套方式是不断增加数据和计算能力,以扩展现有模型来达成更高性能。这样做不仅能耗巨大,而且会带来政经关系上的问题——硅谷公司越来越多地与美国政府形成某种“抱团”关系。特朗普上台后表现尤其明显,很多硅谷大佬争相表忠心,因为科技公司需要国家来融资建基础设施,政客则希望购买科技公司的“忠诚”。

  一个典型例子是今年1月份特朗普牵头软银、甲骨文、OpenAI搞了一个号称 5000亿美元的“新基建计划”,号称历史上最大的人工智能基础设施项目。没想到一月下旬DeepSeek出来了,狠狠打脸了这件事,因为DeepSeek说我们不需要那么多的数据中心和计算基础设施。特朗普也表态说,这个公司给出了更快、更低成本的AI方法,是好事,不用花那么多钱。所以,这对硅谷及背后的华尔街产生了实实在在的冲击。

  我们看股市对此的表现。对人工智能的投资到底有没有被过度炒作?在这波炒作中,最大赢家英伟达是不是处于泡沫状态?因为英伟达就像当年淘金热里卖铁锹和水桶的主要供应商,可DeepSeek让人怀疑:AI的军备竞赛是不是投入了过多无用的算力与资金?所以,这是一个中国公司对硅谷商业模式的有力挑战。技术创新是否一定要按照硅谷说的“需要庞大的资源,最少的监管”来走?DeepSeek做了些什么,居然让财力雄厚的OpenAI也难以跟进?从效率上说,至少是全面击败对方了。

  因此,DeepSeek对硅谷人工智能领头羊OpenAI也是一个严峻挑战:能不能改变自己的商业模式?OpenAI的商业模式是建立在一个高昂的定价和对大规模云计算及庞大数据的预设需求之上。DeepSeek用一种更精妙的优化方式削弱了这种高成本模式,表现出“扩展不是唯一之路”。它也意味着华尔街存在的 AI“霸主地位”幻想被打破,不再必然需要投入数十亿美元来加强基础设施。因而,商业上很多人开始认真评估AI 投资回报,把关注点转移到这种“精简化”道路上。从长期看,对英伟达的估值会不会产生更深远的影响还不好说。但至少,AI不再只依靠几家大玩家。通过 DeepSeek,AI 进一步实现“民主化”,这是它的一个了不起的贡献。

  最后一点就是国家战略层面。新冷战的氛围让很多人把DeepSeek问世比作“苏联发射第一颗人造卫星”——这是典型的冷战话语。当年苏联发射人造卫星,让美国紧急加大对太空探索和科学技术的投入,现在DeepSeek也可能让美国做出同样的紧急反应,加剧美中之间的技术竞争和战略对抗。

  美国政府和技术领域的领导者的冷战思维其实已相当根深蒂固。最典型的是 Anthropic联合创始人阿莫迪最近的长文,他提出的基本观点是:明年或后年,人工智能可能会走向两个截然不同的世界。若美国公司拥有所有芯片,而中国开云网址 kaiyun官方入口拿不到数百万块芯片,那就变成美国主导的“单极世界”,如果中国能拿到,那就变成美中对立的“两极世界”。这对美国国家安全的影响远比TikTok 大多了。因为 TikTok 采集的是用户行为,但大语言模型采集人们的个性与兴趣、希望和梦想,隐私和安全层面的担忧就完全不一样。特朗普政府已经开始表态要调查 DeepSeek 所带来的安全影响,甚至一些美国官方机构都禁止使用这个服务,这将成为巨大的地缘政治博弈因素。

  最后我想表达一下对 DeepSeek 和梁文峰的敬佩。DeepSeek 并不代表人工智能的终极形态,我们还不知道强化学习能改变到什么地步,也不知道下一个里程碑会不会是数据规模、微调、强化学习或其他要素。但DeepSeek 告诉我们,大规模数据中心和巨额预算并不是通往 AI 主导地位的唯一道路,也许还可以是优雅的算法,也许是无情的高效。最重要的是,DeepSeek把人工智能真正从象牙塔带到了大众手中。这一点,对梁文峰致以最高的敬意都不为过。因为他一直说,AI 应该是人人都能负担得起并能获取的。这就是 DeepSeek 给我们带来的最大贡献。

  苇草智酷(全称:北京苇草智酷科技文化有限公司)是一家思想者社群组织。通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的苇草思想者大会(原名互联网思想者大会),苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。