DeepSeek-R1的出现堪比一匹黑马,让中国AI企业突然冲进国际舞台,以高昂的姿态参与竞争,被众多国际媒体称之为美国Open AI的头号竞争者。
(DeepSeek横空出世)
从1月20日发布至今,DeepSeek-R1的热度一直居高不下,总结起来就是这样一个态势:
一群中国的职场年轻人,拿着500万美元的投资,用了不到两年时间,搞出了一个足以比肩Open AI和谷歌的智能大模型,而它的训练成本仅有对手的二十分之一!
(中国开源AI大模型:DeepSeek-R1)
要知道前段时间,OpenAI可是刚宣布要联合众多科技企业,耗资数千亿打造“星际之门”(Stargate)项目。
没想到才过去不到一个月,DeepSeek就出现了,仿佛直接给“星际之门”设立了一个追赶的目标。
关于DeepSeek诞生的故事,相信这些天大家已经听得足够多了,这么我们简单概述一下。
浙江大学80后高材生梁文峰,从2008年起带领团队使用机器学习等技术探索全自动化的交易。
2015年,他成立了幻方量化基金公司,这是一家依靠数学和人工智能模型进行量化投资的对冲基金公司。经过几年的发展,这家公司的资产管理规模已经突破了千亿。
(幻方量化)
所谓的量化基金公司,简单来说就是用设定的数学模型和AI进行自动投资,是一种由机器和AI做决策的投资基金。
和主要由人做投资决策的主观基金比较,量化基金收益不一定很高,但相对稳健,风险较低。
可以说,在投资领域,AI已经和人脑展开了相当长时间的交锋。
(量化和主观收益比较)
2023年,梁文锋投资成立了DeepSeek,开始专注于人工智能AI的大模型技术研发。
总投资只有500万美元,一百多人的团队大多是名校毕业的年轻行业精英,工作经历并不显赫,有的甚至是离开校园没多久的应届生。
(传言中的DeepSeek清北应届生团队)
就是这样一只名不见经传的队伍,经过一年多的潜心研发,于2024年5月发布了DeepSeek-V2模型,12月又发布了DeepSeek-V3模型。
到了1月20日这天,DeepSeek正式推出了R1模型。
一经推出,R1短短几天下载量便在多个国家登顶,还同时登顶苹果中美两区的APP免费榜。
(DeepSeek力压ChatGPT登顶)
下载量节节攀升,自然不是因为炒作和追捧,而是因为R1大模型确实厉害。用行业最通俗的话说:不服咱跑个分看看…
作为一款开源大模型,DeepSeek R1在数学、代码、自然语言推理等任务上的性能,都足以比肩OpenAI o1模型正式版。
在AIME 2024数学基准测试中,DeepSeek R1得分率为79.8%,OpenAI o1的得分率为79.2%;
在MATH-500基准测试中,DeepSeek R1得分率为97.3%,OpenAI o1的得分率为96.4%。
真正做到了在多个领域压制OpenAI o1。
(DeepSeek R1测试结果)
更直观点,让DeepSeek R1和OpenAI o1比一比解题。
有人用DeepSeek R1解答勾股定理,结果30秒不到便出了结果。
(DeepSeek R1解答勾股定理)
让OpenAI o1和DeepSeek R1测试物理法则,
让它们各自编写一个程序:
让一个黄色球在某个形状内弹跳。让该形状缓慢旋转,并确保球停留在形状内。结果显而易见,DeepSeek R1更胜一筹。
(左边OpenAI o1:没有弹跳 右边DeepSeek R1:轻微穿模,但完成度较高)
而对9个AI大模型进行测试:旋转的三角形内,弹球随之运动。
DeepSeek R1成功完成动态模型,OpenAI o1则直接建模失败,连三角形都没了…
(左上1:OpenAI o1 左上3: DeepSeek R1)
比较了这么多,该来说一下DeepSeek R1为啥这么强了。
简单来说:
同为推理大模型,DeepSeek R1的强大在于其创新的训练方法。
OpenAI o1背靠强大的团队和雄厚的资金,但对模型的训练非常依赖人工干预。甚至一些低级数据的处理还会外包给肯尼亚的外劳。
而DeepSeek R1团队从一开始就强化了R1的学习能力,让它能自动清除一些无关和重复的数据,也无需依赖人工监督和微调。
打个可能不大恰当的比方:
DeepSeek R1被设计成了一个天才儿童,稍微训练一下,掌握学习方法后很快就能举一反三,事半功倍;
而OpenAI o1更像请了名师辅导的懒惰儿童,需要老师不断地催促,监督和调整……
(外媒报道OpenAI曾雇佣肯尼亚劳工帮忙清理“有毒”数据)
Perplexity公司CEO曾这样评价DeepSeek的工程创新:“需求是发明之母。DeepSeek必须要找到解决办法,于是他们努力创造出了更高效的技术。”
(Perplexity公司CEO)
这几天Deepseek的强势崛起,也让美国科技圈狠狠震动了一番:原来搞AI,不一定需要花那么多钱?!
于是今天纳斯达克科技股暴跌——投资者对这些科技公司失去信心了。
(纳斯达克)
据彭博社预测,如果跌势持续,纳斯达克100和欧洲斯托克600科技股指数的市值,将共同蒸发1.2万亿美元……
(“1万亿暴跌”)
事实证明,即使没有庞大的资金,强大的算力支持,没有现成的技术……只要能静下心,不受外界干扰地独立思考和钻研,一样能找出技术突破的办法。
这场AI领域的竞争,归根结底是智力和精神的较量…