好问题,简单从比较通俗的视角来说一下,为什么deepseek造成了海外这么大反应?它又是什么样的存在。
提起chatgpt我们都知道,但是事实上国内用户是无法直接使用它的,得fq,所以在这之前,只有少数人是真的用到它的。而现在,deepseek在汉语言文学理解与创作、数学及推理、代码等领域,已经达到了每月200刀的chatgpt级别的水平,就这么牛。
不仅如此,花的钱还少,总训练成本甚至不如meta的一个管理人员的薪资高。
此外,deepseek把他们最大的671b r1模型,真开源了,选择的还是最宽松的开源协议,且他们把他们的核心论文也公开出来了,此前业内是没有任何一家这么做的。
大家都是闷声自己沿着openai的prm过程奖励模型的这一套体系去搞,而这次deepseek公开的论文,为业界指明了还有另一条更优路线,花费成本更少,效率提高至少50%,所能达到的上限还比prm这种路线高。所以这次deepseek一下子引爆了海外了,各家都开始重头来按照deepseek开源的这个路线推倒重来。
就是这么牛逼
提起chatgpt我们都知道,但是事实上国内用户是无法直接使用它的,得fq,所以在这之前,只有少数人是真的用到它的。而现在,deepseek在汉语言文学理解与创作、数学及推理、代码等领域,已经达到了每月200刀的chatgpt级别的水平,就这么牛。
不仅如此,花的钱还少,总训练成本甚至不如meta的一个管理人员的薪资高。
此外,deepseek把他们最大的671b r1模型,真开源了,选择的还是最宽松的开源协议,且他们把他们的核心论文也公开出来了,此前业内是没有任何一家这么做的。
大家都是闷声自己沿着openai的prm过程奖励模型的这一套体系去搞,而这次deepseek公开的论文,为业界指明了还有另一条更优路线,花费成本更少,效率提高至少50%,所能达到的上限还比prm这种路线高。所以这次deepseek一下子引爆了海外了,各家都开始重头来按照deepseek开源的这个路线推倒重来。
就是这么牛逼