这家国产ai公司搞出了个超能打的模型——实力直追gpt-4,但价格直接砍到百分之一,简直是ai界的“白菜价”
特别是数学解题和编程辅助这些硬核技能点满,码农和理工科学生都爱疯了。
企业老板们更是两眼放光:花小钱就能用上顶级ai,省下的钱都够再雇个团队了,这性价比谁顶得住啊!
- 编程问答
- 答案列表
最近火遍美国的DeepSeek,到底是什么[朗读]
我认为deep seek其实并没有对美国ai造成多少大的影响,最大的影响就是美股吧,估计幻方提前做空美股了吧,不过你看美股又立马涨回来了,所以说没有我们想象的那么大的影响,我认为就是极大的降低了算力成本,但是我们国家不是一向来都这样吗?可以压缩成本。
好问题,简单从比较通俗的视角来说一下,为什么deepseek造成了海外这么大反应?它又是什么样的存在。
提起chatgpt我们都知道,但是事实上国内用户是无法直接使用它的,得fq,所以在这之前,只有少数人是真的用到它的。而现在,deepseek在汉语言文学理解与创作、数学及推理、代码等领域,已经达到了每月200刀的chatgpt级别的水平,就这么牛。
不仅如此,花的钱还少,总训练成本甚至不如meta的一个管理人员的薪资高。
此外,deepseek把他们最大的671b r1模型,真开源了,选择的还是最宽松的开源协议,且他们把他们的核心论文也公开出来了,此前业内是没有任何一家这么做的。
大家都是闷声自己沿着openai的prm过程奖励模型的这一套体系去搞,而这次deepseek公开的论文,为业界指明了还有另一条更优路线,花费成本更少,效率提高至少50%,所能达到的上限还比prm这种路线高。所以这次deepseek一下子引爆了海外了,各家都开始重头来按照deepseek开源的这个路线推倒重来。
就是这么牛逼
提起chatgpt我们都知道,但是事实上国内用户是无法直接使用它的,得fq,所以在这之前,只有少数人是真的用到它的。而现在,deepseek在汉语言文学理解与创作、数学及推理、代码等领域,已经达到了每月200刀的chatgpt级别的水平,就这么牛。
不仅如此,花的钱还少,总训练成本甚至不如meta的一个管理人员的薪资高。
此外,deepseek把他们最大的671b r1模型,真开源了,选择的还是最宽松的开源协议,且他们把他们的核心论文也公开出来了,此前业内是没有任何一家这么做的。
大家都是闷声自己沿着openai的prm过程奖励模型的这一套体系去搞,而这次deepseek公开的论文,为业界指明了还有另一条更优路线,花费成本更少,效率提高至少50%,所能达到的上限还比prm这种路线高。所以这次deepseek一下子引爆了海外了,各家都开始重头来按照deepseek开源的这个路线推倒重来。
就是这么牛逼
加入收藏