看看专业人士写的DeepSeek-V3/R1出现的意义[并不简单]
它在AI大模型领域的地位仅次于OpenAI的GPT,大于其他所有大模型 [鼓掌]
特别是“尤里卡”时刻的出现让AI大模型训练自己完成进化成为可能,是AI领域继GPT后又一重大进展 [酷]
DeepSeek 证明仅用结果奖励(outcome reward RL)就能让模型达到顶尖水平,颠覆了业界认为需要过程奖励(PRM)的认知。模型还能自我反思、纠错,展现了“自我进化”能力。这一突破可能改变 AI 成长规律,推动模型向 AGI 迈进,价值远超 LLaMA 等开源模型。
这下美国人彻底懵逼了 [哈哈]