XNGP强化学习的奖励函数,大量汲取了规则时代的经验积累。突然想到,有投资人反

真的不是郑小康 2025-04-14 16:09:19

XNGP 强化学习的奖励函数,大量汲取了规则时代的经验积累。

突然想到,有投资人反复质疑,「如果 OpenAI 做智能驾驶,对特斯拉是不是降维打击?」,当然国产的一个版本就是「如果 DeepSeek 做智能驾驶,对小鹏是不是降维打击?」

用这句话回复就够了。

待在实验室里,连强化学习的奖励函数都很难设计得好。智能驾驶是物理 AI,这是和 LLM 一个根本的不同。

0 阅读:0
真的不是郑小康

真的不是郑小康

感谢大家的关注