XNGP 强化学习的奖励函数,大量汲取了规则时代的经验积累。
突然想到,有投资人反复质疑,「如果 OpenAI 做智能驾驶,对特斯拉是不是降维打击?」,当然国产的一个版本就是「如果 DeepSeek 做智能驾驶,对小鹏是不是降维打击?」
用这句话回复就够了。
待在实验室里,连强化学习的奖励函数都很难设计得好。智能驾驶是物理 AI,这是和 LLM 一个根本的不同。
XNGP 强化学习的奖励函数,大量汲取了规则时代的经验积累。
突然想到,有投资人反复质疑,「如果 OpenAI 做智能驾驶,对特斯拉是不是降维打击?」,当然国产的一个版本就是「如果 DeepSeek 做智能驾驶,对小鹏是不是降维打击?」
用这句话回复就够了。
待在实验室里,连强化学习的奖励函数都很难设计得好。智能驾驶是物理 AI,这是和 LLM 一个根本的不同。
作者最新文章
热门分类
汽车TOP
汽车最新文章