4月28日,中国汽车工业协会发布《关于汽车数据处理4项安全要求检测情况的通报(第一批)》文件,宣布特斯拉、比亚迪、理想、路特斯、合众新能源、蔚来等6家企业的76款车型,符合汽车数据安全4项合规要求。其中特斯拉是唯一一家符合合规要求的外资企业。
文件显示,检测对象为2022-2023年上市的智能网联汽车,主要检测车外人脸信息等匿名化处理、默认不收集座舱数据、座舱数据车内处理、处理个人信息显著告知等4项要求。
其中,特斯拉的2022/2023款Model 3、Model Y通过了合规要求,这意味着,国内禁停禁行区域如机场、高速等,或将对特斯拉大部分车型解除限制,特斯拉车辆的行驶范围将进一步扩大。
在数据存储方面,特斯拉也已经在2021年建设上海数据中心,实现数据本地化存储。特斯拉还引入第三方机构,对公司信息安全管理制度进行审核,通过了安全管理体系认证(ISO27001)。
此前有媒体报道,特斯拉正在中国组建一个20人左右的本地运营团队,并准备在中国建立一个上百人的数据标注团队,为训练FSD算法提供人工标注样本。这也为特斯拉FSD落地中国扫清了数据安全方面的障碍。
通过汽车数据安全合规要求的车型
在通过合规要求的同一天,特斯拉CEO马斯克抵达北京,与多位政府官员见面。其目的也为了推动FSD(全自动驾驶)在市场应用。
FSD全称是Full Self-Drive,是特斯拉多年研发的完全自动驾驶解决方案,是一项革命性的技术,也是目前特斯拉提供的最高水平的测试版的自动驾驶系统。它最终目标就是实现车辆完全在没有人类干预的情况下,自己识别路况、规划路线、控制速度和方向,完成从起点到终点的行驶。FSD和传统的自动驾驶思路有本质的不同。传统的模块化自动驾驶算法是将整个过程拆分为感知,预测、规划等等不同环节,它是一套基于规则的算法。而FSD的算法是通过观察人的行为来掌握这些技能。大家知道,特斯拉的优势是拥有庞大的数据资源和计算能力,它可以利用来自全球数百万辆车辆的实时数据来优化和训练其FSD自动驾驶系统。
据多家等媒体报道,特斯拉已获得中国政府初步批准,熟悉内情的人士称,特斯拉将在百度提供的地图和导航功能的基础上部署高阶智能驾驶服务。据悉双方此次合作的地图为独家、深度定制。
在4月22日百度智能汽车产品发布会上,百度副总裁尚国斌透露,百度最新地图V20版本的真车道级导航预计5月在特斯拉全球首发,未来特斯拉的车主不仅可以使用智能车道级导航的推荐引擎、红绿灯倒计时等等,效果体验要比手机更好看、更好用。
据介绍,百度的车道级导航地图是为自动驾驶而生的地图,由自动驾驶视觉感知大模型而生成,兼具了标准地图和高精地图的优势,可以做到“只要百度地图能导航的地方,就可以使用城市高阶智驾”。目前百度已经完成全国360万公里道路、360个城市的车道级地图数据制作和上线,覆盖用户95%的导航里程。
此外,4月20日,特斯拉CEO埃隆·马斯克(Elon Musk)在社交媒体平台X上回复一位中国车主询问何时在中国推出FSD时表示:“可能很快就会实现。”
在4月28日马斯克访华当日,特斯拉官方微博先后两次发声,提到“加速自动驾驶技术落地”。同时特斯拉APP显示,特斯拉中国官方的FSD购买页面描述已由“稍后推出”改为“即将推出”。
但是,尽管马斯克访华加快了特斯拉在中国的智驾业务布局,但目前不论是中方政府还是特斯拉公司方面,都没有提到FSD进入中国的事情。业内人士认为,有一些关键问题仍然没有解决,仅仅把几项汽车隐私数据收集合规直接解读成FSD落地,实在为时过早。
首先是数据和大模型训练问题。
根据公开信息,特斯拉早在2021年就在上海建立了两个主要的数据中心:一个是特斯拉上海研发创新中心,另一个是特斯拉上海超级工厂数据中心。
前者专注于特斯拉在华软硬件、流程和技术的开发工作,还参与全球AI机器学习的研发工作,并对中国市场的应用适配和标准测试起到重要作用。
后者存储所有中国大陆市场销售车辆所产生的数据,包括但不限于生产数据、销售数据、服务数据和充电数据。特斯拉多次强调过,绝不会向美国政府提供在中国或其他国家所收集的任何车辆和用户数据,会通过加密、鉴权和访问控制等技术手段确保存储安全。
对于自动驾驶这种需要海量数据信息进行训练的技术来说,特斯拉目前的主场依然停留在人车密度有限、路况相对简单的北美,即使其大模型已经调教得相当顺滑,一旦进入中国,遇到例如杭州、厦门那种随时变化的“潮汐车道”、重庆这种8D魔幻城市,或是一线城市三轮车电瓶车横行的城中村,可能随时会懵圈罢工。
这就涉及智能驾驶大模型训练中的“模型分叉”问题。
模型分叉指的是在模型的训练过程中,由于某种原因(如参数设置、训练数据集的变化、训练过程中的优化策略等)导致模型出现了多个不同的状态或版本。就好比生物进化过程中,由一个共同祖先分化出多个后代,彼此体貌特征可能完全不同。
因此特斯拉的FSD技术如果要进入中国,必须要利用中国道路数据进行训练,这就涉及两种选择:1.将相关数据带到美国本土的超算重心进行训练;2.在中国成立超算中心,建立独立的大模型训练体系。
前者显然面临敏感的数据安全问题,后者又会带来巨额的成本,尤其在当前,中美“芯片制裁问题”剑拔弩张的大背景上,并不容易落地。