AI为核心的新一轮科技创新浪潮已至,AI将与互联网一样,带来新一轮范式革命,人类社会将进一步加速发展。我们精心准备,重磅推出【智能时代专题】,目前已规划121篇深度原创研报,将全方位梳理AI产业、技术、代表性公司等发展历史、现状、趋势,展望智能时代未来图景,挖掘投资机会。
智能时代专题:数据资源
免费版2,657字,预计阅读6分钟
完整版17,949字,欢迎付费解锁
一、AI时代,算法、算力、数据、业务,四位一体,才能形成飞轮效应。
算法:不能成为长期壁垒,算法类似解题思路,会因论文发表、行业交流、人才流动等形式逐步公开,被同行讨论、借鉴、应用,如Transformer、端到端逐渐形成共识;算力与数据才是竞争的关键,算法需要依托算力与数据,才能持续迭代进化。
算力:短期可以靠大资金投入,阶段性取得算力方面优势,长期需要持续资金实力做支撑。对商业世界来说,长期很难单纯靠盲目烧钱,需要看到良好ROI,形成投入与回报良性循环,否则难以持续支持大规模算力投入。
数据:算法不断学习进步的养分,保证数据优势持续领先,才能充分发挥算力潜力,推动算法持续迭代进化,助力业务持续领先。
业务:业务持续增长,产生持续稳定、规模化现金流,才能持续投资算力、积累数据、迭代算法,推动业务持续领先,进而形成飞轮效应。
二、智能驾驶是构建AI飞轮效应典型杀手级应用,头部智能电动汽车厂商将成为领先的AI科技巨头。
特斯拉、理想等不断进行巨额算力投资,加上庞大车队产生海量数据,不断训练与迭代升级智能驾驶算法。随着智能驾驶技术持续进化,用户体验不断提升,推动销量增长,产生持续稳定现金流,反哺更大规模算力建设;更多销量,带来更多场景与数据积累,进一步提升算法,加速技术迭代,形成飞轮效应。
智能驾驶作为AI最早落地的杀手级应用,不仅推动相关技术快速发展,还使智能电动汽车估值逻辑,从传统汽车制造向AI科技企业转变,将实现显著估值提升。随着智能驾驶技术成熟与商业化深入落地,头部智能电动汽车厂商将在汽车行业与AI领域占据领先地位,成为引领未来AI在更丰富场景应用落地的核心力量。
围绕智能驾驶的AI飞轮效应已经形成,正加速旋转。特斯拉、理想,分别是美国、中国在这方面头部代表。能用、好用、爱用,是分析智能驾驶、AI+机器人等技术,不同发展阶段定性参考标准。
智能驾驶系统,随着特斯拉FSD V12、理想端到端+VLM等不断迭代,正在从能用到好用,这属于车企在智能驾驶领域供给端变革,还需要继续加大算力投入、积累车企智驾里程数、城区接管里程MPI不断突破,使自动驾驶级别从L2提升到L4,以及最终实现真正L5水平,在这个过程中,使用户习惯高频使用,从好用变成用户真正爱用。
三、数据是AI模型可持续竞争优势关键,智能电动汽车与机器人,有望成为未来AI模型训练数据最主要来源。
数据是AI模型训练基础要素,推动AI技术不断进步关键因素之一。2023年3月,GPT-4发布以来,全球大模型产品层出不穷,算力、算法快速发展与优化迭代同时,数据壁垒成为重要限制因素。目前可访问互联网数据资源已趋近耗尽,基础模型性能进一步提升,受限数据多样性与数据质量。
面对挑战,除了继续推动算力增长,未来模型性能突破,将更多依赖高质量、不同场景专业化数据获取与应用。数据资源深度挖掘、精准标注、创新性数据处理等技术发展,成为推动AI进步关键路径。
AI模型训练数据,主要分为数字世界数据、现实世界数据两大类,两类数据来源各异,各具特色,类型丰富,涵盖广泛场景。数字世界数据,以广泛覆盖面与高可获取性,为AI提供丰富训练素材;现实世界数据,通过实际应用场景,提供大量真实、动态信息;两类数据结合,能全面提升AI模型能力,使其在各种应用中表现更加出色。
数字世界数据,主要分简单数据、高级数据两类,简单数据用于AI模型训练已基本使用殆尽,高级数据相比简单数据规模更大、质量更高,开发利用潜力巨大。如果能将高级数据,有效用于AI模型训练,将带来性能上压倒性提升。例如OpenAI与金融时报、学术期刊商Springer合作,获取高质量金融、学术数据。
智能电动汽车与机器人,作为现实世界中持续生成高级数据重要来源,有望成为未来AI模型训练数据最主要来源。现实世界中,实际应用的智能电动汽车与机器人规模不断增长,能在多种复杂环境中持续与现实世界交互,不断产生与收集丰富数据,为AI系统提供更多元、高质量数据,帮助AI系统不断改进与性能提升。
智能电动汽车与机器人重要优势,是能进行集体学习。集体学习机制,允许各个设备在共享学习成果基础上,加速能力提升,增强整个系统学习能力与适应性,为大规模部署与应用提供强大支持。
智能电动汽车自动驾驶系统与机器人智能系统,是通过研发商的中央系统进行控制与分发,当一辆智能电动汽车在行驶中掌握一项新驾驶技巧,或一台机器人在执行任务时学会一项新技能,这些新能力在上传到中央系统后,可迅速分发到其他所有智能电动汽车或机器人,使所有设备能迅速应用这些改进,提升整体系统性能与效率。
2024年9月10日,ALL-IN峰会上,马斯克进行深入对话访谈,分享对AI与机器人未来发展见解,认为未来机器人数量将远超人类,达到至少2:1甚至3:1。马斯克强调自动驾驶汽车与通用人形机器人,将是AI发展关键因素,预计Optimus机器人可能成为AI训练数据最大来源,能与物理世界大规模互动,产生前所未有有价值数据。
面对高级数据不足挑战,仿真数据、合成数据等是增加数据供给重要方式,帮助AI模型训练与升级,加速AI技术在不同领域应用与推广。
基于数据重要性,AI大模型竞争中,科技巨头进一步强化竞争优势。目前只有少数科技巨头,具备这种数据优势。
马斯克X宇宙,通过海量特斯拉汽车与人形机器人Optimus、X/Twitter海量用户与数据、Neuralink来自动物实验与人类脑机数据等多场景、多模态的海量实时数据,形成强大数据获取能力。
四、数据资源是支持深度学习发展重要力量,随着AI技术进步,数据规模持续指数级增长。
深度学习技术持续创新发展,背后是算法、算力、数据不断突破。数据方面,神经网络模型相比其他AI技术,对数据规模要求更高,训练数据集足够大,才能保障神经网络性能优于其他AI技术。神经网络模型训练数据,整体从小规模专业数据集,逐步发展到海量多领域混合数据集,以适应AI模型发展对训练数据规模不断增长需求。
OpenAI GPT系列大模型使用数据量,不断指数级增长,展示数据对模型性能重要性。相比GPT-3,GPT-4训练数据,不仅数据量增加20倍以上,数据质量与处理更精细。
OpenAI正式发布旗下首款具有高级推理能力AI大模型o1。o1使用全新训练方式与专门量身定制的新数据集进行训练,真正具备推理能力。o1推理能力大幅提升,在美国数学邀请赛上,可排名进入美国前500名;在物理、化学、生物等学科的Challenging基准测试中,表现与博士生/专家型人才相当。
o1思考时间越长,推理任务表现越好,有望诞生新的Scaling law。英伟达具身团队领导Jim Fan,点评这一事件历史意义,指出OpenAI新模型,除在训练时,通过增大参数量与数据量,得到性能提升,同时通过增加推理时间,得到性能提升。这代表AI模型不仅拥有训练时的Scaling law,还拥有推理层面的Scaling law,双曲线共同增长,将突破之前大模型能力提升瓶颈。
相关研报:
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会
请务必阅读免责声明与风险提示