主流AI大模型架构及应用场景研究分析

薪科技快评 2024-06-02 23:15:25

国内主流AI 大模型架构及应用场景深度分析 2024

评价门槛

本次评估模型涵盖“中国市场适应性”、“全栈技术能力”、“商业稳固基础”及“产品市场潜力”四项关键基线,满足所有要求的大模型厂商将入围竞争力评估,展现卓越实力。

中国市场尚未迎来海外大模型厂商落地,其产品服务及生态圈构建缺失,非官方渠道使用风险高。OpenAI、谷歌、Meta等大模型厂商尚未向中国开放关键服务。鉴于此,选择接入国产及自主研发的大模型成为更现实、稳定且可控的选项,为国内市场提供强有力的支撑和保障。

大模型服务考核厂商需展现从算力基础设施、深度学习框架到算法设计优化的全栈能力,包括工程化与运营经验。入围厂商需具备自建运营算力、领先算法设计等实力,确保提供卓越的全栈大模型解决方案。

大模型厂商应持续技术投入,并培养商业输出能力,将技术融入业务,积累行业知识和应用洞察。以稳固基础应对大模型市场的高速增长和创新变革,确保稳定性与竞争力。

产品市场日益拥挤,厂商需凭借成熟大模型与商业化产品抢占先机,持续迭代优化大模型,依托用户与行业数据保持竞争优势。

综合竞争力评价的四大基线

评价模型及指标体系

三方维度诠释主要厂商综合竞争力

产品技术能力直接影响AI大模型的性能与应用。训练数据、算力支撑等核心要素构筑坚实技术底座,展现厂商大模型技术的卓越实力与出色应用表现。

战略愿景能力体现于风险缓解与市场洞察的综合评估,高分反映厂商拥有更为全面、精准的战略视野,引领行业发展方向。

生态开放能力:大模型厂商实力通过生态开放性、体系建设、联合创新来衡量。生态能力强则开放性高、产业协作强,彰显厂商实力。

评价模型及指标体系

三方维度诠释主要厂商综合竞争力

评价模型及指标体系

部分指标中的厂商基本情况

综合竞争力表现

本报告深入剖析AI大模型在技术能力、战略眼光及生态开放度三大维度的综合竞争力,精准对比各厂商在AI大模型领域的综合表现,为您呈现全面、专业的行业分析。

中国主要 AI 大模型厂商介绍

商汤SenseCore AI大装置与SenseNova日日新大模型体系,共创智能新纪元,引领行业变革。

◼ 从基础设施到模型研发的全栈能力

基于“大模型+大装置”的技术路径,商汤推进 AGI 为核心的发展战略。

商汤领先发布“日日新 SenseNova”大模型体系,提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型以及能力,结合决策智能大模型,为 AGI 实现提供重要起点。除语言大模型“商 量 SenseChat”外,“如 影SenseAvatar”、“琼宇 SenseSpace”、“格物SenseThings”、“秒画 SenseMirage”一系列生成式 AI 模型,能够在文生图创作、2D/3D数字人生成、大场景/小物体生成实现应用。

商汤五年精心打造AI大装置,成为国内领先的大模型建设基石,为AGI时代奠定坚实基础。该平台不仅孕育了日日新大模型体系,更向外界提供从开发到部署的全方位大模型训练服务。迄今,已助力8家大型企业,实力彰显,引领行业前沿。

◼ 具有前瞻性的开放生态

商汤开源的“书生 2.5”多模态多任务大模型,拥有30亿参数,荣登ImageNet全球开源模型准确度之巅,且规模空前。其在COCO物体检测数据集中,以超过65.0mAP的佳绩独占鳌头。商汤构建的OpenMMLab、OpenDILab、OpenXRLab、OpenPPL等开源算法框架体系,彰显了公司在创新领域的深厚实力,并持续与业界共享成果。

商汤携手国产芯片厂商,强化GPU训练效能,推出大模型推理服务,攻克千卡国产训练集群,成功适配并应用58款国产芯片,助力产业升级与创新。

商汤大模型发展关键事件时间点

商汤日日新自研大模型体系

中国主要 AI 大模型厂商介绍

商汤AI大装置SenseCore与日日新SenseNova大模型体系,引领AI技术革新,构建智能未来。

◼ 体系化研发能力下产业应用积累

商汤科技展现了卓越的体系化大模型研发实力,推出Uni-Perceiver解码建模技术,将多模态数据统一编码,实现跨任务无缝处理。其“秒画 SenseMirage”模型,凭借先进的大模型结构设计与优化算法,参数量超越Stable Diffusion数倍,且在文本理解、图像风格与细节呈现上更胜一筹,展现了业界领先的性能与潜力。

商汤通过 API 对外提供大模型服务,同时也将其作为自身业务创景创新提效的发动机。

“商量 SenseChat”具备多轮对话和超长文本的理解能力,并支持编程助手,可帮助开发者更高效地编写和调试代码等一系列创新应用。另外,商汤将大模型的能力全面赋能自身的业务体系,围绕智慧商业、智慧城市、智慧生活和智能汽车四大关键领域,构建AGI 核心能力。目前商汤超大模型已经覆盖公司核心业务,有 20+落地场景大模型交付,5+ 个项目生产 Serving 交付。

商汤大模型产业布局与应用场景积累

商汤大模型的体系化研发能力

百度:AI 大底座+文心大模型

◼ 产业级知识增强大模型,夫嫩行业大模型发展

百度文心大模型,产业级知识增强典范,深度融合产业需求,自主创新的AI底座,简化AI开发与应用。其特色在于“知识增强”,融合百度自研的超过5,500亿条知识图谱,通过海量数据与知识融合学习,实现高效、优质、可解释性强的AI性能,为产业发展注入强大动力。

◼ 大模型架构分三层体系

百度文心构建了文心大模型层、工具与平台层、产品与社区三层体系:建设更适配场景需求的基础、任务、行业三层大模型体系,提供全流程支持应用落地的工具和方法,孵化基于大模型的任务系统与创新产品。目前文心大模型已经建设了 36 个大模型。文心 API 和提供全流程开箱即用大模型能力的 EasyDL 和 BML 开发平台,全方位降低应用门槛;新增产品与社区层,包括“文心一格”、“文心百中”和旸谷社区,让更多人零距离感受到先进的 AI大模型技术带来的新体验。

百度文心大模型全景图

百度: AI 大底座+文心大模型

◼ 飞桨平台助力大模型落地

预训练大模型市场正处于高速发展阶段,需要解决差异化水平下开发者和企业的应用需求。百度飞桨深度学习平台向下适配各种硬件,支持文心大模型的开发、高性能训练、模型压缩、服务部署的各种能力,贯通 AI 全产业链,串联起全栈化的产业生态体系。文心大模型+飞桨深度学习平台生态共享,在市场生态方面持续发力以百度飞桨为代表的国产开发框架已经逐步与产业融合,在社区生态建设上持续发力。文心大模型是飞桨模型库的重要组成部分,与飞桨共享生态,包含产业级知识增强大模型体系,以及工具平台、API 和创意社

文心大模型与飞桨深度学习平台的关系

飞桨深度学习平台助力大模型高效应用,降低研发门槛,提升效果,实现流程标准化。在文心+飞桨生态中,硬件厂商、开发者与模型应用企业紧密合作,共同促进,形成共聚、共研、共创的繁荣生态,推动AI技术的快速发展与应用。

百度大模型发展历史

◼ 拓展产业链生态,赋能大模型

百度倾力打造生态,携手深圳燃气、吉利、泰康保险等领军企业,发布跨行业大模型,覆盖电力、燃气、金融等多元领域,共同推动行业革新与发展,展现百度生态战略的深远影响与强大动能。

行业智能化转型升级正火热进行,已汇聚535万开发者,服务于20万家企事业单位。我们与12家硬件伙伴合作推出飞桨生态发行版,增强深度学习平台与硬件的适配性。同时,我们与国内顶级科研、教育机构紧密合作,成功助力389所高校、747名教师,并培养了超过10万名AI人才,共同攻克AI技术难题。

阿里:M6-OFA +“通义”大模型系列

◼ 统一底座为基础,构建层次化的模型体系

阿里巴巴通义大模型依托统一底座,构建层次化体系,通用层涵盖NLP、多模态、计算机视觉,专业层深耕电商、医疗、法律、金融、娱乐等行业。通用与专业模型协同,实现性能优化与低成本部署,为各行业提供高效解决方案。

自2020年,阿里推出了多款多模态及语言大模型,显著突破超大模型、低碳训练、平台化服务与落地应用。通义大模型系列已服务超200个场景,应用效果提升2%至10%。为加速规模化应用,达摩院研发了S4框架,实现百亿参数大模型在99%压缩率下多任务精度近乎无损。阿里持续引领大模型技术的创新与应用。

通义千问 发展历程

◼ 关键技术开源,丰富合作生态

通义大模型系列重磅开源,核心包括语言大模型AliceMind PLUG、多模态统一模型AliceMind-mPLUG、底座模型M6-OFA及超大模型落地技术S4框架。这些领先能力现面向全球开发者开放,共绘AI新篇章。

阿里通义大模型架构

华为:ModelArts + 盘古大模型

全栈式AI解决方案,赋能工业与科学领域,推动AI for Industry与AI for Science的深度融合与发展。

华为云于 2020 年内部立项 AI 大模型,并于 2021 年 4 月正式对外发布盘古预训练大模型,强调模型数据、网络结构、泛化能力三大核心设计。华为云规划“L0 基础大模型-L1 行业大模型-L2 细分场景大模型”的发展路径。L0 阶段的盘古大模型由 NLP 大模型,CV 大模型、语音大模型、多模态大模型、科学计算大模型等组成,其中 CV 大模型超 30 亿参数,预训练时输入 10 亿级图像数据,兼顾图像判别与生成能力;NLP 大模型具备领先的中文语言理解和模型生成能力。

L1 阶段,基于已有的行业基础,华为云推出盘古气象大模型、盘古矿山大模型、盘古 OCR大模型等行业大模型,能够在 L2 阶段的煤矿场景下的瓦斯浓度的超前预警、气象领域的天气预报等多个细分场景实现落地。

华为云全栈式AI解决方案,深度融合大模型与Ascend/Kunpeng芯片、MindSpore语言及ModelArts平台。凭借算力底座、服务器、全场景深度学习框架与开发平台,华为全面驱动大模型发展,引领AI新纪元。

◼ 拓展产业链生态,赋能大模型

华为云深耕产业链生态,依托鲲鹏凌云等合作计划,构建算力、软硬件生态伙伴网络,赋能AI大模型。携手下游厂商发布行业解决方案,推动AI大模型商业化应用,引领产业发展新潮流。

华为云盘古预训练大模型架构

腾讯:HCC 高性能计算集群+混元大模型

◼ 新一代 HCC 高性能计算集群为大模型提供底层支持

2022 年 4 月,腾讯首次对外披露混元 AI大模型,协同了腾讯预训练研发力量,以统一的平台实现技术复用和业务降本,支持更多的场景和应用。当前,混元 AI 大模型完整覆盖 NLP 大模型、CV 大模型、多模态大模型、文生图大模型及众多行业与领域任务模型 , 先后在 MSR-VTT、MSVD 等五大权威数据集榜单中登顶,实现跨模态领域的大满贯。目前,HunYuan NLP 1T 大模型已在腾讯多个核心业务场景落地,并带来了显著的效果提升。近日腾讯正式发布全新的 AI 智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等 AI 创作工具。

腾讯云于2023年4月推出新一代HCC高性能计算集群,以自研星脉网络与存储架构为核心,集成TACO训练加速引擎,显著提升大模型训练效率,降低成本。腾讯太极机器学习平台的AngelPTM训练框架亦通过TACO提供服务,助力企业高效落地大模型,开启智能计算新时代。

◼ 用户生态繁荣,促进模型迭代

腾讯凭借在社交、阅读、游戏等领域的深厚底蕴,拥有海量用户与强大生态,语料资源丰富,数据积累深厚,场景优势明显。高级执行副总裁汤道生透露,腾讯正研发类ChatGPT聊天机器人,将融入QQ、微信。智能写作、AI绘图、游戏场景生成等新品迭出,助推大模型在自有生态中迅猛成长。

腾讯 HunYuan 大模型全景图

名词解释

银行业大模型案例深度剖析,揭秘2024全球AI全栈技术前沿。零售电商AI大模型应用,引领行业新变革。小米汽车崛起,预计两年内登顶国内市场!网络AI大模型十大问题深度解读,算力中心全液冷建设揭秘。机器人全产业链深度分析,展望2024发展趋势。

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

0 阅读:6

薪科技快评

简介:薪科技评说,发现技术的点滴,记录科学的飞跃!