一文看懂AI手机不只通话翻译!

东沛评科技 2024-07-15 16:26:49

来源:工商时报(台)

生成式AI在各行各业掀起巨浪,手机是一般人最普及的数字终端用品,与AI结合是大势所趋,通过AI助阵,使用者将发现「手机变得比你还聪明」,在即时通话翻译、自动生成文章摘要、影像自动创建、圈选图片就能搜寻等应用有感升级。

换言之,如果说智能手机的诞生,取代了数码相机、传统音响、小型笔电等产品,AI手机或许将会挑战外语口译、会议纪录、影像美编等人员的饭碗,掀起一波新的典范转移。

研调机构也相当看好AI手机的未来,根据Counterpoint Research预估,2024年AI手机占比将达整体手机市场约11%; 至2027年,占比更将提升到43%,预估出货量成长4倍,年销量可望冲破5.5亿支大关,形成不可忽视的科技浪潮。

(图源:https://pixabay.com)

AI手机的定义?手机可直接运行生成式AI应用

近期市面上,几乎所有新推出的品牌手机,都以各项AI功能来宣传,让人眼花撩乱,AI手机未有明确定义,但必须符合相关条件。

台媒行业分析师邱昰芳表示,AI风潮开始朝向边缘设备延伸,在芯片运算力的持续提升,以及大型语言模型(LLM)的蓬勃发展下,催生AI手机问世,而手机可直接在硬件设备上运行生成式AI应用,应可被视为AI手机的基本定义。

她进一步补充,过去手机实现AI功能,主要依赖云计算; 但现在手机硬件规格已进展到不连网,也能在手机上执行AI运算。

AI手机是结合先进人工智能技术(Artificial Intelligence)的智能手机,与普通智能手机的最大差别在于处理器,由于需要处理AI模型,因此手机必须内建NPU才能顺利执行。

事实上,过去许多智能手机很早就开始主打AI摄影,但不需要AI芯片就可达到,不能称得上是真正的AI手机; 而自2023年下半年开始,手机品牌大厂开始陆续采用AI芯片,导入生成式AI应用功能,进一步优化体验,被认为是AI手机浪潮的初始。

何谓NPU?用来加速AI运算能力的处理器

NPU是神经网络处理单元(Neural Processing Unit)的简称。3C创作者「壹哥」现在多数旗舰手机采用的处理器,如高通Snapdragon 8 Gen3搭载的Hexagon NPU、联发科Dimensity 9300的NPU 790,以及苹果A17 Pro搭载的Neural Engine,都是非常强大的NPU,主要用来加速AI运算能力,或者用来设计独家的机上AI技术。

AI手机的处理器必须采用CPU、GPU、NPU的多核心架构,以三星最新发布的Galaxy Z Fold6而言,其CPU效能较前代提升18%、GPU较前代提升19%、NPU较前代提升42%,都是助力AI功能升级的关键。

哪些品牌加入AI手机战场?

全球掀起生成式AI的风潮,几乎吸引所有手机品牌都全面拥抱AI,除了Google、华为、小米、Vivo、OPPO、荣耀、华硕之外,全球手机龙头三星今年初推出的S24系列首度导入Galaxy AI,成功打开话题与销量,并在近期将AI导入折叠机。而苹果则预计在今年iPhone 16系列正式加入AI手机战场。

有哪些AI基础模型?

AI手机发展的核心关键在于AI基础模型,并靠着训练推论产生AI功能,尽管OpenAI、Google、Meta等国际大厂都有现成开放大语言模型供使用,但邱昰芳表示,为避免受制于平台供应商,手机品牌大厂纷纷扩大AI研发团队,投入大型语言模型(LLM)的开发与训练。

她举例,三星AI手机除采用自行研发的AI大型语言模型三星高斯(Samsung Gauss),也携手Google Gemini 等大型语言模型合作,藉此满足不同区域使用需求; 华为也将鸿蒙操作系统整合自研盘古大模型。

许多品牌都以Google Gemini为基础再开发。例如Vivo的Origin操作系统也纳入自研蓝心大模型、小米澎湃操作系统结合自研的MiLM-6B大模型,OPPO的AndesGPT等,都可借此形塑不同品牌AI手机功能的创新程度与差异化。

市面上的AI手机,各有哪些亮眼功能?

三星近期新一代折叠机,不只延续S24系列导入的AI功能,更优化5大应用,包括搜寻圈可解答数学题、通话实时翻译功能可支持LINE等通讯软件,新的绘图助理则可把手绘涂鸦自动生成实际图像等。

对于有感的AI体验,壹哥举例,三星的Galaxy AI可把「你的一句话自动生成文章」,也可自由选择正式email格式,或是社群贴文风格,也可手机录音转为文字渲染,或将网页翻译并且整理成摘要; 通过AI只要几个线条就可以画成精美图片,也可以将影片转换成流畅的慢动作; 在翻译的部分,可通过实时通话翻译功能,与外国人对话; 聆听模式可不间断同步翻译,如随身个人口译。

针对Google Pixel 8 Pro,壹哥指出,其录音工具可语音转文字、Gboard的智能讯息回覆可根据用户的语气、使用习惯来提供建议响应。通过生成式AI,可优化夜拍效果、将低分辨率影片优化,并修复模糊照片。

他也举例,vivo中国限定手机通过蓝心大模型,搭配联发科手机芯片,手机可直接将文字生成图片; OnePlus AI则可优化照片、影片补帧,都是让人印象深刻的AI体验。

0 阅读:27

东沛评科技

简介:感谢大家的关注