紫金财经10月24日消息 AI巨头科大讯飞,又给科技领域,特别是人工智能大模型加了一剂“猛药”。
10月24日,科大讯飞在全球1024开发者节上推出了讯飞星火大模型的最新版本——讯飞星火4.0 Turbo。
这一版本在七大能力上全面超越了GPT-4 Turbo,包括数学能力和代码能力。根据科大讯飞董事长刘庆峰的介绍,星火4.0 Turbo不仅在性能上有所提升,效率也相对提升50%。
发布会上,科大讯飞针对汽车、医疗、教育等大模型落地的不同场景也进行了模型的全面升级。
此外,刘庆峰还公布了科大讯飞亮相星火大模型的应用落地成绩单:讯飞星火央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、工业大模型第一、赋能科研应用第一、大模型开发者生态第一。
讯飞星火放大招:七大能力全面超过GPT-4 Turbo
自从去年五月份发布以来,讯飞星火大模型在短短一年半的时间内经历了数次迭代,如今,它正在为市场带来新突破和树立新标杆。
在全球1024开发者节上,科大讯飞宣布讯飞星火4.0 Turbo全新升级。这一新版本在七大核心能力上全面超越了GPT-4 Turbo,尤其在数学和代码能力上更是超越了GPT-4o。
发布会上,刘庆峰特别提到“硬碰硬”的数学能力和代码能力。
在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类o1的高难度数学能力显著提升。
在代码能力上,根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。
在由艾伦人工智能研究所、OpenAI等国内外权威单位发布的14项主流测试集中,讯飞星火4.0 Turbo在9项测试中取得了第一名的成绩,效率相对提升50%。
不过刘庆峰也坦言,目前星火在逻辑推理和多模态能力方面较GPT-4o还有所差距,依然需要继续追赶。
根据IDC研究报告和市场公开数据显示,科大讯飞在语音语义市占率中第一、大模型开发者规模第一,达78.1万。
十余个首发:汽车端侧大模型、医疗大模型都来了
除了带来全新升级的讯飞星火4.0 Turbo,会上,科大讯飞还首发了10项基于讯飞星火底座能力的硬核产品与创新应用——
发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏。
在语音识别领域,科大讯飞首发星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
在汽车领域,科大讯飞首发汽车端侧星火大模型,相比云端大模型,端侧1.3B大模型效果损失≤1%,端侧首响40ms,端云融合交互低至1.3s。据了解,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧星火大模型的车型将上市开售。
在医疗领域,科大讯飞发布讯飞星火医疗大模型2.0,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大医疗核心场景能力重大升级并持续领先。
刘庆峰表示,今天的AI应用,已经进入了场景化深水区,他直言:“在这样的一个阶段,我们需要做的就是把最好的技术跟应用场景和人文关怀更深入地连接在一起。”刘庆峰说。
会上,科大讯飞AI学习机首次发布“AI作业过滤器”,用大模型帮助学生科学减负。
据介绍,AI学习机通过OCR能力识别出练习题目后,可根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,学生可以快速排出学习优先级,避免重复无效刷题。
值得一提的是,科大讯飞还首次发布“星火超拟人数字人”,业界率先实现语义贯穿的“口唇、表情、动作”的超拟人数字人生成,实现了文本、语音和表情的跨模态语义一致性,可根据语音节奏和语义自动生成表情和动作,支持音视频输入。
仅需一张照片,其超拟人数字人就可以与用户进行面对面的实时对话,口唇、表情、动作均由大模型自动生成,并能够充分匹配文本的意图。据官方介绍,本次超拟人数字人已在科大讯飞旗下的讯飞智作产品开通了内测通道。
截至2024年10月,科大讯飞已与各头部企业共建了20多个行业大模型,覆盖300+应用场景,所覆盖行业和场景数都是第一。
面向未来,刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。刘庆峰表示:坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化。