国产AI黑马——阶跃星辰携千亿参数大模型工具“跃问”强势登场,多模态测试更胜 GPT-4V 一筹,同时还推出AI角色扮演类软件冒泡鸭。这家名为阶跃星辰的AI公司由微软前高管姜大昕创办,其背后的千亿参数大模型Step-1和Step-1V锋芒毕露。
爆火的KimiChat很好用,但比起GPT4、Claude3和Gemini1.5这些多模态大模型来说毕竟没法识别图像,现在终于有很好的国产多模态大模型了。
Scaling Law 的信仰者
这家低调潜行一年的初创公司,究竟有何独特之处?阶跃星辰,顾名思义取自“阶跃函数”,其发展理念深受“Scaling Law”的影响。Scaling Law于2020年由OpenAI提出,该理论认为,随着模型规模的扩大,性能也会随之提升,并最终实现阶跃式的突破,通俗点说就是给AI堆数据,堆算力,最后力大砖飞。阶跃星辰团队坚信 Scaling Law 是通往 AGI(通用人工智能) 的关键路径,并致力于打造更大规模、更高性能的大模型。
Scaling Laws for Neural Language Models ---OpenAI
厚积薄发,一鸣惊人
成立仅一年,阶跃星辰便交出了亮眼的成绩单:
Step-1 千亿参数语言大模型: 仅用 2 个月训练完成,性能全面超越 GPT-3.5。
Step-1V 千亿参数多模态大模型: 拥有出色的图像理解、多轮指令跟随、数学、逻辑推理、文本创作等能力,在“司南”多模态模型评测榜单中位列第一,比肩 GPT-4V。
Step-1V拥有出色的图像、图表、视频理解能力,还能根据所理解的多模态信息完成内容创作、推理分析等多重任务。不仅文字输入,给它一张图片或者视频,都能精准解读内容并给出全面总结。阶跃星辰专门设置了"一图读懂"工具,只需丢入文档、图片,跃问就能生成图文并茂的信息高度总结,方便用户一览内容要点。这种功能在工作学习中无疑将提升人类的效率。
链接:stepchat.cn/textposter
Step-2 万亿参数 MoE大语音模型 (预览版): 国内首个发布的万亿参数模型,采用 MoE架构,每个 token 都能激活 2000 亿以上的参数。目前预览版仅提供API接口试用,尚未开放。
“跃问”:效率助手的多模态实力
跃问是阶跃星辰推出的首款 C 端应用,定位为个人效率助手,其强大的多模态理解能力令人印象深刻:
轻松解读复杂图表: 准确理解图表信息并进行总结。
精准识别图片内容: 识别照片中的景点,并给出出行建议。
秒懂网络热梗: 无论是谐音梗还是文化梗,都能轻松解读。
长图文一键总结: 将冗长的文件、报告等内容,自动生成重点解析的长图文。
链接:stepchat.cn/chats
“冒泡鸭”:AI 开放世界,无限可能
冒泡鸭是阶跃星辰推出的 AI 开放世界平台,用户可以与各种 AI 智能体进行互动,体验不同的剧情和游戏,甚至可以创建自己的智能体。
冒泡鸭有APP和网页端,跟全球AI应用top50中,排名第三的Character.AI一样,是一款AI角色扮演类软件。它同样可以自由设定角色剧情,跟其宣传的一样,“十亿个精彩角色,十亿种剧情世界”,每个人可以放飞思想,按自己的想法给AI设定角色,剧情,更难得的是,它还预设了角色声音,玩的时候会更有沉浸感。
链接:maopaoya.com/
对于阶跃星辰来说,训练出千亿大模型只是通往AGI的第一步。他们提出了"单模态发展→多模态融合→理解与生成统一 →世界模型→AGI"的技术路线图,下一步的目标就是实现多模态理解与生成的完全统一。届时,大模型将摆脱孤芯模态的瓶颈,迈向真正的通用智能。
我们欣慰的看到阶跃星辰正在走OpenAI的路,向AGI的目标稳步迈进,希望他早日追上并领先。未来,阶跃星辰将如何突破,让我们拭目以待。
好巧不巧,老马开源不久