GPT-4o之后,大模型承载的聊天机器人不仅能与人类对答如流,机器人之间在人的引导下都能互相聊天了。人类也对和机器聊天提出了更高的要求,除了“我想知道的你都懂”之外,还希望它们在语音、语气上更像人。
这似乎在要求人工智能输出情感和情绪,就像科幻电影《Her》里和主人公西奥多对话的人工智能系统OS1一样。
有一个大模型做的正是这件事。前不久,Hume AI 宣布推出首个基于大语言模型的语音对话式聊天助手EmpatHic Voice Interface(EVI),主打一个“有情商”。EVI将大语言模型(LLMs)与表达测量体系集成为“移情大语言模型(eLLM)”,号称要为人工智能赋予“情感”。
在聊天的基础上,EVI将应用场景放在了情感交流、心理治疗、客户服务、教育教学等需要强沟通能力的垂直领域,相关行业的开发者可以使用Hume AI的API调用EVI,形成各种垂直场景的AI助手。不过,从实际体验看,开发者们要做的工作还很多。
EVI如何读懂人心?EVI的创造者Hume AI 是一家位于美国纽约的人工智能初创公司,创始人也很有来头,由前Google DeepMind研究员Alan Cowen创立并担任CEO。
这家初创公司研发了eLLM大模型,试图拓展人工智能的情感边界。eLLM 是EVI的底层模型,被中译者起了一个有趣的名字——移情大语言模型,它结合大型语言模型和表达测量体系,让 AI 捕捉说话者的语气细节来推理情绪,进而做出回应。
eLLM能够识别出人的53种不同情绪,比如钦佩、崇拜、讽刺、羞耻等等,通过对人类情绪的检测识别,eLLM 号称能判断人的心理状态,包括自信水平、健康水平,甚至还可以充当测谎仪。
基于eLLM,Hume AI直接开发了一款AI助手EmpatHic Voice Interface(EVI),它能提供拟人化聊天服务,通过语音交流分析对话者的情绪状况。与ChanGPT、Gemini等知识型聊天机器人的界面不同,在EVI会把对方在交流中流露的各种情绪状态用数值标识在对话界面上,这个数字还会不断在对话中改变。
我们实际测试了一下,在和EVI 说“你好”后,它随即标注了对话者此时此刻的心情值——0.247的兴奋、0.152的冷静以及0.07的无聊。当它回应我们的同时也标注了它的心情——0.313的激动,0.292的惊喜(积极)以及0.276的兴趣。
EVI聊天界面会提供对话者情绪值
对话界面一旁的数值界面据悉是在展示用户实时的其他情绪,不同情绪用上了不一样的颜色:蓝色代表冷静,黄色是激动,橙色代表开心,灰色则意味着无聊……
尽管给情绪做了量表,但 EVI对情绪处理的能力并不理想。比如,当我明确表示“不开心”想要寻求安慰或建议时,EVI的回答基本上都是片儿汤话;我想要找他做个心理疏导,它的建议是“求助身边的朋友”;当我想要让它陪我联系英语时,它表现出兴奋,但一轮对话后它就着急“下课”了。
应用有场景 能力待提升从和EVI的对话体验看,号称能为人工智能植入“情商”的eLLM目前只是个通用的“毛坯房”,还需要各种利用eLLM的开发者们将EVI置入其他场景,进行“精装修”般的二次开发。
Hume AI的CEO兼首席科学家Alan Cowen就表示,EVI的主要用途并不是简单的聊天,而是以API的方式提供服务。通过EVI的API,开发者可以训练自己的Hume AI模型,为此,HumeAI还提供了表达测量系统的API(Expression Measurement API)。
通过聊天页面右上角的Start Building入口,开发者可以通过语音分析、文件分析、摄像头以及文字输入模式这些方式与EVI做交互测试,然后利用现成的模型或构建新模型通过API接口用到自己的产品里。
Hume AI也在不断更新功能方便开发者使用。5月15日,EVI 加加入了本机网络搜索的语音 API,并推出了交互式AI播客Chatter;5月18日,EVI增加了处理呼入电话的功能。
具体来说,开发人员可以使用Hume AI的API构建个人AI助手,将之用在情感交流、心理治疗、客户服务、教育教学等垂直领域。
不过从EVI的基础能力看,各场景开发者们后续要做的工作还很多。因为体验EVI后不难发现,它似乎还没有做到ChatGPT的“长记忆”能力,即上下文的联系。当用户结束与EVI的对话或在对话中岔开聊别的话题后,想要回到之前的交流话题中,就要从头开始了。
短时间内,EVI更倾向一问一答的对话,比如,在客户服务场景里针对产品或服务的某个问题与EVI交流。
如果放在情绪解决层面,一问一答的产品倒也存在,比如名为 “哄哄模拟器”国产AI应用里就有很多“哄女友”的场景解决方案,能提供各种“让女友消气”的方法指导,这类应用似乎也可以加上EVI的情绪分析。不过,AI套路能否得人心就见仁见智了。
在教育、心理治疗等场景中,EVI就相对“幼稚”了,因为一旦重启HumeAI,你就要重新诉说一遍你的烦恼,或者从头再提出你的学习需求,效率上就打了折扣。
尽管仍有不足,但Hume AI的eLLM 确实在AI智商之外找到了一个新的AI赛道,即AI情商,这也为资本流向提供了一个新入口。目前,Hume AI 已经获得了 5000万美元的B轮融资,由 EQT Ventures领投,跟投方里还出现了LG Technology Ventures。