LexisNexis表示,其新的生成式人工智能(GenAI)解决方案将为使用该公司庞大的新闻、法律文件和其他商业信息库进行研究的客户节省数小时的时间。这款名为Nexis+ AI的新产品以多种方式利用大型语言模型(LLM),从大量可用数据中挖掘出洞察力的“金矿”。
自1970年成立以来,LexisNexis一直是数千家公司、律师事务所和其他实体企业值得信赖的信息来源。这家位于纽约的分析公司如今提供来自超过20,000个授权来源的精心设计的信息流,包括美联社,Gannett, McClatchy, Benzinga, FiscalNote等。
值得信赖的搜索引擎仍然是客户与LexisNexis的信息宝库互动的主要手段。除了基本的关键词搜索,LexisNexis早就采用了神经搜索技术,使用向量嵌入来帮助用户找到他们想要的信息。它还在其他业务领域采用了GenAI。
但即使有了神经搜索,浩瀚的可用信息仍然是庞大的。这就是新的Nexus+AI产品的用武之地。
LexisNexis全球通讯解决方案产品副总裁Dani McCormick表示:“我们正在努力解决的问题是……有大量数据。”“有很多东西你可以看,但没有足够的时间,有效地完成所有的事情。”
McCormick表示,记者或企业研究人员可能需要花费数小时来梳理LexisNexis提供的有关特定主题的所有数据来源,并完成一项研究项目。需要做到彻底,得到准确的答案,这意味着受监管或其他严格要求的行业(如调查性新闻)的客户不能走捷径。这使得阅读、记笔记、复制链接、综合、总结,直到最后写一份报告的时间长得令人痛苦。
Nexis+AI使用LLM来加速研究和报告撰写任务
McCormick展示了Nexus+ AI的工作原理。研究人员以标准的方式开始:通过在搜索栏中输入一个术语。一旦研究人员开始阅读各种报纸文章、年度报告和搜索引擎提供的其他信息来源,Nexus+ AI的力量就开始显现出来。
Nexus+ AI以多种方式使用GenAI技术来加速研究和报告撰写过程。首先,该软件使用LLM来提供给定报纸文章或其他文件的摘要,这告诉研究人员这些信息是否可能与任务相关。
当研究人员浏览故事或文档时,另一个LLM使研究人员能够对故事或文档中的信息进行交互式问答会话,这是产品使用GenAI的第二种方式。
最后,当研究人员发现一条相关信息时,可以通过使用鼠标和键盘突出显示文本来获取信息的“片段”。这些片段以及描述其来源的元数据随后由LexisNexis存储在一个“集线器(hub)”中。该公司表示,研究人员可以在该中心加载最多2000个字符的片段。
研究完成后,Nexus+ AI将在hub中总结各种片段,并提供一份报告草稿,并附有原始材料的链接,这是LLM的第三个用途。
McCormick说,当你把所有这些放在一起时,这大大简化了对LexisNexis中可操作信息的访问。“我们(通过Nexus+ AI)想要做的是让你毫不费力地在这些数据中找到金子。这让人们能够超级快速地进入文档。根据报告的大小,从45分钟到两到三个小时不等,它可以将工作时间缩短到15分钟左右。”
LexisNexis全球Nexis解决方案首席技术官Snehit Cherian表示,LexisNexis使用了几个LLM来构建Nexus+ AI,包括在AWS Bedrock上运行的Anthropic Claude和在微软Azure上运行的OpenAI的GPT模型。他说,该公司使用检索增强生成(RAG)技术来提高LLM生成信息的准确性,并建立了一个单独的框架来对抗幻觉。
Cherian说,LexisNexis与其出版商和内容提供商密切合作,以确保他们的知识产权得到保护。除了知识产权,出版商还特别关注信息使用的环境。他说,Nexus+ AI的功能是自动将元数据附加到片段上,这反过来又提供了LLM生成的摘要中引用的信息源的链接,这确实引起了出版商的共鸣。
“我们从2023年中期开始与他们分享这个框架,”他说。“我们一次只与一家发行商合作,包括他们的法律团队、授权团队和技术团队。”
McCormick表示,这不会是LexisNexis推出的最后一款GenAI产品,该公司已经制定了使用GenAI技术的坚实路线图。“这是真正令人兴奋的产品之旅的开始,”她说。“我们对这款产品有一个庞大的开发路线图。即使今天的功能,也可以节省大量的时间。”