LexisNexis利用GenAI加速商业研究

LexisNexis表示，其新的生成式人工智能(GenAI)解决方案将为使用该公司庞大的新闻、法律文件和其他商业信息库进行研究的客户节省数小时的时间。这款名为Nexis+ AI的新产品以多种方式利用大型语言模型(LLM)，从大量可用数据中挖掘出洞察力的“金矿”。

自1970年成立以来，LexisNexis一直是数千家公司、律师事务所和其他实体企业值得信赖的信息来源。这家位于纽约的分析公司如今提供来自超过20,000个授权来源的精心设计的信息流，包括美联社，Gannett, McClatchy, Benzinga, FiscalNote等。

值得信赖的搜索引擎仍然是客户与LexisNexis的信息宝库互动的主要手段。除了基本的关键词搜索，LexisNexis早就采用了神经搜索技术，使用向量嵌入来帮助用户找到他们想要的信息。它还在其他业务领域采用了GenAI。

但即使有了神经搜索，浩瀚的可用信息仍然是庞大的。这就是新的Nexus+AI产品的用武之地。

LexisNexis全球通讯解决方案产品副总裁Dani McCormick表示:“我们正在努力解决的问题是……有大量数据。”“有很多东西你可以看，但没有足够的时间，有效地完成所有的事情。”

McCormick表示，记者或企业研究人员可能需要花费数小时来梳理LexisNexis提供的有关特定主题的所有数据来源，并完成一项研究项目。需要做到彻底，得到准确的答案，这意味着受监管或其他严格要求的行业(如调查性新闻)的客户不能走捷径。这使得阅读、记笔记、复制链接、综合、总结，直到最后写一份报告的时间长得令人痛苦。

Nexis+AI使用LLM来加速研究和报告撰写任务

McCormick展示了Nexus+ AI的工作原理。研究人员以标准的方式开始：通过在搜索栏中输入一个术语。一旦研究人员开始阅读各种报纸文章、年度报告和搜索引擎提供的其他信息来源，Nexus+ AI的力量就开始显现出来。

Nexus+ AI以多种方式使用GenAI技术来加速研究和报告撰写过程。首先，该软件使用LLM来提供给定报纸文章或其他文件的摘要，这告诉研究人员这些信息是否可能与任务相关。

当研究人员浏览故事或文档时，另一个LLM使研究人员能够对故事或文档中的信息进行交互式问答会话，这是产品使用GenAI的第二种方式。

最后，当研究人员发现一条相关信息时，可以通过使用鼠标和键盘突出显示文本来获取信息的“片段”。这些片段以及描述其来源的元数据随后由LexisNexis存储在一个“集线器（hub）”中。该公司表示，研究人员可以在该中心加载最多2000个字符的片段。

研究完成后，Nexus+ AI将在hub中总结各种片段，并提供一份报告草稿，并附有原始材料的链接，这是LLM的第三个用途。

McCormick说，当你把所有这些放在一起时，这大大简化了对LexisNexis中可操作信息的访问。“我们(通过Nexus+ AI)想要做的是让你毫不费力地在这些数据中找到金子。这让人们能够超级快速地进入文档。根据报告的大小，从45分钟到两到三个小时不等，它可以将工作时间缩短到15分钟左右。”

LexisNexis全球Nexis解决方案首席技术官Snehit Cherian表示，LexisNexis使用了几个LLM来构建Nexus+ AI，包括在AWS Bedrock上运行的Anthropic Claude和在微软Azure上运行的OpenAI的GPT模型。他说，该公司使用检索增强生成(RAG)技术来提高LLM生成信息的准确性，并建立了一个单独的框架来对抗幻觉。

Cherian说，LexisNexis与其出版商和内容提供商密切合作，以确保他们的知识产权得到保护。除了知识产权，出版商还特别关注信息使用的环境。他说，Nexus+ AI的功能是自动将元数据附加到片段上，这反过来又提供了LLM生成的摘要中引用的信息源的链接，这确实引起了出版商的共鸣。

“我们从2023年中期开始与他们分享这个框架，”他说。“我们一次只与一家发行商合作，包括他们的法律团队、授权团队和技术团队。”

McCormick表示，这不会是LexisNexis推出的最后一款GenAI产品，该公司已经制定了使用GenAI技术的坚实路线图。“这是真正令人兴奋的产品之旅的开始，”她说。“我们对这款产品有一个庞大的开发路线图。即使今天的功能，也可以节省大量的时间。”

幸福双城资讯网

拥抱科技有未来