医疗保健人工智能公司约翰·斯诺实验室(John Snow Labs)宣布,在生成式人工智能实验室(GenAI Lab)发布了自动化负责任的人工智能测试功能。这是首个用于测试和评估自定义语言模型的安全性和有效性的无代码工具。它使非技术领域的专家能够定义、运行和共享AI模型偏差、公平性、稳健性和准确性的测试套件。
该功能基于John Snow Labs开源库LangTest,其中包括100多种测试类型,用于不同领域负责任的人工智能,从偏见和安全性到毒性和政治倾向。LangTest使用GenAI来自动生成测试用例,从而在几分钟内生成一组全面的测试,而不是以往的几周时间。LangTest是专门为测试自定义AI模型而创建的,它考虑了那些未被通用基准和排行榜覆盖的模型。
美国最近的立法使得这种测试对于希望发布新的基于人工智能的产品和服务的公司至关重要,包括:
ACA第1557条最终规则于2024年6月生效,禁止在医疗人工智能算法中基于种族、肤色、国籍、性别、年龄或残疾的歧视。
关于医疗决策支持系统透明度的HTI-1最终规则,要求公司展示他们如何训练和测试他们的模型。
美国律师协会指南要求在部署人工智能之前进行全面的内部和第三方审计,以应对针对提供自动匹配职位描述和候选人简历模型的公司的诉讼。
对大型语言模型(LLM)的全面测试解决方案的需求是迫切的。然而,许多领域专家缺乏技术专长来做到这一点。同样,许多数据科学家缺乏专业知识来构建全面的、特定于行业和任务的模型。生成式人工智能实验室使领域专家能够创建、编辑和理解模型是如何被测试的,而不需要数据科学家。该工具还包含了最佳实践,例如版本控制、共享,以及为每个新模型自动执行测试。
“长期以来,人工智能模型应该如何测试和它们经常如何测试之间一直存在差距。“John Snow Labs首席技术官David Talby表示:“新的生成式人工智能实验室使团队更容易提供安全、有效、公平和透明的人工智能模型。”
该软件现在既可用于内部部署,也可用于主要的公共云市场。
关于约翰·斯诺实验室
医疗保健人工智能公司John Snow Labs提供最先进的软件、模型和数据,帮助医疗保健和生命科学组织充分利用人工智能。作为Spark NLP、Healthcare NLP、Healthcare GPT LLM、Generative AI Lab No-Code Platform和医疗聊天机器人的开发者,John Snow Labs屡获殊荣的医疗人工智能软件为世界领先的制药公司、学术医疗中心和健康技术公司提供了支持。