人工智能开发出的模型可以预测人生事件。来自丹麦科技大学、哥本哈根大学、美国东北大学和IT大学的一个研究项目表明,如果使用大量关于人们生活的数据,并训练所谓的“Transformer模型”(如ChatGPT),这些模型可以系统地组织数据并预测一个人的生活事件,甚至估计其死亡时间。
在《自然计算科学》杂志上发表的新科学文章《使用生活事件序列预测人类生活》中,研究人员分析了600万丹麦人的健康数据和劳动市场附着情况,创建了一个名为life2vec的模型。
模型在初期训练阶段(即学习数据中的模式)之后,被证明比其他先进的神经网络表现更出色(见事实框),并能高精度预测个性和死亡时间等结果。
“我们使用这个模型来解决一个基本问题:基于过去的条件和事件,我们能在多大程度上预测你未来的事件?对我们科学上来说激动人心的不仅是预测本身,而是数据的哪些方面使得模型能提供如此精确的答案,” 丹麦科技大学教授、文章第一作者Sune Lehmann说。
1.死亡时间的预测Life2vec的预测是对一般问题的回答,比如“四年内死亡”?
当研究人员分析模型的响应时,结果与社会科学领域现有的发现一致;例如,在所有其他条件相同的情况下,处于领导位置或高收入的个体更有可能存活,而男性、熟练工或有精神诊断的个体则与较高的死亡风险相关。
Life2vec使用大型向量系统对数据进行编码,这是一种组织不同数据的数学结构。
模型决定了如何在出生时间、学校教育、工资、住房和健康等方面放置数据。
“令人兴奋的是,将人的生活视为一长串事件,就像语言中的句子由一系列单词组成。通常这是AI中Transformer模型所用的任务类型,但在我们的实验中,我们用它们来分析我们所说的生活序列,即人生中发生的事件,”Sune Lehmann说。
2.提出伦理问题文章背后的研究人员指出,围绕life2vec模型的伦理问题,如保护敏感数据、隐私和数据中的偏见。
在模型可用于评估个人患病风险或其他可预防的生活事件之前,必须更深入地了解这些挑战。
“模型提出了需要在政治上讨论和解决的重要积极和消极观点。类似的技术已被今日科技公司用于预测生活事件和人类行为,例如,他们追踪我们在社交网络上的行为,极其精确地对我们进行画像,并利用这些画像来预测我们的行为并影响我们。这种讨论需要成为民主对话的一部分,这样我们才能考虑技术将我们带向何方,以及这是否是我们想要的发展方向,”Sune Lehmann说。
根据研究人员的说法,下一步将是纳入其他类型的信息,如文本和图像或我们的社会联系信息。
这种数据的使用开启了社会和健康科学之间全新的互动。
研究项目《使用生活事件序列预测人类生活》的研究项目基于劳动市场数据和国家患者注册处(LPR)及丹麦统计局的数据。
数据集包括所有600万丹麦人,并包含收入、工资、奖学金、工作类型、行业、社会福利等信息。
健康数据集包括对医疗专业人员或医院的就诊记录、诊断、病人类型和紧急程度。
数据集跨越2008年至2020年,但在多个分析中,研究人员聚焦于2008年至2016年期间和一个年龄限制的个体子集。
Transformer模型Transformer模型是一种AI、深度学习数据架构,用于学习语言和其他任务。
这些模型可以被训练来理解和生成语言。
Transformer模型被设计得比以前的模型更快、更高效,常用于在大型数据集上训练大型语言模型。
神经网络神经网络是一种受人类和动物的大脑和神经系统启发的计算机模型。有许多不同类型的神经网络(例如Transformer模型)。像大脑一样,神经网络由人工神经元组成。这些神经元相互连接并可以互相发送信号。每个神经元接收来自其他神经元的输入,然后计算输出传递给其他神经元。神经网络可以通过在大量数据上训练来学
习解决任务。神经网络依赖于训练数据来学习,并随着时间提高其精确度。但一旦这些学习算法为准确性进行了微调,它们就成为计算机科学和人工智能中的强大工具,能够高速地对数据进行分类和分组。其中最知名的神经网络之一是谷歌的搜索算法。