AGI通用知识模型和认知架构：打造一个能够思考、学习和创造的AI

近年来，人类开发的智能信息系统有了快速和多方面的发展。这些发展的功能的较远的推断将是创造出一个与人类智能相当的通用人工智能（AGI）。智能信息系统的主要能力，比如感知能力、注意力机制、行为选择、学习、记忆、推理以及它们的实际应用，都取决于系统中使用的认知架构。如果我们考虑基本的运行原则，那么认知架构就与专家系统相反。专家系统在一个狭义的背景下，为它们所拥有知识的活动领域提供智能任务的解决方案，相反认知架构的目标是提供广泛的覆盖范围，解决不同领域的多样化的任务。更重要的是，认知架构在系统层面提供智能行为，而不是在为解决专门任务而设计的单个组件的方法层面。

1月11日发表的论文《A Universal Knowledge Model and Cognitive Architecture for Prototyping AGI》是一篇关于开发新的认知架构的研究报告，主要介绍了一种基于通用知识模型的认知架构的设计，该认知架构可以用于开发 AGI 原型。论文的作者是来自俄罗斯的一些计算机科学和人工智能的专家和学者Artem Sukhobokov, Evgeny Belousov, Danila Gromozdov, Anna Zenger, Ilya Popov，他们在这一领域有着丰富的研究经验和成果。他们的研究动机是为了解决现有的认知架构在知识表示和功能模块方面的不足和局限，提出一种更全面和统一的认知架构的设计，涵盖了人类所有的认知活动，以及一种更灵活和通用的知识表示方法，可以兼容和整合各种知识表示方式。

论文的主要内容可以概括为以下三个创新点：

1）论文对现有的 42 种认知架构进行了分析和比较，发现它们都只包含了部分的功能模块，或者没有将它们有效地集成和协调。论文根据人类的认知活动，提出了一套涵盖17个功能模块的认知架构，包括知识库、意识、潜意识、与外部环境交互的模块、目标管理模块、情感管理模块、社会交互模块、反思模块、伦理评价模块、世界观模块、学习模块、监控模块、任务设定和解决模块、自组织和元学习模块等。这些模块可以实现 AGI 的各种能力和功能，如感知、记忆、推理、规划、执行、学习、交流、情感、伦理、创造等。这是一种全面和统一的认知架构的设计，涵盖了人类所有的认知活动，以及考虑了各个功能模块之间的交互和协作。

2）论文提出了一种通用的知识表示方法，可以将各种非形式化、部分形式化和完全形式化的知识表示方式结合在一个知识库中，如自然语言文本、图像、音频和视频记录、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等。为了结合和结构化各种知识片段，论文使用了建筑图模型，它是基于注释元图的一种发展，可以在知识片段之间添加各种关系和属性，形成一个多层次、多维度、多形式的知识网络。这是一种灵活和通用的知识表示方法，可以兼容和整合各种知识表示方式，以及支持知识的获取、存储、检索、更新、推理、学习等操作。

3）论文详细介绍了认知架构中的五个功能模块：意识、潜意识、世界观、反思和伦理评价，阐述了它们的作用和特点，以及与其他模块的交互方式。这些模块都是 AGI 的重要组成部分，它们可以使 AGI 具有自主意识、快速反应、多样视角、自我调节和道德判断等能力。这是一种对这些功能模块的详细和深入的分析和描述，以及考虑了它们与其他模块的协同和协调。

01 认知架构的设计

认知架构是一个智能系统的组织和结构，它决定了智能系统的能力、行为和性能。认知架构的设计是人工智能研究的一个重要方向，尤其是对于通用人工智能（AGI）的实现，认知架构的设计是一个关键的问题。目前已经有许多不同的认知架构被提出和开发，如SOAR、ACT-R、CLARION、LIDA、OpenCog、NARS、MicroPsi、Sigma等，它们各有各的优点和缺点，但都没有达到真正的 AGI 的水平。

论文的作者对现有的 42 种认知架构进行了分析和比较，发现它们都只包含了部分的功能模块，或者没有将它们有效地集成和协调。例如，SOAR 是一种基于产生式规则的认知架构，它具有强大的推理和规划能力，但缺乏感知和学习能力；ACT-R 是一种基于认知心理学的认知架构，它具有丰富的知识表示和学习能力，但缺乏情感和社会能力；CLARION 是一种基于双过程理论的认知架构，它具有意识和潜意识的协调能力，但缺乏反思和伦理能力；LIDA 是一种基于全局工作空间理论的认知架构，它具有感知、注意、记忆、学习、行为等多个功能模块，但缺乏知识的整合和转换能力；OpenCog 是一种基于超图的认知架构，它具有通用的知识表示和多种学习算法，但缺乏对知识的评价和筛选能力；NARS 是一种基于非单调逻辑的认知架构，它具有处理不确定性和不完备性的知识的能力，但缺乏对多种知识表示方式的兼容和整合能力；MicroPsi 是一种基于动机和情感的认知架构，它具有模拟人类的动机和情感的能力，但缺乏对复杂和抽象的知识的处理能力；Sigma 是一种基于图形处理器的认知架构，它具有高效的计算和并行的能力，但缺乏对不确定性和不完备性的知识的处理能力。这些认知架构都只能实现部分的认知功能，或者没有将它们有效地集成和协调，导致了智能系统的局限性和脆弱性。

论文的作者根据人类的认知活动，提出了一套涵盖17个功能模块的认知架构，包括知识库、意识、潜意识、与外部环境交互的模块、目标管理模块、情感管理模块、社会交互模块、反思模块、伦理评价模块、世界观模块、学习模块、监控模块、任务设定和解决模块、自组织和元学习模块等。这些模块可以实现 AGI 的各种能力和功能，如感知、记忆、推理、规划、执行、学习、交流、情感、伦理、创造等。这是一种全面和统一的认知架构的设计，涵盖了人类所有的认知活动，以及考虑了各个功能模块之间的交互和协作。论文的作者认为，这种认知架构可以解决现有的认知架构的不足和局限，提高智能系统的性能和可靠性，以及为 AGI 的实现提供一个可行的框架和平台。

论文的作者还给出了这种认知架构的一个示意图，如下所示：

图1：可用于开发AGI原型的认知架构图。

从这个图中，我们可以看到，这种认知架构的核心是一个知识库，它是一个由多种知识表示方式组成的知识网络，如文本、图像、音频、视频、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等。这些知识表示方式可以相互转换和整合，形成一个多层次、多维度、多形式的知识网络。知识库可以与其他功能模块进行信息的交换和协作，实现知识的获取、存储、检索、更新、推理、学习等操作。

知识库的上层是一个意识模块，它是一个控制系统，负责智能体在复杂空间中的移动和行为，需要具备自知、自监控、自我意识和自我通知的能力，以及在多维虚拟空间中进行并行控制过程的能力。意识模块的核心是一个多维虚拟空间，它是一个由多个维度组成的空间，每个维度代表了一个不同的知识表示方式，如文本、图像、音频、视频、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等。意识模块可以在这个空间中进行知识的转换和整合，以及控制智能体的行为和目标。

知识库的下层是一个潜意识模块，它是一个存储和激活现成的模型和算法的系统，可以快速应对相应的情境，它与意识模块有区别和联系。潜意识模块的核心是一个模型和算法库，它是一个由多个模型和算法组成的库，每个模型和算法都是针对某个特定的情境或任务的，如面部识别、语音识别、自然语言理解、图像生成、音乐生成、游戏玩法、数学计算、逻辑推理、情感分析、社会交往等。潜意识模块可以在遇到相应的情境或任务时，自动或被动地激活相应的模型或算法，以实现快速的反应和行为。

知识库的左侧是一个与外部环境交互的模块，它是一个负责感知、注意、行为和交流的系统，可以与外部的物理世界和社会世界进行信息的输入和输出，以及与其他智能体进行协作和竞争。与外部环境交互的模块包括感知模块、注意模块、行为模块和交流模块，它们分别负责处理外部的视觉、听觉、触觉、嗅觉、味觉等信息，选择和过滤感兴趣的信息，生成和执行相应的行为，以及使用自然语言或其他符号系统与其他智能体进行交流。

知识库的右侧是一个目标管理模块，它是一个负责设定、选择、执行和评价智能体的目标的系统，可以根据智能体的动机、情感、世界观、伦理等因素来决定智能体的目标和策略，以及根据智能体的反思、学习、监控等能力来调整和优化智能体的目标和策略。目标管理模块包括动机模块、情感模块、世界观模块、伦理评价模块、反思模块、学习模块、监控模块、任务设定和解决模块、自组织和元学习模块，它们分别负责生成和维持智能体的动机和情感，存储和修改智能体的世界观和存在目标，生成和记录事件和行为的伦理评价，构建和使用智能体的自我模型，获取和更新智能体的知识和能力，检查和改进智能体的状态和性能，设定和解决智能体的任务和问题，以及实现智能体的自组织和元学习。

在作者对认知架构的设计的介绍和分析中，我们可以看到，这种认知架构的设计是一种全面和统一的设计，涵盖了人类所有的认知活动，以及考虑了各个功能模块之间的交互和协作。论文的作者认为，这种认知架构的设计可以解决现有的认知架构的不足和局限，提高智能系统的性能和可靠性，以及为 AGI 的实现提供一个可行的框架。

02 知识表示的方法

知识表示是将人类的知识转化为计算机可以理解和处理的形式的方法，它是人工智能研究的一个基础和关键的问题。知识表示的方法有很多种，如自然语言文本、图像、音频和视频记录、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等，它们各有各的优点和缺点，但都没有达到真正的通用和灵活的水平。

论文的作者提出了一种通用的知识表示方法，可以将各种非形式化、部分形式化和完全形式化的知识表示方式结合在一个知识库中，如自然语言文本、图像、音频和视频记录、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等。为了结合和结构化各种知识片段，论文使用了建筑图模型，它是基于注释元图的一种发展，可以在知识片段之间添加各种关系和属性，形成一个多层次、多维度、多形式的知识网络。这是一种灵活和通用的知识表示方法，可以兼容和整合各种知识表示方式，以及支持知识的获取、存储、检索、更新、推理、学习等操作。

论文的作者还给出了这种知识表示方法的一个示例，如下所示：

图2

从这个图中，我们可以看到，这种知识表示方法可以将不同的知识表示方式，如文本、图像、音频、视频、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等，通过建筑图模型的关系和属性，连接在一个知识库中，形成一个多层次、多维度、多形式的知识网络。这种知识表示方法可以实现知识的转换和整合，例如，可以将文本转换为图像，或者将图像转换为文本，或者将文本和图像整合在一起，形成一个更丰富的知识片段。这种知识表示方法也可以实现知识的操作，例如，可以从知识库中检索和更新知识，或者对知识库中的知识进行推理和学习，或者根据知识库中的知识生成新的知识。

这就是论文的作者对知识表示的方法的介绍和分析，可以看到这种知识表示的方法是一种通用和灵活的方法，可以兼容和整合各种知识表示方式，以及支持知识的获取、存储、检索、更新、推理、学习等操作。论文的作者认为，这种知识表示的方法可以解决现有的知识表示方法的不足和局限，提高知识的质量和效率，以及为 AGI 的实现提供一个强大的知识基础。

03 功能模块的分析

功能模块是认知架构中的一个子系统，它负责实现某一类或某几类的认知功能，如感知、记忆、推理、规划、执行、学习、交流、情感、伦理、创造等。功能模块的设计是认知架构的一个重要方面，它决定了智能系统的能力和性能。

功能模块的设计需要考虑以下几个问题：

功能模块的数量和种类应该根据人类的认知活动来确定，既不能过多，导致冗余和复杂，也不能过少，导致缺失和不足。功能模块的数量和种类应该能够覆盖人类所有的认知活动，以及考虑到不同的认知活动之间的关联和影响。

功能模块的作用和特点应该根据人类的认知机制和原理来确定，既不能过于简化，导致失真和不准确，也不能过于复杂，导致难以实现和维护。功能模块的作用和特点应该能够反映人类的认知特征和优势，以及考虑到不同的认知特征和优势之间的平衡和协调。

功能模块的交互和协作应该根据人类的认知过程和结果来确定，既不能过于孤立，导致隔离和无效，也不能过于混乱，导致冲突和错误。功能模块的交互和协作应该能够实现人类的认知目标和任务，以及考虑到不同的认知目标和任务之间的优先和顺序。

论文的作者在设计认知架构时，对功能模块的数量和种类、作用和特点、交互和协作都进行了详细的分析和描述，尤其是对认知架构中的五个功能模块：意识、潜意识、世界观、反思和伦理评价，进行了深入的探讨和阐述。这些功能模块都是 AGI 的重要组成部分，它们可以使 AGI 具有自主意识、快速反应、多样视角、自我调节和道德判断等能力。下面，我们将对这五个功能模块进行更详细的解读和分析：

意识模块

意识模块是一个控制系统，负责智能体在复杂空间中的移动和行为，需要具备自知、自监控、自我意识和自我通知的能力，以及在多维虚拟空间中进行并行控制过程的能力。意识模块的核心是一个多维虚拟空间，它是一个由多个维度组成的空间，每个维度代表了一个不同的知识表示方式，如文本、图像、音频、视频、图、算法、数据库、神经网络、知识图、本体、框架、实体-属性-关系模型、产生式系统、谓词逻辑模型、概念模型等。意识模块可以在这个空间中进行知识的转换和整合，以及控制智能体的行为和目标。

潜意识模块

潜意识模块是一个存储和激活现成的模型和算法的系统，可以快速应对相应的情境，它与意识模块有区别和联系。潜意识模块可以从知识库中获取和存储知识，也可以与其他模块进行信息交换和协作。潜意识模块的核心是一个模型和算法库，它是一个由多个模型和算法组成的库，每个模型和算法都是针对某个特定的情境或任务的，如面部识别、语音识别、自然语言理解、图像生成、音乐生成、游戏玩法、数学计算、逻辑推理、情感分析、社会交往等。潜意识模块可以在遇到相应的情境或任务时，自动或被动地激活相应的模型或算法，以实现快速的反应和行为。潜意识模块的特点是，它可以利用现成的模型和算法，以实现高效和稳定的性能，但缺乏创新和灵活的能力。

世界观模块

世界观模块是一个存储和修改智能体的世界观和存在目标的系统，它可以包括不同的世界观，如科学的、宗教的、神话的等，并用它们来获取和比较新的知识，以及处理知识的矛盾。世界观模块可以从知识库中获取和存储知识，也可以与其他模块进行信息交换和协作。世界观模块的核心是一个世界观和目标库，它是一个由多个世界观和目标组成的库，每个世界观和目标都是智能体对自身和外部世界的一种认识和价值取向，如科学的世界观是基于事实和逻辑的，宗教的世界观是基于信仰和道德的，神话的世界观是基于想象和故事的，存在的目标是智能体的生存和发展的动力和方向，如探索、学习、创造、享受、帮助等。世界观模块可以在获取和比较新的知识时，使用不同的世界观来评价和筛选知识，以及在处理知识的矛盾时，使用不同的世界观来调和和解决矛盾。世界观模块的特点是，它可以拥有和使用多种世界观，以实现多样和广泛的知识获取和比较，但也可能导致世界观的混乱和冲突。

反思模块

反思模块是一个构建智能体自身模型的系统，可以从不同的角度和层次来反映智能体的各个方面，如活动、计划、知识、外貌等，这些模型可以用于自我评估和调整。反思模块可以从知识库中获取和存储知识，也可以与其他模块进行信息交换和协作。反思模块的核心是一个自我模型库，它是一个由多个自我模型组成的库，每个自我模型都是智能体对自身的一种描述和理解，如活动模型是智能体对自身的行为和过程的描述，计划模型是智能体对自身的目标和策略的描述，知识模型是智能体对自身的知识和能力的描述，外貌模型是智能体对自身的形象和特征的描述等。反思模块可以在进行自我评估和调整时，使用不同的自我模型来检查和改进自身的状态和性能，以及在与其他智能体交互时，使用不同的自我模型来展示和沟通自身的信息和意图。反思模块的特点是，它可以构建和使用多种自我模型，以实现自我认识和自我改进，但也可能导致自我模型的不一致和不准确。

伦理评价模块

伦理评价模块是一个生成事件和行为的伦理评价的系统，可以根据知识库中的伦理原则来鼓励或阻止某些行为，以及对已发生的行为进行评价和记录。伦理评价模块可以从知识库中获取和存储知识，也可以与其他模块进行信息交换和协作。伦理评价模块的核心是一个伦理原则和评价库，它是一个由多个伦理原则和评价组成的库，每个伦理原则和评价都是智能体对事件和行为的一种价值判断和规范，如利他主义是一种认为应该为他人的利益而行动的伦理原则，正义是一种认为应该公平地对待所有人的伦理原则，善恶是一种认为某些行为是好的或坏的的伦理评价，责任是一种认为某些行为是应该的或不应该的的伦理评价等。伦理评价模块可以在进行事件和行为的选择和执行时，使用不同的伦理原则来指导和约束行为，以及在进行事件和行为的回顾和总结时，使用不同的伦理评价来评价和记录行为的结果和影响。伦理评价模块的特点是，它可以生成和使用多种伦理原则和评价，以实现事件和行为的合理和道德的选择和执行，但也可能导致伦理原则和评价的冲突和矛盾。

参考资料：https://arxiv.org/abs/2401.06256

噬元兽（FlerkenS）是一个去中心化的个人AI数字价值容器，同时也是数字经济的新型资产捕捉器和转化器，用数据飞轮为用户提供无边界的数字化、智能化和资产化服务。

噬元兽(FlerkenS)构建AI市场、AI发布器和一个在通用人工智能（AGI）上建设可扩展的系统，AI-DSL让不同类型和领域的AI应用和服务可以相互协作和交互，通过RAG向量数据库（Personal Vector Database）+ Langchain技术方案（Langchain Technology Solution）+大模型的技术实现路径，让用户获得个性化的AI服务，在分布式的网络环境里与AI技术下的服务商实现点到点的连接，建设一个智能体和经济体结合的数智化整体。

波动世界（PoppleWorld)是噬元兽平台的一款AI应用，采用AI技术帮助用户进行情绪管理的工具和传递情绪价值的社交产品，采用Web3分布式技术建设一套采集用户情绪数据并通过TOKEN激励聚合形成情感垂直领域的RAG向量数据库，并以此训练一个专门解决用户情绪管理的大模型，结合Agents技术形成情感类AI智慧体。在产品里植入协助用户之间深度交互提供情绪价值的社交元素，根据用户的更深层化的需求处理准确洞察匹配需求，帮助用户做有信心的购买决定并提供基于意识源头的商品和服务，建立一个指导我们的情绪和反应的价值体系。这是一款针对普通人的基于人类认知和行为模式的情感管理Dapp应用程序。

幸福双城资讯网

AGI通用知识模型和认知架构：打造一个能够思考、学习和创造的AI

独角也有噬元兽