根据公开的数据显示,亚马逊有35%的销量来自推荐系统。对于亚马逊卖家来说,35%的推荐流量可不是能忽略的小数字。那什么是推荐系统吗?各位亚马逊卖家了解过吗?
首先推荐系统(RS)是一种智能工具,它根据用户的历史行为、社交关系、兴趣点,所处上下文的环境等信息去预测并推荐用户可能需要或者感兴趣的商品。推荐系统本身是一种信息过滤的方法,与搜索和类目导航组成三大主流信息的过滤方法。最常见的场景就是首页推荐和详情页推荐。
为什么今天要跟各位卖家聊推荐系统呢?不知道卖家们有没有注意到,亚马逊官方网站前阵子发布过这样一篇论文《RecMind:用于推荐的大型语言模型代理》。在这篇论文中,亚马逊介绍了他们如何设计一个LLM强大的自主推荐代理RecMind,能够利用外部知识,通过精心规划的工具向用户提供零样本个性化推荐。
RecMind的核心基于一个自我激励算法,它通过深度学习和大型语言模型的结合,为用户提供个性化推荐。它在每个决策步骤中都会回顾并考虑所有先前的状态,以更智能地规划下一步。与传统推荐系统相比,RecMind能够更好地理解用户的历史行为和偏好,从而提供更为精准的推荐。
简单一点理解就是,能够优化当前推荐系统,使得用户可以更精准地找到需要的产品。作为卖家来说,了解推荐系统的工作原理以及最新的推荐算法变化,才能更好抓住流量。
一、RecMind推荐系统是如何工作的?
前面提到,RecMind的核心是一个自我激励算法(Self-Inspiring SI),它能够在每个决策步骤中回顾历史信息,从而做出更加精准的推荐。
这个算法与原先的算法有所不同,原先的它们在生成新状态时会丢弃先前探索过的路径中的状态,而新算法SI在生成新状态时会保留所有历史路径中的所有先前状态。这就意味着当前的算法,能将之前所有历史信息保存,以至于为用户提供更好的推荐,提供更多有用的信息。
据目前案例测试,SI算法比之前的算法获得准确的评级。
RecMind工作过程主要依赖三大组件:
1、规划组件:将复杂的推荐任务分解成一系列小步骤,逐步推进,每一步涉及思考、行动和观察。这个组件确保了推荐过程的有序进行,并能够根据不同的用户需求灵活调整推荐策略。
2、记忆组件:具备长期记忆能力,能够存储和回忆用户的个性化信息和广泛的世界知识。个性化记忆指的是帮助RecMind理解和记住用户的偏好和历史行为,而世界知识则使RecMind能够融入最新的外部信息和趋势。
3、工具组件:集成了多种工具,包括数据库查询、网络搜索和文本摘要,以增强其功能并辅助推理过程。利用各种外部资源和工具,提升推荐的准确性和相关性。
RecMind工作过程:
当一位有着丰富购买历史的用户,最近浏览了A产品。RecMind随即启动,开始它的个性化推荐。RecMind首先会搜寻数据库,通过查询,追溯用户过往评价过的产品及其评分。并且迅速找到了用户对类似产品的正面评价历史。
接着,RecMind利用网络搜索引擎,探索A产品所属的产品类别。假设RecMind确定A产品是一款牙刷产品,RecMind会深入会理解牙刷的用户需求。基于用户对类似产品做出过正面评价的历史,RecMind开始预测用户对A产品的评分。
先获取A产品的评分星级,假如星级很不错,RecMind会反馈这是一个积极的信号。在综合用户的历史评价和产品的评论星级或内容等,深入分析,预测用户对A产品的评分。假设预测用户会给出一个接近之前评价的高分,那么RecMind就会向用户推荐这款牙刷。
目前,据研究人员表示,已在多个推荐场景对RecMind进行了评估,在直接推荐、顺序推荐、解释生成和评论摘要等五个推荐板块和两个数据集上进行了评估。实验结果表明,RecMind在多个任务上超越了现有的基于LLM的推荐方法。即使在零样本的情况下,RecMind也能够提供高质量的推荐。
在某些任务上,RecMind的表现与完全训练的顶级推荐系统相当。这意味着RecMind在推荐质量和用户满意度方面,达到了与顶级推荐系统相媲美的水平。且自激励算法(SI)在一般推理任务上也优于其他,证明了其广泛的应用潜力。
预测后续RecMind推荐系统会覆盖在亚马逊上。与COSMO会形成怎么样的联系目前还不知晓,各位卖家也可以关注我们,第一时间有新算法的信息我们都会与大家共享。
二、构建常识知识图谱助力产品推荐
5月10号,亚马逊官方网站发布的文章称使用COSMO来辩别亚马逊用户交互数据中的常识性框架将下游任务的性能提高多达60%。
亚马逊表示为了可方便推荐引擎进行常识性推断,正在构建一个知识图谱,编码了亚马逊商店中产品与人类使用场景之间的关系,包括功能、目标受众、使用地点等属性。比如,当一位孕妇搜索鞋子时,知识图谱能帮助推荐系统理解她可能需要防滑鞋。
其中还介绍到了COSMO涉及一个递归过程,在这个过程中,生成LLM关于查询-购买和共同购买数据的常识性的假设。人工注释和机器学习模型的结合过滤掉了低质量的假设,人工评审员从高质量的假设中提取指导原则,基于这些原则提升推荐的准确性和相关性。
基于用户行为和大语言模型(LLMs)的知识生成流程:
1、记录用户行为:用户行为数据被记录下来,包括用户的搜索和购买行为。
2、提示:这些用户行为数据被用来生成提示,输入到大型语言模型中(LLMs)中。
3、生成知识:大型语言模型(LLMs)接收到提示后,生成相关的知识数据。
4、过滤:生成的知识数据会经过过滤,包括基于平台规则的过滤和相似性过滤,确保数据的准确性和相关性。
5、人类反馈:经过过滤的知识数据会被人审查和注释,提供反馈。
最终将所反馈和筛选的高质量知识进行保存和使用。
以用户查询“冬季外套”为例,如点击产品“长袖羽绒服”,则会输出提供用户高水平的保暖的指令,会在搜索页面及推荐上推荐提供带有高水平保暖的功能属性的外套。
亚马逊表示,通过构建常识知识图谱并运用COSMO框架,亚马逊在产品推荐领域迈出了创新的一步。这不仅提升了推荐的相关性和准确性,还为顾客提供了更加个性化和满意的购物体验。