比如花生酱?这个算法对你接下来要买什么有预感

网上杂货
学分:Pixabay/CC0 公共领域

推荐算法可以通过在购物者将产品添加到他们的购物篮时推荐互补产品来使客户的在线购物体验更快、更有效。顾客买花生酱了吗?该算法推荐了几个品牌的果冻接下来添加。

这些算法通常通过将购买的物品与其他购物者经常购买的物品相关联来工作。如果购物者的习惯、品味或兴趣与以前的顾客非常相似,则此类推荐可能会节省时间、加深记忆,并成为购物体验中受欢迎的补充。

但是,如果购物者购买花生酱来填充狗玩具或诱捕捕鼠器怎么办?如果购物者喜欢蜂蜜或香蕉和花生酱怎么办?推荐算法将提供不太有用的建议,使零售商付出销售成本,并可能惹恼客户。

由最近在加州大学河滨分校获得计算机科学博士学位的 Negin Entezari、Instacart 的合作者和她的博士顾问 Vagelis Papalexakis 领导的新研究将一种称为张量分解的方法——科学家用来在大量数据中寻找模式——引入商业世界更根据客户喜好推荐互补产品。

张量可以被描绘为多维立方体,用于对具有许多不同组件的数据进行建模和分析,称为多方面数据。与其他数据密切相关的数据可以连接成立方体排列并与其他立方体相关以揭示数据中的模式。

“张量可以用来代表客户的购物行为,”Entezari 说。“三模张量的每一种模式都可以捕捉交易的一个方面。客户形成张量的一种模式,第二种和第三种模式通过考虑在单个交易中共同购买的产品来捕捉产品与产品之间的交互。”

例如,三个假设的购物者——A、B 和 C——进行以下购买:

  • A:一次性购买热狗、热狗面包、可乐和芥末。
  • B:进行三笔单独的交易: 篮子 1:热狗和热狗面包;篮子2:可乐;篮子 3:芥末
  • C:热狗、热狗面包和芥末在一笔交易中。

对于传统的基于矩阵的算法,客户 A 与客户 B 相同,因为他们购买了相同的商品。然而,使用张量分解,客户 A 与客户 C 的关系更密切,因为他们的行为相似。尽管他们的购买略有不同,但两者都在一次交易中共同购买了类似的产品。

典型的推荐算法根据客户刚刚购买的商品进行预测,而张量分解可以根据用户整个购物篮中已有的商品进行推荐。因此,如果购物者的篮子里有狗粮和花生酱,但没有面包,那么基于张量的推荐算法可能会建议使用可填充的狗咀嚼玩具而不是果冻,前提是其他用户也进行了购买。

“张量是多维结构,可以对复杂的异构数据进行建模,”计算机科学与工程副教授 Papalexakis 说。“不是简单地注意到哪些产品是一起购买的,还有第三个维度。这些产品是由这类用户购买的,算法试图确定哪些用户正在创建这种匹配。”

为了测试他们的方法,Entezari、Papalexakis 和合著者 Haixun Wang、Sharath Rao 和 Shishir Kumar Prasad 都是 Instacart 的研究人员,他们使用 Instacart 公共数据集来训练他们的算法。他们发现他们的方法在预测客户特定的补充产品推荐方面优于最先进的方法。尽管还需要做更多的工作,但作者得出的结论是,大数据张量分解最终也可以在大企业中找到一席之地。

“就推荐系统而言,张量方法尽管是非常强大的工具,但在学术研究中仍然更受欢迎,”Papalexakis 说。“为了让工业界采用它们,我们必须证明用他们已经拥有的任何东西来替代它们是值得且相对轻松的。”

虽然之前的研究已经展示了张量建模在推荐问题中的好处,但新出版物是第一个在互补项目推荐的设置中这样做的,使张量方法更接近推荐系统背景下的工业采用和技术转移。

“张量方法之前已经被工业界成功采用,化学计量学和食品质量就是很好的例子,像我们的工作这样的每一次尝试都证明了张量方法的多功能性,能够解决不同领域如此广泛的具有挑战性的问题,”说帕帕莱克斯基斯。

论文“基于张量的互补产品推荐”在 IEEE Big Data 2021 上发表。

本文为作者 黄凯 独立观点,并不代表 我是CIO 立场。

发表评论

登录后才能评论