产品分类/产品分类是将产品组织到各自的部门或类别中。这个过程的很大一部分是整个产品分类的设计。
产品分类最初是一个文本分类任务,它分析产品的标题以选择适当的类别。但是,已经开发了许多方法,这些方法考虑到了产品标题、描述、图像和其他可用的元数据。
以下关于产品分类的论文代表了该领域的基本阅读,为产品分类任务提供了新颖的方法

1. 不分类,翻译

本文由新加坡国立大学和乐天理工学院的研究人员提出并解释了一种新颖的机器翻译方法,以进行产品分类。该实验使用乐天数据挑战和乐天一巴数据集。
他们的方法将产品的描述转换或转换为一系列令牌,这些令牌表示到正确类别的根到叶路径。使用此方法,它们还能够在分类中提出有意义的新路径。
研究人员指出,他们的方法优于当今机器学习中常用的许多现有分类算法。
  • 发布时间/上次更新时间 » 12 月

org/pdf/1812.05774v1.pdf”标题\”https://arxiv.org/pdf/1812.05774v1.pdf”>阅读现在]

2. 使用神经注意模型对日本产品名称进行大规模分类

本文作者对基线卷积神经网络(CNN)模型和梯度增压树(GBT)分类器提出了关注卷积神经网络(ACNN)模型。
该研究使用从乐天一叶(RakutenIchiba)取取的日本产品标题作为培训数据。利用这些数据,作者比较了三种方法(ACNN、CNN 和 GBT)在大规模产品分类中的性能。
虽然不准确的差异可能小于 5%,但准确性的轻微改进也可能导致数百万个额外的正确分类。
最后,作者解释了 ACNN 和 GBT 模型组合如何进一步减少错误分类。

  • 发布/最后更新 – 2017 年 4 月,EACL 2017
  • 作者和贡献者 – 来自乐天理工学院:夏燕迪、亚伦·莱文、普拉迪普托·达斯·朱塞佩·迪·法布里齐奥、庆吉·辛扎托和安库尔·达塔

3

在这篇论文中,该团队展示了其数据集,其中包括超过 186,000 张服装产品图片及其产品标题。

此外,他们还介绍了影响他们学习的领域的相关工作。最后,他们使用 Resnet34 分类模型和 Seq 到 Seq 模型测试其数据集,以对产品进行分类。
这些数据取自印度电子商务商店,因此使用一些类别可能不适用于西方市场。但是,数据集是开源的,可在 Github 上找到。
  • 发布时间/上次更新时间 » 2019年8月19日
  • 作者和贡献者 – 文卡泰什·乌马尚卡尔(爱立信研究)、吉里什·尚穆加姆(爱立信研究)和阿迪提·普拉卡什(科罗拉多大学)

4. 使用结构化和非结构化属性进行大规模产品分类

在这项研究中,WalmartLabs 的一个团队将分层模型与平面模型进行产品分类。
研究人员采用基于深度学习的模型,从每个产品中提取特征来创建产品签名。在论文中,研究人员描述了一种基于多LSTM和多CNN的方法,以完成这一极端的分类任务。此外,它们提出了一种使用结构化属性的新方法
  • 发布时间/上次更新时间 » 2019年3月1日
  • 作者和贡献者 – 来自沃尔玛实验室: 阿比南丹 · 克里希南和阿比拉什 · 阿马塔鲁里

5. 多标签产品分类使用多模式融合模型

在这篇论文中,来自纽约大学和美国银行的研究人员研究了在亚马逊上对产品进行分类的多模式方法。
他们的方法使用多个分类器,这些分类器对产品列表中的每种类型的输入数据进行了培训。他们使用包含 940 万个 Amazon 产品的数据集,开发了基于产品图像、标题和描述的产品分类三模式模型。他们的三模晚融合模型保留了88.2%的F1分。

他们的研究结果表明,增加模式的数量可以提高多标签产品分类的性能。
  • 发布时间/上次更新时间 – 2019年6月30日
  • 作者和贡献者 – 帕萨韦·维罗伊瓦塔纳库尔(纽约大学)和阿蒂特·旺佩拉旺(美国

银行)

在上面关于产品分类的论文中,研究人员对包括数百万个产品的开放式数据集进行了模型培训。但是,如果您正在构建用于商业用途的产品分类模型,则这些数据集将不可用。
Comments are closed.