我们到处都能看到关于机器学习的新闻。事实上,机器学习有很大的潜力。根据 Gartner的预测,”到2020年,80%的 人工智能项目仍将是炼金术,由那些人才在组织中无法扩展的 巫师运行”,而《2019年创业 发展》 预测,87%的人工智能项目将永远无法投入生产

为什么会这样?为什么这么多项目失败?

专业知识不足

其中一个原因就是这项技术对大量受众还是新的。此外,大多数组织仍然不熟悉软件工具和所需的硬件。

今天,任何从事数据分析或软件开发工作过,做过一些数据科学样本项目的人,在上完一个简短的在线课程后,都把自己标为数据科学家。

事实是,需要有经验的数据科学家来处理大多数机器学习和 AI 项目,尤其是在定义成功标准、最终部署和持续监视模型时。

数据科学与传统软件开发的脱节

数据科学与传统软件开发之间的脱节是另一个主要因素。传统的软件开发往往更可预测和可衡量。

然而,数据科学仍然是部分研究和部分工程。

数据科学研究通过多次迭代和实验进行。 有时,整个项目将不得不从部署阶段循环回规划阶段,因为 挑选的指标不会驱动用户行为。

基于敏捷的传统项目交付可能不会期望从数据科学项目中实现。这将会给在正常软件开发项目的每个任务周期结束时处理明确交付的领导者造成大规模混乱。

数据量和质量

每个人都知道数据集越大,AI 系统的预测越好。除了高容量的直接影响外,随着数据规模的增加,还出现了许多新的挑战。

在许多情况下,您必须合并来自多个源的数据。一旦你开始这样做,你会意识到,他们不是同步很多次。这将导致很多混乱。 有时,您最终会合并不应合并的数据, 这将导致具有同名但含义不同的数据点 错误数据也可能导致误导性结果。

数据标签

标签数据的不可用是阻碍许多机器学习项目的另一个挑战。根据麻省理工学院斯隆管理评论

76% 的人通过尝试自己标记和注释培训数据来应对这一挑战,63% 的人则尝试构建自己的标签和注释自动化技术。

这意味着这些数据科学家的很大一部分专业知识在贴标过程中丢失了。这是有效执行 AI 项目的一大挑战。

这就是许多公司将标签任务外包给其他公司的原因。但是,如果标签任务需要足够的领域知识,则将其外包是一项挑战。如果需要保持数据集的质量和一致性,公司必须投资对注释进行正式和标准化的培训。

另一种选择是开发自己的数据标记工具,如果数据要标记为复杂。但是,这通常比机器学习任务本身需要更多的工程开销。

组织 A1re 思洛

数据是机器学习项目最重要的实体。在大多数组织中,这些数据将驻留在具有不同安全约束的不同位置,并且以不同的格式 ( 结构化、非结构化、视频文件、音频文件、文本和图像) 。

将这些数据以不同的格式本身在不同位置是一项要处理的问题。 但是,当组织孤立且负责任的个人不相互协作时,挑战加倍 这对数据科学的工程计划中的团队尤其重要,因为他们的工作方式和用于完成项目的技术存在很多差异。

工程团队将实施机器学习模型,并带之生产。 因此,他们之间需要有适当的理解和强有力的协作。

技术上不可行的项目

由于机器学习项目的成本往往非常昂贵,大多数企业倾向于针对一个超雄心勃勃的”月球”项目,该项目将彻底改变公司或产品,并给出超大的回报或投资。

这些项目需要永远完成,并将数据科学团队推到极限。

最终,商业领袖们将失去对项目的信心,并停止投资。

最好把注意力集中在一个范围合适的、可实现的项目上,并针对离散的业务挑战。

技术团队和业务团队之间的一致性问题

很多时候,ML 项目的启动没有明确一致,在业务和数据科学团队之间的项目的期望、目标和成功标准上。

这类项目将永远停留在研究阶段,因为他们从来不知道他们是否正在取得任何进展,因为永远不清楚目标是什么。

在这里,数据科学团队将主要关注准确性,而业务团队将更感兴趣的指标,如财务收益或业务洞察。 最后,业务团队最终不接受数据科学团队的结果。


缺乏数据策略

根据 MIT 斯隆管理审查,只有50%的大型企业超过10万员工最有可能有一个数据战略。在开始机器学习项目之前制定可靠的数据策略至关重要。

作为数据策略的一部分,您需要清楚地了解以下内容,

  • 您公司的总数据
  • 项目真正需要多少数据?
  • 所需个人如何访问这些数据,以及这些个人如何轻松访问这些数据?
  • 关于如何将不同来源的所有这些数据汇集在一起的具体策略
  • 如何清理和转换这些数据。

大多数公司在没有计划或开始认为他们没有数据时没有开始。

缺乏领导力支持

很容易认为 “你只需要扔一些钱和技术的问题, 结果会自动来”

我们看不到领导层给予正确的支持,以确保成功所需的条件。有时,企业领导者对数据科学家开发的模型没有信心。

这可能是由于业务领导者对 AI 缺乏了解,以及数据科学家无法将模型的业务优势传达给领导者。

归根结底,领导者需要了解机器学习的工作原理以及 AI 对组织真正意味着什么。

Comments are closed.