什么是深度学习以及它如何为现代人工智能提供动力？

生成式人工智能的影响和力量已在去年的企业。现在，每个软件公司，超市品牌和企业，甚至与科技无关的企业，似乎都在为 2024 年构建自己的基于人工智能的解决方案。但是我们对这些技术的基础以及它们的作用了解多少？我们在幕后处理我们的数据吗？

我们都在学习信任的人工智能黑匣子在利基技术圈之外的真正理解程度如何？对于设计上不透明的东西，我们需要了解什么？首先，让我们从头开始。

简而言之，人工智能是一组广泛的系统和数据，汇集在一起学习单一的利基任务。在大型语言模型（LLM）中，这可能用于根据在大量数据中观察到的识别模式来生成文本。先前摄取的内容的数组。目前所有的AI，从OpenAI的ChatGPT和DALL·E 2到Adobe的Sensei 图像生成工具正是遵循通过模仿以前的数据输入来学习复制任务的原理。

更通用的人工智能，即能够进行上下文切换以完成任何给定任务的技术，是大多数专家仍然认为还需要十多年的时间。然而，基于营销炒作和社交媒体评论，普通用户认为更普遍的类似科幻的技术即将到来也是情有可原的。

然而，您对当今日益流行的工具了解得越多，您就越容易想象它们在未来几个月和几年内将如何发展和变化。当今的生成式人工智能远非科幻小说中的魔法，它只是机器学习（ ML）技术已经存在了几十年。那么，过去五年发生了什么变化？

在这里，我们将深入探讨深度学习领域——它是当今机器学习技术背后的基石技术之一，也是当今人工智能革命能力的关键。

什么是深度学习？

深度学习是一种特定的应用神经网络本身就是机器学习的一个分支。基于神经网络的机器学习算法通过模仿有机大脑的一部分学习方式来训练不断发展的软件——使用逐步细化算法来使近似解决方案更加接近建议的目标。

在这个学科中，深度学习算法的应用极其多样且复杂。几乎每隔一周就会推出新系统，以识别图像和语音，并将原本会被错过的数据模式可视化。在健康科技等领域，这些技术被证明是革命性的，并且确实改变了生活。

深度学习模型经过训练，可以通过医学成像诊断一系列疾病，取得了巨大的成功过去10年。未来十年，他们将能够通过增加准入、不断增强的能力和专业技术为患者提供令人难以置信的服务。

“深度学习的力量使得当今每个可能的行业都能实现无缝语音识别、图像识别以及自动化和个性化，因此可以肯定地说，您已经体验到了深度学习的好处，”Sajid Sadi，三星研究副总裁告诉福布斯。

为了在新项目中实现这些目标，工程师首先必须构建一个能够在其领域内学习的神经网络。这是通过创建大量小型、简单且相对隔离的代码片段来对输入数据片段进行微小转换来完成的。这些称为节点的代码片段通过进行微小的转换并通过大型互连网络将其结果传递到下一个来模仿大脑中的神经元。

就像大脑中的神经元一样，单个软件节点非常简单，而且几乎毫无用处。即使在只有数百个节点的少量节点中，对输入数据进行的转换也几乎无法追踪。当这些节点以及它们之间的关键连接扩展时，系统的结果就会变得真正引人注目。

神经网络如何工作？

当各个节点连接在一起时，它们的连接会被加权，以优先考虑某些通信通道并限制其他通信通道。这些连接充当有机大脑中的突触，决定信息作为一个整体如何传播和发挥作用。

使用人工神经元和突触（建模为节点和加权连接），神经网络构建大量层来模仿有机大脑的规模和复杂性，使其能够执行类似的复杂任务。这些节点分为三种类型，在系统中各有其独特的作用：

输入节点：这些节点负责简单地从系统外部获取数据并将其传递到网络中。
隐藏节点：这些节点在一系列层中相互协作，处理数据并根据其准确性做出决策。
输出节点：在最外层，输出节点向外界提供最终的数据产品。

就像有机大脑一样，节点之间的连接对于系统的成功至关重要。有机大脑突触的强度在其整体能力中发挥着最大的作用。在指示神经网络学习时，开发人员在处理输入后系统地更改这些权重，以测量算法输出与我们的目标之间的距离。

在大量训练数据上使用成本分析功能，工程师可以评估迭代之间的网络性能，并调整其学习以实现其目标。深度学习与其他神经网络的区别在于它应用于其目标的隐藏节点层数。

深度学习算法的变体

卷积神经网络 (CNN)

对于涉及计算机视觉、图像和视频的应用，最常使用卷积神经网络。这些非常适合检测较大数据集（例如原始图像）中的特征和模式子集 – 允许对象检测、面部识别和许多相关的智能功能。

循环神经网络 (RNN)

相比之下，对于自然语言处理和语音识别等领域，经常使用循环神经网络，因为它们能够很好地处理顺序数据。

所有深度学习算法的共同特征之一是它们比其他机器学习技术要复杂得多。正是这种固有的复杂性使得深度学习算法能够为它们想要完成的任务构建一个完整的工作模型。然而，正如我们将看到的，这一功能需要进行重大的工程权衡才能抵消其突破性优势。

深度学习实践

深度学习能够在机器学习领域做一些相对独特的事情。无监督学习可以完全自主地对非结构化原始数据进行分类和区分，提供了一种无需人工分类即可处理海量数据集的新方法。

凭借当今云系统可用的处理能力和存储，用于处理数据的算法现在能够以越来越真实的方式进行学习。

已用于启用在嘈杂环境中的语音识别，使可以实现准确的手写识别，并启用手机和智能家居中使用的面部识别功能，这些系统是我们日常生活中习以为常的东西。

流媒体巨头依靠技术根据大数据推荐电视节目、游戏和音乐许多用户之前已经浏览过他们的服务。在实际使用中，用户经常发现他们的预测和建议出奇的准确.

深度学习是科技的成功故事。无监督学习是最新的“杀手级应用”之一。用于构建一些最大、功能最强大的平台，很容易将其想象为一个现成的解决方案，可以插入到您可以准确描述的任何问题中。然而，这个非常强大的工具也有一些缺点。

深度学习方法的缺点

深度学习的最大陷阱来自于神经网络作为人工智能黑盒解决方案的本质。即使系统在 100 次中提供了 99 次正确的答案，当您看不到软件的内部工作原理时，也很难完全信任任何软件。

神经网络的高度不透明性使得它们很难推荐用于需要广泛监督或监管的应用。医疗和航空应用是两个关键领域，这可能会引发一些重大问题。

该领域最大的问题是工程师定义为数据集偏移——训练数据与现实世界的例子不太吻合或者存在基本偏差。数据转移问题的结果通常会出现在部署到实际用例的算法的意外行为中。

令人不安的是，这个问题在早期使用或测试中可能不会变得明显。机器学习系统往往会悄无声息地失败。数据转移引起的问题可能会在使用中潜伏数月或数年，并且可能会在系统以难以理解的推理做出决策时被完全诊断出来。

困扰深度学习的另一个问题来自规格不足 – Google 最近发现的一个问题。与数据转移一样，此问题会导致实际性能出现问题，但可能不会被注意到。与数据集转移不同，此问题背后的主要驱动因素不是缺乏合适的训练数据，而是优化不佳的成本函数，无法捕获有关预期目标的足够细节。

算法输出的变化大到足以产生有意义的差异，但又小到足以确保成本分析仍然产生合格的成绩，该成绩可以传递到最终的系统并进一步产生意想不到的后果。

解决深度学习的现实挑战

这两个问题的共同点是当前深度学习算法的未知性和不可知性。在实践中使用时，几乎不可能区分好系统和坏系统，因为我们没有足够的信息来了解底层发生的情况。但工程师们正在开发克服这一障碍的方法。

可解释的人工智能领域正在快速发展开发人类可以更好理解的算法。这将规避该领域固有的许多最大问题，但在完全可解释的深度学习算法解决重大医学问题之前，我们还有很长的路要走。今天，对构建深度学习系统的工程师的建议是测试、测试、测试，然后再测试。

“最直接的收获是我们需要做更多的测试，”领导行业领先的 Alex D’Amour 对规范不足的研究，告诉《麻省理工学院技术评论》。“我们对机器学习模型的要求超出了我们当前方法所能保证的范围。”

部署深度学习系统以确保成功时，必须进行广泛而彻底的测试、持续集成和彻底验证。诸如合成数据之类的相关领域正在通过提供更多、更高质量的数据来帮助工程师克服这些挑战通过人工智能支持的数据合成。

深度学习的未来

深度学习技术已被证明是极其强大的工具，对各个领域都产生了影响。从当今道路上的自动驾驶汽车到医疗保健诊断和无障碍应用的现代进步——这不是一项可以轻易忽视的技术。

尽管这里列出了潜在的陷阱和缺点，但这是一个值得大量投资和研究的领域。如果 2023 年是 GPT 年，那么 2024 年无疑标志着强大、可解释且高度稳健的人工智能系统十年的开始，这些系统为未来的软件解决方案提供动力。