很难相信,距离我写上一篇关于人工智能 (AI) 的文章“实用人工智能。”在那篇文章中,我概述了人工智能和机器学习 (ML) 的现状以及当时的一些流行用法和工具。从那时起,人工智能世界变得疯狂:每个人都在谈论像 ChatGPT 这样的工具,但大多数人确实不理解所有术语和工具或它们最适合什么。在本文(第 1 部分,共 2 部分)中,我将尝试让您对这个生态系统有一个最新的了解,并尝试用“Joel”术语来解释事情。

所以让我们开始吧定义所有关键术语并查看每个术语的一些示例。
现代人工智能简介 2024 年版

关键术语

人工智能 (AI)

人工智能 (AI )是机器展现的人类智能。人工智能的例子包括面部识别、服务台聊天机器人、智能恒温器和语音转文本。

“AI示例”

作为开发人员,我们从一开始就将人工智能写入我们的代码中。下面是玩井字游戏的早期示例 – 代码正在模拟另一个人的智力来与你对战。请注意,这段代码没有什么花哨或神奇的地方,事实上,它只是一系列 IF 语句;是的,这确实符合人工智能的资格!

“井字游戏编码示例”

机器学习 (ML)

机器学习 (ML )是人工智能的一个子集,我们使用算法来解析数据,从中学习,然后决定做某事。所有的机器学习都算作人工智能,但并非所有的人工智能都算作机器学习。例如,符号逻辑——规则引擎、专家系统和知识图谱——都可以被描述为人工智能,但它们都不是机器学习。

机器学习示例

如果您转到亚马逊购买一些鞋子,也许它会推荐一件与之搭配的衬衫。亚马逊还使用图像分类等工具来确定图像的内容,以防止虚假广告。最后,谷歌和雅虎等大型电子邮件提供商使用垃圾邮件分类来确定电子邮件是否为垃圾邮件。他们在这方面做得多么好,每天都影响着我们!

作为开发人员,当我们将机器学习放入代码中时,我们历史上是用算法作为模型来实现它的。您曾经在代码中构建过决策树吗?这是您实现的机器学习模型,但您可能甚至没有意识到。

决策树示例< /p>

大型语言模型 (LLM)

大型语言模型 (LLM) 是一种人工智能(AI)算法,使用深度学习技术和海量数据集来理解、总结、生成和预测新内容。 “生成式人工智能”一词也与法学硕士密切相关,是一种生成式人工智能,专门用于帮助生成基于文本的内容。

法学硕士的当前示例是 GPT-4(OpenAI 的 ChatGPT)、Llama(Meta)和 LaMDA(Google)。

历史开发人员示例- 建立的法学硕士包括:

  1. 编写一个聊天机器人来理解基本命令并处理它们(想想早期基于文本的“冒险游戏”)
  2. Word2vec 技术,您可以通过获取单词的向量表示来确定语义。

生成式人工智能

生成式 AI 是人工的能够使用预测模型生成文本、图像或其他媒体的智能。当今最著名的生成式人工智能可能是 Dall-E。许多人用它来生成图像。此外,ChatGPT 还用于生成文章/内容。

我们大多数人从来没有早期对生成式人工智能进行了编码,但早在 1970 年就有大量工作正在进行;一些早期的例子包括语音合成。

GPT:生成式预训练 Transformer< /strong>

ChatGPT(聊天生成预训练的 Transformer)最受欢迎的是由 OpenAI(这里有多个竞争对手,如 Bard、Claude)开发的基于大型语言模型的聊天机器人。

检索增强生成 (RAG)

检索增强生成 ( RAG)是一种强大的技术,它将预训练语言模型的优势与信息检索系统的优势结合起来。 RAG 的主要目的是增强大型语言模型 (LLM) 的能力,特别是在需要深入理解并生成上下文相关响应的任务中。

因为大多数开发者没有以前没有对 LLM 进行编码,大多数也没有实现 RAG。

RAG 示例正在获取标准模型中尚未包含的一些信息并对其进行扩充,以使模型对于特定用途更加强大。一个例子包括使用我的公司手册,并通过使用一种称为嵌入的技术,用现有的 GPT/LLM 对其进行扩充。完成此操作后,我可以向 GPT 询问有关我公司政策的问题,并且它应该能够对此进行扣除,即使原来的法学硕士对我的公司一无所知。

商业用途

现在我们有掌握基本词汇,并提供一些关于所有这些内容如何工作的好例子,让我们谈谈 2024 年,以及我们应该如何利用人们构建的所有出色工具来实现出色的人工智能和机器学习!

我的公司使用软件为我们的客户解决业务问题。这是我们一直在做的事情,所以我喜欢不从技术角度来看待人工智能和机器学习,而是更多地从“我们可以解决哪些业务问题?”这个问题出发。

传统上我们使用AI和ML解决以下问题:

  • 获取文档并将其转换为可搜索和可用的内容:传统上,我们使用自然语言处理 (NLP) 来理解文本的含义和情感,使其可搜索,并自动进行文档处理以将图像转换为图像成文本并对它们进行分类和分段。这项工作的大部分内容都围绕着获取旧版 PDF 文档并更好地利用它们。
  • 预测销售结果:获取客户拥有的数据并构建模型,为客户生成销售预测
  • 构建速度更快、不易出错的软件:过去几年,我们一直在利用 GitHub Copilot 和 Amazon CodeWhisperer 等代码辅助工具来帮助开发人员更快、更高质量地编写代码。

今天,我们可以使用最新和最好的工具以更高的精度和更少的工作来解决这些相同的问题(我们将很快讨论其中的一些)。我们还可以使用新工具更轻松地解决其他典型业务问题。

一些问题现在更容易解决的是:

  • 自动化简单的客户服务交互:构建自定义聊天机器人来解决客户最常见的问题现在相当容易。
  • 使用 ChatGPT 类型的工具来帮助您自动化以前手动完成的任务,例如合并文件、过滤文件、汇总文件等。
  • 将面部识别和语音转文本/文本转语音等功能合并到我们的系统中。

工具和框架< /h2>

直到最近,如果如果您想构建一个机器学习模型,唯一的选择就是编写一些代码。大多数开发者都会选择以下几个选项之一:

  • Scikit-learn:简单易学,大多数人从这里开始
  • TensorFlow:来自 Google;更强大,但复杂(有些人在上面使用 Keras)
  • PyTorch:来自Meta,比TensorFlow更强大且更易于使用

现在各大云每个提供商都有自己的一套针对每个领域的工具:

  • 微软:Azure OpenAI (GPT)、视觉/语音/翻译、ML Studio、自动化机器学习、预训练模型
  • AWS: Sagemaker(传统);基岩 – 多种型号选择; Sagemaker 拥有用于自动化 ML、AmazonQ (GPT) 的 Canvas 和 Autopilot
  • Google:VertexAI(Gemini 模型)、Bard (GPT)、TensorFlow

最近,较高-关卡工具也出现了,让您无需编写任何代码即可快速构建模型:

  • Nyckel – 让您上传 CSV 并开始
  • 适用于 Google 表格的 SimpleML :请参阅“企业主:掌控您的数据”
  • AutoML (AWS,< a href="https://azure.microsoft.com/en-us/products/machine-learning/automatedml/#overview" rel="noopener noreferrer" target="_blank">Azure,GCP)(在上一页)
  • 使用ChatGPT 为您进行机器学习! (以前称为高级数据分析)

摘要

在本文中 (第 1 部分),我们总结了有关人工智能和机器学习的所有最新术语以及其中的许多示例。我们还展示了可以使用最新工具解决的典型业务问题。最后,我们讨论了今天这个领域的流行工具。请继续关注本文的第 2 部分,我们将引导您完成一个使用这些工具之一来解决业务问题的现实示例!

Comments are closed.