探索AI基础知识：关键术语和定义指南

生成式人工智能掀起了全球风暴，大多数人都在谈论它将如何影响全球各行各业。在本文中，我想谈论一些关键词汇和定义，帮助您更好地理解它们。

在深入研究生成式 AI 之前，让我们先了解什么是 AI。简单来说，AI（人工智能）是机器或计算机程序像人类一样执行任务，思考和学习的能力。也就是说，目标是开发出能够像人类一样执行任务、行动和思考的智能体。

以下是一些基本术语及其定义，以帮助您熟悉AI术语。

自然语言处理（NLP）：NLP是人工智能（AI）的一个组成部分，它将人类和机器语言连接起来，使人机交互更加自然。自然语言理解（NLU）和自然语言生成（NLG）是NLP的两个子集，使系统能够进行更加类人对话。总体来说，NLP研究计算机如何理解和与人类沟通，并执行搜索、信息检索和回答问题等任务。

自然语言理解(NLU): NLU是一台机器理解和处理自然语言呈现的语音或文本意义的能力。NLU包括从文本中提取含义、识别文本中的实体以及提取有关这些实体的信息等任务。

自然语言生成（NLG）：NLG基于提供的语义构建句子。NLG负责将结构数据解释为有意义的人类可理解的句子。

机器学习是人工智能领域的一个分支，专注于使系统或计算机应用能够在没有明确编程的情况下学习和改进他们的经验。

机器学习模型可以进一步分为有监督学习模型、无监督学习模型和强化学习模型。

监督学习
无监督学习
强化学习

监督学习：它是一种机器学习类型，其中机器使用“标记”的数据集进行训练。也就是说，在监督学习中，您需要向机器学习模型提供输入数据和正确的输出数据，模型会逐渐学习。该算法通过损失函数来衡量准确性，并进行调整，直到误差被足够地最小化。

监督学习模型在风险评估、图像分类、欺诈检测、垃圾邮件过滤等应用场景中非常有用。

无监督学习：这是有监督学习的完全相反。在无监督学习中，您提供未标记的数据集，机器分析数据集，尝试找到模式，得出有意义的见解并提供响应。

无监督学习在推荐系统、客户分割、异常检测等情况下非常有用。

强化学习：它是一种机器学习技术，通过试错、使用来自自身行动和经验的反馈/奖励，在交互式环境中使代理学习。在这种方法中，我们模拟出问题陈述之后的环境。模型与这个环境互动，并自行提出解决方案，没有人类干涉。为了将其推向正确的方向，如果它执行了一个将它拉 closer 到目标的行动，我们只需提供一个积极的奖励，或者如果它离目标越来越远，提供一个负面奖励。

深度学习：深度学习是人工智能（AI）中的一种方法，它教导计算机以类似人类大脑的方式处理数据。深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式，以产生准确的洞察和预测。您可以使用深度学习方法来自动化通常需要人类智力的任务，例如描述图像或将声音文件转录为文本。

深度学习在数字助手、欺诈检测等应用中非常有用。

深度学习使用人工神经网络，使其可以处理比传统机器学习更复杂的模式。人工神经网络受到人类大脑的启发。它由许多互相连接的节点或神经元组成，可以通过处理数据和进行预测来学习执行任务。神经网络可以使用已标记和未标记的数据。

深度学习模型进一步分类为判别式和生成式类型。

生成式/生成AI：生成AI是深度学习的一个子集，能够通过识别现有数据内的模式和结构来生成新的和原始的内容（文字、图像、视频和音频）。这些系统已经通过大量的数据进行训练，以基于查询/提示生成内容。

生成预训练变压器（GPT）：生成预训练变压器，通常称作 GPT，是一系列神经网络模型，采用变压器架构和深度学习技术生成类似人类写作的文本和内容（图像、音频和视频），并以对话方式回答查询。

大型语言模型（LLM）：大型语言模型是深度学习的一部分。LLM是指一种大型、通用的语言模型，可以进行预训练并针对特定目的进行微调。LLM是基础ML模型，经过大量数据的训练以学习模式并生成新内容。

基础模型：基础模型是一种大型的机器学习模型/神经网络，它利用监督、非监督和半监督学习技术在海量数据上进行训练，并可适用于广泛的用例。这些模型是在公开可用的互联网数据源上进行训练的。

扩散模型：扩散模型是通过向可用的训练数据添加噪声（也称为正向扩散过程），然后反转该过程（即去噪或反向扩散过程）以恢复数据的深度生成模型。模型逐渐学会去除噪声。

微调：微调指的是带入自己的数据集并重新训练模型，通过调整 LLM 中的每一个权重来进行微调。这需要托管自定义模型和大量的训练。微调是一项昂贵的任务。

提示：提示是用户或程序向AI模型提供的查询或输入，以从模型中获得所需的响应。提示是指导AI模型的输出并影响其语调、风格和质量的因素。根据模型的预期用途，提示可以包括说明、问题或任何其他类型的输入。

提示设计：它涉及将指令和上下文传递给模型，以生成所需的输出。

提示微调：这涉及在推断期间对模型提供的原始输入提示进行小的调整。通过更改提示中的关键词或短语，您可以引导模型生成更准确的类似主题的响应。

提示工程：这是定义、开发和优化提示以生成预训练模型所需输出的过程。它不仅修改提示，还涉及其周围的上下文环境。您可以提供额外的背景知识，改变查询的语法或长度，或重新构建整个对话流程。

幻觉：幻觉是发生在AI模型生成的输出与预期不同的状态。

它们发生的原因有很多，比如对问题空间的错误假设、设计不良的算法、数据集质量、缺乏足够的防护等等。

零样本学习：零样本学习是一种机器学习技术，使模型能够识别和分类之前未经过训练或遇到的对象。它通过利用基于属性的信息和语义关系来弥合已知和未知类别之间的差距实现此目的。这种方法使学习系统更加灵活和适应性强。

Few-shot学习：Few-shot学习是一种机器学习技术，它解决了使用有限标记数据进行模型训练的挑战。Few-shot学习致力于训练能够从少量标记实例中进行泛化的模型。这使得模型能够快速适应并分类新的类别，只需少量示例便可实现，从而使它们在具有有限标记数据可用性的真实世界情况下更加多才多艺和高效。

思维链提示：思维链提示是一种在语言生成模型中使用的技术，用于以连贯和情境相关的方式指导生成过程。通过提示一系列与逻辑序列相连的提示、步骤或说明，类似于思维链，它提高了LLM的推理能力。这有助于模型引导一个多步问题的最终答案。

流行生成式人工智能工具

ChatGPT是由OpenAI开发的先进聊天机器人。它基于GPT-4语言模型，可用于与人进行互动交流，回答问题和生成创意文本格式。
巴德是由谷歌AI开发的大型语言模型，类似于GPT-4，可以用于生成文本、翻译语言、编写不同类型的创意内容，并以信息化的方式回答你的问题。巴德由LaMDA（对话应用语言模型）驱动。
PaLM（Pathway Language Model）2 是谷歌最新的 LLM，具有高度先进的推理、多语言、推理、分类和编码能力。
DALL-E 2 是由OpenAI开发的图像生成工具。它可用于从文本描述生成逼真的图像。
GitHub Copilot是由GitHub开发的编码工具。它是一种先进的编码工具，利用了OpenAI Codex语言模型的能力。这个非常出色的工具旨在通过生成代码、提供代码片段和提供有价值的建议来帮助开发人员加强他们的代码。
AlphaCode是由DeepMind开发的编程工具。它基于AlphaFold语言模型，并可用于生成代码，解决编码问题和编写不同类型的编程内容。
Synthesia是一种创新的视频生成工具，它使用户能够创建真实逼真的视频，其中包括能够讲话，唇齿同步和移动的人。

感谢您抽出时间阅读本文。如果您喜欢并希望了解更多科技话题，请考虑订阅获取更多富有见地的内容。

参考资料

https://cloud.google.com/blog/zh-cn/products/ai-machine-learning/generative-ai-for-industries

https://builtin.com/artificial-intelligence/generative-ai 生成式人工智能