智能发展——在人工智能时代蓬勃发展的路线图——第一部分
你好!我是Kenny,来自比利时的自由开发者,拥有超过15年的编码经验。在深度学习热潮之前,我对人工智能和机器学习就有浓厚的兴趣,回溯到神经网络重新流行的时代。作为一个狂热的人工智能爱好者,我密切关注每一次发展,利用闲暇时间阅读每一篇有趣的新论文,并将其算法应用到我自己的电脑上。为了分享一些我所掌握的知识,并帮助那些没有像我一样密切关注的人迅速了解最新动态,我决定写一系列关于人工智能、人工智能产品开发、内部人工智能工具等的文章。
这些文章将作为导航指南,特别适用于开发人员、产品所有者、首席技术官和商业领域中尚未发现人工智能如何改变他们工作的人,或者需要一些额外想法的人。无论您是已经创建了以人工智能为驱动的产品,正在考虑将人工智能整合到您的内部工具和流程中,还是仅仅希望保持在技术创新的前沿,这个指南都适合您。我们将深入讨论关键的人工智能概念和技术,超越基本应用,提供能够扩展您对人工智能的理解和应用的见解和项目想法。这包括超越简单的聊天机器人和与ChatGPT或Copilot等工具的基本交互。与我一起探索人工智能重新定义发展、商业战略以及在您尚未考虑的领域中潜在的未来。
本文将为您提供一些关于我自己的背景信息,当前的人工智能景观以及我们的发展方向。重点将主要放在大型语言模型上,因为它们对大多数公司提供了最直接的益处,但我也会谈到其他模态,如视觉和音频。
如果这篇文章激发了您的兴趣,并且您有任何商务合作的需求,请随时通过LinkedIn与我联系。
一些背景
机器学习作为我作为一名前端开发人员、后来成为区块链开发人员、教练和课程作者之外的一项非常迷人的爱好开始。我涉足了许多项目和实验,例如使用LSTMs和生成对抗网络生成音乐,创建扑克牌强化学习代理(创建一个真正能够支持多个玩家和机器人的扑克引擎比AI本身更具挑战性),以及通过硬币照片进行货币计数。我还参加了一些Kaggle挑战,并梦想着有一款完美的视频游戏,其敌方AI能够真正从你的行动中学习,还有其他一些东西。我曾想象过像ChatGPT这样的技术只会在我们完全掌握像视觉和强化学习这样的领域的AI之后才会出现。我的假设是AI的早期好处将完全只属于那些开发工厂先进质量控制系统、自动投资、自动驾驶汽车、安全系统甚至更高级敌方AI的游戏公司,只要消费者硬件足够运行它...
男孩,我真高兴这一次错了!
我认为对于许多人来说,即使是对人工智能有浓厚兴趣的人,LLM(Language Model)的革命及其所带来的一切都完全出乎意料。毕竟,在Attention Is All You Need论文引入Transformer架构两年后的2019年,该架构仍然只被认为是“未来机器学习模型的一种有竞争力的基准”,正如《Transformer语言模型在语法错误校正中的非常有效性》一文所述。这引发了许多有趣的研究,逐步改进这些模型,直到GPT-3的问世,它在那时超越了其他任何模型。由于这些架构通常有很多共同之处(最常见的是Transformer架构,但不仅限于此),其他模态如视觉和音频也很快实现了类似的突破。
那么说,如今很明显地,这些技术不仅仅是停留在这里,它们正在以越来越快的速度推动我们向前发展。
当前景象
在今天的世界中,我们都熟悉那些已经成为许多人日常生活不可或缺一部分的大型人工智能应用,但是有很多种方式来利用人工智能进行构建,所以让我们来看一下其中的一些类别。
一方面,你有像ChatGPT这样的应用程序用于生成文本,OpenAI的Whisper用于转录语音,Dall-E和Midjourney用于创建图像,ElevenLabs和OpenAI用于生成文本到语音……这些都是只需通过界面与模型进行交互的应用程序的例子。
然而,故事还有更多内容。像Mistral AI和Stability AI这样的公司正跟随OpenAI的步伐,从头开始训练自己的模型并将其作为API提供,同时还提供较小的模型以供消费级硬件使用。当然,还不能忘记Meta的LLaMa和LLaMa2模型,就像Mistral AI和Stability AI的模型一样,它们可以在消费级硬件上本地运行(不过最重的模型仍然可以在您自己的服务器上运行!),并且基于其架构,已经启发并激发出了数百甚至数千种自定义的微调,旨在改进它或使其在特定的对话风格或主题上更加专业化。
然后我们有许多公司正在包装这些模型,无论是本地可运行的模型还是通过APIs,以某种方式来增强这些模型的能力或者加入自己的内部数据,可以通过从矢量数据库中添加额外的上下文到提示中来增强模型,或者通过使用OpenAI的Assistant API与Web APIs或PDF文件进行交互来增强模型。这基本上是构建一个由LLM驱动的聊天机器人所需要的一切。已经有许多聊天机器人使用大型语言模型作为驱动,使得公司能够提供更便宜、更快速的客户支持,并且这些支持是基于公司自己内部的知识库。事实上,Microsoft的Bing、Copilot和GitHub的Copilot都属于这个类别,因为它们不仅包装了OpenAI的GPT模型,还通过传入您的活动文档、网络搜索结果、代码库等额外的上下文来增强模型。这就是我们所说的检索增强生成(Retrieval Augmented Generation,简称RAG)。
当然,还有很多人和公司利用这些产品直接与之进行交互,以内部提高效率并从中获利。例如,想想Netflix日本正在尝试使用AI工具来生成和帮助创作动画背景。还有作家工藤理惠,她的作品《共鸣的东京塔》获得了芥川龙之介奖,她表示没有ChatGPT的帮助,她不可能做到这一切。
个人而言,我经常使用ChatGPT或Bing的浏览能力进行事实核查,我经常使用phind.com来处理编码问题和编码研究。我也非常喜欢GitHub Copilot作为我的初级编程伙伴,当我在玩视频游戏时,我发现Bing非常有帮助!(视频游戏指南文章现在充斥着烦人的弹窗和广告,与Bing聊天则没有这些问题!)
对于许多商业应用来说,最大的 LLM(语言模型)可能过于庞大,并且性能较差,不如定制模型。几乎可以为任何场景构建定制的生成式人工智能工具,从客户支持到供应链管理,尤其是在具有专业术语的行业,如医疗保健、金融和法律。这种定制化导致的模型更加针对和高效。而且,由于它们可以在本地或自己的服务器上运行,它们也更加安全,从而在隐私和数据控制方面具有优势。
这只是 AI 在过去一年内产生的重大影响的一瞥。如果我们要全面探索上述每个领域,可以写一本书,因为它们都值得有自己专门的文章。大多数这些应用案例对于普通企业来说可能会显得非常陌生。然而,我认为在这最后的类别中,99% 的商业应用案例都将属于这种情况。利用经过精确调整的模型和其他专门针对您需求的 AI 工具有巨大的未开发潜力,特别是在大型语言模型的世界里。毕竟,大型语言模型本质上不是聊天机器人、客户支持引擎、编码助手或其他那些东西。大型语言模型本质上是一个非常先进的文本处理引擎。
前进的道路
所以,正如我之前提到的,对于普通公司来说,大部分的价值将来自于整合LLMs(生成图像和音频非常酷,但对于普通公司来说,在实际应用中更加局限)。LLMs可以在增强IT基础设施、自动化需要人工干预或人工输入的重复性任务、加速开发等方面提供战略优势……技术总监们,请注意:你们的主要任务很快肯定会包括研究如何将人工智能与现有技术堆栈集成,并为人工智能能力培养团队。此外,对于那些需要使用自己的数据来增加或微调模型的用例,拥有/收集/维护高质量的数据将变得极其重要。
对于产品所有者和架构师来说,随着人工智能的日益突出,将人工智能纳入产品、架构和设计决策中将变得越来越重要。这就好比我经常和同事们讨论的一件事,我认识的很多人如果没有网站可以提前查看菜单,就不再去餐馆了。这样做可以减少意外和失望。但是仅仅20年前,几乎没有餐馆拥有网站。人工智能可能也会走同样的路。事实上,没有人知道未来会怎样,但重要的是在如果有一天需要一个真正有用的客户支持人工智能聊天机器人,或者当竞争对手通过开放与人工智能模型良好配合的API将其应用程序更易于使用人工智能的能力,要有心理准备并及时更新自己的知识。
对于开发人员来说,像GitHub Copilot和Phind这样的工具提供了极好的编码辅助,尽管我确信通过微调或增强公司内部数据的语言模型仍然可以进行许多改进。想象一下,根据票务需求,能够完全遵循公司内部的样式指南来搭建新的页面/组件/...,完全摆脱乏味的样板工作,这样你就可以专注于令人激动的部分 - 这对每个开发者来说都是一个梦想!
结论
随着我们航行于人工智能不断变化的领域,认识到低估其覆盖范围和影响可能是一个关键的错误是至关重要的。人工智能不仅仅是科技巨头或利基初创公司的工具;它正在迅速成为我们技术生态系统中的一个基础层,就像互联网在早期一样。
即使您的公司不直接专注于人工智能或开发以人工智能为核心的产品,也绝不能自满。人工智能的应用是广泛的,不仅局限于明显的用例,如客户支持聊天机器人。请更广泛地思考 — 数据分析、流程自动化、个性化用户体验,甚至在我们尚未完全想象到的领域。
无论您的领域或关注点如何,如果想保持竞争力和创新力,了解人工智能已经不再是可选项。这不仅仅是为了跟上目前的趋势,更是为了准备好迎接一个将人工智能与我们工作和创造方式紧密融合的未来。重要的是要记住,无论现在有什么,这都是最糟糕的,这意味着从现在开始,技术只会越来越好。
作为参与软件创建的人员,我们需要拥抱这个转变,不仅仅把它看作是一个挑战,而是一个重新定义我们各自领域可能性的机会。人工智能的时代不仅仅即将来临;它已经到来,是我们所有人参与其中的时候了。
在这个变革时代,你的角色将是什么?你将如何利用人工智能来重新定义你所在的行业或专业,或者仅仅是让生活和工作变得更加简单和少一些枯燥乏味?
敬请关注我的下一篇文章,我将深入探讨具体的使用案例,并从技术堆栈的角度探索如何处理它们。人工智能时代已经到来,我们能够共同利用其力量,开启一个前所未有的创新和增长时代。
正如我在介绍中提到的,如果本文激发了您的兴趣并且有任何商业合作需求,欢迎通过LinkedIn与我联系。我提供辅导服务,并可以帮助将人工智能解决方案应用到您的基础设施中。