AI初创企业趋势：Y Combinator最新一批公司的见解

构建在最新人工智能技术之上的公司有哪些类型？

ChatGPT中文站 — Photo by Proxyclick Visitor Management System on Unsplash

Y Combinator（YC）是著名的硅谷创业公司加速器，最近宣布了他们的2023年冬季批次，毫不奇怪，269家初创公司中约有31%（80家）自称拥有人工智能标签。对实际数字持保留态度，但趋势明显——利用人工智能的初创公司现在占了YC批次的相当大一部分。

对于这篇文章，我分析了这一批次的20-25个初创企业，以了解一些较大的趋势，特别是那些利用LLM（大型语言模型）的初创企业。这些趋势涵盖了他们如何发现并解决问题，他们采取的解决方案方法，他们的正确做法以及他们方法中可能存在的风险。

但在我们进入趋势之前，让我们从一个通用框架开始思考科技公司（不论规模大小）如何从人工智能中获得价值。

AI价值链

如果你最近一直关注科技新闻，关于人工智能的内容爆发式增长，很难把这些新闻放入整体图片中去理解。让我们使用一个简化的框架来思考这个问题。

AI是一个非常广泛的术语，涵盖了各种技术，从可以预测事物的回归模型，到可以识别物体的计算机视觉，最近又发展出了大型语言模型（LLMs）。为了讨论方便，我们将重点放在LLMs上，自从OpenAI向公众开放ChatGPT并引发了公司之间的AI竞赛以来，它们一直备受关注。

科技公司利用人工智能通常在三个层面中的一个运营：

基础设施 - 这包括硬件供应商（如 NVIDIA，用于支持AI模型所需的所有重型计算所需的GPU），计算供应商（如亚马逊AWS，微软Azure，谷歌云，提供云端处理能力），AI模型/算法（如OpenAI，Anthropic提供LLMs），以及AI平台（如TensorFlow为您的模型提供训练平台）。
数据平台 / 工具层 - 包括能够收集、存储和处理用于AI应用的平台（例如提供云端数据仓库的Snowflake，提供统一分析平台的Databricks）。
应用层 - 这包括所有利用人工智能进行特定应用的公司（初创公司、中大型科技公司以及非本地科技公司）。

基于当前市场的情况以及类似过去情况的发展（例如，云计算市场），基础设施和数据平台层可能会趋向于少数几家拥有相对商品化产品的参与者。例如：

在硬件领域的参与者中，NVIDIA 目前以其 GPU 产品处于领先地位（2023 年他们的股票增长了两倍），我们将见证其他公司是否能够赶上。
计算机市场已经趋于融合，AWS、Azure和Google Cloud共占市场的三分之二。
在AI算法层面上，OpenAI以GPT模型强势登场，但这是一个竞争激烈、有着财力充沛的市场（Deepmind/Google Brain的谷歌、Facebook的Lambda、Anthropic、Stability AI）——如果你想深入了解，可以参考这份分析。这里需要注意两点：i) 大多数公司都可以访问相同的数据集，如果其中一家公司获得了新的付费数据集（比如Reddit），其他竞争对手很可能也会获得访问权限；ii) GPT模型位于算法层，而ChatGPT产品位于应用层（而非算法层）。

鉴于这种商品化的可能路径，这些层面上运营的公司可以选择两种可能的发展路径：

首条路线正在加强其在各个层级上的产品，最近的并购活动佐证了这一点——数据平台层的数据仓库公司Snowflake最近收购了Neeva，以加强其搜索能力并有可能在企业中应用LLMs，数据平台层的分析平台公司Databricks收购了AI算法层的MosaicML，以便“让每个组织都能获得生成式人工智能，使其能够使用自己的数据构建、拥有和保护生成式人工智能模型”。
第二个路径是向上移动到应用层——ChatGPT是一个典型的例子。OpenAI的实力在于人工智能算法层面，但随着消费产品的推出，他们现在成为数十年来与谷歌搜索的第一个真正的竞争对手。

未来从AI和LLMs中释放出的大部分价值将在应用层实现，包括通过创办新创业公司创造的价值，这也带我们来到了Y Combinator。

Y Combinator（YC）的工作原理是怎样的

关于 YC 的简要背景介绍完毕，接下来我们将探讨一些趋势。大多数 YC 公司都处于非常早期的阶段 - 批次中有 52% 的公司只是基于一个创意被接受，而在 YC 之前有 77% 的公司没有任何收入。

YC非常挑剔（

他们在2023年的两批次中投资了300多家公司，并在2022年投资了600多家公司。
公司获得一个标准的交易（125,000美元的资金对应7%的股权）。
YC为初创企业提供许多导师指导以及与大量人士的联络机会，包括YC校友、投资者等。
因此，为了使他们成功，YC只需要一些巨大的成功案例来赚钱（与任何天使投资类似），并且有几位校友取得了巨大的成功。

说这些只是为了表明——YC是一个很好的代表性列表，它代表了早期初创企业市场的现状以及借助人工智能迎接刚起步的创业公司所获得的机遇。有了这些，我们将深入探讨大趋势。

人工智能初创公司的趋势

1. 专注于特定问题和客户

初创企业致力于为特定一组客户解决专注的问题，即“通用”人工智能解决方案较少。

一个这样的例子是Yuma.ai，它专注于帮助在处理客户请求和关注方面遇到困难的Shopify商家（您可以在这里查看演示）。通过利用大型语言模型（LLMs），Yuma.ai可以自动从知识库生成响应。另一个名为Speedy的创业公司致力于支持没有时间使用生成式人工智能创建营销内容的中小型企业（SMBs）。Haven旨在为物业经理自动化约50%的住户互动。OfOne专注于大型快餐驱通过程，帮助它们自动化订单处理流程并提高盈利能力。

在所有这些例子中，都专注于一个狭窄的问题领域和客户，并在该上下文中应用LLM。

2. 与现有软件的集成

除了简单地选择GPT / LLM并通过用户界面公开它们，一些初创公司正在进一步与客户已经使用的现有软件进行整合。

一个典型的例子是Lightski，它专注于与客户关系管理 (CRM) 软件，如Salesforce进行集成。他们的目标是通过Slack发送自然语言消息，使客户能够简单地更新他们的CRM，从而消除了需要在用户界面层层导航的需求。Yuma.ai提供一键安装功能到帮助台软件中，将LLM的能力与客户自己的知识库结合，为服务代理人生成草稿回复。

这些集成是推动解锁新的用例的重要因素，而那些开箱即用的 LLM 应用，如 ChatGPT，不能轻易解决。

3. 结合其他人工智能技术来利用LLMs

初创公司正在探索结合计算机视觉和预测等其他人工智能技术，以创建一种与众不同的产品。

一个这样的例子是Automat，其客户提供了一个他们希望自动化的重复Chrome过程的视频演示。然后，Automat利用应用于屏幕录制的计算机视觉技术以及人的自然语言输入来创建所需的自动化。另一个名为Persana AI的初创公司利用客户关系管理数据集成和公开可用的数据来预测销售团队的潜在热门线索。然后，他们利用LLMs为每个已识别出的线索起草个性化的外发消息，利用有关个体的可用自定义数据（您可以在此处查看演示）。

运用多种技术的结合帮助这些初创企业打造了壕沟，并与普通的法学硕士申请应用程序形成了差异。

4. 自定义LLMs

许多创业公司都提供根据用户过去数据和语言风格的定制选项，以定制顾客使用的LLM模型。

例如，Speedy是一个帮助中小企业生成营销内容的平台，与他们的客户一起进行品牌工作坊。从这些工作坊中收集到的见解会被输入到他们的模型中，使Speedy能够捕捉并融入每个企业独特的声音和品牌形象到生成的内容中。在类似的方向上，Yuma.ai专注于从以往的客服工单中学习写作风格。通过分析这些互动中使用的模式和语言，Yuma.ai能够生成与建立的风格相符的初稿回复，确保客户交流的一致性和个性化。

5. 创意用户界面

最被低估的创业公司开始利用的杠杆之一是构建独特而实用的用户界面（UI界面），而当前大多数LLM产品（如chatGPT、Bard）在这方面并不擅长。当这些界面根据特定使用案例进行定制时，可以为客户带来大量新的价值，并吸引更多尚未采用现有产品的用户加入，因为他们很难使用。

类型是一个有趣的例子 - 它们构建了一个灵活、快速的文档编辑器，允许用户在书写时通过按下 cmd + k 快速使用强大的人工智能命令。Type 的人工智能能够理解文档的上下文，并随着您的写作而调整建议，并学习您的风格（您可以在此处查看演示）。

其他一些有趣的例子包括Lightski使用Slack作为更新CRM信息的接口，以及Persana AI使用Chrome扩展作为在个人的LinkedIn页面上轻松提供外发草稿的方式。

6. 高信息量，高精度的使用案例

有一批初创公司专注于特定用例，既需要处理大量信息，又需要对发现的洞察力有高度的准确性。

SPRX直接从您的工资和会计系统中获取数据，计算符合IRS要求的准确的研发税收抵免。

在医疗保健领域，Fairway Health使用LLMs来提高效率，这是一个相当手动化的过程 - 分析长篇医疗记录以评估患者是否适合接受特定治疗。这有助于保险公司更高效地运作，并为消费者创造了更少令人沮丧的体验（您可以在此处观看演示）。

AiFlow使用LLMs从分析数百份文件中提取引用和数据，帮助私募股权公司进行尽职调查。

7. 数据封锁，为企业客户提供BYOD产品

与消费者不同，企业希望对其数据的使用和与公司以及人工智能软件提供商的分享拥有控制权。企业投入了大量的精力来整合来自不同来源的数据并将其内部化（本文《合作伙伴集成+智能系统：今日最深的壕沟》由Medium的作者Phani Vuyyuru深入探讨了该策略）。因此，他们不太愿意放弃对数据的控制。他们希望能够在一个隔离的环境中，将自己的数据（BYOD）引入基线产品，并对产品进行定制。

CodeComplete的创意最初是在他们的创始人在Meta期间尝试使用GitHub Copilot时提出的，由于数据隐私考虑，他们的请求在内部被拒绝了。CodeComplete现在是一款经过调优以迎合客户自身代码库的AI编码助手工具，为客户提供更相关的建议，并直接部署在客户的本地或云端。

在类似的范围内，AlphaWatch AI 是一种为对冲基金提供的人工智能副驾驶员，可以帮助客户使用定制的LLMs，利用外部数据源和安全的私人数据。

护城河风险

肯定令人激动的是看到越来越多的人工智能初创企业涌现出来，这将有助于个人消费者和组织更加高效地解决问题。毫无疑问，这些产品将对提高生产力和问题解决的效果起到巨大的推动作用。

然而，这些初创公司中的几个存在一个关键风险，即潜在的长期护城河缺乏。考虑到这些初创公司的发展阶段以及有限的公开信息，很难对此过分乐观，但很容易对它们的长期防御性提出质疑。例如：

如果一家初创公司的基础是构建在像GPT这样的基本语言模型上，将其整合到帮助台软件中以理解知识库和写作风格，然后生成草稿回复，那么是什么阻止了像Zendesk、Salesforce等帮助台软件巨头复制这个功能，并将其作为他们产品套件的一部分提供？
如果一家初创企业正在为文本编辑器构建一个酷炫界面来帮助内容生成，那么是什么阻止了谷歌文档（已经在尝试自动草稿）和微软Word（已经在尝试Copilot工具）复制这一点呢？更进一步说，是什么阻止他们提供一个质量差25%的产品，并与现有产品套件（如微软Teams取代了Slack的市场份额）免费提供？如果一家初创企业正在为文本编辑器构建一个酷炫界面来帮助内容生成，那么是什么阻止了谷歌文档（已经在尝试自动草稿）和微软Word（已经在尝试Copilot工具）复制这一点呢？更进一步说，是什么阻止他们提供一个质量差25%的产品，并与现有产品套件（如微软Teams取代了Slack的市场份额）免费提供？

那些没有护城河的公司仍然可以在其现有形式下获得成功，而它们所从事的业务特点使其成为有吸引力的收购目标，无论是作为特色附加功能还是从人才角度来看。然而，对于有兴趣将这些初期想法转化为巨大成功的初创公司来说，建立护城河至关重要。

一个明确的方法是构建一个完整的产品，解决一个问题领域，并将人工智能作为其特性的重要部分（而不是将人工智能仅作为现有问题领域的附加产品）。

例如，Pair AI专注于在类似抖音的格式中帮助创作者构建更具吸引力的课程的问题领域，并通过一些人工智能功能（如对话式问答）作为其服务的一部分。KURUKURU正在构建一个用于创作漫画的3D引擎，并具有一些创建角色相关的人工智能功能。

另一种方法是通过将一些以上趋势与彼此结合，加强产品提供（从AI功能扩展至更广泛的解决方案产品），包括数据整合、BYOD模式、实现定制化、与其他AI技术结合。

这是一个快速发展的市场，我们离看到这些创业公司的成果还有很长的路要走——看到它们在未来几年如何发展将会很有趣。祝愿 YC 的 W23 孵化班好运！

感谢阅读！喜欢这篇文章吗？考虑订阅我的每周Substack电子报吧。我每周发布一篇关于当前科技和商业话题的深度分析，以10分钟阅读的形式呈现。你也可以在Twitter上关注我@viggybala。祝好，Viggy。