我试过人工智能，发现它们没有用。

ChatGPT中文站 — Image by Gorden Johnson from Pixabay

当我第一次发现ChatGPT时，我认为它是一种可以改变世界的技术，就像互联网或智能手机一样（更具体地说，是那些使这些设备与之前版本的复杂移动电话不同的移动操作系统）。而且我真的相信图像生成AI可以在图像创作业务中扮演重要角色。

在经过将近半年的尝试ChatGPT与图像生成AI之后，我得出了一个结论。

就我而言，它们是无用的。

不要误会我。我是那些为AI服务订阅付费的人之一，试图探索他们的能力，了解他们能做什么，不能做什么，并找出如何利用这种技术，最终开始自己的媒体制作公司而不烧掉一堆钱。我尝试使用小说AI为我的博客文章和网络小说创建图像，以及电子书封面艺术。我尝试了ChatGPT，以找出它是否可以可靠地生成基于文本的内容，并帮助我使用Ren'py（一种视觉小说引擎）编写简单的视频游戏。我的想法是，也许我可以与LLM聊天机器人开发故事，并使用生成图像的AI创作/设计角色，以加快基于故事的视频游戏，以及网路小说和博客文章的制作过程，以从我的个人博客和网站中获得广告收入。

这些都不符合我的要求。

图像生成人工智能的局限性

让我从图像生成AI开始说起。我使用了NovelAI，当您想要它创建性感动漫女士的图像时，它仍然能够出色地完成任务。我生成了几千张图片，其中一些非常壮观。但更多情况下，这些图片往往非常丑陋，即使是还不错的图片也有很多限制。我尝试中观察到的这些限制也没有被其他人克服，因为我找不到能克服这些限制的人工智能生成的图像。我认为人工智能生成的图像作为内容业务资源无用的原因是：

严重受限的创意能力：图像生成的AI无法做很多事情，不仅仅是NovelAI我试过的。例如，几乎不可能让你的角色拿着你选择的物品，比如枪、刀、杯子、勺子或乐器。这些物品要么被乱搞了，要么是初级和不现实的形式，要么是持有它们的手是解剖学灾难。拥有太多的手指相比我有时会得到的奇怪结果而言微不足道。此外，几乎不可能让AI画一个打斗场景。它不明白一个合适的踢或拳打应该是什么样子的。它甚至不能让一个角色用枪瞄准敌人。你必须非常幸运才能让你的角色用一只手正确地拿着一支枪。在大量由AI生成的图像中，我至今没有看到一个带有适当拳打或踢腿的打斗场景，更不用说使用武器了。人们可以创造一个图像小说，这些图像更像是站立或坐着的人物的静态插图。但你需要更多的东西来讲故事。
有限的一致性：你不能让你的角色穿同样的衣服。一些引擎在某种程度上克服了这个限制。但是，当你试图再现角色以微妙的姿势、背景或面部表情变化为前一个图像时，AI会改变角色穿着的衣服和饰品的细节。它一直变化。因此，当你必须为图像小说或视频游戏获取角色艺术作品时，不可能让你的角色在两幅不同的图像中穿同样的项链或大衣。那就是我放弃创造AI动力图像小说的想法的时候。
美学价值的局限性：在像ArtStation或DeviantArt这样面向艺术的网站上，您可能会发现一些AI图像非常惊人，人物拥有超现实的美丽或宏伟。如果只有几张这样的图片，可能就会出现这种情况。但是，由于有数百万这样的图片被不断制作，由于面部形状，角度，姿势和身体形态缺乏多样性，这些图像变得无聊并且有所欠缺。这些图像的另一个缺点是阴影。尽管有时它能够在角色的身体上创造出完美的阴影和正确的渐变，但渐变的层数受到能力的限制。因此，AI生成的图像通常缺乏手绘艺术的深度，使它们看起来很“平面”。再加上多样性的限制，这些图像会立即被多次接触过这些AI生成的图像的观众所注意到。这些美学上的限制会给人留下廉价制作的印象，即一个艺术家或制作公司试图通过依靠便宜的AI生成的图像来省钱。这使得读者或潜在客户怀疑这样的封面下面的内容质量。虽然没有任何科学研究证明这个假设，但我的个人经验是，当书籍封面艺术被替换为AI生成的图像时，电子书销售情况并不好。
在各种形式上存在着局限性：当AI图像首次出现时，一些人似乎认为它至少能够使角色开发过程更快。这是正确的，但在外观上做出的更改方面也存在着局限性，即使没有武器握在手中。例如，发色的数量有限，而要获得准确的瞳孔和眼睛形状非常困难。嘴唇甚至更难控制，因为到目前为止我遇到的只有几种图案。而身体形态也没有太大的不同，仅限于少数几种原型，而当您希望从不同角度再现同一角色时，无法保持身体的精确尺寸。
字符数量限制：在由人工智能生成的图像中可能会出现一个或多个字符，甚至是一大群字符。但问题在于，从各个角度对个体字符的控制变得更加困难。尽管在某种程度上可以控制它们的外观，但当您尝试以特定方式排列它们并使它们按您所希望的方式互动时，事情就变得不可控制了。您无法使两个字符打架或相爱，因为它们很可能会被混在一起，形成令人恐惧的有机物堆。在许多情况下，图像实际上非常丑陋。即使你能用多个字符完成你想要的场景，但在保持一致性并将它们带到后续场景中将几乎是不可能的，或者需要与自己画图花费相同的时间。无论如何，如果想要创建高质量的内容，至少不能通过这样的方式制作网络漫画或图像小说。

这些只是AI生成图像的一些技术限制，更有价值的是版权问题。美国版权局明确表示，虽然包含AI图像的内容仍然可以受版权保护，就像漫画书本身一样，但其中的单个AI生成图像不能受版权保护，而且这还没有解决AI侵犯他们接受训练的手绘原作品版权的问题。

结合所有这些问题，AI图像对于严肃的商业内容项目几乎没有任何价值，任何试图在严肃的商业项目中使用它们的尝试都肯定会适得其反或使项目在市场上沉没。

文本生成人工智能的局限性

文字生成人工智能，例如ChatGPT，并没有表现得更好。虽然ChatGPT以其撰写散文或以不同语气改写给定散文的能力惊艳了许多人，但是在将其用于内部运营目的，例如销售报告或商业内容创作项目（如小说写作或撰写基于故事情节的视频游戏）方面存在局限性。至少从我个人的经验来看，ChatGPT存在一些问题，包括：

准确性在ChatGPT之前，有Google翻译。翻译软件比AI存在的时间更长，曾经被认为是人类翻译者的毒瘤。一些翻译机构向客户提供机器翻译服务，支持人工审查和编辑，以较低的价格进行服务。问题出在编辑上。他们发现他们必须仔细注意大量的计算机翻译句子，因为计算机很少犯错，但当它们犯错时，错误可能是致命的。例如，它可能使合同甲方承担100万美元的责任，而合同则说其“不承担”责任。这样的审核和修正最终需要像手动翻译一样的时间。这些机器翻译编辑工作薪酬较低，因此许多翻译人避免此类工作。ChatGPT也是如此。虽然它可以总结大量文本或根据某些材料撰写报告，但结果可能存在如上所述的致命缺陷。更糟糕的是，当他们无法提供信息时，ChatGPT往往会编造不存在的信息或产生幻觉，如所谓的幻觉。这个问题可以通过后续升级程序来解决，但仍需注意AI输出的不正确性，花费如此多的时间和精力，仍需担心潜藏在无数文本中的错误性和一致性，将抵消AI快速度的优势。有时，通过自己完成工作，可更可靠地最终更快地完成工作。
缺乏创意：这个问题在虚构写作中尤其突出。 ChatGPT可以在空中创造一篇短篇小说，并在您提供详细概述时做得更好。但是，当它被托付为创作情节时，它往往会给出一个缺乏惊喜或充满陈词滥调的结果，因为它试图模仿它所受过训练的现有小说和故事。虽然有些人可能会有不同的看法，但我个人发现AI的写作风格太预料化和平淡无奇。它还有一个让角色道德地行动的倾向。当允许AI设计故事情节时，您无法让反派人物做出真正可怕的事情。由于程序员政策要在可能的情况下给出积极的输出，他们倾向于在给定的情况下做出道德选择。
缺乏偏见：这是人工智能写作最大的问题。通常，偏见是一件坏事，有人可能认为完全没有任何偏见的作家是一件好事。但问题在于，我们读别人写的东西并欣赏陌生人设计的故事，因为我们对别人可能会有什么话想说很好奇。而人们说的话和写的故事都是不同的，因为他们从不同的角度或者通过与你自己不同的眼睛看待事物。这种差异也是一种轻微的偏见，意味着他们看待和理解事物的方式存在扭曲。如果没有任何偏见，每个人都以完全相同的方式看待事物，就没有必要写作和阅读，因为大家都有相同的观点，没有任何可好奇的地方。但我们在思考和想象方面都有所不同，这就是为什么阅读别人创作的故事如此迷人。它是对另一个人（作家、记者、分析师或学者）头脑的探索，我们发现它很有趣，因为有时会发现具有不同观点的新领域。另一方面，人工智能的设计是不具有任何偏见的，因为程序员致力于使人工智能编程能尽可能地被许多人接受（当然，这也是为了获得更好的利润）。即使它有偏见，也不是基于过去的经验或特定人经历过的世界，其他人可以通过阅读他的作品进行探索。它是一些偏见的混合物，这些偏见仍然留在它的程序中，逃过了程序员无情的清除过程，因此缺乏一致性和压缩，几乎没有任何可探索的内容。这不是因为我是一个艺术纯粹主义者而成为了问题。这是一件坏事，因为最终产品——写作不具有吸引力和乐趣，并且必须进行大量的修正和编辑，才能吸引读者，这可能需要和独自完成所花费的时间一样长。

AI仍然是研究中有用的工具，比如发现某个主题的最新科学文章。但即使在这方面，AI也不能完全依赖，因为它缺乏很多东西。尝试使用Bing聊天查找某个主题的科学文章。它只能给你一些，但你可以在谷歌或Bing上找到更多。

（原先发布在broocle.com上）