使用ChatGPT来纠正新闻文章的西班牙语语法和风格。

ChatGPT中文站
Photo by Jonathan Kemper on Unsplash

La Silla Vacía是一家知名的哥伦比亚数字原生媒体机构,专注于政治报道。它有一个名为“En Vivo(现场直播)”的栏目。新闻室中的所有记者每15天至少工作6个小时来更新这个栏目。它的目标是通过简短而简明的文字条目来叙述当下的主要新闻。

减少En Vivo以及网站所有部分中的写作、语法和拼写错误数量是新闻记者和编辑的目标之一。为了简化这项任务,我们开始尝试使用OpenAI模型(GPT-3.5和GPT-4)。

中期目标是产生良性循环:记者们意识到自己的错误更多,实时进行自我编辑,减少向编辑提交的错误数量,编辑们也因此花费更少的时间纠正简单错误,并有更多时间专注于对观众更相关的任务。

我们测试的结果让人又喜又忧。该系统可以识别和纠正大部分错误,但有时它会表示已经纠正了一句话,但是当我们检查“纠正后”的句子时,它与原句完全相同。此外,由于我们使用的是我们自己写作风格书中没有训练过的系统,它的某些建议虽然在语法上是正确的,但与我们的网站无关。最后但并非最不重要的是,创作提示所需的时间比我们最初估计的要长。

尽管如上所述,我相信我们可以达到一个系统允许我们审核我们样式指南正确应用的点。合作、共享文档和经验在这个过程中是关键。就目前而言,我们并不考虑在未经人类记者或编辑批准这些更正的情况下发布由ChatGPT更正的文本的情况。

以下是我使用ChatGPT的实验过程描述。

随机性、系统提示和用户提示

当我开始这个实验的时候,我想要实现两件事:我想让系统对文本进行更正,而且我希望系统能以项目符号格式告诉我它进行了哪些更正以及为什么做出了这些更正。在我的看来,获取错误和建议的列表是将ChatGPT建议整合到文本中最优和最快的方式。

这是我在ChatGPT界面中使用的第一个提示之一(URL为“https://chat.openai.com/”):充当一名样式编辑器。 在文法,性别和数量一致错误以及标点符号使用错误例如冗余,也请指出错误单词或错字,并识别文本风格中的任何不连贯之处。 当您向我展示结果时,请告诉我原始短语,错误和您建议的新修订。

你是一位风格编辑。识别并指出语法错误,如冗余、性别和数量一致错误,或使用标点符号上的错误。还要指出拼写错误或打印错误,并确定文本风格中的任何不一致之处。当你向我展示结果时,请标明原始句子、错误和您建议的新措辞。

我开始注意到,尽管给系统相同的指令,但每次与系统交互时它做出不同的事情。在Nick Diakopoulos的建议下,我开始在OpenAI Playground上进行测试,这是一个与以前不同的界面。在Nick的指导下,我了解到有一个名为温度的变量,可以将值指定为0到2之间,该值接近于0,系统的响应就会更连贯和可预测。在这个实验中,我决定将温度参数设置为0。

在GPT-4中,我也开始区分系统提示和用户提示。系统提示是最初提供给模型以建立对话语境的文本。用户提示用于定位模型到具体的对话目标。

以下是我尝试过的系统提示版本:

  • 你是样式编辑器。
  • 你是媒体机构中的样式编辑。你是西班牙文法专家和媒体机构的编辑。
  • 你是一位西班牙语语法专家、有丰富经验的记者和编辑。你擅长编辑新闻报道,保证语言使用正确和准确,具备写作和拼写能力。
  • 你是一位语法专家,具有丰富的记者和编辑经验。你拥有出色的写作和拼字能力。

为了建立用户提示,我查阅了La Silla Vacía的样式书,并确定了一系列指南,希望能够在ChatGPT中进行检查。最适合我的方法是为每个规则创建一个提示,当我检查了提示的正确性后,我尝试构建更大的提示,将已经单独运行良好的指令集成在内。在大多数情况下,我使用了零-shot提示,即我向系统提供描述或指示,告诉它我期望它能够做什么,而不介绍具体的例子。

为了测试提示,我准备了一组五个测试文本,并故意添加了我希望系统纠正的错误。如果系统没有纠正错误,我会调整提示并一次又一次地尝试。在这些情况下,我没有告诉系统它做错了什么,我只是不断尝试。当我成功时,我进行了实时测试,测试了15篇文章。通过实时测试,我指的是当一篇文章准备好发布时,我使用ChatGPT检查并采纳相关的建议。这是我在实时测试中使用的提示之一。

改正错别字、冗余和重复的词语。纠正使用标点符号的任何错误。不要用逗号把主语和谓语分开。在附加信息前后使用逗号。在连接表达后使用逗号。纠正动词时态的任何错误。

由于我的目标是以列表格式进行更正,因此我使用了第二个提示来完成这个任务。我最初的想法是创建一个单一的用户提示,但是由于我没有得到好的结果,所以我决定使用单独的提示。这就是这个第二个提示的演变过程:

  • 告诉我你做了哪些更正。
  • 请列出您对文本所做的所有更改。(List all the changes you have made in the text.)
  • 逐一列出您所做的所有更改(Lista, uno a uno, todos los cambios que realizaste en el texto)。[这是迄今为止我最喜欢的]

注意:到了五月底我在检查西班牙语版本文章的语法时,发现上述提示未能如之前那样有效。系统开始告诉我:“上述请求中没有提供要更正的具体文本。请提供其中有错误的文本以便我进行更正并列出更改。”我对提示进行了微调,问题得到了解决:

  • 一一列出你在之前的文本中所做的所有更改。

2023-10-20 16:52:49 AI中文站翻译自原文