关于如何重写对话，让AI系统更容易…… — 这是一个关于如何重写对话以让AI系统更容易理解的例子。

资料来源：圣地亚哥加利福尼亚大学

10.11.2021•

比喻性语言混淆了聊天机器人

计算机科学家最近研究了对话系统的性能，例如个人助理和聊天机器人，它们被设计用来与人类互动。研究小组发现，当这些系统遇到包含习语或明喻的对话时，它们的性能会下降到10%到20%。

研究小组还开发了一种局部疗法。他们写了一个简单的脚本来识别比喻性的短语，并用它们的字面意思替换它们。结果，对话系统的性能提高了15%。

这项工作的应用不仅包括个人助理，还包括用于总结信息的系统，比如谷歌页面顶部的总结搜索结果的框。需要回答问题的自动化系统(例如，当需要支付账单或预约时)也会从这项工作中受益。

该论文的第一作者Harsh Jhamtani说:“我们想让人们和对话系统之间有更多的自然对话。”

Jhamtani是卡内基梅隆大学(Carnegie Mellon University)的博士生，目前与加州大学圣地亚哥分校(UC San Diego)计算机科学与工程系(Department of Computer Science and Engineering)的资深作者Taylor Berg-Kirkpatrick一起担任访问研究员。

这项研究的灵感来自Jhamtani自己在比喻性语言方面的挣扎。他的母语是印地语，也会说英语，这是印度的另一种官方语言。但他必须学习他的同事们使用的许多美国习语和隐喻。

例如，当一位同事说他们正在挨饿时，他惊慌失措，因为在印度语中，这可能意味着医疗紧急情况。他的同事解释说，这只是表示他饿了。那时Jhamtani想知道人工对话系统是否也会有同样的问题。

在这项研究中，研究人员测试了五种不同的与人类对话的系统，其中包括GPT-2。GPT-2经过训练，可以预测40GB互联网文本中的下一个单词，由研究公司OpenAI开发。

研究人员首先通过13.1万个关于旅游、健康等口语话题的对话数据集运行对话系统。然后，他们从数据集中提取包含比喻性语言的对话，并只通过这些对话运行系统。他们观察到表现下降了10%到20%。

然后，他们编写了一个脚本，使系统能够快速检查将比喻性语音翻译成文字语音的词典。这比重新培训系统更快更有效地学习这些词典的完整内容。研究人员观察到性能提高了15%。

在文本被转换之前，研究人员仍然必须部分依靠人类观察者来识别数据集中的比喻语言。这方面还需要进一步的研究。

在研究人员开发的算法准备好实施之前，需要进行多次迭代。例如，他们发现在一些罕见的情况下，用文字语言代替比喻语言会扭曲句子的语法，使对话系统无法理解。