当前位置:首页 > 产品运营 > 正文

【NLP-ChatBot】我们熟悉的聊天机器人有哪些类型?

本文是介绍聊天机器人的专栏第一篇。 简单介绍聊天机器人的历史、特点、分类和技术框架,让大家对聊天机器人有一个大概的了解。

作者兼编辑 | 小梦哥哥

【NLP-ChatBot】我们熟悉的聊天机器人有哪些类型?  第1张

1 聊天机器人概述

对话机器人的研究可以追溯到 20 世纪 50 年代。 艾伦·M·图灵提出了图灵测试问题“机器能思考吗?” 衡量人工智能的发展程度。 简单来说,图灵测试就是要求测试人员分别与机器人和人类对话,看看测试人员是否能够识别机器人。 这一领域于是成为人工智能领域一个非常有趣且具有挑战性的研究问题:如何设计和开发智能聊天机器人。

在应用方面,智能聊天机器人实际上是为了应对当今信息爆炸所存在的信息过载问题而设计的。 早期,智能聊天机器人被设计和开发为搜索引擎的最终形式。 具体来说,需要解决的问题是,人们对于仅返回网页集合的简单搜索引擎并不是特别满意。 通常,现有的搜索引擎需要一一浏览并仔细阅读搜索引擎返回的每个链接URL中的信息,然后消除冗余信息才能得到想要的答案。

更好的用户体验是,用户用自然语言向智能对话系统提出问题后,智能对话系统也能自然流畅地回答问题,而且回答内容与问题紧密相关且回答准确,节省了时间。用户有更多的时间。 很多时间。

目前,智能聊天机器人在业界已经有了一些初步的成功应用。 在智能客服、个人助理等场景中,已经能够替代大量人工客服人员,在电商、保险等行业进行简单的业务处理。 和客户支持。

根据聊天机器人的应用场景,聊天机器人主要分为三种类型,即问答系统(QA)、对话系统和聊天机器人。 下面简单介绍一下三类聊天机器人的特点。

2 问答系统(QA)

问答系统根据用户的问题给出答案,不涉及多轮对话。 通常用于智能家居中的智能搜索、家电控制等场景。 问答系统往往不需要调用业务能力,只需要完成用户问题的匹配和回答。

下面介绍问答系统中最常用的技术方案,如下图所示:

抽象地看,问答系统的任务实际上就是计算用户输入的相似度或相关性,然后在相应的FAQ库中找到与用户输入相对应的答案并返回给用户。

因此,一般来说,QA系统一般都是针对某个领域的,通常用于某个领域的客户支持和服务。

所以,构建QA系统,第一步就是构建高质量的FAQ语料库。 语料库应包含大量高质量的问答(QA)对。

模型的训练过程是为了使模型能够学习问答(QA)对之间的联系,或者查询集的特征。 因此,目前QA系统的实现只需要以下三种方法:

【NLP-ChatBot】我们熟悉的聊天机器人有哪些类型?  第2张

1. 计算用户输入Query和Question之间的相似度。 通过计算用户输入的Query与FAQ语料库中的Question之间的相似度,选择相似度最高的Question,然后通过QA图找到对应的答案并返回给用户。

2. 计算用户输入Query和Answer之间的相关性。 通过计算用户输入的查询与FAQ语料库中答案之间的相关性,选择相关性最高的答案返回给用户。

3、结合用户输入的Query和Answer之间的相关性以及用户输入的Query和Question之间的相似度。 通过结合相关性和相似性,选择最匹配的答案并将其返回给用户。

3 对话系统

对话系统(Dialogue System)通常面向某个任务,机器人需要与用户进行交互,甚至是多轮交互。 最后需要调用业务资源来完成某项任务。 例如,天气查询机器人根据用户的输入确定是否可以查询某个时间、某个地点的天气。 如果条件不够,就需要主动询问用户,最后调用“中国天气网”之类的东西来获取天气数据。

对话系统的应用场景非常丰富,比如客服机器人、销售机器人等都是对话系统的代表。

如下图所示,是一个对话系统的技术架构图:

通常,对话系统包含自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)等部分。

NLU部分负责理解用户输入,主要包括意图识别和实体识别; DM部分用于管理整个用户的通话状态,包括时隙管理、行为决策、数据采集等功能; NLG主要负责生成答案。

4 个聊天机器人

聊天是一种开放域的聊天场景,就像两个朋友之间聊天一样,没有话题和内容的限制。 聊天机器人主要应用于个人助理、娱乐等场景。 典型代表有微软小冰、苹果Siri等。

聊天式机器人的开发难度很大,需要庞大的数据集和能够兼顾灵活性和准确性的算法模型。 目前聊天式机器人的效果并不理想。 我个人认为,未来我们需要将高质量的知识图网络和强大的强化学习算法结合起来。

这里我们介绍一个比较流行的生成式聊天机器人的技术架构,以便大家熟悉聊天机器人最基本的实现。

【NLP-ChatBot】我们熟悉的聊天机器人有哪些类型?  第3张

如上图所示,生成式聊天机器人通常基于seq2seq架构,利用模型自动生成答案,并利用Attention等技术进行优化。 目前,为了实现对用户输入更好的编码,会引入Attention等技术; 为了实现模型理解用户上下文输入的能力,将引入用户历史记录的编码。 该方法完全基于数据。 优点是比较灵活,不需要复杂的对话管理。 缺点是不可控,生成的答案往往很短,返回很多无意义的答案,需要大量的训练数据。

总结

Chatbot是当前NLP领域非常重要的应用场景。 它集成了各种NLP技术,非常具有挑战性。 稍后我们会针对每一类机器人进行更详细的介绍,敬请期待。

我们将在知识星球上讨论代码的具体实现和优化。 如果您有兴趣,请扫描下方二维码了解更多。

读者可以留言或者加入我们的NLP群进行讨论。 有兴趣的同学可以微信搜索jen104并备注“加入佑三AI NLP群”。

下一期预览:Chatbot-QA介绍

知识星球推荐

扫描上方二维码加入我们的星球,帮助您成长为一名合格的自然语言处理算法工程师。

知识星球主要包含以下内容:

(1) 聊天机器人。 考虑到聊天机器人是一个非常复杂的NLP应用场景,它涵盖了几乎所有的NLP任务和应用。 因此,小梦计划以聊天机器人为切入点。 通过介绍聊天机器人的原理和实践,他将逐步系统地更新大部分NLP知识,包括语义匹配、文本分类、意图识别、语义匹配命名实体识别、对话等。 管理和分词等

(2)知识图谱。 知识图谱对于各种 NLP 任务表现的重要性就像基础知识对于学生表现的重要性一样。 它是NLP最重要的基础设施。 目前,各大公司都在努力构建知识图谱。 作为一名NLP工程师,你必须熟悉并理解它。

(3)NLP预训练模型。 基于海量数据,对超大规模网络进行无监督预训练。 然后通过少量样本对特定任务进行微调。 该模型是目前NLP领域最热门的模型,很可能引领NLP发展到一个新的水平。 为什么不了解得更深入一点呢?

0
0
收藏0

最新文章

取消
扫码支持 支付码