男子在《她》中与人工智能相爱,电影
对于一个计算机程序来说,理解语音是一个细微的问题。语音的字面解释可能与语气、表情和潜台词不同,或受到其影响。
像Alexa和Siri这样的语音激活系统对指令来说是很好的,但要有持续的对话似乎是一个更难的、更_人性化的_ 问题,需要破解。口语对话系统(SDS)通过解析语音来理解用户的意图。这些系统分析语音中涉及的语义概念–赋予一个短语或句子一般意义的想法。
口语对话AI系统
人类对话中的语义概念可能_有次语义、_ 颠覆性和_多端_概念。人类具有讽刺性、指代性,并且经常对上下文和潜台词有共同的理解。这些都是机器要探索和推断的复杂问题。
无监督学习是机器学习的一个分支学科,是一个统计-计算概念,从原始的、无标签的数据中收集信息、趋势和特征。例如,使用自然语言处理(NLP)程序和聚类技术来总结学生的讲座笔记语料库,以确定主要的、最大限度的相互概念。这一原理被用来从原始语音数据中提取知识。
像Siri这样的系统有一个口语理解(SLU)组件,将自然语音与它的含义联系起来。SDS利用这种意义和语音的结构来理解用户的话语。大多数系统将对话限制在几个预定义的主题上,尽管有一个强有力的倡议来普及和扩展这些系统。
用矩阵分解法理解未标记的语音
Chen提出的系统旨在利用知识获取模型和矩阵分解来理解意图。这些模型可以识别显性和隐性特征。例如,在 “我想去一家便宜的餐厅 “的查询中,显性特征是 “便宜 “和 “餐厅”。语义概念归纳法将单词与基础概念或_槽_相关联。因此,”便宜 “是对 “昂贵 “的衡量,而 “餐馆 “是一个 “目标 “地点。
概念关系模型将基础概念关联起来,并将概率分配给可能不存在于用户查询中的词语的语义影响。虽然 “食物 “没有在话语中明确提到,但模型了解到 “食物 “与 “餐厅 “的关联概率为0.85,正如你在上图的右下方看到的那样。因此,该系统创建了一个概念在句子中出现的概率值的矩阵。每一行是一个说出的句子或短语,每一列是一个概念形成该句子含义的概率。
捕捉语义概念之间关系的图表
使用一个预先训练好的语义分析系统,该系统可以从一个语词中自动提取相互依赖的概念图,就像上面的图片一样。一个基于词的词汇知识图,在概念上以下面的图片为例,被结合使用以捕捉内容的本体结构。这些都是在语料被感知时立即生成的。
构建知识图谱来解释语篇
前面提到的概率矩阵由代表上述两个知识图谱的矩阵复合而成,形成最终的矩阵。矩阵分解可以用来从这个矩阵中提取潜在的特征。这种线性代数技术之所以被使用,是因为它有助于对噪声数据、隐藏信息和观察依赖性进行建模。
因式分解的目的是利用矩阵中捕获的现有知识及其因素,来推断一个特定的概念是否存在于一个语篇中。这可以让SDS理解语境和隐藏的含义。它还有助于解决歧义问题,因为该系统对句子中的一个词有本体论、关系论和结构论的理解。
除了预测语义概念之外,这个系统还可以理解一个查询是否是特定领域的。增加更多的领域知识可以进一步规范。纳入额外的数据,例如来自谷歌知识图谱的数据,可以帮助实现泛化和可扩展性。
这篇文章是这篇论文的总结。我期待着情感智能对话式人工智能系统的出现。
对话式人工智能系统如何理解语言》最初发表在《Nerd For Tech》杂志上,人们正在通过强调和回应这个故事来继续对话。