对码当歌,猿生几何?

北大AI公开课第八课--自然语言对话的现状与未来by今日头条李航

最近坚持学英语,感觉还是挺不错的,推荐大家一个新的比较好玩的应用:喜马拉雅,上面有很多免费的资源,可以用来学习消遣都行,和得到差不多,但是比起得到,免费的内容更多,而且确实也挺方便的。我现在最爱的就是用它来订阅一些日常英语的节目,每天学习半个小时英语,可以在路上听、睡觉前听,挺享受的,也把碎片时间利用了一下,当然要提醒大家的是,也不能指望这个APP能帮你得道升天,毕竟一些专业的知识、硬技能,我们还是要静下心,做好规划,然后花一整块的时间进行学习在,这种碎片化的时间,就本着一个心态,能学多少就学多少,开开眼界就好!

所以,我发现自己总是会被各种各样的事打断,但是一看到,事情已经做了一半,所以无论如何也没有中途放弃的道理,如此还是要接着整理接下来的课程,现在轮到的是第八课 ,由李航老师带来的自然语言处理的趋势分享。如果一直处于人工智能浪潮里,你会发现,自然语言处理占有很重要的地位,无论是图像还是视频的处理,最终还是需要回归到底层的自然语言,因为说到底,所有信息的沟通和交流还是以自然语言为主导。

一、课堂回顾

学者风范——李航老师

李航老师,毕业于日本京都大学电气工程系,日本东京大学计算机科学博士学位,北京大学、南京大学的兼职教授,曾任日本NEC公司中央研究所研究员、微软亚洲研究院高级研究员与主任研究员、华为技术有限公司诺亚方舟实验室主任,现任职于今日头条人工智能实验室,主要从事自然语言处理的研究。其实每一个同学进入人工智能的大门,应该都会看过《统计学习方法》。这也是李航老师的经典著作,拜读过的同学应该心里都是十分敬佩的,快来听听大神要给我们分享一些什么吧!

分享内容

一点点前话:自然语言是一个很宽泛的概念,所以在有限的分享时间里,李航老师选择了以自然对话系统构建的现状、发展及挑战为主展开分享。其框架如下:



1、合理行动的智能机器

在这里李航老师首先推荐了一本书,人工智能的经典教材《Artificial Intelligence》,这本书提出了四个概念,指出一个智能机器,应当遵从以下标准:

(1)thinking humanly  (2)acting humanly  (3)thinking rationally   (4)acting rationally

但显然,今天很多的机器无法达到合理思考的能力,更不要说像人一样地思考了,一定程度上也是因为自然语言的处理能力没有跟上,所以当下的机器更多地是符合了合理行动,它们有以下五个共同的特点:

(1)智能系统   (2)明确目标  (3)评价标准   (4)环境互动  (5)功能

但是这些机器的行为其实都是比较机械和单一的,通用性不强,也没有很好的适用性,可能只是单一的某一个方面后者某一个点超越了人类。换言之,机器的智能其实很大程度上取决于决策大脑的智能程度,今天我们处于弱人工智能的发展阶段,自然机器的智能也只能是递进式发展,慢慢达到理想的智能状态。

2、自然语言的理解

自然语言的理解可以有两种不同的方式:

第一种:基于表示,我们在接收别人的自然语言之后,如果可以在自己的脑海中生成一些对应的概念,说明我们理解了,同样地,如果机器对于人类的指令,生成了对应的内部表示,我们就说机器理解了自然语言;

第二种:基于行为,人类接收到外部的自然语言,判定理解与否的直观表现就是看对方是否发起正确的行为,同样地,如果机器可以按照人类的指令,顺利达成相应的任务,比如人类发出拿茶的命令,机器顺利完成,我们也认为机器理解了自然语言。

3、自然语言理解的过程及涉及的基本技术原理

自然语言处理的过程中,主要的步骤包括:词汇处理、句法处理、语义处理、语用处理,这些环节综合起来就形成了系统化的自然语言处理,达到自然语言理解的目的,并帮助机器合理地行动。

(1)词汇处理:词汇的处理基于字典,需要了解词意和用法。这也是自然语言处理的基础,通常要达成对一种语言的理解,我们需要积累大量的词汇,并且能在不同的语言环境下正确判断该词的用法和意思,才能保障接下类的后续理解和操作的正确性。现在自然语言处理中文的语料构建、分词处理效果已经相对还可以。

(2)句法处理:句法的处理就要依据既定的句法规则进行处理,但句法本身是个相对复杂的东西,因为句法既有规律也有例外,没有通用的、固定的标准,而且通常是处于动态发展中的,也没有办法由某一个人决定,需要很多人共同参与制定;

(3)语义处理:语义处理是把语言符号映射到内部的表示上,需要对应到一些已知的概念,并且结合已有的对于世界的先验认知,达成句子的最后理解,语义理解需要考虑的因素比较多,容易出现歧义,而且往往表述在不同的环境下表达的意思也有所出入,所以具有一定的难度。

(4)语用处理:不同的句子有不同的语用,而同样的句子也有可能有不同的语用,比如我饿了,很有可能只是单纯地陈述,但也有可能言外之意是希望听话者给说话者买东西吃,所以语用一定是基于一定的对胡情景和上下文做出的最合理的判断,这个也是很灵活的。

所以可见,当前我们在处理自然语言的时候,除去既定的词表、语法规则之外,更多的是一些语义、语用的处理,是相当灵活的额,而这恰恰是当前智能机器或系统的弱势。

除了这些基本的处理过程,李航老师还结合人类真是的大脑结构及管理,对自然语言的处理作出了新的分析。


  • 语言处理是整个大脑共同参与的复杂活动:Broca区负责句法,而wernicke负责词汇。语言理解是对大脑表层联想的模拟和描述,它会和每个人的经历有关,因为人处于不同的成长环境,对于语言的理解其实是有很大出入的,但是也会存在很多的共性,因为人和人之间是不断地沟通的,所以需要基于一定的共性。

  • 最核心的挑战在于语言的多样性和多义性:因为自然环境的复杂性,语言的表达可以千变万化,人类总是可以灵活地应对,但是机器要想有效地克服这种灵活性,其实需要面临的挑战还很多,为如何更好地处理语言的多样性和歧义就是首要。

  • 对话:对话是当前语言类应用的重要构成,分为单轮对话和多轮对话。首先,对话都是有目的的,存在一定的动机或者是情感交流的需求,而且目标可能是会动态变化的。其次,在单轮对话中,一种是基于语义表示,把对话的内容生成内部的语句,一种是基于检索,比如聊天机器人、问答系统等,还有一种是基于生成式,比如分析器及答案生成器。目前单轮对话的应用已经相对普遍,效果也还可以接受。但是多轮对话可能就会比较困难,主要应用状态机和马尔科夫链等技术,但是并没有获得很好的发展和进步。

4、NLP的进步

(1)机器翻译:深度学习、深度强化学习等方法逐渐用于多轮对话处理中,可以提高多轮对话的准确性和对语义环境的判断,已经逐步地成为自然语言处理的主流技术。

(2)具体的几个例子:

第一,google提出的 Neural Symbolic Machines以及华为诺亚方舟提出的Neural Responding Machine,基于分析的原理,结合符号处理和神经处理,对自然语言进行更精准的处理;

第二,微软提出的Hierarchical Deep Reinforcement Learning,利用层次化的深度强化学习原理,将对话目标进行分层次处理,比如可以把对话的目标进行分层,之后展开,最后进行复述,将有限的状态机层次化,这样学习的目标就可以被拆解,然后利用层次化的神经结构来进行强化的迭代学习,或许是解决多轮对话困境的一个有效方法。

5、趋势及结论

(1)自然语言处理的趋势

在李航老师看来,自然语言处理接下来的主要技术研究方向在于:

semantic grounding 自然语义映射到语言的内部进行表示,不涉及外部的一些表示,主要用于解决语言的多样性及歧义问题,

neural symbolic processing :结合符号学和神经学的优势,协同完成自然语言的处理和理解;

deep reinforcement learning :深度学习+强化学习,结合更大语料库,提高自然语言理解的准确率;

modular and hierarchical processing :模块化、分层次地进行学习,将语言目标分解,层次化地完成学习和训练;

meta learning :基元学习,无论是对于图像还是自然语言,最本质的学习往往也可能是最高效的,所以也是无数学者愿意一直坚持下去的。

(2)结论:

立足于制作合理思考和行动的智能机器,当前已经有了一些可用的产品,尤其是一些基于单轮对话的。但是要处理的主要的挑战在于,自然语言的多样性和多义性,人类语言的灵活度也未被机器真正习得。但是深度学习已经强度学习、层次学习等一些新的概念的到来,为人类自然语言的处理带来了新的可能,所以或许,这些问题会有新的解决思路。

后话:

李航老师的分享是比较学术和技术的,可能一些内容在理解上有困难,但是不管是做技术还是做产品,我们都应当明确,要想真正地懂得一些知识的内核,并且能够基于这个知识圈有一些自己的思考和设计,必要的、深入地学习、理解技术还是很有必要的,也会帮助我们在设计的过程中降低犯错的风险,加油!

阅读更多