新一代人工智能蓬勃兴起,各类应用加速落地,“人工智能”的本质到底是什么?今天,以数据驱动的人工智能在“奔跑”的道路又会遭遇哪些瓶颈问题?什么是第三代人工智能?它能让人工智能更加安全、可信、可靠吗?本期《超级智能》,世界工程组织联合会(WFEO)主席,中国新一代人工智能发展战略研究院执行院长龚克深度对话中国科学院院士、清华大学人工智能研究院名誉院长、我国人工智能奠基人张钹,从本源出发,去探寻人工智能的未来。 |
►►►
专家介绍
龚克
世界工程组织联合会(WFEO)主席,中国新一代人工智能发展战略研究院执行院长,南开大学学术委员会主任
张钹
中国科学院院士、清华大学人工智能研究院名誉院长、我国人工智能奠基人
►►►
访谈直击
龚克
张老师,我知道您是我们在中国的科学家里最早接触人工智能的(之一),现在人工智能应该说是和原来已经不在一个阶段了。现在人工智能进入了2.0时代,我想这个阶段非常重要的一个特点呢,从应用角度来讲,是真正有了实际的应用的时期,在社会上的谈论也特别多。我想咱们回到一个根本的问题上:在您看来,到底什么是人工智能?
张钹
这个问题很好,因为现在大家对于人工智能的问题都非常关注,但是对人工智能究竟做什么?什么是人工智能?大多数人还不是很理解,我们也是从四十多年的工作中慢慢地理解到人工智能究竟是做什么的、究竟能做什么。大家都以为人工智能就是用机器来模拟人类的智能,但实际上这是很困难的。大家知道,我们对人类的大脑和人的智能了解得很少。如果要沿着这个方向做研究的话,(人工智能)它必须去模拟大脑的工作机理,而怎么去模拟大脑的工作机理?所以走这条路就很困难,这在人工智能领域也算是一个比较少数的流派。
现在大多数人做的人工智能,实际上是用机器来模拟人类的智能行为,简单地来理解就是:智能行为就是智能的外部表现。比如说人类的情感,就是喜怒哀乐等情绪,是模拟困难的一部分,好多人以为我们去模拟情感,是真的去模拟情感,所以大家对这个会提出质疑。确实我们没法去模拟人类的情感,因为很多时候人类的情感无法定义,是因人而异的,我们不是很清楚当产生情感时,它的生理基础是什么、它的大脑起什么变化、它的心理学基础是什么,所以人们会很疑惑人工智能到底能不能产生情感。这个不是该对人工智能提出的问题,人工智能是要模拟情感的表现,比如说模拟快乐的表现,由一般情感通过三个途径的表达,即脸部、语言及声音、肢体的动作等方面进行模拟;或者通过情感分析,即通过分析人类的语言去分析他的情感。
这样的前提是智能的行为是可以观察的,因为可以观察我们就可以模拟它,模拟的结果我们可以评价它,这就可以作为一个科学问题来研究。
龚克
您现在谈的是对“什么是人工智能”这个问题的解答,我觉得非常受启发。概括下来就是说人工智能实际上是在用人工,即我们设计的各种算法,利用各种工具去模拟人的智能行为。接下来,请您继续为我们分析下,基于我们对于人工智能的定义,在经过了这么多年的发展后,人工智能现在走到了一个什么程度?
张钹
到本世纪初的时候,因为我们有了大数据、有了计算能力,在这方面人工智能就在图像识别、语音识别、文本处理方面有了很大的进步,而且也产生了很多实用的系统,这个技术现在还在继续发展,因此人工智能取得了很大的进步。
龚克
我自己也有所体会。其实在我们九十年代的时候,当时也出现了一些手写的输入、语音的输入,但对我个人来说,错误率太高,很不实用。现在对比当时有了很大的进步,从原来的基本不可用到现在的基本可用,产生这样的变化,像您刚才所提到的是因为我们有了大数据技术,我们有了强大的算力,使得我们有了深度机器学习的办法。那是不是就可以说机器学习就是人工智能了呢?
张钹
应该说机器学习是人工智能中间的一部分,而且深度学习是机器学习里头的一部分。语音识别、图像识别在深度学习出来之前,它基本上是不能用的,主要归功于大数据的数据和计算能力。这几年算法技术本身就有很大的改进,但是在这之前,算法在其中的贡献还不是很大,因为和以前的技术不可同日而语了,现在有很快速的算法了。深度学习,我们现在把它叫做第二代人工智能,有的时候又把它叫做数据驱动的方法,因为它必须要有数据来驱动。
人工智能的创始人最早就提出来一个基于知识和经验的符号推理模型,比如医生看病,这是一种诊断的行为,是医生利用他本身丰富的医学知识和临床经验做一些推理,一般情况就是从症状到疾病的推理,然后再从疾病到如何用药做治疗。所以我们可以把人类的很多行为看成是在知识和经验支持下面的一些推理行为,它是专门针对某些领域,医疗也好、生产过程也好、调度过程也好,建立的这些实用的专家系统,我们把它叫做第一代人工智能。现在,支撑人工智能发展的主要是知识驱动和数据驱动。
龚克
人们对现在的人工智能,比如说我们要建立可信的人工智能、可靠的人工智能,张老师您怎么看待这个问题?
张钹
深度学习就是刚才说的数据驱动的方法,有个很大的好处,它可以利用大数据做出来很多实用系统,但是有很大的问题,就是这个方法本质上是不可解释的。如果严格地讲,人工智能现在只能用到一些结构化的、变化比较小的、信息比较完备的环境中。所以人工智能一个很大的问题就是如何处理这个不确定性,如果针对不确定性去做的话,做出来的系统就很难对付一些复杂的环境。现在我们想出来的办法,就是用概率统计的方法去做,把概率加进入,实际上考虑了不确定性,这样才符合实际情况。应该说现在人工智能遇到了一个很大的困难,我过去用“天花板问题”来描述它,即单纯地沿着两代人工智能的方法走下去,会遇到的很大的困难。
龚克
您用了“天花板”这个词,实际上是描述这个困难之大,人工智能的发展受到很严重局限。您在2015年的时候提出了“第三代人工智能”的概念,为什么要提出这个概念呢?
张钹
2015年,在深度学习在全世界范围内如日中天被讨论的时候,首先是由美国发现了深度学习的一个非常致命的缺点——深度学习非常脆弱。他们做了一个图像,原来是熊猫的图像,机器的识别率很高,但是如果在熊猫的图像上加上一点点噪声,人类可以识别它是熊猫,可机器却会99.9%的认为它是长臂猿。
机器跟人类的视觉是完全不同的,在一定条件下,它的识别率甚至能超过人类,但它跟人类视觉的性能差得太远了。拿上面的例子来说,只有将图片上的熊猫改变成语言概念上的其他物种人类才会识别出错,但对于机器来说,即使给图片上加上一点点噪声,语义上没有任何改变,机器仍然会将图片识别成完全不同的东西。这就说明机器的根本不能理解图像的语义的,而只是处理实际上的形式。不仅仅图像是这样,语音、文本也是这样,尤其是文本,只要加上一点点变化,文章的意思就完全不同。
之所以会有这样的现象,就是因为纯粹数据驱动的方法会必然带来这样的问题。与人类从大的轮廓来识别图像不同,人工神经网络、深度学习只能提取局部的纹理色彩特征,所以只要改变局部的特征,就会出现识别错误。如果用技术的术语来讲的话,数据驱动最大的问题就在于单纯的数据驱动只是在低层次的特征空间层面来识别物体,而不是在高层的语义空间中进行识别。因此,我们提出了“第三代人工智能”的概念,就是把数据驱动和知识驱动结合起来。
数据驱动为什么会有那么多的缺点?是因为在人工智能领域,只用了数据驱动的三个要素:数据、算力和算法。同样的,知识驱动也有不少的缺点,我们也只用了其中另外的三个要素:知识、算法和算力。为了克服这两个算法存在的缺点,应该将四个要素结合起来,而且四个要素之间,我认为应该遵循以下的顺序:第一应该是知识,我认为知识才是人类智慧的源泉;第二是数据,因为机器处理数据能力远比人类强,利用这个要素,机器就有可能做出超越人类(能力)的事情;第三是算法;第四是算力。我们现在也是沿着这个方向去发展第三代人工智能。
龚克
从现在来看,过去十多年来,以机器学习算法为代表的大量应用走到了生产和生活里,各种应用场景不断地展开,知识的一些算法也有一定进展,期间也有一些结合。下面张老师是不是能够结合产业的应用,来进一步的谈一谈人工智能的发展?
张钹
这也是一个很好的问题。实际上人工智能从一开始就非常重视应用和产业发展,当时也一直在摸索人工智能产业的发展道路应该是什么样子,同样也是经过六七十年的发展,不断地积累经验。最初时候的发展有点像按照信息产业发展的路子走,我们能看到信息产业的发展是非常快而且非常顺利的,中间基本上没有过停顿。它的发展路径,拿计算机来讲,首先是做机器、做硬件等体系结构,经过了三代的发展,由一台机器好多人用发展到一台机器一个人用,再到后来的以手机为代表的移动端,它的发展是非常迅速的,产业的发展也非常顺利。从硬件到系统软件,再到后来成千上万的应用软件的开发,每一个硬件、每一个软件都能支撑起大量的企业。之所以会这样,在于软硬件具有通用性,具有很大的市场,从而推动了信息产业的快速发展。
人工智能一开始发展时,也有一部分人想沿着信息产业的发展道路走,如七八十年代美国的Lisp机、日本的五代机,都是想做出来一个人工智能的硬件或者机器,在此之上发展软件及应用,但是后来都失败了,没能形成产业,原因就在于人工智能没有理论基础的支持,我们不知道智能机器应该是什么样子的。后来大家被迫选择了一条路,现在看来这条路也还是可以的。如上面说到的人工智能所拥有的两类算法,基于数据驱动的算法和基于知识驱动的算法,我们现在的产业就不是从硬件出发,而是从算法出发,根据算法来定义硬件或者定义软件,所以不是硬件在先而是算法在先。或者我们不去定义硬件,而是利用现有的硬件来进行应用,且这个应用是必须针对行业的应用,场景的应用,这一点和信息产业不同。
深度学习出现之后,紧接着大家就用深度学习的算法去定义一些硬件,如我们现在看到的所谓AI芯片,它实际上是由深度学习定义出来的硬件,我们也可以用算法开发出来的各种各样的计算平台去应用,现在看起来,企业发展还是很快的。基于知识算法的系统,比如已经出现的各种专家系统,它一定是跟领域紧密相连的,因此它就存在很大的局限性;基于数据驱动的算法开发出来的产品要比基于知识驱动开发出来的产品要多,但它本身也有一个非常大的弱点,也由算法带来,限制了它的应用场景。要解决算法的问题,唯一的办法就是开展基础研究去克服缺陷,如果我们有办法克服它,那么产业就会得到高速的发展。
龚克
我听张老师您讲了这一段以后,也很受启发,我感觉是这样,我们在人工智能的发展,特别是技术产业发展的过程中,更加凸显了我们对人工智能扎实的基础理论的强烈需求。它不是简单地在一个现有的方法上做一些微调就可能克服我们所有的问题,要从根本上解决问题,我们需要加强基础研究,但这个基础研究并不是很遥远的,并不是远远地脱离我们现在的产业实践。根据您刚才的讲述,我们是不是可以理解为一方面要很好地做一个扎实的理论,另一方面也需要对具体的应用场景有比较深入地把握,结合具体应用场景去发展,即通用算法和专业算法还是需要很好地结合?
张钹
你说得很对。人工智能从1978年开始发展,我们基本上经历了人工智能的整个发展过程,前面的二十年基本是探索的过程,这与信息产业的发展非常不一样。信息产业的整个发展思路是非常清楚的,人工智能完全不一样。人工智能是在探索“无人区”,我们连什么叫智能都没有搞清楚,人工智能始终在我们对智能一知半解的情况下发展的。所以其发展就必须要有两个精神:一个是坚韧不拔,因为人工智能的发展一定会有起伏;一个是必须相信人工智能永远在路上,不应该急于求成,必须得有一个长期奋斗的思想。
新一代人工智能蓬勃兴起,各类应用加速落地,“人工智能”的本质到底是什么?今天,以数据驱动的人工智能在“奔跑”的道路又会遭遇哪些瓶颈问题?什么是第三代人工智能?它能让人工智能更加安全、可信、可靠吗?本期《超级智能》,世界工程组织联合会(WFEO)主席,中国新一代人工智能发展战略研究院执行院长龚克深度对话中国科学院院士、清华大学人工智能研究院名誉院长、我国人工智能奠基人张钹,从本源出发,去探寻人工智能的未来。 |
►►►
专家介绍
龚克
世界工程组织联合会(WFEO)主席,中国新一代人工智能发展战略研究院执行院长,南开大学学术委员会主任
张钹
中国科学院院士、清华大学人工智能研究院名誉院长、我国人工智能奠基人
►►►
访谈直击
龚克
张老师,我知道您是我们在中国的科学家里最早接触人工智能的(之一),现在人工智能应该说是和原来已经不在一个阶段了。现在人工智能进入了2.0时代,我想这个阶段非常重要的一个特点呢,从应用角度来讲,是真正有了实际的应用的时期,在社会上的谈论也特别多。我想咱们回到一个根本的问题上:在您看来,到底什么是人工智能?
张钹
这个问题很好,因为现在大家对于人工智能的问题都非常关注,但是对人工智能究竟做什么?什么是人工智能?大多数人还不是很理解,我们也是从四十多年的工作中慢慢地理解到人工智能究竟是做什么的、究竟能做什么。大家都以为人工智能就是用机器来模拟人类的智能,但实际上这是很困难的。大家知道,我们对人类的大脑和人的智能了解得很少。如果要沿着这个方向做研究的话,(人工智能)它必须去模拟大脑的工作机理,而怎么去模拟大脑的工作机理?所以走这条路就很困难,这在人工智能领域也算是一个比较少数的流派。
现在大多数人做的人工智能,实际上是用机器来模拟人类的智能行为,简单地来理解就是:智能行为就是智能的外部表现。比如说人类的情感,就是喜怒哀乐等情绪,是模拟困难的一部分,好多人以为我们去模拟情感,是真的去模拟情感,所以大家对这个会提出质疑。确实我们没法去模拟人类的情感,因为很多时候人类的情感无法定义,是因人而异的,我们不是很清楚当产生情感时,它的生理基础是什么、它的大脑起什么变化、它的心理学基础是什么,所以人们会很疑惑人工智能到底能不能产生情感。这个不是该对人工智能提出的问题,人工智能是要模拟情感的表现,比如说模拟快乐的表现,由一般情感通过三个途径的表达,即脸部、语言及声音、肢体的动作等方面进行模拟;或者通过情感分析,即通过分析人类的语言去分析他的情感。
这样的前提是智能的行为是可以观察的,因为可以观察我们就可以模拟它,模拟的结果我们可以评价它,这就可以作为一个科学问题来研究。
龚克
您现在谈的是对“什么是人工智能”这个问题的解答,我觉得非常受启发。概括下来就是说人工智能实际上是在用人工,即我们设计的各种算法,利用各种工具去模拟人的智能行为。接下来,请您继续为我们分析下,基于我们对于人工智能的定义,在经过了这么多年的发展后,人工智能现在走到了一个什么程度?
张钹
到本世纪初的时候,因为我们有了大数据、有了计算能力,在这方面人工智能就在图像识别、语音识别、文本处理方面有了很大的进步,而且也产生了很多实用的系统,这个技术现在还在继续发展,因此人工智能取得了很大的进步。
龚克
我自己也有所体会。其实在我们九十年代的时候,当时也出现了一些手写的输入、语音的输入,但对我个人来说,错误率太高,很不实用。现在对比当时有了很大的进步,从原来的基本不可用到现在的基本可用,产生这样的变化,像您刚才所提到的是因为我们有了大数据技术,我们有了强大的算力,使得我们有了深度机器学习的办法。那是不是就可以说机器学习就是人工智能了呢?
张钹
应该说机器学习是人工智能中间的一部分,而且深度学习是机器学习里头的一部分。语音识别、图像识别在深度学习出来之前,它基本上是不能用的,主要归功于大数据的数据和计算能力。这几年算法技术本身就有很大的改进,但是在这之前,算法在其中的贡献还不是很大,因为和以前的技术不可同日而语了,现在有很快速的算法了。深度学习,我们现在把它叫做第二代人工智能,有的时候又把它叫做数据驱动的方法,因为它必须要有数据来驱动。
人工智能的创始人最早就提出来一个基于知识和经验的符号推理模型,比如医生看病,这是一种诊断的行为,是医生利用他本身丰富的医学知识和临床经验做一些推理,一般情况就是从症状到疾病的推理,然后再从疾病到如何用药做治疗。所以我们可以把人类的很多行为看成是在知识和经验支持下面的一些推理行为,它是专门针对某些领域,医疗也好、生产过程也好、调度过程也好,建立的这些实用的专家系统,我们把它叫做第一代人工智能。现在,支撑人工智能发展的主要是知识驱动和数据驱动。
龚克
人们对现在的人工智能,比如说我们要建立可信的人工智能、可靠的人工智能,张老师您怎么看待这个问题?
张钹
深度学习就是刚才说的数据驱动的方法,有个很大的好处,它可以利用大数据做出来很多实用系统,但是有很大的问题,就是这个方法本质上是不可解释的。如果严格地讲,人工智能现在只能用到一些结构化的、变化比较小的、信息比较完备的环境中。所以人工智能一个很大的问题就是如何处理这个不确定性,如果针对不确定性去做的话,做出来的系统就很难对付一些复杂的环境。现在我们想出来的办法,就是用概率统计的方法去做,把概率加进入,实际上考虑了不确定性,这样才符合实际情况。应该说现在人工智能遇到了一个很大的困难,我过去用“天花板问题”来描述它,即单纯地沿着两代人工智能的方法走下去,会遇到的很大的困难。
龚克
您用了“天花板”这个词,实际上是描述这个困难之大,人工智能的发展受到很严重局限。您在2015年的时候提出了“第三代人工智能”的概念,为什么要提出这个概念呢?
张钹
2015年,在深度学习在全世界范围内如日中天被讨论的时候,首先是由美国发现了深度学习的一个非常致命的缺点——深度学习非常脆弱。他们做了一个图像,原来是熊猫的图像,机器的识别率很高,但是如果在熊猫的图像上加上一点点噪声,人类可以识别它是熊猫,可机器却会99.9%的认为它是长臂猿。
机器跟人类的视觉是完全不同的,在一定条件下,它的识别率甚至能超过人类,但它跟人类视觉的性能差得太远了。拿上面的例子来说,只有将图片上的熊猫改变成语言概念上的其他物种人类才会识别出错,但对于机器来说,即使给图片上加上一点点噪声,语义上没有任何改变,机器仍然会将图片识别成完全不同的东西。这就说明机器的根本不能理解图像的语义的,而只是处理实际上的形式。不仅仅图像是这样,语音、文本也是这样,尤其是文本,只要加上一点点变化,文章的意思就完全不同。
之所以会有这样的现象,就是因为纯粹数据驱动的方法会必然带来这样的问题。与人类从大的轮廓来识别图像不同,人工神经网络、深度学习只能提取局部的纹理色彩特征,所以只要改变局部的特征,就会出现识别错误。如果用技术的术语来讲的话,数据驱动最大的问题就在于单纯的数据驱动只是在低层次的特征空间层面来识别物体,而不是在高层的语义空间中进行识别。因此,我们提出了“第三代人工智能”的概念,就是把数据驱动和知识驱动结合起来。
数据驱动为什么会有那么多的缺点?是因为在人工智能领域,只用了数据驱动的三个要素:数据、算力和算法。同样的,知识驱动也有不少的缺点,我们也只用了其中另外的三个要素:知识、算法和算力。为了克服这两个算法存在的缺点,应该将四个要素结合起来,而且四个要素之间,我认为应该遵循以下的顺序:第一应该是知识,我认为知识才是人类智慧的源泉;第二是数据,因为机器处理数据能力远比人类强,利用这个要素,机器就有可能做出超越人类(能力)的事情;第三是算法;第四是算力。我们现在也是沿着这个方向去发展第三代人工智能。
龚克
从现在来看,过去十多年来,以机器学习算法为代表的大量应用走到了生产和生活里,各种应用场景不断地展开,知识的一些算法也有一定进展,期间也有一些结合。下面张老师是不是能够结合产业的应用,来进一步的谈一谈人工智能的发展?
张钹
这也是一个很好的问题。实际上人工智能从一开始就非常重视应用和产业发展,当时也一直在摸索人工智能产业的发展道路应该是什么样子,同样也是经过六七十年的发展,不断地积累经验。最初时候的发展有点像按照信息产业发展的路子走,我们能看到信息产业的发展是非常快而且非常顺利的,中间基本上没有过停顿。它的发展路径,拿计算机来讲,首先是做机器、做硬件等体系结构,经过了三代的发展,由一台机器好多人用发展到一台机器一个人用,再到后来的以手机为代表的移动端,它的发展是非常迅速的,产业的发展也非常顺利。从硬件到系统软件,再到后来成千上万的应用软件的开发,每一个硬件、每一个软件都能支撑起大量的企业。之所以会这样,在于软硬件具有通用性,具有很大的市场,从而推动了信息产业的快速发展。
人工智能一开始发展时,也有一部分人想沿着信息产业的发展道路走,如七八十年代美国的Lisp机、日本的五代机,都是想做出来一个人工智能的硬件或者机器,在此之上发展软件及应用,但是后来都失败了,没能形成产业,原因就在于人工智能没有理论基础的支持,我们不知道智能机器应该是什么样子的。后来大家被迫选择了一条路,现在看来这条路也还是可以的。如上面说到的人工智能所拥有的两类算法,基于数据驱动的算法和基于知识驱动的算法,我们现在的产业就不是从硬件出发,而是从算法出发,根据算法来定义硬件或者定义软件,所以不是硬件在先而是算法在先。或者我们不去定义硬件,而是利用现有的硬件来进行应用,且这个应用是必须针对行业的应用,场景的应用,这一点和信息产业不同。
深度学习出现之后,紧接着大家就用深度学习的算法去定义一些硬件,如我们现在看到的所谓AI芯片,它实际上是由深度学习定义出来的硬件,我们也可以用算法开发出来的各种各样的计算平台去应用,现在看起来,企业发展还是很快的。基于知识算法的系统,比如已经出现的各种专家系统,它一定是跟领域紧密相连的,因此它就存在很大的局限性;基于数据驱动的算法开发出来的产品要比基于知识驱动开发出来的产品要多,但它本身也有一个非常大的弱点,也由算法带来,限制了它的应用场景。要解决算法的问题,唯一的办法就是开展基础研究去克服缺陷,如果我们有办法克服它,那么产业就会得到高速的发展。
龚克
我听张老师您讲了这一段以后,也很受启发,我感觉是这样,我们在人工智能的发展,特别是技术产业发展的过程中,更加凸显了我们对人工智能扎实的基础理论的强烈需求。它不是简单地在一个现有的方法上做一些微调就可能克服我们所有的问题,要从根本上解决问题,我们需要加强基础研究,但这个基础研究并不是很遥远的,并不是远远地脱离我们现在的产业实践。根据您刚才的讲述,我们是不是可以理解为一方面要很好地做一个扎实的理论,另一方面也需要对具体的应用场景有比较深入地把握,结合具体应用场景去发展,即通用算法和专业算法还是需要很好地结合?
张钹
你说得很对。人工智能从1978年开始发展,我们基本上经历了人工智能的整个发展过程,前面的二十年基本是探索的过程,这与信息产业的发展非常不一样。信息产业的整个发展思路是非常清楚的,人工智能完全不一样。人工智能是在探索“无人区”,我们连什么叫智能都没有搞清楚,人工智能始终在我们对智能一知半解的情况下发展的。所以其发展就必须要有两个精神:一个是坚韧不拔,因为人工智能的发展一定会有起伏;一个是必须相信人工智能永远在路上,不应该急于求成,必须得有一个长期奋斗的思想。