- 中国人工智能发展报告:知识工程(2019—2020)
- 李德毅等
- 2022字
- 2020-11-24 12:52:38
5.1 发展智能科学需要智能数学
人类经历过多次科技革命,但最本质的科技革命只有两次:一次是以解放劳动力为目标的工业革命,另一次是以解放智力劳动为目标的信息革命。网络革命并不是后信息革命而是信息革命中的一个新阶段。网络是信息革命的翅膀,智能是信息革命的灵魂。工业革命以人与物为二元背景,人认识、利用和改造物,知识是人对物认识的成果。信息革命以人机和信息为二元背景,人机认识和利用信息。背景中的客体从物变为信息是这两次科技革命之间最根本的区别。
信息与物是虚与实的对立统一。实是本体,虚是认识主体对本体的观测。信息不是事物的简单镜像,它因受观测的影响而与认识主体有关。物质的微观都是粒子运动(语法),信息是要理解它的语义,看它究竟表示什么东西。从信息提取语义并将语义转化为知识的能力就是智能,人工智能要用智能去解决问题,从某种意义上说,信息科学与人工智能之间是语义与语用的关系。知识在第一次科技革命中是革命成果,但在第二次科技革命中却变成营造的对象。第一次科技革命给了我们许多物质运动的知识,第二次科技革命将带给我们信息运动的知识,即知识何以成为知识的知识。
信息革命把计算机和人放在一起成为认知主体,使知识的发展工程化,这就是知识工程。这个名称是在人工智能的发展过程中提出来的,从这个意义上来讲,知识工程是人工智能的一部分,但是,知识属于教育文化的范畴,从这个意义上来讲,知识工程又是跨人工智能和教育文化的交叉学科。本章姑且将其作为人工智能的一部分来加以解读。
知识工程在人工智能中曾经掀起研究热潮,但却一度噤若寒蝉。难以想像人工智能对一个学术理论和方法竟然采取如此情绪化的偏激处理。人工智能发展到今天还是一个以实验性为主的学科,各种算法多以实验的方式来进行,知识并不是必需的要素。人工智能整体发展至今还处于一个自下而上的自发过程,而知识工程必须是一门自上而下与自下而上相结合的学科。试问,盖一个大楼没有一个自上而下的顶层设计可以吗?摸着石头过河是不能盖楼的,但是现在的人工智能还在摸着石头过河。归根结底,人工智能还没有建立起自己的基本理论。不是不想建立起自己的基本理论,而是这个过程太难。实践是最神圣的,但不能轻视理论。数学工作者感到惭愧的是:微积分为工业革命创造出了牛顿力学,今天,我们该用什么来为信息革命添一块砖呢?我国学者在人工智能流派三足鼎立的局面下探寻三者共同具有的机制,提出了一种机制主义的人工智能,这是很有希望的一种理论,而这个理论需要有一种统一的数学理论来做支撑。
数学早就为智能服务,即使是简单的算术也在为人提供结算和谋划的工具。鸡兔同笼的算术问题很伤脑筋,用符号x,y,…代替具体的数字,就出现了代数。用方程来解鸡兔同笼问题就变得非常简单,代数的出现使数学研究的对象从定数扩大到变数。笛卡儿坐标的出现把代数与几何联系在一起,能表现物体的匀速运动。再引入极限概念,便可以表现非线性的运动。牛顿第二定律发现力与受力物体的加速度成正比,由此导出了物理运动的基本定律和方程,并渗入到机械制造,引发了工业革命。这是数学与科技的同步进化过程。
确定性的定量计算能准确地把握未来,可以精确计算物体运行的轨道,但是,人工智能的研究永远锁定在不确定性上,对随机现象的预测催生出了概率论。相应的决策需求更刺激了优化、运筹和离散数学的产生,这是在工业革命向信息革命过渡时期所发生的变化。
计算机的出现是信息革命的开始。计算机的产生及其应用都离不开布尔逻辑。按照著名的Stone拓扑表示定理,布尔逻辑按与、或、非运算与集合论按并、交、余运算同构,集合论使数学可以从外延上表现概念,它的产生是数学向智能靠拢的重要一步。
信息革命要处理的是信息,信息论对语法信息及信息传输具有重要的理论和实践价值,但是,直到20世纪60年代以前,计算机所从事的都是定量而非定性的计算。在进行识别和控制的时候,计算机不具备人脑所具有的定性分析和模糊识别的能力,于是,Zadeh在1965年提出了模糊集合论。这是一个非数学家向数学的根基所提出的挑战,模糊集合论的功能是在定性与定量之间搭起了一座桥梁,使数学描述进入人们的生活,模糊集合论是数学跨入人工智能的重要里程碑。
所有这些数学分支都曾经并且将继续对人工智能发挥重要的作用。但是,所有这些数学分支都是自发而非自觉地为智能做贡献的,人工智能从没有专有的数学学科。即使是像Zadeh这样一位控制论专家,尽管他提出模糊集合论有着十分明确的目标,但在他也从来没有明确地宣布模糊集合论是一种智能数学。他用模糊集合论来表现日常概念,但却没有指明外延与内涵之间的关系。伟大的信息革命理应有一个数学分支公开地宣称要为它服务。
1982年,Wille提出了形式概念分析(Normal Concept Analysis),Pawlak提出了粗糙集(Rough Sets),汪培庄提出了因素空间(Factors Space)。这三个数学分支都明确地宣称要以知识和智能作为研究对象,这几个分支和更早的Topos、同期的可拓学,以及稍晚的软集、粒计算、云模型、直觉模糊集、犹豫模糊集等一起,将要共同构建出新的智能数学。