世界上大部分的科学与工程问题本质上都可以归为两类,即滤波与控制。
首先看滤波。 滤波是一种信号处理的手段,用以从观测到的信号中提取出你想要的部分或者特征。 从数学对应关系上看,滤波就是从一系列观测值中获得被估计变量的值。滤波器最早应用于信号处理与控制工程中。 对于时间序列,滤波问题可以覆盖很广的范围。假设要利用t1时刻及其以前的历史观测数据去估计t2时刻的值。那一般认为,如果t1>t2,则这称为平滑问题;如果t1=t2,这就是狭义的滤波问题;如果t1 从信号处理角度看,滤波器可以在频域中设计,比如低通滤波、维纳滤波等;也可以在时域中设计,比如经典的卡尔曼滤波;另外,滤波在图像处理领域中,空间域可以相当于时域。广义上的滤波就是从实际获得的观测数据中抽取需要的特征,然后估计和判断的过程。不管是频域、时域,还是空间域,滤波问题都可有应用。 目前人工智能发展比较成熟的两大应用即图像识别和语音识别可以直接归到滤波问题,因为图像识别和语音识别是从图像数据或者声音信号中提取到特征,然后估计判断出期望的变量,只不过这个被估计是一个离散型变量。计算机视觉领域有很多方法也直接以滤波作为关键词命名,如核相关滤波,而人工神经网络本身就可以看作一个滤波器。
信号处理中的滤波 再来谈谈控制。 控制问题的目标是设计控制器使得被控对象的实际输出达到期望值。如果控制过程中考虑被控对象的实际输出而进行在线调节,那这就是闭环控制;否则就是开环控制。 闭环控制是控制理论研究的主要问题,其核心在于反馈,能根据反馈的实际情况不断调整控制策略,相比开环控制更能满足性能要求。反馈控制思想存在于机器、人以及社会生活的方方面面。 控制问题最终是要设计出控制器,一个完整的控制系统由控制器、被控对象和传感器组成(有时把执行机构也单独拿出来,实际中根据关联程度,执行机构可以归到控制器或者被控对象中)。 与滤波类似,控制科学中设计控制算法可以在频域或者时域内进行。早期基于伯德图的频域分析,后来出现了基于状态方程的时域方法。用于非线性系统的现代控制理论大部分都基于时域。
控制系统结构框图
反馈控制需要测量实际值的传感器,而实际信号中会有噪声存在,这样反馈控制系统会涉及到滤波问题。另外控制系统常常需要观测器来获得需要的变量值,这也是滤波问题。 这样看来,控制与滤波实际上关联很大,密不可分。不过从数学对应关系上看,控制问题是要保持一个信号A尽可能接近另一个信号B,而信号B一般来说是完全已知的;然而滤波问题从A信号中估计出B信号,这里虽然知道B信号的某些特性,但值是需要估计的。因此控制问题与滤波问题的目标是不一样的。 按照深度学习的层次架构,底层是实际数据,越往上是越抽象的特征。那么从信号流动方向看,滤波过程是自下而上的,是一个信息不断浓缩和提取的过程;而控制问题是自上而下的,是把期望值转化为实际信号,一步一步地变成现实的过程。 从哲学上看,滤波是在认识世界,而控制是在改造世界。 当下的人工智能主要关注于滤波问题,不管是图像识别和语音识别,还是自然语言理解和用户画像技术。 现阶段人工智能的进步主要是停留在计算智能层面,利用数据、计算能力和智能算法很好的解决了各种滤波问题。基于信息处理的计算智能层面取得了巨大进步,机器已经在围棋这种相当有智力挑战的活动中达到成熟人类的水平,甚至超过人类的最高水平。 但是,机器在运动智能方面依然不足三岁小孩,难以做到流畅地抓握取放、摸爬滚打、蹦蹦跳跳,现在工业机器人依然傻大黑粗,虽然出现了协作型机器人,但是依然需要很大的人力配合才能完成任务。一句话,运动智能不提高,即便有强大的计算智能,我们也不用担心机器人会统治世界,因为简单点,拔掉电源就可以了。
滤波与控制对比 众所周知,当下人工智能的发展属于弱人工智能的范畴,也就是说机器现在可以擅长单方面的人工智能。 比如可以在围棋领域战胜人类AlphaGo不会精确地投放广告,人脸识别系统不会识别你的声音。 迁移学习能力目前也成为了人工智能领域研究的重要课题。人有五大感官,具备听说读写能力,每时每刻都在接受多模态的信息进行决策与推断,目前机器难以做到。 在弱人工智能之后就是强人工智能和超人工智能。要想实现从弱人工智能到强人工智能的跨越,必须考虑多模态信息,实现迁移学习能力,并且提升运动智能。处理多模态信息就是滤波问题,而提升运动智能就是控制问题。
不管是信息提取的滤波问题,还是具体实现的控制问题,要想提升原有性能都有很大难度,不过就目前的基础科学与技术发展而言,控制问题难度更大。 控制问题的难点在于闭环和在线。控制系统本身包含多种形式的信息,比如机器人中电机的控制,需要考虑磁、电、光、力、位移等各种信息和干扰。目前工程上倾向于单独考虑各部分,做到各个子部分达到一定精度。 但从参考信号,到最后的输出信号,整个闭环控制系统的各个子部分是相互联系的,这种联系不以人类的意志而转移。即使采用相同的器件装配而成的工业机器人,也存在装配误差导致的各种不确定性。 现代控制理论大都基于模型建立,控制理论的发展过程就是不断考虑被控对象更多特性和更多不确定性的过程。从最初的线性定常模型,到非线性模型,再到随机模型。现代控制理论的发展在一定程度上改善了控制效果,考虑的因素越来越多,但控制器的设计也越来越复杂,并且有些复杂的高级控制算法并没有改善品质。 深度学习的思想其实比较简单,就是深度网络+特征学习。如果将现有的深度学习、强化学习等技术应用到控制问题中,数据来源是很大的问题,因为需要的是实时在线的闭环数据,毕竟对于具有不确定性的控制对象,怎么给出辨识过程的控制输入满足信号的丰富性,并且需要保证控制过程不造成损害。
机器人学中同时存在滤波和控制问题。校正运动学参数就是滤波问题,而提高末端跟踪精度就是控制问题。将智能赋予工业机器人就是一个典型的运动智能层面的课题。 在互联网时代,最聪明的人都在研究如何精准地给用户画像从而投放广告,这是一个滤波问题。相反,大家对运动智能关注不够。当下人工智能的巨大进步来源于算法、计算能力和数据三大要素的支持,运动智能的发展可能远不止这些。 抛开资本推动、利益驱动等一些社会因素,运动智能会涉及能源、材料以及基础科学的进步。因为更好的能源可以实现机器人真正地移动而不担心续航问题,更好的材料是机器人接触更多东西完成更多任务的前提,而机器人的自主学习就需要基础科学理论的巨大突破。 我一直在思考,人工智能与机器人学如何结合。随着新一代工业革命的推动和人口结构的变化,相信越来越多的人会关注运动智能。就运动智能而言,当机器人能够进行自主运动规划完成组装任务,那就是实现了强人工智能;当机器人能够自我装配从而实现自动繁殖,那就是实现了超人工智能。路漫漫其修远兮,吾辈将上下而求索。
|