神经网络控制-经济百科

什么是神经网络控制

神经网络控制是指在控制系统中，应用神经网络技术，对难以精确建模的复杂非线性对象进行神经网络模型辨识，或作为控制器，或进行优化计算，或进行推理，或进行故障诊断，或同时兼有上述多种功能。

神经网络是由大量人工神经元（处理单元）广泛互联而成的网络，它是在现代神经生物学和认识科学对人类信息处理研究的基础上提出来的，具有很强的自适应性和学习能力、非线性映射能力、鲁棒性和容错能力。充分地将这些神经网络特性应用于控制领域，可使控制系统的智能化向前迈进一大步。

随着被控系统越来越复杂，人们对控制系统的要求越来越高，特别是要求控制系统能适应不确定性、时变的对象与环境。传统的基于精确模型的控制方法难以适应要求，现在关于控制的概念也已更加广泛，它要求包括一些决策、规划以及学习功能。神经网络由于具有上述优点而越来越受到人们的重视。

神经网络控制就是利用神经网络这种工具从机理上对人脑进行简单结构模拟的新型控制和辨识方法。神经网络在控制系统中可充当对象的模型,还可充当控制器。常见的神经网络控制结构有:

1、参数估计自适应控制系统;

2、内模控制系统;

3、预测控制系统;

4、模型参考自适应系统;

5、变结构控制系统。

神经网络控制的特性及作用

与传统控制相比，神经网络控制具有以下重要特性:

1、非线性，神经元网络在理论上可以充分逼近任意非线性函数;

2、并行分布处理，神经网络具有高度的并行结构和并行实现能力，使其具有更大程度的容错能力和较强的数据处理能力;

3、学习和自适应性，能对知识环境提供的信息进行学习和记忆;

4、多变量处理，神经网络可自然地处理多输入信号，并具有多输出，它非常适合用于多变量系统。

通常将人工神经网络技术与传统的控制理论或智能技术综合使用。神经网络在控制中的作用有以下几种：

1、在传统的控制系统中用以动态系统建模，充当对象模型；

2、在反馈控制系统中直接充当控制器的作用；

3、在传统控制系统中起优化计算作用；

4、与其他智能控制方法如模糊逻辑、遗传算法、专家控制等相融合。

神经网络控制的基本结构模型

1、神经网络监督控制

神经网络监督控制是指通过对人工或传统控制器（如PID控制器）进行学习，然后用神经网络控制器取代或逐渐取代原有控制器的方法（Werbos1990），图1为两种神经网络监督控制结构模型。

图1中的神经网络监督控制是建立在人工控制器基础上的正向模型，经过训练后，神经网络NNC记忆人工控制器的动态特性，并接受传感信息输入，最后输出与人工控制相似的控制作用。其不足是，人工控制器是靠视觉反馈进行控制的，这样用神经网络进行控制时，缺乏信息反馈，从而使系统处于开环状态，系统的稳定性和鲁棒性得不到保证。

图2中的神经网络控制器通过对传统控制器的输出进行学习，在线调整自身参数，直至反馈误差e(t)趋近于零，使自己逐渐在控制中占据主导地位，以最终取代传统控制器。当系统出现干扰时，传统控制器重新起作用，神经网络重新进行学习。这种神经网络监督控制结构由于增加了反馈结构，其稳定性和鲁棒性都可得到保证，且控制精度和自适应能力也大大提高。

2、神经网络直接逆控制神经网络直接逆控制就是将被控对象的神经网络逆模型直接与被控对象串联连接，使系统期望输出y_d(t)与对象实际输出之间的传递函数等于1，从而再将此网络置于前馈控制器后，使被控对象的输出为期望输出，如图3所示。图中神经网络NN1和NN2具有相同的网络结构（逆模型），采用相同的学习算法。这种方法的可行性直接取决于逆模型辨识的准确程度，逆模型的连接权必须在线修正。其成功的应用是机器人手臂的跟踪控制。

3、神经网络模型参考控制

神经网络模型参考控制是神经网络自适应控制中的一种，在这种控制结构中，闭环控制系统的期望性能由一个稳定的参考模型来描述，且定义成{r(t),y图4为神经网络内模控制模型，被控对象的正向模型和控制器（逆模型）均由神经网络实现，滤波器为线性滤波器，以获得期望的鲁棒性和闭合回路的跟踪响应特性。应当注意，内模控制的应用仅限于开环稳定的系统。这一技术已广泛地应用于过程控制中，其中，Hunt和Sharbam等人(1990)实现了非线性系统的神经网络内模控制。

5、神经网络预测控制

预测控制是20世纪70年代后期发展起来的一种新型控制算法，其特性是预测模型、滚动优化和反馈校正，已证明预测控制对非线性系统具有期望的稳定性能(MayneanDMichalsKA1990)。

神经网络预测控制模型如图5所示，其中神经网络预测器建立了非线性被控对象的预测模型，利用该预测模型，可由当前的控制输入u(t)，预测出被控系统在将来一段时间内的输出值y(t+j)=y_d(t+j)?y(t+j,t).则非线性优化器将使下式所示的二次型性能指标极小，以得到合适的控制作用u（t）:

其中，Δu(t+j?1)=u(t+j?1)?u(t+j?2),且λ_j为控制加权影子。

6、神经网络自适应评判控制

在上述各种神经网络控制结构中，都要求提供被控对象的期望输入，这种方法称为监督学习，但在系统模型未知时，有时只能定性地提供一些评价信息，基于这些定性信息的学习算法称为再励学习。神经网络自适应评判控制就是基于这种再励学习算法的控制。

神经网络自适应评判控制通常由两个网络组成，如图6所示。其中自适应评价网络相当于一个需要进行再励学习的“教师”。其作用为，一是通过不断的奖励、惩罚等再励学习方法，使其成为一个“合格”的教师；二是在学习完成后，根据被控系统当前的状态及外部再励反馈信号r(t)，产生一再励预测信号，进而给出内部再励信号，以期对当前控制作用的效果进行评价。控制选择网络的作用相当于一个在内部再励信号指导下进行学习的多层前馈神经网络控制器，该网络在学习后，将根据编码后的系统状态，在允许控制集中选择下一步的控制作用。