230
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ Конспект лекций Б. Р. АНДРИЕВСКИЙ Балтийский государственный технический университет (БГТУ) «Военмех» Кафедра И3 Санкт-Петербург 2008

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

  • Upload
    others

  • View
    82

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ТЕОРЕТИЧЕСКИЕ ОСНОВЫАВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

Конспект лекций

Б. Р. АНДРИЕВСКИЙ

Балтийский государственный технический университет (БГТУ) «Военмех»Кафедра И3

Санкт-Петербург

2008

Page 2: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

СОДЕРЖАНИЕ

1 Динамические и статические системы. Понятие состояния динамическихсистем 7

2 Уравнения состояния линейных систем. Линеаризация уравнений состоя-ния 112.1 Линейные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Линеаризация уравнений состояния . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3 Примеры уравнений состояния систем . . . . . . . . . . . . . . . . . . . . . . 16

2.3.1 Электротехнические устройства . . . . . . . . . . . . . . . . . . . . . 16

2.3.2 Угловое движение искусственного спутника Земли. . . . . . . . . . . 18

3 Передаточные функции и их определение по уравнениям состояния 20

3.1 Передаточные функции линейных систем . . . . . . . . . . . . . . . . . . . . 20

3.2 Алгоритмы вычисления передаточных функций . . . . . . . . . . . . . . . . . 21

3.3 Примеры перехода к передаточным функциям от уравнений состояния . . 23

3.4 Частотные характеристики . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.4.1 Частотные характеристики непрерывных систем . . . . . . . . . . . . 26

3.4.2 Частотные характеристики дискретных систем . . . . . . . . . . . . . 28

3.4.3 Частотные характеристики цифровых систем реального времени . . . 29

4 Преобразование базиса. Инвариантность передаточной функции 31

5 Канонические формы уравнений состояния. Диагональная и жорданова

формы 35

5.1 Диагональная форма. Простые вещественные собственные числа . . . . . . 35

5.2 Вещественная диагональная форма. Простые мнимые собственные числа . . 36

5.3 Общий случай. Вещественная форма Жордана . . . . . . . . . . . . . . . . . 39

6 Управляемая и наблюдаемая канонические формы 42

6.1 Управляемое каноническое представление . . . . . . . . . . . . . . . . . . . . 42

6.2 Наблюдаемое каноническое представление . . . . . . . . . . . . . . . . . . . . 44

2

Page 3: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

7 Преобразование уравнений состояния к каноническому виду. Преобразо-

вание к диагональной и блочно-диагональной формам 46

7.1 Простые вещественные собственные числа . . . . . . . . . . . . . . . . . . . 47

7.2 Простые мнимые собственные числа . . . . . . . . . . . . . . . . . . . . . . . 48

8 Преобразование уравнений состояния к управляемой и наблюдаемой ка-

ноническим формам 50

8.1 О возможности преобразования матрицы к форме Фробениуса . . . . . . . . 50

8.2 Управляемое каноническое представление . . . . . . . . . . . . . . . . . . . . 51

8.3 Наблюдаемое каноническое представление . . . . . . . . . . . . . . . . . . . 52

9 Определение уравнений состояния по передаточной функции 55

9.1 Управляемое каноническое представление . . . . . . . . . . . . . . . . . . . . 56

9.2 Наблюдаемое каноническое представление . . . . . . . . . . . . . . . . . . . 57

9.3 Блочно-диагональная форма . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

9.4 Жорданова форма . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

9.5 Случай систем с несколькими входами и выходами . . . . . . . . . . . . . . 61

10 Фазовые траектории и фазовые портреты линейных систем 64

10.1 Определения и основные свойства фазовых траекторий и фазовых портретов 64

10.2 Поле фазовых скоростей. Классификация особых точек . . . . . . . . . . . . 66

10.2.1 Вектор фазовой скорости . . . . . . . . . . . . . . . . . . . . . . . . . . 66

10.2.2 Состояния равновесия системы . . . . . . . . . . . . . . . . . . . . . . 66

10.2.3 Декомпозиция пространства состояний . . . . . . . . . . . . . . . . . . 68

10.3 Виды фазовых портретов для систем второго порядка . . . . . . . . . . . . . 71

10.3.1 Фазовые портреты при диагональной (жордановой) форме матрицы A 74

10.3.2 Фазовые портреты при канонической форме фазовой переменной . . 76

11 Решение уравнений состояния. Формула Коши 79

11.1 Решение однородного уравнения . . . . . . . . . . . . . . . . . . . . . . . . . 79

11.2 Решение неоднородного уравнения . . . . . . . . . . . . . . . . . . . . . . . . 81

11.3 Свойства переходной матрицы . . . . . . . . . . . . . . . . . . . . . . . . . . 82

3

Page 4: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

11.4 Вычисление функции веса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

11.5 Определение начального состояния по начальному значению выхода и егопроизводных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

12 Дискретные модели непрерывных систем 86

12.1 Постановка задачи дискретизации . . . . . . . . . . . . . . . . . . . . . . . . . 86

12.2 Формулы перехода к разностным уравнениям . . . . . . . . . . . . . . . . . . 88

13 Методы вычисления матричной экспоненты 90

13.1 Точные методы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

13.2 Приближенные методы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

13.3 Вычисление матрицы Q в общем случае . . . . . . . . . . . . . . . . . . . . . 95

14 Дискретные модели для различных видов входного процесса 97

14.1 Смещенное z-преобразование . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

14.2 Прямоугольные импульсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

14.3 Экспоненциальные импульсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

14.4 Треугольные импульсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

14.5 Подстановочные формулы для вычисления передаточной функции дискрет-ной модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

15 Управляемость и наблюдаемость линейных систем 104

15.1 Основные определения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

15.2 Критерии управляемости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

15.3 Критерии наблюдаемости. Теорема дуальности . . . . . . . . . . . . . . . . . 111

16 Оценивание состояния объекта и возмущений 114

16.1 Постановка задачи оценивания . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

16.2 Наблюдатели состояния . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

16.3 Наблюдатель полного порядка . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

16.4 Наблюдатели пониженного порядка . . . . . . . . . . . . . . . . . . . . . . . . 119

16.5 Оценивание возмущений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4

Page 5: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

17 Синтез модальных и терминальных регуляторов 125

17.1 Задача модального управления . . . . . . . . . . . . . . . . . . . . . . . . . . 125

17.2 Модальное управление по состоянию объекта . . . . . . . . . . . . . . . . . . 125

17.3 Модальное управление по выходу объекта. Теорема разделения . . . . . . . . 127

17.4 Терминальное управление . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

17.5 Примеры систем модального и терминального управления . . . . . . 134

17.5.1 Стабилизация углового движения ИСЗ с компенсацией возмущений . 134

17.5.2 Возбуждение колебаний в цепочке осцилляторов . . . . . . . . . . . . 135

18 Уравнения и характерные свойства нелинейных систем 138

18.1 Общие сведения о нелинейных системах . . . . . . . . . . . . . . . . . . . . . 138

18.2 Уравнения нелинейных звеньев и систем . . . . . . . . . . . . . . . . . . . . 141

18.3 Особенности процессов в нелинейных системах . . . . . . . . . . . . . . . . . 147

18.3.1 Принцип суперпозиции . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

18.3.2 Сепаратрисные поверхности . . . . . . . . . . . . . . . . . . . . . . . . 148

18.3.3 Предельные циклы. Автоколебания . . . . . . . . . . . . . . . . . . . . 149

18.3.4 Состояния равновесия. Отрезки покоя . . . . . . . . . . . . . . . . . . 152

18.3.5 Неединственность решений. Пересечение траекторий . . . . . . . . . . 153

18.3.6 Скользящие режимы . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

18.3.7 Влияние внешних воздействий . . . . . . . . . . . . . . . . . . . . . . . 155

19 Методы исследования нелинейных систем 157

19.1 Задачи и методы теории нелинейных систем . . . . . . . . . . . . . . . . . . . 157

19.2 Методы фазового пространства . . . . . . . . . . . . . . . . . . . . . . . . . . 159

19.2.1 Метод фазовой плоскости . . . . . . . . . . . . . . . . . . . . . . . . . . 159

19.2.2 Метод точечных отображений . . . . . . . . . . . . . . . . . . . . . . . 160

19.2.3 Условия существования предельных циклов для систем второго порядка161

19.3 Метод гармонической линеаризации (гармонического баланса) . . . . . . . . 161

19.3.1 Основные положения. «Свойство фильтра» . . . . . . . . . . . . . . . 162

19.3.2 Коэффициенты гармонической линеаризации . . . . . . . . . . . . . . 163

19.3.3 Уравнение гармонического баланса . . . . . . . . . . . . . . . . . . . . 166

5

Page 6: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

19.3.4 Пример. Исследование генератора колебаний . . . . . . . . . . . . . . 169

20 Метод функций Ляпунова 175

20.1 Основные определения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

20.2 Устойчивость множеств и частичная устойчивость . . . . . . . . . . . . . . . 177

20.3 Функции Ляпунова . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

20.4 Устойчивость непрерывных систем . . . . . . . . . . . . . . . . . . . . . . . . 183

20.5 Устойчивость дискретных систем . . . . . . . . . . . . . . . . . . . . . . . . . 189

20.6 Примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

21 Методы теории абсолютной устойчивости 199

21.1 Задача абсолютной устойчивости . . . . . . . . . . . . . . . . . . . . . . . . . 199

21.2 Круговой критерий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

21.3 Критерий В. М. Попова . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

22 Исследование скользящих режимов. Метод эквивалентного управления 203

22.1 Понятие о скользящих режимах . . . . . . . . . . . . . . . . . . . . . . . . . . 203

22.2 Определение движения в скользящем режиме . . . . . . . . . . . . . . . . . . 205

22.3 Методы определения движения в скользящем режиме . . . . . . . . . . . . . 206

22.4 Метод эквивалентного управления . . . . . . . . . . . . . . . . . . . . . . . . 208

23 Системы с переменной структурой в задаче управления 210

24 Системы с переменной структурой в задаче оценивания состояния 216

25 Методы адаптивного управления 219

25.1 Задача адаптивного управления . . . . . . . . . . . . . . . . . . . . . . . . . 219

25.2 Структура адаптивных систем управления . . . . . . . . . . . . . . . . . . . . 220

25.3 Методика решения задач адаптивного управления . . . . . . . . . . . . . . . 221

6

Page 7: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 1

1 Динамические и статические системы. Понятие состояния ди-намических систем

Любая система, в том числе и система управления, состоит из совокупности подсистем

(звеньев). Звенья могут различаться по характеру реакций на входное воздействие. С этой

точки зрения все звенья могут быть разделены на статические (безынерционные) и дина-

мические (инерционные) . Рассмотрим отличительные особенности в поведении и матема-тическом описании систем одного и другого типов.

Статические системы 1 обладают мгновенной реакцией на входное воздействие. Болеесущественным свойством таких систем является то, что их реакция на входное воздействиене зависит от предыстории, от поведения системы в прошлом, а также от предыдущихзначений входа.

Математически это можно описать следующим образом.

Обозначим через u(t), y(t) вход и выход системы в момент t. У статической системы для

каждого t выход y(t) можно определить однозначно по значению u(t) в тот же момент вре-

мени. Для этой цели служит статическая характеристика y = f(u) или y = f(u, t) (для

нестационарных систем). В соответствии с ней получаем y(t) = f(u(t)). Никакой другой

дополнительной информации не требуется. 2

Иначе обстоит дело с динамическими системами. Их особенностью является то, что

для определения y(t) недостаточно информации об u(t) в тот же момент времени. Выход-ной сигнал зависит также от предыстории изменения входа и, кроме того, совокупностинекоторых величин, называемых начальным состоянием системы. Рассмотрим понятие со-стояния более подробно.

Понятие состояния системы (звена) является одним из базовых понятий теории ди-намических систем, поэтому оно определяется не через другие понятия, а аксиоматически

– перечислением совокупности присущих ему свойств [8, 20, 21]. Рассмотрим некоторые изних.

Как отмечено выше, выход динамической системы определяется однозначно, если за-даны предыстория изменения входного процесса на некотором промежутке и, кроме того,некоторая совокупность величин, относящаяся к началу данного промежутка – начальное

1 В дальнейшем термины система, подсистема и звено обычно будут использоваться как синонимы,так как их математические модели однотипны.

2 Статической характеристикой в общем случае называют зависимость между входом и выходом си-стемы в установившемся режиме (по истечении времени переходных процессов). Можно сказать, что убезынерционных систем (звеньев) этот режим наступает немедленно.

7

Page 8: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

состояние системы. Символически это будем записывать так: 3

y(t1) = S(x(t0); u[t0,t1]).

Таким образом, состояние системы – это некоторый параметр, позволяющий сделать од-нозначным определение ее выхода по входу.

Различные начальные состояния приводят, вообще говоря, к различной реакции на однои то же входное воздействие. В приведенном выше уравнении S – некоторый оператор,

преобразующий одну функцию в другую. 4

Состояние системы должно удовлетворять четырем аксиомам (условиям) совместно-

сти [20]. Рассмотрим две наиболее важные из них.

Аксиома 1. Выход y(t) для всех t ≥ t0 определяется однозначно, если заданы x(t0) и

u[t0,t1] (см. рис. 1.1, а).

Рисунок 1.1 – Аксиомы совместности.

Таким образом, состояние системы в данный момент времени содержит всю памятьо прошлом, существенную для развития процесса в будущем. Если фиксировать началь-ное состояние, то будущее от прошлого не зависит; все, что нужно знать от прошлогодля определения процесса в будущем, содержится в состоянии на данный момент времени.Таким образом, для определения будущего поведения системы не имеет значения то, как

3 Через u[t0,t1] обозначено сужение функции u(·) на промежуток [t0, t1].4 Такая запись похожа на описание динамики систем передаточными функциями. Разница состоит в

том, что передаточные функции используются для описания только линейных систем и позволяют опре-делить реакцию лишь для нулевых начальных условий.

8

Page 9: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

она пришла в данное состояние, – по начальному состоянию и входу процесс определяетсяоднозначно.

Аксиома 2. Если траекторию системы разбить на ряд участков, то можно рассматри-вать движение на каждом из них как новую траекторию при соответствующем начальном

состоянии (см. рис. 1.1, б).

Пусть t0 < t1 < t2. Тогда y(t2) = S(x(t0); u[t0,t2]). С другой стороны, при любых

x(t0), u[t0,t1] можно определить состояние x(t1) таким образом, что y(t2) = S(x(t1); u[t1,t2]).Из этой аксиомы следует, что состояние динамической системы должно изменяться

во времени соответствующим образом (в зависимости от входного процесса и начального

состояния).

Определение. Множество X = {x} возможных значений состояния системы называ-

ется пространством состояний (данной системы). 5

Часто можно рассматривать в качестве пространства состояний n-мерное линейное ве-

щественное пространство, X = Rn. Тогда состояние x(t) есть n-мерный вещественный век-

тор – вектор состояния, или фазовый вектор. Компоненты этого вектора обычно будем

обозначать через xi(t), или, если возможны совпадения в обозначениях – через x(i)(t), т.е.писать

x(t) =

⎡⎢⎢⎢⎣x1(t)x2(t)...

xn(t)

⎤⎥⎥⎥⎦ или x(t) =

⎡⎢⎢⎢⎣x(1)(t)x(2)(t)...

x(n)(t)

⎤⎥⎥⎥⎦ .

Для краткости будем также использовать запись

x = col{x1, x2, . . . , xn}, или x = [x1, x2, . . . , xn]T .

Такая запись в общем случае означает, что x есть вектор-столбец, составленный из распо-ложенных в столбец компонент векторов xi, i = 1, 2, . . . , n . Иногда, как будет видно изконтекста, индекс используется для обозначения различных одноименных векторов.

Заметим, что такой вид пространства состояний не исчерпывает всех возможных ситу-аций. Например, пространство состояний конечных автоматов состоит из конечного числаточек. С другой стороны, для многих систем нельзя указать конечное значение n размерно-сти пространства X . К таким системам относятся различные распределенные объекты, ди-намика которых описывается дифференциальными уравнениями в частных производных,

5 Используется также термин «фазовое пространство».

9

Page 10: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

объекты с запаздыванием и так далее. В этой книге рассматриваются только конечномер-ные динамические системы. Однако и для конечномерных систем не обязательно X = Rn.

Например, для простейшей механической системы – маятника – одной из переменных со-стояния является угол поворота относительно точки подвеса. Но в множестве возможныхзначений угловой переменной точки 0 рад. и 2π рад. совпадают. Следовательно, это мно-жество не может быть линейным пространством, его геометрическим образом являетсяне прямая, а окружность. Строгое рассмотрение таких систем требует привлечения поня-тия многообразия и выходит за рамки этой книги. Тем не менее многие свойства системс угловыми координатами можно изучать, не используя аксиом линейного пространства.Поэтому, если не оговорено противное, мы будем считать, что X = Rn.

Из определения понятия состояния следует, что если x – состояние системы, μ(·) – неко-торое взаимно однозначное отображение пространства X в себя (μ : X −→ X ), то x = μ(x)

также можно рассматривать как состояние данной системы [8, 20]. Таким образом, состо-

яние определяется неединственным образом, а с точностью до взаимно однозначного пре-

образования (которых может быть сколь угодно много). В частности, если X = Rn, а T –

некоторая невырожденная матрица порядка n (det T �= 0), то вектор x = Tx также может

быть использован для описания состояния системы. Такой переход называется преобразова-нием базиса в пространстве состояний. Это преобразование не нарушает входо-выходныхсоотношений в описании системы.

Конкретизируем вид уравнений состояния. Рассмотрим так называемые конечномерные

дифференциальные (непрерывные) системы. Уравнения состояния таких систем могут бытьпредставлены в виде

x(t) = f(x(t), u(t), t

), x(t0) = x0, t ≥ t0,

y(t) = g(x(t), u(t), t

).

(1.1)

Первое из этих уравнений – (собственно) уравнение состояния, или эволюционное урав-

нение, описывает изменение состояния системы во времени t ∈R в зависимости от началь-

ных условий в момент t0 и входного воздействия u(t). Второе уравнение – уравнение выхода,устанавливает связь между текущими значениями состояния и входа, с одной стороны, и

выхода y(t) – с другой. Фактически вся динамика системы сосредоточена в первом уравне-нии, а второе является статическим соотношением.

Переменные, входящие в уравнения (1.1), считаются векторными: x(t) ∈ Rn, y(t) ∈

Rl, u(t) ∈ R

m, f(·), g(·) – вектор-функции от векторных аргументов соответствующихразмерностей.

10

Page 11: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 2

2 Уравнения состояния линейных систем. Линеаризация урав-нений состояния

2.1 Линейные системы

Если функции f(·), g(·) линейны по x, u, то уравнения состояния (1.1) могут быть записаны

в виде [8, 20]

x(t) = A(t)x(t) +B(t)u(t), x(t0) = x0, t ≥ t0,y(t) = C(t)x(t) +D(t)u(t).

(2.2)

Такие системы называются непрерывными линейными системами. 6 Здесь, как и выше,

x(t) ∈Rn, y(t) ∈R

l, u(t) ∈Rm, а матрицы-функции A(t), B(t), C(t), D(t) имеют размеры

n×n, n×m, l×n, l×m соответственно.

Определение 1. Если D(t) ≡ 0, то то система (2.2) называется собственной (строго

реализуемой). В противном случае система называется несобственной. 7

Уравнения состояния (2.2) реализуемых непрерывных систем иллюстрируются струк-турной схемой, приведенной на рис. 2.2.

Определение 2. Если матрицы A(t), B(t), C(t), D(t) постоянны (не зависят от времени

t), то система (2.2) называется стационарной, в противном случае – нестационарной.

Вид процессов в стационарных системах не зависит от того, какой момент временирассматривается как начальный. Поэтому для них можно считать t0 = 0.

Поскольку ниже основное внимание уделяется стационарным собственным системам,запишем соответствующие уравнения состояния:

x(t) = Ax(t) +Bu(t), y(t) = Cx(t), x(0) = x0, t ≥ 0. (2.3)

Аналогично могут быть записаны уравнения состояния реализуемых дискретных си-6 Для линейных систем справедлив принцип суперпозиции, согласно которому реакция системы на

линейную комбинацию (суперпозицию) воздействий совпадает с той же линейной комбинацией реакций накаждое воздействие в отдельности.

7 Такое название связано с тем, что операция «чистого» дифференцирования нереализуема практическии связана с трудностями при математическом описании. Введение нереализуемых звеньев в математиче-скую модель системы оправдано в тех случаях, когда реально присутствующие постоянные времени прене-брежимо малы в рассматриваемом диапазоне частот. Это дает возможность уменьшить порядок уравненийсистемы.

11

Page 12: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 2.2 – Структурная схема системы (2.2).

стем. Они имеют вид разностных уравнений

x[k + 1] = f(x[k], u[k], k

), x[k0] = x0, k ≥ k0,

y[k] = g(x[k], u[k], k

) (2.4)

– для нелинейных систем и

x[k + 1] = A[k]x[k] +B[k]u[k], x[t0] = x0, k ≥ k0,y[k] = C[k]x[k] +D[k]u[k]

(2.5)

– для линейных систем. В уравнениях (2.4), (2.5) k = k0, k0 + 1, k0 + 2, . . . – «дискрет-

ное время», x[k] ∈ Rn, y[k] ∈ R

l, u[k] ∈ Rm, f(·) ∈ R

n, g(·) ∈ Rl. Матрицы-функции

A[k], B[k], C[k], D[k] имеют размеры n×n, n×m, l×n, l×m.

З а м е ч а н и е . Иногда уравнения состояния записывают более подробно, выделяя в

них, кроме управления, внешние возмущения ϕ(t), а также разделяя выходной сигнал на

управляемый yc(t) и измеряемый ym(t) выходы. Тогда уравнения (2.3) принимают вид

x(t) = Ax(t) +Buu(t) +Bϕϕ(t), yc(t) = Ccx(t), ym(t) = Cmx(t).

В некоторых случаях подобная детализация оказывается удобной и будет использоватьсяниже.

2.2 Линеаризация уравнений состояния

В реальных системах всегда присутствуют нелинейные зависимости, обусловленные, напри-мер, такими свойствами физических звеньев, как насыщение, люфт, нечувствительность,

12

Page 13: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

кулоново («сухое») трение и так далее. Эти эффекты приводят к нелинейности системы в

целом. Исследование системы можно существенно упростить путем линеаризации ее моде-

ли, т.е. приближенной заменой уравнений вида (1.1) уравнениями (2.2) (или, для дискрет-

ных процессов, – использованием (2.5) вместо (2.4)).

Рассмотрим процесс линеаризации в общем виде. Пусть динамика системы описывается

уравнениями состояния (1.1)

x(t) = f(x, u, t), y(t) = g(x, u, t). (2.6)

Введем некоторые произвольно изменяющиеся по времени ("опорные") функции x∗(t) ∈Rn и u∗(t) ∈ R

m. Найдем линейную часть разложения функций f(·), g(·) в окрестности

x∗(t), u∗(t) в ряд Тейлора. 8 В результате получим

x(t) + Δx(t) = f(x∗(t), u∗(t), t) +∂f(x, u, t)

∂x

∣∣∗Δx(t) +

∂f(x, u, t)

∂u

∣∣∗Δu(t) +O2, (2.7)

y(t) = g(x∗(t), u∗(t), t) +∂g(x, u, t)

∂x

∣∣∗Δx(t) +

∂g(x, u, t)

∂u

∣∣∗Δu(t) +O2,

где Δx(t) = x(t)− x∗(t) – отклонение состояния исходной модели по отношению к вектору

x∗(t); Δu(t) = u(t)−u∗(t) – отклонение входного процесса от u∗(t),∂f(·)∂x

∣∣∗,∂f(·)∂u

∣∣∗,∂g(·)∂x

∣∣∗,

∂g(·)∂u

∣∣∗ – матрицы частных производных вектор-функций f(·), g(·) (матрицы Якоби) по

компонентам векторов x, u, вычисленные при значениях x(t) ≡ x∗(t), u(t) ≡ u∗(t); O2 –

малые величины второго порядка малости по Δx(t), Δu(t).

Отсюда следует общий вид уравнений для приращений:

Δx(t) = A(t)Δx(t) +B(t)Δu(t) + f ∗(t)− x∗(t) +O2,

Δy(t) = C(t)Δx(t) +D(t)Δu(t) +O2,

где

A(t) =∂f(x, u, t)

∂x

∣∣∗, B(t) =

∂f(x, u, t)

∂u

∣∣∗,

C(t) =∂g(x, u, t)

∂x

∣∣∗, D(t) =

∂g(x, u, t)

∂u

∣∣∗−

8 Для осуществимости этой операции требуется дифференцируемость функций f(·), g(·) по x, u в окрест-ности x∗(t), u∗(t).

13

Page 14: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

матрицы-функции размеров n×n, n×m, l×n, l×m (соответственно), f ∗(t) = f(x∗(t), u∗(t), t).

При достаточно малых отклонениях x(t), u(t) от опорных траекторий x∗(t), u∗(t) малы-

ми величинами более высокого порядка можно пренебречь.

Конкретный вид линеаризованной модели зависит от выбора опорного движения

x∗(t), u∗(t). Основной интерес представляют следующие частные случаи [8, 9, 14, 22, 32]:

– в качестве опорного выбирается некоторое невозмущенное движение, когда x∗(t), u∗(t)

удовлетворяют исходному уравнению (2.7).

В этом случае линеаризованная модель имеет вид

Δx(t) = A(t)Δx(t) +B(t)Δu(t),

Δy(t) = C(t)Δx(t) +D(t)Δu(t) (2.8)

– в качестве опорного движения выбираются неизменные во времени состояние системы

и входной процесс, т.е. считается, что x∗(t) ≡ 0, u∗(t) ≡ 0, x∗(t) ≡ x∗, u∗(t) ≡ u∗(t). Тогдалинеаризованная модель имеет вид

Δx(t) = A(t)Δx(t) +B(t)Δu(t) + f ∗(x∗, u∗, t),

Δy(t) = C(t)Δx(t) +D(t)Δu(t). (2.9)

Заметим, что в приведенных выше соотношениях в качестве u(t), u∗(t) можно рас-

сматривать не только внешние воздействия на систему, но и ее параметры. Тогда модель,полученная в результате линеаризации, позволяет приближенно судить о чувствительностирешений системы к отклонению параметров от расчетных значений, причем эти отклоне-

ния представляются в виде аддитивных возмущений (так как они являются компонентами

"расширенного"входного процесса Δu(t)).

Пример. Линеаризация модели маятника

Для иллюстрации рассмотрим линеаризацию уравнений свободного движения математи-ческого маятника массой m и длиной l. Влиянием сил трения будем пренебрегать. Для

вектора состояния x(t) = [ϕ(t), ϕ(t)]T , где ϕ – угол поворота маятника, получим системууравнений

{x1(t) = x2(t),x2(t) = −mglJ−1 sin(x1(t)).

(2.10)

14

Page 15: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Здесь J = ml2− момент инерции маятника, g− ускорение свободного падения. Нулевому

значению угла ϕ соответствует положение маятника «вертикально вниз». Маятник (2.10)

имеет два состояния равновесия: x10 = 0 и x20 = [π, 0]T . 9 Линеаризация (2.10) в окрестности

этих состояний приводит к уравнениям вида (2.3) с матрицей

A =

[0 1

±gl−1 0

],

где знак «минус» соответствует нижнему, а знак «плюс» – верхнему состояниям равновесия

(т.е. точкам x10 и x20. )

Рассмотрим теперь в качестве опорной траектории процесс x∗(t), у которого x∗1(t) =

π

2cos(βt), x∗2(t) = −π

2β sin(βt), где β =

√gl−1. Заметим, что такой процесс соответствует по-

ведению модели, полученной линеаризацией относительно состояния x10 при x(0) = [π

2, 0]T .

Тогда функция

f ∗ =[−π2β sin(βt), −mglJ−1 sin(

π

2cos(βt))

]T

.

В свою очередь x∗(t) = [−π2β sin(βt), −π

2β2 cos(βt)]T , откуда получаем уравнения в откло-

нениях Δx(t) = x(t)− x∗(t) :

⎧⎪⎪⎨⎪⎪⎩Δx1(t) = Δx2(t),

Δx2(t) = −mglJ−1 cos(π

2cos(βt))Δx1(t)−

− mglJ−1 sin(π

2cos(βt)) +

π

2β2 cos(βt).

(2.11)

Уравнения (2.11) представляют собой систему линейных неоднородных нестационарных

уравнений и дают более точное приближение к колебательному процессу в исходной нели-

нейной системе (2.10), чем линеаризация в окрестности состояния x10. Отметим, что (2.11)

имеют вид (2.2) со входным процессом v(t) = − mglJ−1 sin(π

2cos(βt))+

π

2β2 cos(βt) и мат-

рицами

A(t) =

[0 1

−mglJ−1 cos(π

2cos(βt)) 0

], B =

[01

].

9 Строго говоря, имеется множество состояний равновесия x0 = = [πn, 0]T , n = . . .− 2,−1, 0, 1, 2, . . . ,поэтому для задач данного типа пространство состояний удобнее отождествлять не с плоскостью R2, а споверхностью цилиндра.

15

Page 16: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Приведенная здесь процедура линеаризации может применяться (с очевидной заменой обо-

значений и аргументов) и для дискретных систем. Для линеаризации колебательных про-

цессов также известен и широко используется так называемый метод гармонического ба-

ланса (гармонической линеаризации) [11, 33, 38, 39, 42, 50].

2.3 Примеры уравнений состояния систем

Рассмотрим несколько примеров моделей линейных систем в виде уравнений состояния.

2.3.1 Электротехнические устройства

Пример 1. RC-цепь. Рассмотрим систему, состоящую из последовательно соединенных

емкостного элемента C и резистора с сопротивлением R (рис. 2.3, а). Входным процессом

считаем напряжение u(t) от внешнего источника, приложенное к зажимам цепи. Рассмот-рим следующие два случая.

Рисунок 2.3 – Электротехнические устройства

1. Выход системы – напряжение uC(t) на зажимах емкостного элемента.

RC-цепь описывается уравнением

RCduC(t)

dt+uC(t) = u(t). (2.12)

Введем T = RC – постоянную времени цепи и примем x(t) = uC(t). Выразив из (2.12) зна-

чение x(t), получим уравнение состояния вида (2.3), в котором n = 1, A = −T−1, B = T−1,

16

Page 17: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

C = 1. Матрицы порядка 1×1 обычно отождествляются со скалярными элементами, по-этому при их записи квадратные скобки опускаются. Найденные уравнения соответствуютсобственной системе.

2. Выход системы – напряжение uR(t) на зажимах резистора.

Уравнение состояния (для x(t)) имеет тот же вид. Изменяется уравнение выхода, так

как теперь y(t) = uR(t) ≡ u(t)− uC(t) ≡ u(t)− x(t). Поэтому данная система не относится к

строго реализуемым и имеет матрицы A = −T−1, B = T−1, C =−1, D = 1.

Пример 2. Колебательный контур (RLC-цепь). Запишем теперь уравнения со-

стояния колебательного контура, включающего последовательно соединенные R, L, C-

элементы (рис. 2.3, б). Выходным сигналом y(t) будем считать напряжение на зажимах

индуктивного элемента uL(t), а входом, как и в предыдущем случае, – падение напряжения

на всей цепи u(t).

Как известно из электротехники, выполнены соотношения

Ldi(t)

dt= uL(t),C

duC(t)

dt= i(t),

uR(t) = Ri(t), u(t) = uL(t)+uC(t)+uR(t), где i(t) – сила тока в цепи, uC(t) – напряжение на

зажимах емкостного элемента, uR(t) – падение напряжения на активном сопротивлении.

Определив вектор состояния x(t) = [i(t), uC(t)]T и выход y(t) = uL(t), получим следующую

систему уравнений:

{x1(t) = (u(t)− Rx1(t)− x2(t))L

−1,x2(t) = C−1x1(t),

(2.13)

y(t) = u(t)− Rx1(t)− x2(t).

Следовательно, в рассматриваемом примере n = 2, m = l = 1 и уравнения состояния (2.2)содержат матрицы

A =

[−RL−1 −L−1

C−1 0

], B =

[L−1

0

], C = [−R, −1] , D = 1.

Пример 3. Двигатель постоянного тока с независимым возбуждением.Рассмотрим линеаризованные уравнения электрического двигателя постоянного тока с

независимым возбуждением (рис. 2.3, в). Пусть обмотка возбуждения двигателя создаетпостоянный магнитный поток, управление осуществляется изменением электродвижущей

17

Page 18: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

силы источника в якорной цепи e(t). Внутренним сопротивлением источника пренебрегаем.

Входными воздействиями считаем e(t) и приведенный момент нагрузки на валу двигателя

M(t). Выходами системы считаем угол поворота ротора α(t) и ток в якорной обмотке i(t).

Динамику системы можно описать следующими уравнениями [11, 33]:⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩dα(t)

dt= ω(t),

Ldi(t)

dt+Ri(t) = e(t)−Ceω(t),

Jdω(t)

dt= CM i(t)−M(t).

(2.14)

Здесь обозначены: L, R – индуктивность и активное сопротивление якорной цепи, J – при-веденный момент инерции ротора, Ce, CM – постоянные, зависящие от конструктивныхпараметров двигателя и величины потока возбуждения.

В данном примере n = 3, m = l = 2. Введем вектор состояния так, чтобы его компонен-

ты соответствовали значениям α(t), i(t), ω(t) : x(t) = [α(t), i(t), ω(t)]T ∈R3. Аналогично

определим вектор входа u(t) = [e(t), M(t)]T ∈R2 и вектор выхода y(t) = [α(t), i(t)]T ∈R

2.

Как легко убедиться, уравнения (2.14) принимают вид (2.3), в которых

A =

⎡⎣0 0 10 −RL−1 −CeL−1

0 CMJ−1 0

⎤⎦ , B =

⎡⎣ 0 0L−1 00 −J−1

⎤⎦ , C =

[1 0 00 1 0

].

2.3.2 Угловое движение искусственного спутника Земли.

Рассмотрим упрощенную модель углового движения искусственного спутника Земли (ИСЗ)

относительно продольной оси [12], рис. 2.4.

Обозначим через γ(t), ωx(t) – угол и угловую скорость крена ИСЗ; Jx – момент инерции

ИСЗ относительно продольной оси x; Mx(t) – управляющий момент относительно этой оси,

развиваемый, например, реактивными двигателями. Запишем уравнение динамики враща-тельного движения и кинематическое соотношение, связывающее угол и угловую скорость.Получим ⎧⎪⎨⎪⎩

dγ(t)

dt= ωx(t),

dωx(t)

dt=

Mx(t)

Jx.

(2.15)

Для данной системы n = 2, m = 1. Естественным образом можно определить вектор состо-

яния, сопоставив его компонентам значения угла и угловой скорости: x(t) = [γ(t), ωx(t)]T .

18

Page 19: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 2.4 – Искусственный спутник Земли.

Снова получаем уравнения вида (2.3), в которых матрицы

A =

[0 10 0

], B =

[0J−1x

].

Вид матрицы C определяется тем, какие переменные измеряются или относительно какихиз них формулируется цель управления. Например, если измеряется только угол крена, то

l = 1 и C = [1, 0]. Если измеряются обе переменные, то l = 2, C = I2 .10

Как видно из приведенных примеров, несмотря на то что вектор состояния принадле-жит некоторому абстрактному пространству X , его компоненты могут отождествляться счисловыми значениями конкретных физических переменных, представленных в выбраннойсистеме единиц.

10 Здесь и далее через In обозначена единичная матрица порядка n. Иногда индекс n в записи будетопускаться.

19

Page 20: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 3

3 Передаточные функции и их определение по уравнениям со-стояния

3.1 Передаточные функции линейных систем

Рассмотрим линейную стационарную систему непрерывного времени

x(t)=Ax(t)+Bu(t), y(t)=Cx(t)+Du(t) (3.16)

либо дискретную линейную стационарную систему

x[k + 1]=Ax[k]+Bu[k], y[k]=Cx[k]+Du[k], (3.17)

где x ∈Rn, y ∈R

l, u ∈Rm.

Определение [4, 8, 22, 29]. Выражение

W(λ) = C(λIn−A

)−1B+D, λ ∈ C, (3.18)

называется передаточной функцией системы (3.16) (или (3.17)) от входа u к выходу y. �Заметим, что W(λ) является матричной функцией размера l×m от комплексного ар-

гумента. В литературе по теории регулирования обычно принято для непрерывных системаргумент передаточной функции обозначать через s или p, а для дискретных систем – через

z [8, 11, 22, 29, 33, 38, 42].

Передаточные функции часто используются в различных задачах исследования дина-

мических (в первую очередь – линейных и стационарных) систем. Применение этих функ-

ций для получения частотных характеристик будет показано в следующем параграфе. Что-бы сделать данное определение менее формальным и показать, как можно ввести переда-

точные функции в других ситуациях, используем для вывода выражения (3.18) преобразо-

вание Лапласа 11 [11,29,33,38,39,42]. Для этого при нулевых начальных условиях x0=0 пе-

рейдем к изображениям по Лапласу [29]: X(s) = L{x(t)

}, Y (s) = L{

y(t)}, U(s) = L{

u(t)}.

Тогда при det(sIn−A) �= 0 получаем

X(s)=(sIn−A)−1BU(s) и Y (s)=(C (sIn−A)−1B+D

)U(s).

11 Изображением по Лапласу X(s) вектор-функции x(t) называется функция комплексной переменнойs, заданная как L(

x(t))=

∫∞0 e−stx(t)dt.

20

Page 21: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Таким образом, мы нашли матричный множитель, связывающий изображения по Лапласувходного и выходного процессов при нулевом начальном состоянии – передаточную функ-

цию данной системы (3.18).

Для дискретных систем (3.17) аналогичный результат получается с помощью z-

преобразования [8, 29, 33].

Для строго реализуемых систем передаточная функция имеет более простой вид

W(λ)=C(λIn−A

)−1B, который обычно и будем использовать в дальнейшем.

Размер матрицы W(λ) определяется размерностями входа и выхода системы. Для си-

стем с одним входом и одним выходом, y(t) ∈ R, u(t) ∈ R, l =m = 1 и W(λ) становится

отношением многочленов от λ : W(λ)=B(λ)A(λ)

. В общем случае получается матрица, элемен-

тами которой являются передаточные функции Wi,j(λ)=Bi,j(λ)Ai,j(λ)

, i=1, . . . , l , j=1, . . . , m ,

от каждого входа ui к каждому выходу yi :⎡⎢⎣Y1(λ)...Yl(λ)

⎤⎥⎦=

⎡⎢⎣W1,1(λ) . . . W1,m(λ)... . . . ...

Wl,1(λ) . . . Wl,m(λ)

⎤⎥⎦⎡⎢⎣U1(λ)

...Um(λ)

⎤⎥⎦ .3.2 Алгоритмы вычисления передаточных функций

Остановимся на вычислительной стороне получения W(λ). Наибольшую сложность пред-

ставляет вычисление резольвенты R(λ) =(λIn−A

)−1 матрицы A. По правилу обращенияматриц выполнено

R(λ)=adj

(λIn−A

)det(λIn−A) ,

где через adj(·) обозначена матрица алгебраических дополнений к (λIn−A

)T, или присоеди-

ненная (к λIn−A) матрица [23]. Знаменатель этого выражения есть скалярный многочленстепени n, det(λIn−A) = A(λ)=λn+a1λ

n−1+a2λn−2+· · ·+an. Он называется характеристи-

ческим многочленом матрицы A. Таким образом, все передаточные функции Wi,j(λ), вы-

численные по формуле (3.18), имеют (с точностью до возможных сокращений) одинаковые

знаменатели Ai,j(λ) ≡ A(λ). Поэтому характеристический многочлен матрицы A совпадает

со знаменателем передаточной функции системы. Вид переходного процесса в системе, ееустойчивость определяются корнями λi данного многочлена. Значения λi называются соб-

21

Page 22: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ственными числами матрицы A. Множество собственных чисел {λi} известно как спектрданной матрицы [23]. Поэтому условие асимптотической устойчивости системы (3.16) мож-

но сформулировать, как требование того, чтобы спектр матрицы A целиком располагалсяв левой полуплоскости комплексной плоскости C. Для асимптотической устойчивости дис-кретных систем (3.17) спектр матрицы A должен лежать внутри окружности единичного

радиуса плоскости C с центром в начале координат.

Вычисление резольвенты R(λ) осложняется тем, что характеристическая матрица

λIn−A не числовая, а функциональная – зависит от переменной λ. Поэтому стандартные

алгоритмы обращения матриц (например, алгоритм Гаусса) здесь не применимы. Для реше-

ния этой задачи разработан ряд специальных алгоритмов: Леверье–Фаддеева, Данилевско-

го, Сурье [22,39], дающие хороший результат при невысоком порядке системы. Для матриц

высокой размерности при вычислении по этим алгоритмам происходит быстрое накоплениеошибок округления, связанных с ограниченностью разрядной сетки ЭВМ. Для устраненияэтого явления разработаны более устойчивые вычислительные алгоритмы, основанные наприведении матриц с помощью элементарных преобразований к так называемой канониче-

ской форме Хессенберга [3, 44]. 12

При «ручном» вычислении передаточной функции оказывается более удобной запись

уравнений состояния в операторной форме [29] с последующим определением выходной

переменной через решение систем линейных алгебраических уравнений. Рассмотрим этот

метод более подробно [8].

Перепишем выражение для передаточной функции в виде W(λ) = CWx(λ)+D, где

Wx(λ) =(λIn−A

)−1B. (Заметим, что Wx(λ) есть n×m-матричная передаточная функция

к вектору состояния системы). Представим Wx(λ) и B в виде Wx(λ) = [w1(λ), w2(λ), . . . ,

wm(λ)], B = [b1,b2, . . . , bm], где wj(λ), bj , j = 1, 2, ..., m – столбцы указанных матриц

Wx(λ) и B. Для wj(λ), очевидно, получаем уравнения

(λIn−A)wj(λ)=bj , j=1, 2, ..., m, (3.19)

каждое из которых является системой n линейных уравнений относительно n неизвестных

компонент вектор-функций wj(λ)= [w1j(λ), w2j(λ), . . . , wmj(λ)]T . Находя решения (3.19) по

12 Матрица A порядка n имеет верхнюю каноническую форму Хессенберга, если ее элементы aij удовле-творяют условию aij = 0 для i− j ≥ 2 (i, j = 1, 2, . . . n).

22

Page 23: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

формулам Крамера [4, 23, 29], получим

wij(λ)=Δij(λ)Δ(λ)

, i=1, 2, . . . , n, j=1, 2, ..., m, (3.20)

где Δ(λ) = det(λIn−A) есть главный определитель системы (3.20), совпадающий с харак-

теристическим многочленом матрицы A, а Δij(λ) есть определители, полученные заменой

i-го столбца характеристической матрицы λIn−A на столбец bj . Найдя все определители,

получим матричную передаточную функцию Wx(λ) к состоянию системы. После умноже-

ния на матрицу C и суммирования полученного выражения с матрицей D находим искомуюпередаточную функцию.

Данный прием вычислений удобен и для уравнений более общего вида, например

A0x(t)=A1x(t)+B1u(t), (3.21)

где A0 − n×n-матрица, detA0 �= 0. При переходе к стандартному виду (3.16) получаем

A=A−10 A1, B=A−1

0 B1. При вычислении передаточной функции можно этого не делать, асразу решать уравнения

(λA0−A1)wj(λ)=bj, j=1, 2, ..., m. (3.22)

Главный определитель системы (3.22) Δ(λ)=det(λA0−A1) будет (с точностью до постоян-

ного множителя) совпадать с характеристическим многочленом матрицы A.

Рассмотрим некоторые примеры.

3.3 Примеры перехода к передаточным функциям от уравнений состояния

Пример 1. Электрические цепи. Вернемся к рассмотренным в п. 2.3.1 с. 16, урав-

нениям RLC-цепей. Непосредственным вычислением получаем, что уравнениям (2.12)

при y(t) = x(t) (выход – напряжение на емкости) соответствует передаточная функция

W(s) =(s+ 1

T

)−1 1T = 1

Ts+1 . Данная цепь является апериодическим звеном первого по-

рядка [11,33] ( или фильтром нижних частот). Когда выходом системы является напряже-

ние uR(t) на зажимах резистора, получаем W(s) = TsTs+1 – дифференцирующее звено с

замедлением.

23

Page 24: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Для колебательного контура (2.13), с. 17, система (3.19) имеет вид{(s+RL−1)w1(s)+L−1w2(s)=L−1,−C−1w1(s)+sw2(s)=0,

о{

(Ls+R)w1(s)+w2(s)=1,−w1(s)+sCw2(s)=0,

(3.23)

где s ∈ C, w1(s),w2(s) – передаточные функции к переменнным x1, x2. Из (3.23) находим

Δ(s)=LCs2+RCs+1, Δ1(s)=Cs, Δ2(s)=1, поэтому

w1(s)=Cs

LCs2+RCs+1, w2(s)=

1LCs2+RCs+1

.

Учитывая уравнение выхода в (2.13), получаем передаточную функцию

W(s)=−Rw1(s)−w2(s)+1=−RCs−RL−1+LCs2+RCs+1LCs2+RCs+1

=

= Ks2

T 2s2+2ξTs+1, где T =

√LC, K = LC = T 2, ξ = R

2

√CL . Данная передаточная функция

соответствует комбинации двойного дифференцирующего звена и колебательного (при ξ <

1) или апериодического второго порядка [11, 33] (при ξ ≥ 1) звеньев. В качестве частотно-

избирательного фильтра оно является фильтром верхних частот (ВЧ-фильтром).

Отметим, что в рассмотренных случаях размерность пространства состояний системысовпадает со степенью знаменателя передаточной функции. Кроме того, у строго реали-зуемых систем степень числителя передаточной функции ниже степени знаменателя. ПриD �= 0 они совпадают. Данная зависимость имеет общий характер и будет наблюдаться вдальнейшем.

Далее для вычисления передаточных функций будем использовать соотношения (3.21),

(3.22).

Пример 2. Двигатель постоянного тока. Рассмотрим модель двигателя постоян-

ного тока (2.14), с.18. Уравнения (3.22) принимают вид⎧⎨⎩swα,e(s)−wω,e(s)=0,(Ls+R)wi,e(s)+Cewω,e(s)=1,−CMwi,e(s)+Jwω,e(s)=0,

а

⎧⎨⎩swα,M (s)−wω,M(s)=0,(Ls+R)wi,M(s)+Cewω,M (s)=0,−CMwi,M(s)+Jwω,M(s)=−1.

24

Page 25: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Здесь wj,k(s), j ∈ {α, i, ω}, k ∈ {e,M} являются передаточными функциями от входов

e(t), M(t) к переменным состояния α(t), i(t), ω(t). Поскольку в данном примере выхо-

дом считается вектор [α(t), i(t)]T , нас будут интересовать четыре передаточные функции:

wα,e(s), wα,M(s), wi,e(s), wi,M(s). Найдем определители Δ(s) = s(JLs2+JRs+CeCM),

Δ(s)α,e = CM , Δ(s)α,M =−(Ls+R), Δ(s)i,e = Js2, Δ(s)i,e = Ces, откуда получим матричную

передаточную функцию системы (2.14):

W(s)=

⎡⎢⎣ CMs(JLs2+JRs+CeCM)

−(Ls+R)s(JLs2+JRs+CeCM)

JsJLs2+JRs+CeCM

CeJLs2+JRs+CeCM

⎤⎥⎦ . (3.24)

Заметим, что в данном примере сумма степеней знаменателей передаточных функций (да-

же с учетом сокращения нулей и полюсов) равна десяти, в то время как система описывает-

ся уравнениями состояния третьего порядка. Можно сделать вывод, что для многосвязных

систем (систем, имеющих несколько входов и выходов) уравнения состояния могут приве-

сти к реализации меньшего порядка, чем совокупность передаточных функций. 13

Как видно из полученных выражений, рассматриваемый объект демонстрирует разно-образное поведение в зависимости от того, на какой вход поступает воздействие и какаявыходная переменная определяется. По углу вращения ротора двигатель является звеноминтегрирующего типа в сочетании с апериодическим звеном второго порядка или с колеба-

тельным звеном – в зависимости от соотношения параметров. Если JR2 ≥ 4LCeCM , то про-цесс имеет апериодический, иначе – колебательный, характер. По якорному току двигатель

является звеном дифференцирующего типа (от напряжения источника) либо позиционным

звеном (от момента нагрузки). Инерционность токовой цепи имеет тоже апериодический

либо колебательный характер.

Пример 3. Уравнения ИСЗ (2.15) в форме (3.22), имеют вид{swγ(s)−wω(s)=0,Jxswω(s)=1.

(3.25)

Отсюда получим Δ(s)= Jxs2, Δγ(s)= 1, W(s)= K

s2, K = J−1

x , т.е. рассматриваемая система

представляет собой двойное интегрирующее звено.13 В литературе встречаются следующие сокращения:– при l=m=1 система относится к виду SISO (single input – single output),– при l > 1,m > 1 – к виду MIMO (multi input – multi output).Возможны, соответственно, варианты SIMO и MISO.

25

Page 26: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

3.4 Частотные характеристики

Одной из причин, обусловивших широкое использование передаточных функций, являетсяих связь с частотными характеристиками. Рассмотрим отдельно непрерывные и дискрет-ные системы.

3.4.1 Частотные характеристики непрерывных систем

Рассмотрим стационарную систему (3.16). Пусть u(t)= ues0t, где постоянные u ∈Rm, s0 ∈ C.

Будем искать решение (3.16) в виде x(t) = xes0t, где x ∈ Cn – подлежащая определению

константа. Подстановка выражений для u(t), x(t) в (3.16) дает s0xes0t = Axes0t+Bues0t,

(s0I−A)xes0t =Bues0t, (s0I−A)x=Bu. Полагаем, что имеет место нерезонансный случай:

s0 не совпадает ни с одним собственным числом матрицы A и поэтому det(s0I−A) �= 0.

Отсюда находим, что x=(s0I−A)−1Bu и, следовательно, выполнено равенство

x(t)=(s0I−A)−1Bues0t. (3.26)

Прежде чем использовать полученное выражение, исследуем единственность найденно-

го решения. Пусть функция x(t) также удовлетворяет (3.16). Подстановкой x(t)= x(t)+Δx(t)

в (3.16) непосредственно убеждаемся, что Δx(t) удовлетворяет однородному уравнению, по-

лучающемуся из (3.16) при u(t) ≡ 0. Следовательно, любое решение (3.16) можно предста-

вить в виде суммы вынужденной (3.26) и переходной составляющих. Поэтому найденное ре-

шение единственно с точностью до переходной составляющей Δx(t). При асимптотической

устойчивости системы Δx(t) → 0 при t→ ∞ и каждое решение стремится к вынужденному

процессу (3.26).

Подставим теперь полученное выражение для x(t) в уравнение выхода (3.16): y(t) =

Cx(t)+Du(t)=C(s0I−A)−1Bues0t+Dues0t=(C(s0I−A)−1B+D)ues0t=W(s0)ues0t=W(s0)u(t).

Таким образом, передаточная функция является множителем (в общем случае – комплекс-

ным), связывающим вынужденную составляющую выходного процесса системы со вход-

ным сигналом экспоненциального вида. Это свойство позволяет найти и реакцию системына гармонический входной сигнал, т.е. частотные характеристики системы.

Пусть входной процесс имеет вид гармонических колебаний u(t) = u cosωt ≡ u12(ejωt+

e−jωt), где ω – вещественная константа, частота колебаний, j2=−1. Используя полученнуювыше формулу при s0=±jω и очевидное свойство суперпозиции решений линейных систем,

26

Page 27: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

получим

y(t)= 12

(W(jω)ejωt+W(jω)e−jωt

)u. (3.27)

Определение. ВыражениеW(jω) (ω ∈R, j2=−1) называется частотной передаточнойфункцией или частотной характеристикой непрерывной системы (3.16).

Каждый элемент Wij(jω) матричной функции W(jω) можно представить в виде 14

W(jω)=A(ω)ejω+ϕ(ω)=U(ω)+jV (ω),

где A(ω) = |W(jω)| – амплитудно-частотная характеристика (АФХ);ϕ(ω) = argW(jω) – фазо-частотная характеристика (ФЧХ);

U(ω) = ReW(jω), V (ω) = ImW(jω) – вещественная и мнимая частотные характери-

стики (ВЧХ, МЧХ).

ГодогафW(jω) на комплексной плоскости при ω ∈ [ω0, ω1] (обычно берут ω0=0, ω1=∞) называется амплитудно-фазовой характеристикой (АФХ), или кривой Найквиста. Часто

используется и диаграмма Боде (логарифмическая амплитудная характеристика, ЛАХ),

которая определяется как L(ω) = 20lgA(ω), измеряется в децибелах и строится в функции

от lg(ω).

Поскольку W(λ) – рациональная функция с вещественными коэффициентами, выпол-

нено U(−ω)=U(ω), V (−ω)=−V (ω), т.е. W(−jω)=conj(W(jω)), A(−ω)=A(ω), ϕ(−ω)=−ϕ(ω).

При вычислении фазо-частотной характеристики учитывается, что tgϕ(ω)=V (ω)U(ω)

при

U(ω) �= 0. Но функция arctg(·) принимает значения в интервале[−π2 , π2

], поэтому при ее

использовании ϕ(ω) будет иметь нежелательные разрывы. Из соображений непрерывности

целесообразно предварительно разлагать числитель и знаменатель W(jω) на множители не

более второго порядка (что всегда возможно)

W(jω) ≡∏l

i=1 ri(jω)∏Li=l+1 ri(jω)

14 Для краткости записи индексы далее опускаем.

27

Page 28: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

и вычислять ϕ(ω)=∑L

i=1

(±ϕi(ω)). Каждое из слагаемых ϕi(ω) определяется выражением

ϕi(ω)=

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

arctg Vi(ω)Ui(ω)

п Ui(ω) > 0,π2 signVi(ω) п Ui(ω)=0, Vi(ω) �= 0,

arctg Vi(ω)Ui(ω)

+πsignVi(ω) п Ui(ω) < 0, Vi(ω) �= 0,

н п Ui(ω)=Vi(ω)=0,

(3.28)

где Ui(ω)=Re ri(jω) Vi(ω)=Im ri(jω).

Чтобы прояснить смысл частотных характеристик, рассмотрим при указанном входе ре-

акцию (вынужденную составляющую) i-й компоненты вектор-функции y(t) на j-ю компо-

ненту вектора uj(t). Используя выражение (3.27), получим

yi(t)=12

(W(jω)ejωt+W(jω)e−jωt

)uj =

= 12A(ω)

(ej(ϕ(ω)+ωt)+e−j(ϕ(ω)+ωt)

)= yi cos(ωt+ϕ),

где yi=A(ω)uj– амплитуда выходного процесса (точнее – его вынужденной составляющей),

а ϕ = ϕ(ω) – "фазовый сдвиг"между входным и выходным процессами. Таким образом,

зная передаточную функцию системы, нетрудно определить ее реакцию на гармоническое

воздействие (или суперпозицию таких воздействий).

Обратимся теперь к системам дискретного времени.

3.4.2 Частотные характеристики дискретных систем

Рассмотрим стационарную дискретную систему (3.17) при u[k] = uzk0 , где u ∈ Rm, z0 ∈

C, z0 �= 0. Ищем решение (3.17) в виде x[k] = xzk0 для некоторого x ∈ Cn. Аналогичнонепрерывному случаю подстановкой u[k], x[k] в (3.17) получаем xzk+1

0 =Axzk0+Buzk0 , (z0I−

A)x=Bu. Для нерезонансного случая det(z0I−A) �= 0, откуда получим x= (z0I−A)−1Bu,следовательно

x[k]=(z0I−A)−1Buzk0 . (3.29)

Как и для непрерывных систем, формула (3.29) дает вынужденную составляющую реше-

ния. Выходной процесс (с точноcтью до переходной составляющей) описывается выраже-

нием y[k] =Cx[k]+Du[k] =C(z0I−A)−1Buzk0+Duzk0 = (C(z0I−A)−1B+D)uzk0 =W(z0)uz

k0 =

W(z0)u[k].

28

Page 29: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотрим далее «гармонический» входной процесс u[k] = u cos ωk ≡ u12(ejωk+e−jωk),

где вещественный параметр ω – безразмерная частота. 15 Последовательность u[k] можно

представить в виде u[k] = u12(zk++zk−), где z± = e±jω. Отсюда, полагая в (3.29) z0 = ±ejω,

получим

y[k]= 12

(W(ejω)ejωk+W(ejω)e−jωk

)u.

Определение. Выражение W(ejω) называется частотной передаточной функцией,

или частотной характеристикой дискретной системы (3.17) от безразмерной частоты ω.

После рассуждений, аналогичных приведенным в п. 3.4.1 с. 26, вводим следующие ча-

стотные характеристики дискретных систем [11, 22, 29, 33, 42]

A(ω) = |W(ejω)| – амплитудно-частотная характеристика (АФХ), A(−ω)=A(ω);ϕ(ω) = argW(ejω) – фазо-частотная характеристика (ФЧХ), ϕ(−ω)=−ϕ(ω);U(ω) = ReW(ejω), V (ω) = ImW(ejω) – вещественная и мнимая частотные характери-

стики (ВЧХ, МЧХ), U(−ω)=U(ω), V (−ω)=−V (ω).

Особенностью частотных характеристик дискретных систем является их периодичность

с периодом 2π : W(ejω+2πN) =W(ejω), N =±1,±2,±3, . . . . Формально это связано с тем,

что аргумент z дискретной передаточной функцииW(z) при подстановке z=ejω принимает

периодически повторяющиеся значения, "пробегая"на комплексной плоскости окружностьединичного радиуса. С точки зрения "физического"смысла частотных характеристик за-метим, что дискретные входные процессы, частоты которых отличаются на 2πN, неразли-

чимы, образуют одну и ту же последовательность (cos ωk ≡ cos(ω ± 2πN)k). Поэтому при

вычислении частотных характеристик достаточно рассматривать ω ∈ [0, 2π), более того,

в силу симметрии годографа W(ejω) относительно вещественной оси брать ω ∈ [0, π]. Ча-

стота ωN = π называется иногда частотой Найквиста дискретной системы. При ω > ωN

получаются повторяющиеся (симметрично) значения АЧХ и ФЧХ.

3.4.3 Частотные характеристики цифровых систем реального времени

Остановимся на распространенном и практически важном способе применения дискрет-

ных систем, при котором входной процесс u[k] получается, как "дискретная выбор-

ка"непрерывного сигнала u(t) с периодом квантования T0: u[k]=u(t)|t=kT0, k = 1, 2, 3, . . . .

Нас интересуют частотные характеристики дискретной системы в функции от реальной15 Отметим, что гармонические функции дискретного аргумента k могут иметь период, отличающийся

от 2πω−1, или вообще не иметь периода; кроме того, наибольшее значение |u[k]| может не достигать |u|.

29

Page 30: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

частоты ω непрерывного процесса u(t). Полагая u(t)= u cosωt, находим u[k]= u cos(ωkT0).

Сравнивая с предыдущим пунктом, видим, что эти последовательности совпадают приω = ωT0. Поэтому частотные характеристики систем реального времени получаются под-

становкой z=ejωT0 вW(z) : A(ω)= |W(ejωT0)|, ϕ(ω)=argW(ejωT0), U(ω)=ReW(ejωT0), V (ω)=

ImW(ejωT0), где W(ejωT0) есть частотная передаточная функция (частотная характери-

стика) дискретной системы по реальной частоте ω.

Частота Найквиста дискретной системы реального времени ωN = π/T0. Начиная с ωNвид частотных характеристик повторяется, их нельзя задавать независимо от значений в

"основной"полосе частот |ω| ≤ ωN . Поэтому, если дискретная система реального време-ни подвержена действию высокочастотных помех или возмущений, то для возможности

их фильтрации должно выполняться условие |Ω| ≤ ωN , где Ω – граничная частота спек-

тра входного процесса u(t). Добиться выполнения этого условия можно уменьшая период

дискретности T0, однако в силу ряда причин слишком малые значения T0 нежелательны.16 Наиболее общим решением в этой ситуации является использование предварительногоаналогового фильтра нижних частот, который вводится до аналого-цифрового преобразо-вателя. АЧХ такой системы равна произведению амплитудных характеристик пре-фильтраи цифрового устройства и имеет ограниченную полосу пропускания.

16 Например, из-за недостаточной производительности процессора или возрастания влияния ошибок,связанных с конечным числом разрядов ЭВМ.

30

Page 31: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 4

4 Преобразование базиса. Инвариантность передаточной функ-ции

Как отмечено в п. 1 с. 7, вектор состояния может быть представлен неединственным об-разом – произвольное взаимно-однозначное отображение пространства состояний X в себядает новый вектор, который также можно использовать в качестве состояния системы. Этотвектор имеет другие значения компонент. Особенно распространено линейное невырожден-ное преобразование с квадратной n×n-матрицей T, det T �= 0. При таком преобразованииговорят, что вектор состояния представлен в новом базисе, а соответствующее преобразо-вание уравнений называют преобразованием базиса уравнений состояния. Вид уравненийсистемы при этом изменяется, но остаются неизменными входо-выходные соотношения. Вчастности, для стационарных линейных систем остается неизменной передаточная функ-ция. Рассмотрим преобразование базиса более подробно.

Пусть T – невырожденная матрица порядка n, det T �= 0, x(t) ∈ Rn – вектор состо-

яния системы. Определим вектор x(t) = Tx(t). В силу невырожденности матрицы пре-

образования T, вектор x(t) определяется по x(t) взаимно-однозначно и можно записать

x(t) = T−1x(t). 1 Перепишем уравнения состояния (2.2) в преобразованном виде. Учитывая

что x(t) = T−1 ˙x(t), получим

˙x(t) = TA(t)T−1x(t)+TB(t)u(t), x(t0) = x0 = Tx0,y(t) = C(t)T−1x(t)+D(t)u(t),

(4.1)

Обозначим матрицы A(t) = TA(t)T−1, B(t) = TB(t), C(t) = C(t)T−1. Отсюда получаем

уравнения (4.1) в форме (2.2):

˙x(t) = A(t)x(t)+B(t)u(t), x(t0) = x0 = Tx0,

y(t) = C(t)x(t)+D(t)u(t).(4.2)

Уравнения (4.2) представляют собой уравнения состояния системы (2.2) в новом базисе.

Очевидно, что различных форм уравнений состояния может быть записано неограниченно

много. 2

1 В литературе иногда используют преобразование x(t) = T−1x(t). При таком преобразовании в после-дующих формулах надо вместо матрицы T использовать T−1 (и наоборот).

2 Здесь не рассмотрено преобразование с переменной во времени матрицей T = T (t). Матрица A(t) притаком преобразования принимает вид A(t) =

(T (t) + T (t)A(t)

)T−1(t).

31

Page 32: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотрим теперь стационарные реализуемые системы, заданные уравнениями

x(t) = Ax(t)+Bu(t), y(t) = Cx(t)+Du(t). (4.3)

В результате преобразования с матрицей T получим

˙x(t) = Ax(t)+Bu(t), y(t) = Cx(t)+Du(t), (4.4)

где матрицы A, B , C определены выше. Вычислим передаточную функцию системы (4.4)

по формуле (3.18) и выполним преобразования: 3

W(s) = C(sIn−A

)−1B+D = CT−1

(sIn−TAT−1

)−1TB+D =

= C(sIn−A

)−1T+D ≡ W(s).

Таким образом, передаточная функция системы после преобразования подобия с мат-рицей T не изменилась. Говорят, что передаточная функция инвариантна по отношениюк преобразованию базиса уравнений состояния. Заметим, что изменение базиса уравненийсостояния соответствует структурным преобразованиям систем, заданных передаточнымифункциями.

Матрицы A и A = TAT−1 называются подобными. У них много общих свойств. В

частности, их характеристические многочлены совпадают: det(sIn−A) ≡ det(sIn−A), сле-довательно, совпадают и собственные числа. Обратное, вообще говоря, не верно. Например,

матрицы A1 =

[0 10 0

]и A2 =

[0 00 0

]имеют одинаковые собственные числа s1,2 = 0, но не

являются подобными.

Аналогично тому как по координатам вектора состояния в новом базисе можно одно-

значно получить его координаты в исходном базисе, можно по матрице A восстановить

матрицу A = T−1AT.

Следует иметь в виду, что хотя преобразование подобия не изменяет передаточнойфункции, обратное, вообще говоря, не верно. Можно привести примеры, когда одной итой же передаточной функции отвечают уравнения состояния, которые не преобразуютсядруг в друга ни при какой невырожденной матрице T. Это явление связано с возможнойвырожденностью системы и обсуждается ниже, в главе 15 с.104.

3 Использованы тождества (AB)−1 = B−1A−1, det(AB) = detA · detB, справедливые для квадратныхневырожденных матриц.

32

Page 33: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Пример. Преобразование уравнений ИСЗ. Пусть исходные уравнения системы

(2.15) (с. 18) заданы в виде (2.3) и матрицы

A =

[0 10 0

], B =

[0J−1x

], C = [1, 0].

Зададим матрицу T =

[1 10 1

], (det T = 1). Выполним с этой матрицей преобразование

базиса рассматриваемой системы. Получим

A =

[0 10 0

], B =

[J−1x

J−1x

], C = [1, −1].

В «развернутом» виде (относительно отдельных компонент вектора состояния) в результате

преобразования получаем уравнения

{˙x1(t) = x2(t) + Jx

−1u(t), y(t) = x1(t)−x2(t),˙x2(t) = Jx

−1u(t).(4.5)

Как видно, уравнения состояния (4.5) отличаются от исходных (2.15), однако при со-

ответствующих начальных условиях данные системы будут иметь одинаковые реакции навходное воздействие – их передаточные функции совпадают. Заметим также, что не всегдакомпонентам вектора состояния удается приписать определенный физический смысл. Если

компоненты вектора x(t) в исходном базисе сопоставлялись с фазовыми координатами –

углом и угловой скоростью, то после преобразования трудно дать физическую интерпрета-цию полученным переменным состояния. Структурные схемы, соответствующие исходным

(2.15) и преобразованным (4.5) уравнениям состояния, приведены на рис. 4.1

Рисунок 4.1 – Структурные схемы систем (2.15) (а) и (4.5) (б).

33

Page 34: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотренный пример показывает, что значения переменных состояния могут соот-ветствовать значениям некоторых физических переменных, но могут и представлять собойнекоторые абстрактные величины. В этой связи возникает вопрос о размерностях пере-

менных, входящих в уравнения состояния. Эти величины считаются безразмерными (ве-

щественными) числами. При составлении математической модели системы и определении

ее параметров, а также начальных условий, физическая размерность учитывается. Далее

модель подвергается исследованиям (которые могут включать и операции преобразования

базиса), имеющим абстрактный характер. Для интерпретации полученных результатов в

терминах исходной задачи выполняется обратное преобразование.

34

Page 35: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 5

5 Канонические формы уравнений состояния. Диагональная ижорданова формы

Ввиду того, что имеется множество эквивалентных (с точки зрения входо-выходных со-

отношений) способов представления уравнений состояния системы, можно выбрать из них

«наилучшие» – наиболее удобные для использования в рассматриваемой задаче. Такие фор-мы записи уравнений называются каноническими. Поскольку может быть много различныхприложений, известно и много канонических форм. Рассмотрим некоторые, наиболее рас-пространенные из них. Основное внимание будет уделяться системам с одним входом ивыходом.

Пусть собственные числа матрицы A в (2.3) заданы и равны si, i=1, 2, . . . , n . Рассмот-рим следующие случаи.

5.1 Диагональная форма. Простые вещественные собственные числа

Пусть si – простые, т.е. si �= sj при i �= j, i, j=1, 2, . . . , n и, кроме того, они вещественные:

Imsi = 0. В этом случае 1 любую матрицу n×n можно привести с помощью некоторого

невырожденного преобразования к диагональной матрице A=diag{s1, s2, . . . , sn} [8, 23, 51]или, более подробно, к матрице вида

A=

⎡⎢⎢⎢⎢⎢⎢⎢⎣

s1 0 0 . . . 0 00 s2 0 . . . 0 00 0 s3 . . . 0 0... . . . ...0 0 0 . . . sn−1 00 0 0 . . . 0 sn

⎤⎥⎥⎥⎥⎥⎥⎥⎦(5.1)

Как нетрудно убедиться, множество {si} действительно образует спектр матрицы (5.1). Для

этого найдем характеристическую матрицу sIn−A, которая тоже оказывается диагональной,sIn−A= diag{s− si}. Характеристический многочлен есть определитель данной матрицы,

а для диагональной матрицы он равен произведению элементов главной диагонали [23].

Следовательно, получаем A(s)=∏n

i=1 (s− si), откуда непосредственно следует высказанноеутверждение.

1Следует иметь в виду, что отсутствие кратных собственных чисел является достаточным, а не необхо-димым условием возможности преобразования матрицы к виду (5.1) или (5.4). При выполнении некоторыхусловий такое преобразование выполнимо и при наличии кратных собственных чисел. Более подробно этотвопрос обсуждается в следующем п. 5.3 и в литературе по теории матриц (см., например, [8, 23, 29, 51]).

35

Page 36: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Такой базис удобен тем, что в нем уравнения системы распадаются на уравнения n

независимых подсистем первого порядка. Предполагая для простоты записи, что u(t) ∈R (m = 1), приведем соответствующие уравнения состояния «в развернутом виде», т.е. в

виде системы уравнений первого порядка относительно компонентов вектора x. Получим

⎧⎪⎪⎪⎨⎪⎪⎪⎩x1(t) = s1x1(t)+b1u(t),x2(t) = s2x2(t)+b2u(t),

...xn(t) = snxn(t)+bnu(t).

(5.2)

Видно, что здесь xi(t) не зависят от xj(t) (при i �= j). Следовательно, происходит декомпо-

зиция системы – система высокого (n-го) порядка распадается на n независимых подсистем

меньшего (первого) порядка. Вследствие этого упрощается расчет процессов в системе.

Посмотрим, какая структура системы соответствует такой форме матрицы A с точкизрения передаточных функций. Пусть l=m=1 – система имеет один вход и один выход,

B=[b1, b2, . . . , bn

]T, C=

[c1, c2, . . . , cn

]. Из (5.2) сразу получаем, что передаточные функции

к xi определяются выражениямиWi(s) =bi

s−si , i=1, 2, . . . , n . Учитывая уравнение выхода

y(t)=Cx(t) ≡ ∑ni=1 cixi(t), получим, что передаточная функция всей системы имеет вид

W(s)=

n∑i=1

Ki

s− si, где Ki=cibi.

Таким образом, диагональная форма матрицы A соответствует системе, состоящей из па-

раллельно соединенных подсистем первого порядка (апериодических или интегрирующих

звеньев).

5.2 Вещественная диагональная форма. Простые мнимые собственные чис-ла

Более сложным случаем является наличие у матрицы A невещественных корней. 2 Как ивыше, при простых собственных числах, матрица A также может быть приведена невы-

рожденным преобразованием к диагональному виду (5.1), однако такая матрица будет2 Поскольку рассматриваются уравнения с вещественными коэффициентами, мнимые корни характе-

ристического многочлена будут комплексно-сопряженными, si,i+1 =αi ± jβi (j2 =−1), αi =Resi,i+1, βi =

|Imsi,i+1|.

36

Page 37: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

содержать на диагонали мнимые элементы. Это неудобно для дальнейшего ее исполь-

зования. Для устранения указанной трудности используется квазидиагональная (блочно-

диагональная) форма [8, 23, 51]. При таком представлении мнимым корням si,i+1=αi ± βij

характеристического многочлена соответствуют блоки (клетки) вида

Ai=

[αi βi−βi αi

](5.3)

Характеристический многочлен данной матрицы Ai(s) = (s−αi)2+β2i = s2−2αis+α

2i +β

2i .

Корни этого многочлена si,i+1=αi ± jβi совпадают с заданными. Окончательно матрица A

имеет следующую блочную структуру (определенную с точностью до порядка следования

блоков):

A =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

s1 0 0 0 . . . 00 s2 0 0 . . . 0... . . . . . .

...0 . . . 0 sq 0 . . . 00 . . . 0 α1 β1 . . . 00 . . . 0 −β1 α1 . . . 0... . . . . . . ...0 . . . 0 αr βr0 . . . 0 −βr αr

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦(5.4)

Вещественным корням s1, . . . , sq характеристического многочлена соответствуют блоки ра-

змера 1×1, мнимым корням sq+2i−1,q+2i = αi ± jβi, i = 1, 2, . . . , r соответствуют блоки

размера 2×2 вида (5.3).

Вычисляя характеристический многочлен матрицы (5.4), аналогично п. 5.1 с. 35, полу-чим

det(sIn−A)=q∏i=1

(s−si)r∏j=1

(s2−2αjs+α2j+β

2j ).

Таким образом, матрица A имеет заданные собственные числа si. Если снова записатьуравнения состояния для каждой компоненты вектора x, то убеждаемся, что система «рас-падается» на q+r независимых подсистем первого и второго порядков. При m = l = 1

37

Page 38: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

передаточная функция системы принимает вид

W(s) =

q+r∑i=1

Wi(s), где (5.5)

Wi(s) =

⎧⎪⎪⎨⎪⎪⎩Ki

s− si, i=1, . . . , q,

d′js+djs2−2αjs+α

2j+β

2j

, j= i−q, i=q+1, . . . , q+r.

Следовательно, такой форме уравнений состояния соответствует разложение передаточнойфункции системы на слагаемые первого и второго порядков, что иллюстрируется рис. 5.1.3

Рисунок 5.1 – Структурная схема, соответствующая жордановой форме (5.4).

Рассмотренные выше канонические формы матрицы A (5.1) и (5.4) представляют собой

частные случаи так называемой вещественной формы Жордана. Такая форма может бытьполучена, если характеристический многочлен матрицы A не имеет кратных корней. Нижеприведен общий вид вещественной жордановой формы при наличии у матрицы A кратных

собственных чисел (см. сноску 1 на с. 35).3 Здесь (и далее в пособии) структурные схемы линейных систем содержат представление уравнений зве-

ньев (подсистем) в виде их передаточных функций. Иногда, чтобы подчеркнуть отличие между реальнымипроцессами и их изображениями в комплексной области [29,33,42], на структурных схемах используют спе-циальные обозначения для операторов дифференцирования и сдвига вперед [33]. Мы этого делать не будем,рассматривая передаточную функцию просто как компактную форму записи соответствующих уравнений.

38

Page 39: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

5.3 Общий случай. Вещественная форма Жордана

Пусть матрица A порядка n имеет кратные собственные числа: s1 – кратности l1, s2 –

кратности l2, . . . , sp – кратности lp. Выполнено условие∑p

i=1 li = n. При наличии крат-

ных корней не всякая матрица может быть невырожденным преобразованием приведена

к диагональной или блочно-диагональной форме (5.1), (5.4). Однако известен более об-

щий блочно-диагональный канонический вид матрицы A, который может быть получен и

для кратных собственных чисел при любой исходной матрице [8, 23, 29, 51]. В этой форме

матрица A имеет следующую блочную структуру: 4

A=

⎡⎢⎢⎢⎣J1 0 . . . 00 J2 . . . 0... . . .

. . . ...0 . . . 0 Jr

⎤⎥⎥⎥⎦ , (5.6)

где Ji, i=1, 2, . . . , r – клетки (ящики) Жордана, имеющие вид:

– для вещественных собственных чисел (Imsj=0)

Ji=

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

sj 1 0 0 . . . 0 00 sj 1 0 . . . 0 00 0 sj 1 . . . 0 00 0 0 sj . . . 0 0... . . .

. . . . . . ...0 . . . 0 sj 10 . . . 0 0 sj

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦; (5.7)

– для мнимых собственных чисел sj=αj ± jβj

Ji =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

αj βj 1 0 0 . . . 0−βj αj 0 1 0 . . . 00 0 αj βj 1 0 0 . . . 00 0 −βj αj 0 1 0 . . . 0... . . . . . . . . . ...0 . . . 0 αj βj0 . . . 0 −βj αj

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦(5.8)

Блочно-диагональная форма матрицы A вида (5.6) называется вещественной (обобщен-

ной) жордановой матрицей. Из теории матриц (см. [23, 51]) известна следующая теорема.4 В этом случае также говорят, что матрица A представлена в собственном базисе.

39

Page 40: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Теорема. Всякая квадратная матрица над полем вещественных чисел подобна неко-торой обобщенной жордановой матрице, которая определяется однозначно с точностью допорядка расположения клеток на главной диагонали.

Размер каждой клетки Ji вида (5.7) может быть от 1×1 до lj×lj, а размеры клеток Ji

вида (5.8) – от 2×2 до 2lj×2lj, (где j – кратность корня sj). Следовательно, в случае простых

корней клетки, отвечающие вещественным собственным числам имеют порядок один: Ji=

si, а клетки, отвечающие мнимым собственным числам – порядок два: Ji=

[αi βi−βi αi

]Таким

образом, приведенная в п. 5.2 с. 37, форма (5.4) следует из (5.6) как частный случай.

Существенно, что размер клеток Жордана в общем случае не совпадает с кратностьюкорня. Одному и тому же значению si может отвечать несколько клеток разного размера.

Например, матрицы A1 =

[0 10 0

]и A2 =

[0 00 0

], имеют одинаковые наборы собственных

чисел s1,2 = 0. Обе матрицы записаны в канонической жордановой форме, но матрица A1

совпадает с клеткой 2×2, а матрица A2 содержит две клетки J1= J2=0 размера 1×1. Какотмечено выше, данные матрицы не могут быть преобразованы одна к другой никакимневырожденным преобразованием, т.е. они не являются подобными. В этом проявляетсяобщее свойство матриц, согласно которому каноническая форма Жордана определяется

единственным образом с точностью до порядка следования клеток [23, 51].

Вычисление передаточной функции системы с одним входом и одним выходом, пред-

ставленной уравнениями с матрицей (5.6), дает следующий результат. Передаточная функ-

ция W(s), как и для случая простых собственных чисел, имеет вид (5.5), где соответству-ющие слагаемые равны

Wi(s) =

⎧⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎩

Bi(s)

(s− si)li, − для вещественных

собственных чисел;

Di(s)

(s2−2αis+α2i+β

2i )li

− для мнимых

собственных чисел,

(5.9)

в которых многочлены Bi(s), Dj(s) имеют степени li−1 и 2lj−1 соответственно.

Алгоритм определения размеров клеток Жордана для матриц с кратными собственны-

ми числами связан с выполнением следующих действий [8, 23, 51]:

– составление характеристической матрицы sIn−A и приведение ее к каноническому

40

Page 41: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

виду;

– вычисление элементарных делителей матрицы sIn−A;– построение клеток Жордана по каждому элементарному делителю.

Этот процесс достаточно трудоемок и здесь не рассматривается. Более подробные све-

дения о жордановой форме содержатся в [23, 29, 51].

41

Page 42: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 6

6 Управляемая и наблюдаемая канонические формы

6.1 Управляемое каноническое представление

Рассмотрим другую каноническую форму – управляемое каноническое представление

(УКП) [4], которая иногда называется также канонической формой «с общим выходом»,

канонической формой фазовой переменной [22, 46] либо управляемой формой Луенберге-

ра [3, 53]. 1

Запишем матрицу A в виде

A=

⎡⎢⎢⎢⎢⎢⎣0 1 0 . . . 00 0 1 . . . 0... . . . . . .

...0 0 0 . . . 0 1

−an −an−1 −an−2 . . . −a2 −a1

⎤⎥⎥⎥⎥⎥⎦ , (6.1)

где a1, a2, . . . , an – некоторые коэффициенты. 2 Вычислим ее характеристический много-

член. Как нетрудно убедиться, A(s)=sn+a1sn−1+a2sn−2+· · ·+an−1s+an. Таким образом, ко-

эффициенты характеристического многочлена располагаются в последней строке матрицыA. Матрицы такого вида называются сопровождающими для своего характеристического

многочлена, или матрицами Фробениуса. 3 Данные матрицы обладают рядом интересных

свойств (см. [23, 51] и п. 8.1 с. 50). В частности, коэффициенты характеристического мно-

гочлена таких матриц определяются без вычислений.

Матрица B для данной канонической формы также имеет специальный вид. Остано-

вимся на частном случае систем со скалярным входным воздействием u(t) ∈R, т.е. m=1.

4

Для таких систем матрица B имеет размер n×1 и может рассматриваться как вектор-столбец. В данной канонической форме выполнено равенство

B=[0, · · · , 0, 1]T . (6.2)1 В отличие от формы Жордана для этой канонической формы в литературе встречаются разные на-

звания.2 Такое представление выполнимо не всегда, см. п. 8 с. 50.3 Иногда используют более компактную запись A=

[0 In−1

−aT

].

4 Мы здесь не рассматриваем форму УКП для систем с векторным входным процессом. В последнемслучае матрица A может иметь более общий вид, чем (6.1), см. [3,4,53]. Аналогичное замечание относитсяи к рассмотренной в следующем параграфе форме НКП при векторном выходе.

42

Page 43: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Следовательно, уравнения состояния системы в данной канонической форме имеют вид⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

x1(t) = x2(t),x2(t) = x3(t),

...xn−1(t) = xn(t),xn(t) = −anx1(t)−an−1x2(t)−· · ·−a1xn(t)+u(t),

(6.3)

⎧⎪⎨⎪⎩y1(t) = c1,1x1(t)+c1,2x2(t)+. . . c1,nxn(t),

...yl(t) = cl,1x1(t)+cl,2x2(t)+. . . cl,nxn(t),

где через ci,j обозначены элементы l×n-матрицы C, вид которой не оговаривается. Вид-

но, что переменные состояния системы (6.3) связаны друг с другом как последовательные

производные. 5 Такая форма уравнений обычно используется в математике при приведе-нии дифференциального уравнения n-го порядка к системе уравнений первого порядка,

т.е. к так называемой нормальной форме Коши [29]. Структурная схема системы с одним

выходом, уравнения которой имеют вид (6.3), показана на рис. 6.1.

Рисунок 6.1 – Структурная схема системы (6.3) (форма УКП).

Получим передаточную функцию системы (6.3), считая для простоты записи, что

l = 1, C =[c1, c2, . . . , cn

]. Непосредственное вычисление по формуле (3.18) приводит к

выражению

W(s) =cns

n−1+cn−1sn−2+· · ·+c2s+c1

sn+a1sn−1+a2sn−2+· · ·+an−1s+an=

B(s)

A(s). (6.4)

Таким образом, в данной канонической форме как коэффициенты знаменателя A(s), так

и коэффициенты числителя B(s) передаточной функции находятся без вычислений. Они5 Заметим, что переменные состояния xj являются последовательными производными от выхода yi(t)

только в том случае, когда все элементы i-й строки матрицы C, начиная с ci,2, равны нулю.

43

Page 44: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

получаются непосредственно из элементов последней строки матрицы A и соответствующейi-му выходу строки матрицы .

Аналогичные формы уравнений состояния могут быть записаны и для систем с несколь-

кими входами, см. [3, 4, 53].

Надо отметить, что не всякую систему можно привести преобразованием подобия к

виду (6.1), (6.2). Условия осуществимости такого перехода обсуждаются ниже, в п.п. 8 15.2

6.2 Наблюдаемое каноническое представление

Рассмотрим теперь так называемое наблюдаемое каноническое представление (НКП), или

каноническую форму «с общим входом». Ограничимся системами со скалярным выходом,

y(t) ∈ R, l = 1 (т.е. SISO- и MISO-системами). Пусть матрица A, как в и предыдущем

случае, имеет форму матрицы Фробениуса (6.1), матрица B имеет произвольный вид, а1×n-матрица

C=[1, 0, . . . , 0, 0

]. (6.5)

Уравнения состояния тогда принимают форму⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩

x1(t) = x2(t)+b1,1u1(t)+· · ·+b1,mum(t),x2(t) = x3(t)+b2,1u1(t)+· · ·+b2,mum(t),

...xn−1(t) = xn(t)+bn−1,1u1(t)+· · ·+bn−1,mum(t),xn(t) = −anx1(t)−an−1x2(t) . . .−a1xn(t)+

+ bn,1u1(t)+· · ·+bn,mum(t),

(6.6)

y(t)=x1(t),

где через bi,j обозначены элементы n×m-матрицы B. Структурная схема системы с одним

входом, уравнения которой имеют вид (6.6), показана на рис. 6.2.

Коэффициенты знаменателя A(s) передаточной функции системы (6.6) также опре-

деляются непосредственно из последней строки матрицы A. Числитель B(s) вычисляетсясложнее.

Как и уравнения вида УКП, НКП могут быть записаны и для MIMO-систем. Заметим,

что не всякая система может быть приведена к данному виду (см. ниже п.п. 8 15.3)

Рассмотренные здесь канонические формы далеко не исчерпывают используемых вразных приложениях форм уравнений состояния. Например, применяется также иден-

тификационное каноническое представление (ИКП), или наблюдаемая форма Луенберге-

ра [3, 4, 53], при котором матрица A является транспонированной матрицей Фробениуса, а

44

Page 45: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 6.2 – Структурная схема системы (6.6) (форма НКП).

C =[0, . . . , 0, 1

]. Ниже, в главе 15 с. 104, будут приведены также каноническая форма

управляемости и каноническая форма наблюдаемости [4, 22].

45

Page 46: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 7

7 Преобразование уравнений состояния к каноническому виду.Преобразование к диагональной и блочно-диагональной фор-мам

Обратимся теперь к задаче перехода от исходных уравнений состояния к уравнениям взаданной канонической форме. Решение этой задачи сводится к определению невырожден-ной n×n-матрицы T такой, что для заданных матриц A, B ,C получаются уравнения с

матрицами A=TAT−1, B=TB, C=CT−1, имеющими требуемый канонический вид. 1

Заметим, что столбцы матрицы T−1 содержат координаты новых базисных векторов

относительно старого базиса [4, 8, 23, 29, 51]. Это означает, что если в пространстве Rn

заданы две системы базисных векторов 2 {e}= {e1, e2, . . . , en} и {f}= {f1, f2, . . . , fn},то каждый вектор fi базиса {f} можно разложить по базису {e}, т.е. представить в видесуммы fi =

∑nj=1 pjiej, i = 1, 2, . . . , n, или, в матричных обозначениях, [f1, f2, . . . , fn] =

[e1, e2, . . . , en]P, [e1, e2, . . . , en]=[f1, f2, . . . , fn]P−1 и T =P−1.

Рассмотрим теперь вопрос о вычислении матрицы преобразования T по заданным мат-рицам данной системы, записанным в разных базисах.

Если заданы n×n-матрицы A и A, то из условия A = TAT−1 матрица преобразованияT должна удовлетворять матричному уравнению

TA= AT при условии det T �= 0. (7.1)

Уравнение (7.1) приводится к однородной системе n2 линейных уравнений. Сведения о

существовании ее решений содержатся, например, в [23]. Как отмечено выше, не всякие

матрицы с одинаковым спектром являются подобными. Поэтому не каждая матрица можетбыть приведена к заданной канонической форме. Возможность такого преобразования ксоответствующим каноническим формам обсуждается ниже.

При определении диагональной (в общем случае – вещественной жордановой ) кано-

нической формы уравнений состояния системы задается только вид матрицы A. Матри-

цы B и C получаются через найденную «диагонализирующую» матрицу T по формулам1 При приведении к канонической форме задан вид одной, или двух матриц (например, матрицы A или

пары (A, B)), а остальные матрицы находятся через матрицу T путем указанных преобразований2 Напомним, что базисом n-мерного линейного пространства называется (любая) упорядоченная система

n линейно независимых векторов из этого пространства [4, 8, 23].

46

Page 47: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

B=TB, C=CT−1. Поэтому нас интересует задача определения матрицы T такой, что вы-

полнено A=TAT−1, причем матрица A имеет указанный вид. Естественным требованием

является совпадение характеристических многочленов матриц A и A. Считая его выпол-

ненным, построим матрицу A заданного канонического вида. Затем матрица преобразова-

ния T вычисляется из уравнения (7.1) либо исходя из указанного свойства преобразования

базисных векторов. Уточним применение данной схемы решения для случая простых соб-ственных чисел матрицы A. Рассмотрим вначале систему, для которой все собственныечисла si матрицы A простые и вещественные.

7.1 Простые вещественные собственные числа

При решении этой задачи обычно используются собственные векторы матриц. Напомним,что собственным вектором некоторой n×n-матрицы A, отвечающим собственному зна-

чению si называется такой вектор x0i �= 0, для которого выполнено равенство [8, 23, 51]

Ax0i =six0i . (7.2)

Таким образом, собственный вектор – это ненулевой вектор, который при линейном преоб-разовании с матрицей A остается коллинеарным самому себе. Очевидно, что собственные

векторы определяются с точностью до произвольного ненулевого множителя, т.е. если x0i– собственный вектор и λ �= 0, то λx0i также является собственным вектором матрицы

A. Поэтому каждый вещественный собственный вектор определяет некоторое собственное

направление, или собственную прямую в пространстве Rn. 3

Пусть вещественная матрица A имеет диагональную форму A = diag{s1, s2, . . . , sn},Imsi = 0, i = 1, 2, . . . , n. Подставляя ее в выражение (7.2) и учитывая, что диагональ-

ные элементы матрицы A совпадают с собственными значениями, находим, что единичные

векторы x0i = ei = [0, . . . , 1︸︷︷︸i

, . . . , 0]T являются собственными векторами x0i данной мат-

рицы. Собственными направлениями, таким образом, здесь являются оси ортогональнойсистемы координат. Нетрудно убедиться, что при простых собственных числах матрицы

A других собственных векторов нет. Покажем, что матрица приведения T к диагональной

канонической форме (5.4) при простых вещественных собственных числах определяется из3 Нетрудно заметить, что мнимым собственным числам матрицы A с вещественными элементами от-

вечают собственные векторы, имеющие мнимые компоненты. Случай мнимых собственных чисел будетрассмотрен в следующем параграфе.

47

Page 48: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

выражения

T =[x01, x02, . . . , x

0n]

−1, (7.3)

где x0i (i=1, 2, . . . , n) – собственные векторы матрицы A.

Действительно, пусть si – собственные числа, а x0i – собственные векторы n×n-матрицы

A, т.е. Ax0i = six0i , x

0i �= 0, (i = 1, 2, . . . , n). Пусть также известно, что данная матрица связа-

на некоторым соотношением подобия с диагональной, т.е. выполнено A = TAT−1, detT �= 0,

A=diag{s1, s2, . . . , sn}. Образуем модальную матрицу P = [x01, x02, . . . , x

0n]. Объединяя запи-

санные выше выражения для собственных векторов в одно матричное соотношение, получа-

ем AP = PA. Отсюда при линейной независимости x0i получим A = P−1AP, следовательно,

T = P−1, что непосредственно дает выражение (7.3).

З а м е ч а н и е . Здесь не обсуждался вопрос о линейной независимости собственных

векторов {x0i }, что, очевидно, необходимо для существования матрицы T вида (7.3). Как

известно [23, 51], при простых собственных числах si матрицы A это условие выполнено, а

именно данный случай и рассматривается в настоящем парарафе.

7.2 Простые мнимые собственные числа

Рассмотрим теперь более общий случай приведения уравнений состояния системы к блоч-

но-диагональному виду (5.4). Считаем, что все корни характеристического многочлена мат-

рицы A попарно различны, но среди них имеются комплексно-сопряженные si,i+1=αi± jβi,(j2 =−1), αi = Resi,i+1, βi = |Imsi,i+1|. В этом случае матрица A также имеет n ли-

нейно независимых собственных векторов и изложенный в п. 7.1 с. 47, алгоритм при-меним. Однако полученная в результате такого преобразования диагональная матрица

A=diag{s1, s2, . . . , sn}, как и матрица преобразования T, будет содержать мнимые эле-

менты, что вызывает трудности при их последующем использовании. Поэтому рассмот-рим алгоритм, позволяющий получить вещественную блочно-диагональную форму вида

(5.4) [8, 22, 36].

Пусть имеются собственные значения si,i+1 = αi ± jβi, которым отвечают собственные

векторы x0i , x0i+1. Можно показать [36, 51], что всегда есть множитель λ ∈R, λ �= 0 такой,

что x0i , λx0i+1 – комплексно-сопряженные. Поэтому будем считать, что выполнено условие

x0i+1=conj(x0i ), где conj(·) – операция комплексного сопряжения. Определим теперь векторы

48

Page 49: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

hi, hi+1 формулами

hi=1

2(x0i+x

0i+1), hi+1=

1

2j(x0i−x0i+1). (7.4)

Векторы hi, hi+1 по построению вещественные и, если все собственные числа простые,линейно независимы между собой и с другими собственными векторами. Эти векторыопределяют в пространстве Rn некоторую собственную плоскость – инвариантное под-

пространство матрицыAразмерности два. 4

Построим теперь матрицу преобразования

T =[x01, x02, . . . , hj, hj+1, . . . , hq+r−1, hq+r]

−1,

где вектор-столбцы x0i отвечают вещественным, а hj, hj+1 – мнимым собственным значе-

ниям sj,j+1 = αj ± jβj . Преобразование A = TAT−1 с найденной таким образом матрицей

T приводит уравнения системы к вещественной блочно-диагональной форме (5.4), в ко-

торой порядок следования блоков соответствует порядку расположения столбцов x0i , hj у

матрицы P =T−1.

Приведение уравнений состояния к вещественной жордановой форме при наличии крат-ных собственных чисел здесь не рассматривается. Заметим, однако, что если вид матрицы

Жордана (5.6) определен, то для вычисления матрицы T можно непосредственно использо-

вать формулу (7.1). Для кратных вещественных собственных чисел формулы вычисления

T в явном виде приведены, например, в [22].

Заметим, что если матрица A в исходных уравнениях состояния имеет вид матрицы

Фробениуса (6.1), что соответствует формам УКП и НКП, собственные векторы опреде-

ляются достаточно просто. Непосредственной подстановкой можно установить, что такая

матрица имеет собственные векторы x0i = [1, si, s2i , . . . , s

n−1i ]T , (i= 1, 2, . . . , n). Если соб-

ственные числа простые, то полученная система векторов линейно независима и определяетматрицу T перехода к диагональной, или блочно-диагональной, форме.

4 Напомним, что инвариантным подпространством относительно линейного оператораA, выраженногоматрицей A (не обязательно квадратной), называется множество XA ⊆ X такое, что из x ∈ XA следуетAx ∈ XA [51]. Тривиальными инвариантными подпространствами являются XA = {0} и все пространствоX . Собственные прямые представляют собой нетривиальные инвариантные подпространства единичнойразмерности.

49

Page 50: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 8

8 Преобразование уравнений состояния к управляемой и наб-людаемой каноническим формам

8.1 О возможности преобразования матрицы к форме Фробениуса

В канонических формах УКП и НКП (см. п.п. 6 6.2) матрица A должна иметь вид матрицы

Фробениуса (6.1). Кроме того, в форме УКП задается вид матрицы B, а в форме НКП –

матрицы C.

Заметим прежде всего, что не для всякой матрицы имеется преобразование подобия к

виду (6.1). Как известно [23, 51], для матрицы вида (6.1) характеристический многочлен

A(s) = det(sIn−A) совпадает с ее минимальным многочленом. 1 Верно также и обрат-ное: каждая матрица, у которой приведенный характеристический многочлен совпадает сминимальным, может быть приведена к виду матрицы Фробениуса. Например, посколькуэто выполнено для матриц с простыми собственными числами, то каждая такая матрица

может быть приведена невырожденным преобразованием к виду (6.1).

Возможность приведения матрицы к виду (6.1) в общем случае зависит от размера кле-

ток жордановой формы (5.6). Если размер каждой клетки совпадает с кратностью соответ-

ствующего вещественного собственного значения или равен удвоенной кратности мнимых

(комплексно-сопряженных) собственных значений, то такая матрица может быть приведе-

на и к виду (6.1) [51]. В противном случае такая возможность отсутствует.

З а м е ч а н и е . Помимо жордановой формы матрицы A, известна и другая блочно-

диагональная форма (первая естественная нормальная форма [23,51]), в которой матрица1 Напомним следующие определения [23]. Скалярный многочлен f(s) называется аннулирующим мно-

гочленом для квадратной матрицы A, если f(A)=0. Заметим, что характеристический многочлен A(s), потеореме Кэли–Гамильтона, является и аннулирующим многочленом. Матрица может иметь аннулирующиемногочлены, отличные от характеристического.

Минимальным многочленом χ(s) матрицы A называется приведенный аннулирующий многочлен дляA наименьшей степени. Очевидно, что степень минимального многочлена degχ(s) ≤ n. При degχ(s) = nминимальный многочлен совпадает с характеристическим. Такая ситуация имеет место прежде всего, есливсе собственные числа матрицы A простые. Минимальный многочлен χ(s) можно вычислить из соотноше-ния [23]: A(s) = χ(s)d(s), где A(s) – приведенный характеристический многочлен (A(s) = det(sIn −A) ), аd(s) – наибольший общий делитель элементов присоединенной для sIn −A матрицы adj(sIn −A)T .

50

Page 51: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

A имеет вид

A=

⎡⎢⎢⎢⎣L1 0 . . . 00 L2 . . . 0... . . .

. . . ...0 . . . 0 Lr

⎤⎥⎥⎥⎦ , (8.1)

где Li, i= 1, 2, . . . , r – блоки вида (6.1). Подобно канонической форме Жордана, данная

форма может быть получена для любой матрицы A.

Предполагая возможным преобразование матрицы A к виду (6.1), рассмотрим алгорит-

мы приведения уравнений состояния к формам УКП и НКП.

8.2 Управляемое каноническое представление

Как и в п. 6 с. 42, остановимся на системах с одним входом – u(t) ∈R. Прежде чем перейти

непосредственно к данному преобразованию, рассмотрим несколько более общую задачу.

Пусть даны n×n-матрицы A, A и n-мерные вектор-столбцы b, b. Требуется найтиневырожденную матрицу T такую, что выполнено

A=TAT−1, b=Tb, (8.2)

т.е. пары матриц (A, b) и (A, b) отвечают приведенным в п. 4 с. 31, соотношениям для

преобразования базиса уравнений состояния. 2

Умножим выражение для b в (8.2) слева на матрицу A. Получим Ab= ATb. Учитывая

первую формулу в (8.2) (см. п. 7.1 с. 51), находим, что Ab= TAb. Снова, умножив полу-

ченное выражение на A и учитывая (7.1), получаем A2b=TA2b. Продолжая этот процесс,приходим к системе уравнений:

b = Tb,

Ab = TAb,

. . . (8.3)

An−1b = TAn−1b.

Введем n×n-матрицы

Q = [b, Ab, . . . , An−1b], Q = [b, Ab, . . . , An−1b]. (8.4)2 Мы здесь предполагаем, что такая матрица существует. Прежде всего это означает, что матрицы A и

A имеют одинаковые характеристические многочлены.

51

Page 52: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

С учетом введенных обозначений уравнения (8.3) принимают вид

Q=QT.

Если выполнены условия: det(sIn−A) ≡ det(sIn−A), detQ �= 0, detQ �= 0, то существует и

единственна невырожденная матрица преобразования T, определяемая выражением

T =QQ−1, (8.5)

при которой матрицы A, b и A, b связаны соотношением (8.2): A=TAT−1, b=Tb. 3

Обратимся теперь непосредственно к поставленной задаче преобразования уравненийсостояния к форме УКП, ограничиваясь рассмотренными в главе 6 с. 42, SISO и SIMO-системами. В данной канонической форме матрица A должна иметь вид матрицы Фробе-

ниуса (6.1), а матрица B = [0, 0, . . . , 0, 1]T . Именно в таком виде запишем матрицы A, B

уравнений состояния в новом базисе. Предварительно следует вычислить коэффициенты ai

характеристического многочлена A(s)=sn+a1sn−1+a2sn−2+· · ·+an−1s+an исходной матрицы

A. Приравнивая теперь b=B, b= B = [0, 0, . . . , 0, 1]T , найдем матрицы Q, Q по (8.4).

Если выполнено detQ �= 0, detQ �= 0, то преобразование к УКП возможно и его матрица

определяется уравнением (8.5). Для вычисления соответствующей матрицы C используем

соотношение C=CT−1.

З а м е ч а н и е . Как нетрудно убедиться непосредственным вычислением, для матриц

A, B указанного вида условие detQ �= 0 выполнено всегда (вне зависимости от коэффи-

циентов ai). Поэтому требуется проверить только невырожденность матрицы Q исходной

системы. Кроме того, специальный вид матриц A, B позволяет получить достаточно про-

стую формулу для Q [4, 22].

8.3 Наблюдаемое каноническое представление

Описанный выше прием можно использовать и для перехода к другим формам уравненийсостояния, для которых задан вид матриц A и C, например – к описанной в п. 6.2 с. 44,

форме НКП. Ограничимся рассмотрением SISO- и MISO-систем (y(t) ∈R, l=1). Предвари-

тельно рассмотрим более общую задачу.3 Приведенные выше рассуждения относятся к вычислению матрицы преобразования T, а не к доказа-

тельству ее существования. В частности, предполагалось выполненным соотношение (7.1) при некоторой T,detT �= 0. Вопрос о существовании матрицы T связан с рассмотренными ниже в главе 15 с. 104, понятиямиуправляемости и наблюдаемости систем. Более подробные сведения приведены в [17,37].

52

Page 53: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Пусть даны n×n-матрицы A, A и n-мерные вектор-строки c, c. Требуется найти невы-рожденную матрицу T такую, что выполнено

A=TAT−1, c=cT−1, (8.6)

т.е. пары матриц (A, c) и (A, c) отвечают приведенным в п. 4 с. 31, соотношениям для

преобразования базиса уравнений состояния. 4

Умножим выражение для c в (8.6) справа на матрицу A. Получим cA= cAT−1. Учи-

тывая первую формулу в (8.6), находим, что cA = cAT−1. Снова умножив полученное

выражение на A и учитывая (7.1), получаем cA2=cA2T−1. Как и в пункте 8.2, после рядаитераций, приходим к системе уравнений

c = cT−1,

cA = cAT−1,

. . . (8.7)

cAn−1 = cAn−1T−1.

Введем n×n-матрицы

Q =

⎡⎢⎢⎢⎣ccA...

cAn−1

⎤⎥⎥⎥⎦ , Q =

⎡⎢⎢⎢⎣c

cA...

cAn−1

⎤⎥⎥⎥⎦ . (8.8)

Уравнения (8.7) можно тогда переписать в виде

Q=QT−1.

При выполнении условий det(sIn−A) ≡ det(sIn− A), detQ �= 0, detQ �= 0 существует и

единственна невырожденная матрица преобразования

T =Q−1Q, (8.9)

так что матрицы A, c и A, c связаны соотношением (8.6).

4 Как и выше, мы предполагаем, что матрица T существует; следовательно, матрицы A и A имеютодинаковые характеристические многочлены.

53

Page 54: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотрим теперь непосредственно переход к форме НКП, для SISO-, MISO-систем.

В этом базисе матрица A должна иметь вид матрицы Фробениуса (6.1), а матрица C=[1,

0, . . . , 0, 0]. В таком виде и выберем матрицы A, C уравнений состояния в новом базисе.

Вычислим коэффициенты ai характеристического многочлена A(s) = sn+a1sn−1+a2sn−2+

· · ·+an−1s+an исходной матрицы A. Приравнивая теперь c= C, c= C = [1, 0, . . . , 0, 0],

найдем матрицы Q, Q по (8.8). Если выполнено detQ �= 0, detQ �= 0, то преобразование к

НКП возможно и его матрица определяется уравнением (8.9). Для вычисления матрицы B

используем соотношение B=TB.

З а м е ч а н и е . Для матриц A, C указанного вида Q= In. Поэтому detQ �= 0 прилюбых коэффициентах ai. Следовательно, требуется проверить только невырожденностьматрицы Q исходной системы. Кроме того, это упрощает вычисление матрицы преобразо-

вания T, так как из (8.9) получим T =Q, т.е. B=QB.

54

Page 55: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 9

9 Определение уравнений состояния по передаточной функции

Задача определения уравнений состояния по передаточной функции системы есть, по су-ществу, известная в теории дифференциальных уравнений задача приведения линейных

уравнений n-го порядка к нормальной форме Коши [10, 29, 36]. Некоторое отличие состо-ит в том, что в теории управления принято рассматривать уравнения, в которые входятпроизводные не только от выхода, но и от входа системы.

Начнем рассмотрение этой задачи с SISO-систем.

Полагаем, что система задана передаточной функцией

W(s) =b0s

r+b1sr−1+· · ·+br−1s+br

sn+a1sn−1+a2sn−2+· · ·+an−1s+an=

B(s)

A(s)(9.1)

и является строго реализуемой, т.е. r < n. 1

Как было отмечено в 4, уравнения состояния по передаточной функции определяютсяс точностью до произвольного невырожденного преобразования. Поэтому данной переда-точной функции соответствует множество различных уравнений состояния и поставленнаязадача решается неоднозначно. Выбор формы уравнений состояния зависит от того, какони будут использоваться в дальнейшем. Рассмотрим некоторые возможные варианты.

В некоторых приложениях желательно, чтобы значения переменных состояния соот-

ветствовали определенным физическим переменным (как в рассмотренных в п. 2.3 приме-

рах). Тогда структура матриц A, B,C, D в (4.3) оказывается заданной и задача состоит

в нахождении некоторых их элементов. Эта задача может быть решена на основе обрат-ного перехода от уравнений состояния к передаточной функции методом неопределенныхкоэффициентов. Далее рассмотрим ситуацию, в которой физический смысл переменныхсостояния не имеет значения и выбор вида уравнений состояния происходит из другихсоображений.

Прежде всего, если задана только передаточная функция, естественно искать ее мини-мальную реализацию, т.е. такую форму уравнений состояния, при которой заданная переда-

точная функция получается при наименьшей размерности пространства X (следовательно,1 При r = n могут быть получены уравнения состояния вида (4.3), где D �= 0. Для r > n получаются

нереализуемые системы, передаточные функции которых приводят к более общим уравнениям (2.2). Вданной книге ограничимся рассмотрением реализуемых систем.

55

Page 56: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

– при минимально возможном порядке уравнений (4.3)). Как известно, минимальная реа-

лизация соответствует невырожденным (полностью управляемым и полностью наблюдае-

мым) системам. 2 Для SISO-систем это эквивалентно тому, что по уравнениям состояния

получается несократимая передаточная функция, степень знаменателя которой degA(s)

совпадает с размерностью вектора состояния. Поэтому в дальнейшем будем считать, что в

числителе и знаменателе заданной передаточной функции отсутствуют явно (структурно)

выраженные общие сомножители. Это условие, впрочем, не исключает того, что передаточ-ная функция задана в общем виде и при определенных сочетаниях параметров найденнаяреализация не будет минимальной.

Итак, считаем, что степень знаменателя передаточной функции задана и равна n. По-скольку характеристический многочлен матрицы A совпадает со знаменателем переда-

точной функции, 3 а степень характеристического многочлена равна размерности dimXпространства состояний X , то искомые уравнения состояния должы быть n-го порядка:x ∈ X = Rn.

Теперь можно использовать одну из приведенных выше канонических форм. Прощевсего получаются уравнения состояния в форме УКП.

9.1 Управляемое каноническое представление

Уравнения состояния в форме УКП (6.3) имеют матрицы A, B вида (6.1), (6.2). Запишем

эти уравнения явно для данной передаточной функции (9.1). Получим

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

x1(t) = x2(t),x2(t) = x3(t),

...xn−1(t) = xn(t),xn(t) = −anx1(t)−an−1x2(t)−· · ·−a1xn(t)+u(t),

y(t)=brx1(t)+br−1x2(t)+· · ·+b0xr+1(t),

2 Вопросы управляемости и наблюдаемости рассматриваются ниже в главе 153 Следует обратить внимание на то, что знаменатель в (9.1) является приведенным многочленом.

56

Page 57: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

или в матричной форме x(t)=Ax(t)+Bu(t), где

A =

⎡⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 . . . 0 00 0 1 . . . 0 00 0 0 . . . 0 0... . . .

...0 0 0 . . . 0 1

−an −an−1 −an−2 . . . −a2 −a1

⎤⎥⎥⎥⎥⎥⎥⎥⎦, B=

⎡⎢⎢⎢⎢⎢⎣00...01

⎤⎥⎥⎥⎥⎥⎦ , (9.2)

C =[br, br−1, . . . , b0, 0, . . . , 0︸ ︷︷ ︸

n−r−1

].

Данную форму нетрудно использовать и для SIMO-систем, у которых передаточная

функция W(s) размера l×1 приведена к виду

W(s) =1

A(s)

⎡⎢⎢⎢⎣B1(s)B2(s)...

Bl(s)

⎤⎥⎥⎥⎦ ,в котором A(s) указан в (9.1), а многочлены Bj(s) имеют степени rj < n, j=1, . . . , l. Тогда

уравнения состояния имеют вид (9.2), где вместо 1×n-матрицы C используется l×n-матрица

C=

⎡⎣b1,r1 , b1,r1−1, . . . , b1,0, . . . , 0,. . .

bl,rl, bl,rl−1, . . . , bl,0, . . . , 0,

⎤⎦ .9.2 Наблюдаемое каноническое представление

Рассмотрим теперь приведение передаточной функции к виду НКП (6.6), считая сначала,

что l=m=1. Поскольку матрица A в данной канонической форме имеет вид (6.1), то ее эле-

менты, аналогично предыдущему случаю, определяются без вычислений. Матрица B при

приведении к НКП вычисляется через коэффициенты многочленов A(s), B(s). Запишемэту матрицу в виде

B=[β1, β2, · · · , βn−1, βn]T . (9.3)

Элементы βi, i=1, . . . , n, этой матрицы вычисляются методом неопределенных коэффици-ентов. Можно использовать следующую рекуррентную формулу

β1=b0, βj= bj−1−j−1∑i=1

βiaj−i, j=2, 3, . . . , n. (9.4)

57

Page 58: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Коэффициенты bi в (9.4) совпадают с соответствующими коэффициентами bi числителя

B(s) для i=0, 1, . . . , r и равны нулю при больших значениях индекса.

Запишем соответствующие уравнения состояния в "развернутом"виде. Получим

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

x1(t) = x2(t)+β1u(t),x2(t) = x3(t)+β2u(t),

...xn−1(t) = xn(t)βn−1u(t),xn(t) = −anx1(t)−· · ·−a2xn−1(t)−a1xn(t)+βnu(t),

(9.5)

y(t)=x1(t).

Нетрудно заметить, что при r = 0, B(s) = b0 уравнения вида УКП и НКП фактически

совпадают (разница состоит в том, что коэффициент передачи b0 для УКП помещается в

матрицу выхода C=[b0, 0, . . . , 0], а для НКП – во входную матрицу B=[0, . . . , 0, b0]T ).

Покажем использование этой формы для MISO-систем, у которых передаточная функ-

ция W(s) размера 1×m приведена к виду

W(s) =1

A(s)

[B1(s), B2(s), . . . , Bm(s)

],

в котором A(s) указан в (9.1), а многочлены Bj(s) имеют степени rj < n, j=1, . . . , m. Тогда

уравнения состояния имеют вид (6.6), где вместо n×1-матрицы B используется n×l-матрица

B=

⎡⎢⎣β1,1 β1,2 . . . β1,m...

βn,1 βn,2 . . . βn,m

⎤⎥⎦ ,а коэффициенты βi,j, i=1, . . . n, j =1, . . .m вычисляются по формуле (9.4) для каждого

многочлена Bj(s).

Следовательно, если имеется система с одним входом, который "разветвляется"на не-сколько выходов, целесообразно использовать УКП, а если несколько входных сигналовдействуют на систему и выходные реакции суммируются, – форму НКП. Общий случайMIMO-систем является существенно более сложным. Прежде чем обсуждать его, рассмот-рим приведение передаточных функций к уравнениям состояния, представленным диаго-

нальной (жордановой) формой матрицы A.

58

Page 59: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

9.3 Блочно-диагональная форма

Рассмотрим SISO-систему, заданную передаточной функцией (9.1). Пусть известны корни

характеристического многочлена, которые вначале предполагаем простыми. В этом случае

всегда имеется возможность разложить W(s) на простейшие слагаемые первого и второго

порядков, т.е. записать ее в виде (5.5), как W(s)=q+r∑i=1

Wi(s), где

Wi(s) =

⎧⎪⎪⎨⎪⎪⎩Ki

s− si, i=1, . . . , q,

d′js+djs2−2αjs+α2

j+β2j

, j= i−q, i=q+1, . . . , q+r.

Для каждого слагаемого (в произвольно выбранном порядке) заполняются клетки мат-

рицы A, имеющей вещественную форму Жордана (5.4)

A =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

s1 0 0 . . . . . . 00 s2 0 . . . . . . 0... . . . . . .

...0 . . . 0 sq 0 . . . 00 . . . . . . 0 α1 β1 . . . 00 . . . . . . 0 −β1 α1 . . . 0... . . . . . . ...0 0 . . . 0 0 αr βr0 0 . . . 0 0 −βr αr

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦.

Элементы n×1-матрицы B и 1×n-матрицы C находятся таким образом, чтобы соответ-

ствующая данному входу передаточная функция из (5.5) имела заданные коэффициенты

числителя. 4 Если Wi(s) =Ki

s− si, то соответствующие элементы должны удовлетворять

условию bici=Ki. Для блоков второго порядка с передаточной функцией

Wj(s) =d′js+dj

s2−2αjs+α2j+β

2j

,

коэффициенты числителя d′j, dj связаны с элементами матриц B, C соотношениями

d′j=c1b1+c2b2, dj=c1(b2βj−b1αj)−c2(b1βj+b2αj).4 Здесь учитывается, что при блочно-диагональной форме матрицы A каждая подсистема может рас-

сматриваться независимо от других.

59

Page 60: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Эти условия дают возможность выбрать искомые элементы, причем задача также реша-ется неоднозначно. Можно, например, рекомендовать использовать следующие значения:

b1=0, b2=1, c1=αjd

′j+dj

βj, c2=d

′.

9.4 Жорданова форма

Если передаточная функция системы имеет кратные полюса, ее разложение будет содер-жать слагаемые, степени знаменателей которых отвечают значениям кратности. Для ве-щественных корней кратности k получаются знаменатели k-й степени, для мнимых корней

– степени 2k. Тогда W(s) имеет вид (5.5), (5.9). Исходя из найденных при разложении пе-

редаточной функции W(s) слагаемых Wi(s) указанного вида нетрудно записать матрицу

A в форме Жордана (5.6), в которой вещественным корням соответствуют диагональные

блоки вида (5.7), а мнимым – блоки вида (5.8). Элементы матриц B, C можно получить

путем обратных вычислений методом неопределенных коэффициентов.

Например, для вещественных корней s1j =s2j = . . .=skj (кратности kj) можно предста-

вить Wj(s) в виде

Wj(s)=

kj∑i=1

Kji

(s−skj)i.

Если выбрать элементы соответствующих строк матрицы B в виде b1 = b2 = . . .= bkj−1 =

0, bkj = 1, то соответствующие данной клетке элементы матрицы C определяются равен-

ствами ci =Kji. Другой возможный выбор – положить c1 = 1, а остальные элементы под-

строки – равными нулю. Тогда значения Kji, взятые в обратном порядке, присваиваются

элементам bi. Явный вид уравнений состояния для вещественных корней характеристиче-

ского многочлена A(s) приведен в [39].

З а м е ч а н и е 1. Процесс преобразования передаточной функции к блочно-ди-агональной и жордановой формам существенно более трудоемок, чем преобразования квиду УКП или НКП, так как связан с разложением передаточной функции на слагаемыеи, следовательно, с вычислением корней характеристического многочлена.

З а м е ч а н и е 2. Приведенные процедуры применимы и к реализуемым системам,

у которых degB(s) = degA(s). Для их использования надо сначала преобразовать переда-

60

Page 61: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

точную функцию, выделив в ней целую часть путем деления многочленов

W(s) ≡ B(s)

A(s)=d+

B(s)

A(s).

Коэффициент d образует 1×1-матрицу D в (4.3), а передаточная функция W(s) =B(s)

A(s)

оказывается строго реализуемой и приводится к уравнениям состояния обычным образом.В результате этого преобразования находятся матрицы A ,B ,C.

З а м е ч а н и е 3. В некоторых задачах удобно получать уравнения состояния не для

всей системы (пусть даже разомкнутой), а для отдельных звеньев (подсистем). Например,

такая ситуация имеет место, когда система задана в виде структурной схемы. Как пра-вило, переход к уравнениям состояния звеньев оказывается существенно более простым.Например, при синтезе цифровых фильтров применяется «каскадная реализация», при ко-торой передаточная функция системы представляется в виде произведения передаточныхфункций первого и второго порядков.

З а м е ч а н и е 4. Приведенные выше уравнения рассмотрены для непрерывныхсистем, однако изложенные в настоящей главе канонические формы и методы полученияуравнений состояния по передаточным функциям с очевидным изменением обозначенийприменимы и к дискретным системам.

9.5 Случай систем с несколькими входами и выходами

Коснемся вопроса определения минимальной реализации для MIMO-систем, имеющих нес-

колько входов и несколько выходов (m > 1, l > 1). Задача получения минимальной реали-зации уравнений состояния для таких систем существенно сложнее рассмотренной выше,

поэтому ограничимся некоторыми примерами. 5

Пример 1. Пусть заданы матричные 2×2 передаточные функции

W1(s)=

[1s 11s 1

]и W2(s)=

[1s 00 1

s

].

Нетрудно установить, что реализацией минимального порядка W1(s) будут уравнения со-стояния:

x(t)=u1(t), y1(t)=x(t)+u2(t), y2(t)=x(t)+u2(t).

5 Более подробные сведения о решении этой задачи имеются в работах [3, 40, 53].

61

Page 62: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Этим уравнениям соответствуют матрицы

A1=0, B1=[1, 0], C1=

[11

], D1=

[0 10 1

].

В свою очередь передаточная функция W2(s) имеет минимальную реализацию вида

{x1(t) = u1(t), y1(t)=x1(t),x2(t) = u2(t), y2(t)=x2(t),

которой отвечают матрицы

A2=

[0 00 0

], B2=

[1 00 1

], C2=

[1 00 1

], D2=

[0 00 0

].

Как видим, уравнения состояния существенно отличаются: даже размерности векторовсостояния у данных систем оказываются различными. Данный пример показывает, чтопри переходе к уравнениям состояния для MIMO-систем следует учитывать более "тон-кие"свойства матричных передаточных функций, а характеристический многочлен матри-

цы получаемых уравнений состояния необязательно совпадает с многочленом A(s), полу-

ченным в виде общего кратного знаменателей передаточных функций Wi,j(s).

Пример 2. [40]. Пусть задана матричная передаточная функция

W(s)=

⎡⎢⎣ 0.7

9s+10

2.0

8s+1

0.4

9s+1

⎤⎥⎦ .Вычисляя матричные вычеты в полюсах s1=−19 , s2=−18 , получим разложение

W(s) =1

9s+1

[0.7 00 0.4

]+

1

8s+1

[0 02 0

]=

1

9s+1M1+

1

8s+1M2.

Размерность пространства состояний минимальной реализации определяется, как суммарангов матриц M1 и M2. В данном примере

M1=

[0.7 00 0.4

], rankM1=2, M2=

[0 02 0

], rankM2=1,

62

Page 63: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

следовательно n=dimX =3. Матрицу A записываем в диагональной форме:

A=

⎡⎣−19

0 00 −1

90

0 0 −18

⎤⎦ .Далее определяем элементы 3×2-матрицы B и 2×3-матрицы C так, чтобы получить задан-

ные числители W(s). Нетрудно убедиться, что указанному условию удовлетворяют матри-цы

B=

⎡⎣ 0.79

00 0.4

914

0

⎤⎦ , C=

[1 0 00 1 1

].

Рассмотренный в Примере 2 метод рекомендуется для систем, передаточные функции

которых имеют только вещественные простые полюса [40]. В общем случае алгоритмы

преобразования к уравнениям состояния сложнее (см., например, [3], а также Приложение

2 в [48]) и здесь не рассматриваются.

63

Page 64: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 10

10 Фазовые траектории и фазовые портреты линейных систем

Дополнительную наглядную информацию о поведении систем можно получить рассмотре-нием их фазовых портретов. Дадим основные определения и рассмотрим общие свойствафазовых траекторий применительно к линейным системам. Будем рассматривать авто-номные системы, т.е. такие, в уравнения которых явно не входит время. Таким образом,

будем считать, что параметры системы не меняются во времени (система стационарна), а

также что входное воздействие отсутствует и рассматривать только собственные движениясистемы

x(t)=Ax(t), x(0)=x0. (10.1)

10.1 Определения и основные свойства фазовых траекторий и фазовыхпортретов

При построении фазовых траекторий каждому решению ставится в соответствие движение

точки по некоторой кривой в пространстве состояний (фазовом пространстве). Это дает

возможность получить геометрическую, а точнее – кинематическую [10, 11, 36], интерпре-тацию поведения системы.

При заданном начальном состоянии x0 получим решение x(t) уравнения (10.1). В функ-ции от t в процессе своего движения точка x описывает некоторую кривую в пространствесостояний X . Эта кривая называется фазовой траекторией , или фазовой кривой системы(10.1), соответствующей заданным начальным условиям. Поскольку представляет интерес

развитие процесса во времени, на фазовой траектории указывается (стрелкой) направление

движения изображающей точки при возрастании времени t.

Фазовым портретом системы называется совокупность фазовых траекторий, получен-ных при различных начальных условиях.

Рассмотрим основные свойства фазовых траекторий и фазовых портретов систем ука-занного класса. Эти свойства следуют из общих характеристик решений дифференциаль-

ных уравнений [10, 36].

Для систем вида (10.1) выполнены условия стандартных теорем существования и един-

ственности решения. Кроме того, они выполнены и для уравнений в «обратном» времени

τ =−t. Эти уравнения имеют вид dx/dτ=−Ax(τ). Отсюда следует, что решения уравнения(10.1) определены в области t ∈ (−∞,∞). Свойство стационарности системы приводит к то-

64

Page 65: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

му, что при построении фазовых траекторий начальный момент не существен – траектории,проходящие через некоторую точку x0 в различные моменты времени t1, t2, представляютсобой одну траекторию.

Поэтому:

• Через каждую точку пространства состояний проходит некоторая фазовая траек-тория. Следовательно, фазовый портрет системы может быть заполнен фазовыми траек-ториями сколь угодно плотно.

• Никакая фазовая траектория не имеет точек разветвления, т.е. она не может рас-падаться на другие траектории.

• Никакие различные траектории не могут иметь точек пересечения. Это свойствоследует из единственности решения уравнений в обратном времени. Поэтому для системуказанного вида текущее состояние однозначно определяет как будущее, так и прошлоеразвитие процесса.

Таким образом, различные фазовые траектории не могут пересекаться. Если у нихесть хотя бы одна общая точка, то такие траектории представляют собой участки некото-рой одной «более полной» траектории, построенной для более протяженного временного

интервала. 1 Коротко говоря, траектории либо не пересекаются, либо совпадают (с точно-

стью до продолжения), или, другими словами, через каждую точку фазового пространства

проходит одна и только одна фазовая кривая.

• Самопересекающиеся траектории соответствуют либо положениям (состояниям)

равновесия системы, и тогда они вырождаются в точку, либо периодическим движениям.

В первом случае выполнено, что для всех t ∈R : x(t)=x∗, где x∗ ∈ X не зависит от t. Во

втором случае существует некоторое значение T > 0, называемое периодом такое, что при

произвольном t имеют место равенства x(t)=x(t+T ), но при |t1−t2| < T хотя бы для одной

компоненты xi(t) выполнено xi(t1) �= xi(t2).

Фазовая траектория периодического процесса представляет собой замкнутую кривую,

называемую замкнутой траекторией, орбитой или циклом. Само решение x(t) называется

периодическим с периодом T.

1 Используется понятие максимальных (непродолжаемых) траекторий. Соответствующие им решенияне могут быть продолжены ни на какой более широкий интервал. Для линейных систем интервалом опре-деления максимальных траекторий является вся вещественная прямая R.

65

Page 66: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

10.2 Поле фазовых скоростей. Классификация особых точек

10.2.1 Вектор фазовой скорости

Как отмечено выше, решению x(t) соответствует движение точки в пространстве X . Пустьв момент времени t0 точка проходит состояние x0. Определим векторную скорость точки,

описывающей данное решение, в момент ее прохождения через положение x0 : v = x(t)∣∣t=t0

.

Значение вектора v, называемого вектором фазовой скорости или просто фазовой скоро-стью, зависит не от момента t0, а от координат точки, через которую в данный момент

проходит траектория. Эта зависимость выражается уравнением (10.1), из которого следу-

ет, что для автономных линейных систем вектор фазовой скорости в точке x определяетсяравенством

v(x)=Ax.

Поскольку вектор фазовой скорости показывает векторную скорость решения x(t), то, если

его изобразить относительно данной точки, получим направление касательной к фазовойтраектории, а модуль вектора скорости характеризует темп движения точки вдоль траек-тории.

Если в каждой точке пространства X изобразить соответствующую ей фазовую ско-рость, получим поле фазовых скоростей. Заметим, что для построения поля фазовых

скоростей нет необходимости решать дифференциальное уравнение (10.1), так как для

каждого x значение v(x) = Ax. Поле фазовых скоростей дает наглядное и удобное пред-ставление о поведении системы, так как касательные к траекториям позволяют достаточно

точно представить и вид самих траекторий. 2 В качестве примера на рис. 10.1 показаны

поле фазовых скоростей и фазовый портрет системы второго порядка. (Моделировалась

рассмотренная в [39] нелинейная система x+ 2x− 3x+ 4 sat(x) = 0, sat(·) – функция насы-щения).

10.2.2 Состояния равновесия системы

В пространстве состояний системы могут быть особые точки, в которых вектор фазовой

скорости обращается в ноль, v(x) = 0. Это условие эквивалентно тому, что данные точки

представляют собой состояния (положения) равновесия системы [10, 36]. Таким образом,

если для некоторой x0 выполнено v(x0) = 0, то имеется решение x(t) ≡ x0. Справедливо и

обратное утверждение – каждому решению x(t) ≡ x0 соответствует нулевой вектор фазовой2 На этом свойстве основан так называемый метод изоклин, являющийся приближенным графоанали-

тическим методом построения фазовых портретов нелинейных систем x = f(x) второго порядка. В связис развитием вычислительных средств к настоящему времени метод изоклин потерял свое значение.

66

Page 67: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 10.1 – Поле фазовых скоростей.

скорости в точке x0. Как отмечено выше, фазовые траектории в состояниях равновесия

вырождаются в точки, а векторы фазовой скорости «никуда не направлены» (в этом смысле

такие точки «особые»).

Рассмотрим состояния равновесия системы (10.1). Из изложенного ясно, что множество

X 0 = {x0} состояний равновесия этой системы определяется линейным уравнением

Ax0=0, (10.2)

где A – n×n-матрица, x0 – n-мерный вектор. Как известно из линейной алгебры [23, 29,

51], уравнение (10.2) имеет единственное тривиальное решение x0 = 0 в том и только том

случае, когда матрица A невырожденная: detA �= 0. Рассмотрим, что это означает с точки

зрения свойств динамической системы. Поскольку характеристический многочлен A(s),

т.е. знаменатель передаточной функции системы выражается равенством A(s) = det(sIn−A), находим, что A(0) ≡ an = (−1)ndetA. Значит, свободный член характеристического

многочлена с точностью до знака совпадает с определителем матрицы A. Если он не равен

нулю, то у системы (10.1) будет единственное нулевое состояние равновесия. Условие an=0

выполняется для звеньев интегрирующего типа. Именно для них возможны ненулевыесостояния равновесия. Рассмотрим это подробнее.

Так как для всех x0 ∈ X 0 имеет место равенство Ax0 = 0, то X 0 является нуль-про-

странством 3матрицы A , X 0 =N (A). Как известно, [23, 51], пространство N (A) является3 Нуль-пространством (аннулируемым пространством) N (A) матрицы A называется множество {x}

такое, что для всех x ∈ N (A) выполнено Ax=0 [23, 51]. Очевидно, что всегда точка {0} ∈ N (A).

67

Page 68: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

линейным подпространством пространства X . Размерность пространства N (A) равна раз-

ности между размерностью пространства X и рангом матрицы A : dimN (A) = n−rankA.

Таким образом, в зависимости от матрицы A (точнее, от ее ранга) состояния равновесия

линейной системы являются либо точкой {0}, либо прямой, содержащей эту точку, либо

плоскостью, проходящей через начало координат, либо линейным подпространством болеевысокой размерности.

10.2.3 Декомпозиция пространства состояний

Выше, в п. 7.2 использовалось понятие инвариантных подпространств. Рассмотрим егоболее подробно.

Напомним следующие положения [23, 51].

Определение. Пространство X является прямой суммой своих подпространств X1,

X2 , . . . , Xm (иногда записывают X =X1 ⊕ X2 ⊕ · · · ⊕ Xm), если :

• для всякого x ∈ X существует разложение x=x1+x2+· · ·+xm, где x1 ∈ X1, . . . , xm ∈Xm.

• это разложение единственно. (данное условие можно записать в эквивалентной бо-лее простой форме, а именно: если x= x1+x2+ · · ·+xm= 0, где x1 ∈ X1, . . . , x1 ∈ Xm, то

x1=x2= · · ·=xm=0).

Из единственности разложения следует, что всякие подпространства X1, . . . ,Xm имеют

общим лишь один элемент {0}.Если матрица A имеет в пространстве X инвариантные подпространства X1, . . . , Xm,

т.е. для всех x ∈ Xi выполнено Ax ∈ Xi, i = 1, 2, . . . , m, и если пространство X можнопредставить в виде прямой суммы инвариантных подпространств, то невырожденным пре-образованием матрица может быть приведена к блочно-диагональному виду. Справедливо

и обратное утверждение: если матрица имеет квазидиагональную (блочно-диагональную)

структуру, то пространство X разлагается на прямую сумму инвариантных (по отношению

к данной матрице) подпространств.

Если аннулирующий многочлен f(s) (см. 8) матрицы A разложить в произведение двух

взаимно-простых множителей: f(s) = f1(s)f2(s), то пространство X можно разложить в

прямую сумму двух подпространств X =X1 ⊕X2, инвариантных относительно матрицы A.

Если некоторый аннулирующий многочлен f(s) матрицы A представить в виде f(s)=m∏i=1

(s−si)ri, где si – все (различные) корни многочлена, а ri – их кратности, то пространство

68

Page 69: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

X разлагается на прямую суммуm подпространств X1, . . . ,Xm, инвариантных относительно

матрицыA, причем эти подпространства являются нуль-пространствами матрицы (siI−A)ri .Наконец, если аннулирующий многочлен f(s) матрицы A представить в виде

f(s)=

m∏i=1

(s−si)riq∏j=1

(s2−2αj+α2j+β

2j )pj ,

где si – все различные вещественные корни многочлена, а sj,j+1 = αj ± jβj, – различные

невещественные корни, то пространство X разлагается на прямую сумму инвариантныхподпространств

X =m∑k=1

X rk ⊕

q∑k=1

X cj .

Такому разбиению пространства состояний системы соответствует приведение матрицы A

к канонической форме Жордана (5.3).

Исходя из изложенного, пространство состояний X системы можно представить в виде

прямой суммы L инвариантных подпространств XAi , т.е. каждый вектор x ∈ X записать в

виде линейной комбинации x=∑L

i=1 αixi, где xi ∈ XAi , i=1, 2, . . . , L ( [4, 23]). Рассмотрим

связь этого разбиения с фазовыми портретами системы, обращая основное внимание наслучай простых собственных чисел.

Если матрица A имеет попарно различные корни характеристического многочлена, тонетривиальными вещественными инвариантными подпространствами наименьшей размер-

ности будут собственные прямые (для вещественных корней) и собственные плоскости

(для мнимых комплексно-сопряженных корней характеристического многочлена). Пусть

начальное состояние системы принадлежит собственной прямой Gi, соответствующей (про-стому) вещественному корню si, т.е. x0 = α0

ix0i , где α0

i ∈ R – некоторое число, а x0i – соб-

ственный вектор, отвечающий собственному значению si. Для вектора фазовой скорости в

этой точке можно записать v(x0) =Ax0 = α0i six

0i . Поэтому вектор фазовой скорости будет

направлен по этой же прямой. 4 и собственные прямые системы соответствуют некото-рым фазовым траекториям. Следовательно, вся фазовая траектория остается на прямой

Gi 5 При указанных начальных условиях нетрудно получить и формулу для процесса x(t).4 Подробное доказательство можно найти в [10].5 Заметим, что фазовая траектория принадлежит собственной прямой, но нельзя считать, что прямая Gi

является фазовой траекторией. Действительно, на прямой Gi лежат по крайней мере три непересекающиесяфазовые траектории: две из них находятся по разные стороны от начала координат, а третья есть точка{0}. Кроме того, при si = 0 каждая точка прямой Gi является отдельной фазовой траекторией.

69

Page 70: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Действительно, так как выполнено (10.1), то x(t) = six(t), x(0) = α0ix

0i . Отсюда получа-

ем решение x(t) = esitx(0). Это выражение можно записать и в следующем виде. Введем

функцию αi(t) ∈R как решение уравнения αi(t) = siαi(t), αi(0)=α0i . Тогда x(t) =αi(t)x

0i .

Очевидно, что αi(t) = esitα0i . Таким образом, изображающая точка будет двигаться вдоль

прямой Gi с коэффициентом αi(t). Направление движения определяется знаком si : при

si < 0 движение будет направлено к состоянию равновесия {0}, при si > 0 – от точки {0},а при si=0 – x(t) ≡ x0, и каждая точка прямой является состоянием равновесия. 6

Обобщая приведенные рассуждения, примем, что система обладает k простыми веще-ственными корнями. Как отмечено выше, им отвечает k линейно независимых собствен-

ных векторов и, соответственно, k собственных прямых [4, 23, 51]. Из линейности системыследует, что движение при произвольных начальных условиях можно представить, каксуперпозицию движений по собственным направлениям. Более подробно: если начальное

состояние x(0) принадлежит инвариантному подпространству, порожденному собственны-

ми векторами x01, x02, . . . , x0k, то это состояние можно разложить по базису, состоящему из

собственных векторов: x(0)=∑k

i=1 αix0i . Тогда решение x(t) имеет вид: x(t)=

∑ki=1 αi(t)x

0i ,

где αi(t)=esitα0i .

Если имеются простые мнимые комплексно-сопряженные корни характеристическогомногочлена, то они не определяют никакого собственного направления в вещественном про-странстве. Однако с помощью изложенного в п. 7.2 приема таким корням можно поставить всоответствие собственную плоскость, которая также является инвариантным подпростран-ством матрицы A. Рассуждая аналогично предыдущему случаю приходим к выводу, чтотраектория, начинающаяся на собственной плоскости будет ей всегда принадлежать.

Окончательно можно сделать вывод, что при отсутствии кратных корней характери-стического многочлена фазовую траекторию можно получить суперпозицией движений пособственным прямым и собственным плоскостям.

Случай кратных корней более сложен, так как при нем возможны ситуации, в которыхнельзя разложить пространство на сумму инвариантных подпространств размерности неболее двух.

В следующем параграфе вид фазовых траекторий на плоскости будет рассмотрен болееподробно.

6 Напомним, что здесь мы рассматриваем случай простых вещественных корней.

70

Page 71: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

10.3 Виды фазовых портретов для систем второго порядка

Рассмотрим линейные системы второго порядка, X =R2. Их состояние можно изобразить

в виде точки на плоскости 7.

Рассмотрим некоторые случаи.

Пусть собственные числа s1, s2 матрицы A действительны и отличны от нуля, s1 �= s2.

Тогда имеются единственное состояние равновесия в точке {0} и две несовпадающие соб-

ственные прямые G1, G2. Если si < 0, то движение изображающей точки по прямой Giнаправлено к состоянию равновесия, если si > 0 – от этого состояния. При si = 0 изобра-жающая точка на прямой Gi неподвижна. Отметим также, что точка, расположенная междунекоторыми лучами собственных прямых, в процессе движения всегда остается между ни-ми, так как по этим лучам проходят фазовые траектории, а различные фазовые траекториипересекаться не могут.

Более детальное описание фазового портрета системы зависит от знаков s1,s2.

1. Устойчивый узел. Если s1 < 0, s2 < 0, все фазовые траектории направлены к

состоянию равновесия – точке {0} – и асимптотически к нему приближаются (см. рис. 10.2,а). Система асимптотически устойчива. Такой фазовый портрет свойственен собственным

движениям апериодического звена второго порядка, имеющего передаточную функцию

W(s) =K

(T1s+1)(T2s+1), (T1 > 0, T2 > 0).

2. Неустойчивый узел. Если s1 > 0, s2 > 0, то картина фазовых траекторий то-же имеет вид узла, но направление движения меняется на противоположное. Такой типповедения свойственен неустойчивым системам. Пример – собственные движения звена спередаточной функцией

W(s) =K

(T1s−1)(T2s−1), (T1 > 0, T2 > 0).

3. Седло. Если знаки собственных чисел противоположны между собой, например,s1 > 0, s2 < 0, то по прямой G1 движение происходит от состояния равновесия, а по

прямой G2 – к этому состоянию (см. рис. 10.2, б). Несмотря на то, что здесь имеются7 Несмотря на то, что обычно исследуются системы более высокого порядка, изучение движений на

плоскости оказывается полезным. Действительно, при простых собственных числах матрицы A система«распадается» на ряд подсистем не выше второго порядка. Кроме того, часто при исследовании можнопренебречь малыми постоянными времени. Тогда поведение системы с достаточной для практики точно-стью описывается уравнениями второго порядка.

71

Page 72: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 10.2 – Фазовые портреты систем второго порядка.

траектории, направленные к началу координат и соответствующие затухающим процессам,седло свойственно неустойчивым системам. Пример – звено с передаточной функцией

W(s) =K

(T1s−1)(T2s+1), (T1 > 0, T2 > 0).

4. Один из корней имеет нулевое значение. Пусть, например, s1 = 0, s2 �= 0. Тогдапрямая G1 образует множество состояний равновесия системы и движения по ней не проис-ходит. Фазовый портрет состоит из прямых, параллельных G1. Если s2 < 0, то движение потраекториям направлено в сторону прямой G1, иначе – в противоположную сторону. Такиепроцессы свойственны устойчивому и неустойчивому интегрирующим звеньям с переда-точными функциями

W(s) =K

s(T2s+1)и W(s) =

K

s(T2s−1)

соответственно (T1 > 0, T2 > 0).

5. Оба корня равны нулю. Данный случай отвечает наличию у системы кратных соб-ственных чисел, и вид фазового портрета зависит от размера жордановых клеток. Если

жорданова форма матрицы A представлена двумя клетками первого порядка (т.е. матри-

ца Жордана нулевая), то фазовые траектории представляют собой точки на плоскости и

каждое состояние системы есть состояние равновесия. Примером такой системы являютсядва независимых между собой идеальных интегрирующих звена. Если жорданова клетка

72

Page 73: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

имеет размер два, то фазовые траектории представляют собой множество прямых, па-

раллельных собственной прямой. По этой прямой движения не происходит (она образует

множество состояний равновесия), а по разные стороны от нее изображающие точки дви-

жутся в противоположных направлениях. Такой характер фазовых траекторий свойствен

двойному интегрирующему звену W(s) =K

s2. Заметим, что если в первом случае система

нейтрально-устойчива, то во втором – неустойчива.

6. Кратные ненулевые вещественные корни. Если у системы имеются кратные нену-левые вещественные собственные числа s1= s2, то также возможны два существенно раз-личных случая. Если каноническая жорданова форма матрицы состоит из двух клеток

порядка один, то общее решение уравнения (10.1) имеет вид x(t) = es1t и описывает сово-

купность лучей, выходящих из начала координат. При s1= s2 < 0 движение происходит внаправлении к началу координат, а при s1 = s2 > 0 – в противоположную сторону. При-мером системы с таким типом фазовых траекторий является система, состоящая из двухнезависимых апериодических звеньев с равными постоянными времени.

Если каноническая жорданова форма матрицы состоит из одной клетки порядка два, тоимеется одна собственная прямая, на которой лежат фазовые траектории при соответству-ющих начальных условиях и множество кривых, заполняющие полуплоскости, разделенные

данной прямой (рис. 10.2, в). Такой вид фазового портрета в окрестности состояния рав-

новесия называется устойчивым вырожденным узлом – при s1 = s2 < 0 и неустойчивымвырожденным узлом – при s1=s2 > 0. Этот фазовых траекторий характерен для последо-вательно соединенных апериодических звеньев с одинаковыми постоянными времени, т.е.системе с передаточной функцией

W(s)=K

(Ts+1)2, или W(s)=

K

(Ts−1)2, (T > 0).

Рассмотрим теперь систему с мнимыми комплексно-сопряженными собственными чис-лами s1,2=α± jβ, β > 0. В этом случае также имеется единственное состояние равновесия

в точке {0}. Вид фазовых портретов зависит от значения α.7. Фокус. При α �= 0 получаем систему кривых, имеющих вид афинно-искаженных

логарифмических спиралей. При α < 0 движение происходит к состоянию равновесия

(устойчивый фокус), а при α > 0 – от этого состояния (неустойчивый фокус) (см. рис.

10.2, в).

73

Page 74: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Устойчивый фокус свойственен колебательным звеньям с передаточной функцией

W(s)=K

T 2s2+2ξTs+1, (0 < ξ < 1, T > 0, )

а неустойчивый – звеньям

W(s)=K

T 2s2−2ξTs+1

(с теми же диапазонами значений параметров).

8. Центр. При α=0 получаем систему замкнутых эллиптических траекторий с цен-тром в начале координат. Этим траекториям соответствуют периодические процессы с пе-

риодом 2π/β – незатухающие гармонические колебания. Примером может служить консер-

вативное звено с передаточной функцией W(s)=K

T 2s2+1.

Обратимся теперь к характерным особенностям фазовых портретов на плоскости при

каноническом представлении уравнений состояния. Рассмотрим диагональную (веществен-

ную жорданову) форму и каноническую форму фазовой переменной (см. 6), как наиболеераспространенные.

10.3.1 Фазовые портреты при диагональной (жордановой) форме матрицы A

В том случае, когда матрица A представлена в собственном базисе, построение фазовыхпортретов несколько упрощается. Например, можно получить достаточно простые форму-лы для фазовых кривых. Рассмотрим отдельно случаи вещественных и мнимых собствен-ных чисел.

1. Вещественные различные корни. Узел и седло.Выше, в п. 10.3 рассмотрены харак-терные виды фазовых портретов, в том числе – и при s1, s2 ∈R, s1 �= 0, s2 �= 0, s1 �= s2.

Уточним вид фазовых кривых при диагональной матрице A=diag{s1, s2} для этого случая.Как отмечено выше (см. 7.1), при вещественных различных корнях характеристического

многочлена матрицы ее собственные векторы направлены вдоль ортогональных коорди-

натных осей. Примем, что x10 = e1 = [1, 0]T , x20 = e2 = [0, 1]T . Уравнения состояния (10.1)тогда принимают вид

⎧⎪⎨⎪⎩dx1dt

= s1x1(t), x1(0)=x1,0dx2dt

= s2x2(t), x2(0)=x2,0.(10.3)

74

Page 75: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Исключая из (10.3) время (это можно сделать, формально «поделив» второе уравнение

на первое с учетом s1 �= 0), получим дифференциальное уравнение с разделяющимися

переменными. Принимая в качестве аргумента x1, получим выражение для x2 :

dx2dx1

=s2x2s1x1

,dx2x2

=s2s1

· dx1x1

,

ln|x2|= s2s1ln|x1|+ C1, откуда окончательно получаем выражение

|x2|=C|x1|s2s1 , (s1 �= 0, x1 �= 0). (10.4)

Выражение (10.4) описывает линии, на которых расположены фазовые кривые в указанных

случаях. Заметим, что при совпадающих знаках собственных чисел эти кривые имеют вид«парабол», а при разных знаках – «гипербол». Первый вид фазового портрета соответствует

узлу (устойчивому или неустойчивому), а второй – седлу.

Значение константы C в (10.4) определяется из начальных условий C = |x2,0| · |x1,0|−s2s1 .

При построении фазового портрета эту связь можно не рассматривать, а использоватьнабор различных значений C.

Выражение (10.4) применимо также, если один из корней (для определенности – s2)

обращается в ноль. Тогда (10.4) описывает множество параллельных оси абсцисс прямых.

Движение по этим прямым направлено либо к оси ординат (s1 < 0), либо от нее. По вы-

ражению (10.4) можно найти вид траекторий при кратных корнях, если A=diag{s1, s1}.Получается «пучок» прямых, проходящих через начало координат. Ось ординат представ-

ляет множество состояний равновесия. Для вещественной жордановой клетки A=[s1 10 s1

]вид траекторий более сложный [36] и формула (10.4) не применима.

2. Нулевые кратные корни. Представляет интерес второй из рассмотренных в пункте5 п. 10.3 случаев двойного интегрирующего звена, уравнения которого в жордановой форме

имеют матрицу A=

[0 10 0

]. Уравнения состояния тогда принимают вид

⎧⎪⎨⎪⎩dx1dt

= x2(t), x1(0)=x1,0,

dx2dt

= 0, x2(0)=x2,0.(10.5)

75

Page 76: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Отсюда получаем решения x1(t) = x1,0+x2,0t, x2(t) = x2,0. Фазовые траектории – прямые,

параллельные оси абсцисс, но движение по ним направлено «вправо» при x2,0 > 0 и «влево»

при x2,0 > 0. Точки на оси абсцисс служат состояниями равновесия системы.

3.Мнимые корни. Фокус и центр. Пусть теперь характеристический многочлен имееткорни s1,2 = α ± jβ, причем β > 0. Соответствующая вещественная жорданова форма

матрицы A=

[α β−β α

], а уравнения состояния –

⎧⎪⎨⎪⎩dx1dt

= αx1(t)+βx2(t), x1(0)=x1,0 ,

dx2dt

= −βx1(t)+αx2(t), x2(0)=x2,0 .(10.6)

При α=0 после исключения t и несложных преобразований получаем уравнение кон-

центрических окружностей с центром в начале координат x21+x22=C, C ≥ 0 ( центр). При

выбранном знаке β (β > 0) движение изображающей точки будет происходить по часовой

стрелке. В этом нетрудно убедиться, рассматривая, например, вектор фазовой скоростипри x1 > 0, x2=0.

При α �= 0 вид фазовых траекторий усложняется. Они представляют собой логарифми-ческие спирали, уравнения которых удобнее записывать в полярных координатах. Введем

ρ ≥ 0 – расстояние от начала координат до точки на кривой, ρ= |x|, ϕ – угол между этой

точкой и осью абсцисс. Тогда можно получить уравнения [36]

{ρ(t) = ρ(0)eαt, ρ(0)= |x(0)|,ϕ = ϕ(0)−βt , (10.7)

описывающие движение изображающей точки в параметрической форме. Исключив пара-

метр t (например, выразив его из второго уравнения), получим явную связь между по-

лярными координатами. При α < 0 все точки будут двигаться по траекториям к началу

координат (устойчивый фокус), а при α > 0 – «разбегаться» от него ( неустойчивый фокус).

Обратимся теперь к другой форме – канонической форме фазовой переменной.

10.3.2 Фазовые портреты при канонической форме фазовой переменной

Эта форма уравнений состояния соответствует представлениям УКП и НКП (которые для

автономных систем дают одинаковые уравнения состояния). Матрица A в данном базисе

имеет вид матрицы Фробениуса (6.1). Для систем второго порядка это означает, что A=

76

Page 77: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

[0 1

−a2 −a1], где a1, a2 – коэффициенты характеристического многочлена A(s)=s2+a1s+a2.

Такой матрице отвечают уравнения состояния⎧⎪⎨⎪⎩dx1dt

= x2(t), x1(0)=x1,0dx2dt

= −a2x1(t)−a1x2(t), x2(0)=x2,0.(10.8)

Перечислим некоторые особенности фазовых траекторий в указанном базисе.

• Поскольку переменная x2(t) совпадает с производной по времени от x1(t), изобра-

жающая точка будет двигаться только «по часовой стрелке», т.е. в сторону возрастания x1в верхней полуплоскости (где x2 > 0) и в сторону убывания x1 в нижней полуплоскости

(где x2 < 0).

• Фазовые кривые, пересекающие ось абсцисс (ось x1), имеют в точках пересеченияперпендикулярные к ней касательные.

• Состояния равновесия системы могут располагаться только на оси абсцисс.

• Точкам пересечения фазовой траекторией оси абсцисс соответствуют экстремумы

переходного процесса x1(t).

Рассмотрим более подробно случай простых вещественных собственных чисел. Пустьs1 �= s2, s1, s2 ∈ R. Как отмечено выше, при вещественных корнях характеристического

многочлена имеются собственные векторы x01=col{1, s1}, x02=col{1, s2}, линейно незави-симые при s1 �= s2. Соответствующие им собственные прямые лежат в первом и третьем

квадрантах (si > 0 – процесс расходится) или во втором и четвертом квадрантах (si < 0

– решение вдоль прямой затухает). Соответственно, получаем устойчивый или неустойчи-

вый узел, или седло. На рис. 10.3 показаны фазовые портреты и переходные процессы типа

«седло» (а), s1 = 1, s2 = −3 и «устойчивый фокус» (б), s1,2 = α ± jβ, α = −0.2, β = 1,

для системы (10.8). Одинаковыми буквами отмечены соответствующие точки на фазовой

плоскости и на графике переходного процесса.

В данном базисе по виду фазовой траектории можно получить и дополнительную ин-формацию о скорости протекания процесса. Например, время движения точки по отрезку

параллельной оси абсцисс прямой равно отношению длины этого отрезка (в соответству-

ющем масштабе) к значению ординаты x2. Далее, если рассматриваются две кривые на

участках с одинаковыми абсциссами, то время движения меньше по той из них, котораянаиболее удалена от оси абсцисс.

77

Page 78: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 10.3 – Фазовые портреты и переходные процессы в (10.8).

Данные рассуждения, вместе с приведенными в п. 10.3 позволяют получить достаточ-но наглядное представление о фазовых портретах в указанном базисе, но для точного по-строения траекторий их недостаточно. Здесь может оказаться удобным следующий метод.Вычисляется матрица преобразования T уравнений состояния к канонической жордано-

вой форме, для которой строится фазовый портрет (как указано в 10.3.1). Затем точки на

полученных траекториях обратным преобразованием с матрицей T−1 переводятся на исход-ную плоскость. Заметим, что данный метод можно использовать для построения фазовыхпортретов в любом базисе, а не только в базисе канонической формы фазовой переменной.

Достаточно просто можно представить вид фазовых траекторий и для систем третьегопорядка. При простых корнях характеристического многочлена имеются или три собствен-

ные прямые, определяемые векторами x01, x02, x

03, либо собственная прямая и плоскость,

порожденная векторами h1, h2 (как описано в 9.3). Движение точки в пространстве по-

лучается как суперпозиция движений по указанным подпространствам. Более детальные

сведения по этому вопросу приведены в [10].

78

Page 79: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 11

11 Решение уравнений состояния. Формула Коши

Рассмотрим линейную систему, заданную уравнением состояния

x(t)=A(t)x(t)+B(t)u(t), x(t0)=x0, (11.1)

где x(t) ∈Rn, u(t) ∈R

m. Нас интересует решение задачи Коши – т.е. определение функ-

ции x(t) по заданному начальному состоянию x0 при известном входном процессе u(t). 1

Рассмотрим вначале решение однородного уравнения.

11.1 Решение однородного уравнения

Рассмотрим уравнение

x(t)=A(t)x(t), (11.2)

x(t) ∈ Rn. Пусть нам известно n решений (11.2) относительно некоторого момента t0 :

xi(t0) = x0,i, i = 1, 2, . . . , n . Объединим эти решения xi(t) в n×n-матричную функцию

X(t) = [x1(t)... x2(t)

... . . .... xn(t)]. Из теории дифференциальных уравнений известен сле-

дующий результат [10, 36, 43] («альтернатива Вронского»): либо определитель Вронского

W(t) =detX(t)≡0 (для всех t), либоW(t) �= 0 (ни при каком t). Поэтому если векторы x0,i,

линейно независимы, то матрица X(t) будет невырожденной при всех t. Полученная таким

образом матрица X(t) называется фундаментальной матрицей системы (11.2). Это назва-

ние связано с тем, что вектор-функции xi(t) образуют фундаментальную систему решений

данного уравнения: решение задачи Коши при произвольных начальных условиях x0 мо-

жет быть выражено в виде линейной комбинации функций xi(t) : x(t)=∑n

i=1 αixi(t), где

αi есть коэффициенты разложения начального вектора x0 по системе базисных векторов

x0,i, ( т.е. x0 =∑n

i=1 αix0,i). С использованием фундаментальной матрицы X(t) это факт

можно записать в векторной форме: x(t)=X(t)C, где вектор C=[α1, . . . , αn]T определяется

из уравнения x0=X0C. Заметим, что матрица-функция X(t) удовлетворяет уравнению

X(t)=A(t)X(t), X(t0)=X0.

1 Отметим, что если процесс x(t) получен, то определение выхода системы y(t) не представляет слож-ности и выполняется непосредственно по уравнению выхода y(t)=C(t)x(t)+D(t)u(t).

79

Page 80: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Теперь введем матрицу Φ(t, t0) = X(t)X−10 , называемую переходной, или импульсной,

матрицей. Очевидно, что Φ(t0, t0)=In - единичная матрица. Фактически Φ(t, t0) есть фун-даментальная матрица, полученная, если в качестве начальных векторов x0,i использоватьединичные векторы

ei=[0, . . . , 1︸︷︷︸i

, . . . , 0]T .

Таким образом, для переходной матрицы выполнено уравнение

Φ(t, t0)=A(t)Φ(t, t0), Φ(t0, t0)=In. (11.3)

С учетом того что решение однородного уравнения определяется через фундаментальнуюматрицу и что коэффициенты разложения x0 по системе единичных векторов совпадают с

компонентами x(i)0 вектора x0, получим решение однородного уравнения (11.2) через пере-ходную матрицу в виде

x(t)=Φ(t, t0)x0. (11.4)

Чтобы воспользоваться полученным выражением, следует располагать способом вычисле-ния переходной матрицы. К сожалению, в общем случае нет аналитического выражения

для определения Φ(t, t0). В некоторых практических задачах можно решить (11.3) числен-

но, а затем использовать (11.4) при различных начальных условиях. Однако такой способ

связан с хранением больших объемов данных и имеет ограниченное применение. В неко-торых случаях целесообразно выражать решение в виде рядов. Существенное упрощение

получается в стационарном случае, т.е. при постоянной матрице A(t) ≡ A. Для таких си-

стем матрица Φ(t, t0) зависит только от одного аргумента τ= t−t0 и совпадает с матричнойэкспонентой Φ(t, t0)=eAτ , τ= t− t0, определяемой в виде ряда

eAτ =In+Aτ+(Aτ)2

2+· · ·+(Aτ)k

k!+· · ·≡In+

∞∑k=1

(Aτ)k

k!. (11.5)

Таким образом, для стационарных однородных линейных систем решение задачи Кошиопределяется формулой

x(t)=eAτx0, τ= t− t0 . (11.6)

Заметим, что поведение таких систем не зависит от начального момента времени t0 (а

только от временного промежутка τ= t−t0), поэтому в стационарном случае удобно считать

80

Page 81: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

t0=0 и выражение (11.6) записывать в виде

x(t)=eAtx0 . (11.7)

Вычисление матричной экспоненты является значительно более простой задачей, чем на-хождение переходной матрицы в общем случае. Так, для диагональной матрицы A =

diag{s1, s2, . . . , sn} матрица eAt также диагональная и состоит из скалярных экспонент:

eAt = diag{es1t, es2t . . . , esnt}. Достаточно простой вид матричная экспонента имеет и для

более общей, жордановой, формы матрицы A. Некоторые аспекты вычисления матричной

экспоненты в общем случае будут рассмотрены ниже (в 13), а сейчас обратимся к решению

неоднородного уравнения (11.1).

11.2 Решение неоднородного уравнения

Как известно, решение любого неоднородного линейного уравнения (11.1) можно предста-

вить в виде x(t)=x(t)+x(t), где x(t) – переходная составляющая – решение соответствующе-

го однородного уравнения (11.2) при заданных начальных условиях; x(t) – вынужденная

составляющая - решение уравнения (11.1) при нулевых начальных условиях. Оно имеет

вид [4, 8, 22, 29, 39]

x(t)=

∫ t

t0

Φ(t, τ)B(τ)u(τ)dτ .

Учитывая выражение (11.4), запишем следующую формулу Коши:

x(t)=Φ(t, t0)x0+

∫ t

t0

Φ(t, τ)B(τ)u(τ)dτ . (11.8)

Для стационарных систем эта формула принимает вид

x(t)=eA(t−t0)x0+∫ t

t0

eA(t−τ)Bu(τ)dτ, (11.9)

или, при t0=0, – x(t)=eAtx0+t∫0

eA(t−τ)Bu(τ)dτ. Рассмотрим небольшой пример.

Пример. Получим переходную характеристику апериодического звена первого порядка,

заданного передаточной функцией W(s) = 1Ts+1 . Этому звену соответствуют уравнения

81

Page 82: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

состояния x(t) = Ax(t)+Bu(t), y(t) = Cx(t), где A = −1/T, B = 1/T, C = 1. Полагая

x0=0, u(t) ≡ 1, получим по формуле (11.9)

x(t) =1

T

∫ t

0

e−(t−τ)/T dτ=e−t/T · eτ/T∣∣∣t0=1− e−t/T ,

что совпадает с известным выражением для переходной характеристики.

11.3 Свойства переходной матрицы

Приведем перечень основных свойств переходной матрицы.

1. Для всех t0 выполнено Φ(t0, t0)=In.

2. Правило композиции: для всех t0, t1, t выполнено

Φ(t, t0)=Φ(t, t1)Φ(t1, t0).

3. det Φ(t, t0) �= 0 для всех t0, t.

4. Φ(t, t0)=X(t)X(t0)−1, где X(t) – любая фундаментальная матрица.

5. Φ(t, t0)−1=Φ(t0, t) для всех t0, t.

6. Справедливо уравнение

Φ(t, t0)=A(t)Φ(t, t0), Φ(t0, t0)=In.

7. Матрица Φ(t0, t)T удовлетворяет следующему сопряженному уравнению

dΦ(t0, t)T

dt=−A(t)TΦ(t, t0)T , Φ(t0, t0)=In.

Данное свойство полезно при исследовании нестационарных систем, так как дает способполучения «сечений» переходной матрицы по аргументу t0.

8. Если det T �= 0, то Φ(t, t0) = T−1Φ(t, t0)T, где Φ(t, t0) удовлетворяет уравнению

(11.3), в котором вместо матрицы A(t) подставлена подобная ей матрица A(t)=TA(t)T−1.

В частности, это справедливо и для матричной экспоненты eT−1AT =T−1eAT.

9. В стационарном случае

Φ(t+τ, t0+τ)=Φ(t, t0), Φ(t, t0)=eA(t−t0)=eAt · e−At0 .

Рассмотрим теперь некоторые следствия из формулы Коши.

82

Page 83: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

11.4 Вычисление функции веса

Весовая (импульсная) функция w(t) обычно определяется, как реакция системы на

δ-образное входное воздействие при нулевых начальных условиях [8,11,29,33,42]. Эта функ-ция имеет много разных применений при исследовании систем автоматического управления

(САУ), и задача ее получения, например – численными методами, является актуальной.

Очевидная трудность состоит в том, что δ-функция Дирака не может быть реализована нааналоговых или цифровых моделирующих установках. Рассмотрим решение этой задачибез введения δ-функций во входное воздействие.

Предварительно сделаем следующее замечание. Выходной процесс системы y(t), и тем

более его производные diydti

, могут иметь разрывы при разрывном входном воздействии u(t).

Поэтому при определении w(t) указываются начальные условия до момента приложения

входного воздействия, т.е. принимается, что u(t) ≡ 0 при t < 0 и yi(0−) = lim t→0t<0

diydti

= 0,

i = 0, . . . , n−1. Что касается состояния системы x(t), то, как следует из формулы (11.9),

оно изменяется непрерывно, если u(t) не содержит разрывов второго рода. Действительно,

тогда интеграл в правой части (11.9) обращается в нуль при равенстве верхнего и ниж-

него пределов интегрирования. Поэтому в интересующем нас случае x(0) = x(0−). При

определении w(t) полагаем x0 = 0. Поскольку входное воздействие u(t) = δ(t) имеет раз-

рыв второго рода, значение x(0+) = lim t→0t>0

x(t) будет отличаться от x0. Чтобы опреде-

лить x(0+), используем основное свойство δ-функций: для любой непрерывной при t = 0

функции f(t) и t ≥ 0 выполнено∫ t0f(τ)δ(τ)dτ = f(0). Используя это свойство в фор-

муле (11.9) при u(t) = δ(t), x0 = 0, получим x(t) = eAtB. Теперь из уравнения выхода

y(t)=Cx(t) получим искомую весовую функцию в виде w(t)=CeAtB. Для несобственных

систем w(t)=CeAtB+Dδ(t). 2

Заметим теперь, что полученное выражение для x(t) совпадает с собственным движе-

нием системы при начальном состоянии x0=B. Значит, для вычисления весовой функции

можно решить однородное уравнение x(t)=Ax(t) при начальном условии x0=B и вычис-

лить w(t)=Cx(t); иначе говоря, следует промоделировать исходную систему при нулевом

входном воздействии и ненулевом начальном состоянии. Такой способ определения функ-2 Здесь предполагалось, что входной процесс скалярный, u(t) ∈R, следовательно, B – одностолбцовая

матрица. Данный результат легко обобщается на векторный случай, в котором подстановкой i-го столбцаматрицы B в найденное выражение для w(t) получим набор весовых функций wi(t) по каждому входу ui .

83

Page 84: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ции веса соответствует принятому в работах по теории дифференциальных уравнений под-ходу, согласно которому эта функция определяется как решение однородного уравненияпри соответствующих начальных условиях, а вид реакции системы на δ-функцию выво-дится в качестве следствия.

11.5 Определение начального состояния по начальному значению выходаи его производных

В ряде случаев исходное описание системы имеет вид дифференциального уравнения n-гопорядка:

dny(t)

dtn+a1

dn−1y(t)dtn−1

+· · ·+any(t)=b0dmu(t)

dtm+· · ·+bmu(t), (11.10)

для которого заданы начальные условия y(0−), y(0−), . . . , yn−1(0−). Требуется определитьначальное значение x0 вектора состояния системы

x(t)=Ax(t)+Bu(t), y(t)=Cx(t)+Du(t), x(0)=x0, (11.11)

эквивалентное данным начальным условиям с точки зрения реакции на входное воздей-ствие.

Для простоты изложения будем считать, что u(t) ≡ 0 при t < 0 и что входное воздей-

ствие не содержит δ(t). С учетом этого, для t < 0 из (11.11) получим

y(0−)=Cx0, y(0−)= x(0)=CAx0 , . . . , yn−1(0−)=CAn−1x0.

Таким образом, нами найдена система n уравнений относительно n неизвестных компонентначального вектора x0 ⎧⎪⎪⎨⎪⎪⎩

Cx0 = y(0−),CAx0 = y(0−),

· · ·CAn−1x0 = yn−1(0−).

(11.12)

Систему (11.12) удобно записать в матричной форме. Для этого введем матрицу

Q =

⎡⎢⎢⎣CCA· · ·

CAn−1

⎤⎥⎥⎦и вектор z = [y(0−), y(0−), . . . , yn−1(0−)]T . Тогда уравнение (11.12) принимает вид Qx0=z,

откуда получаем x0=Q−1z. Заметим, что задача имеет единственное решение, если матрица

84

Page 85: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Q невырожденная detQ �= 0. Как будет показано ниже, в 15.3, данное условие означает

полную наблюдаемость системы (11.11). Это приводит к некоторым ограничениям в выборе

базиса уравнений состояния. Например, если (11.11) имеет вид НКП (см. 6.2), то Q = In

при любых коэффициентах уравнения (11.10), следовательно, x0=z.

Заметим, кроме того, что при нулевых начальных условиях y(0−)= 0, y(0−)= 0, . . . ,

yn−1(0−)=0 выполнено z=0 и, соответственно, x0=0. Поэтому в распространенном случае

расчета реакций системы (11.10), имеющей нулевые начальные условия, начальное состоя-

ние x0 также равно нулю (кроме рассмотренной в п. 11.4 реакции на δ(t)).

85

Page 86: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 12

12 Дискретные модели непрерывных систем

Важным следствием из формулы Коши являются алгоритмы преобразования моделей си-стем, заданных в виде дифференциальных уравнений, к разностным уравнениям. Это пре-образование связано с задачей построения дискретных моделей непрерывных систем. Рас-смотрим ее более подробно.

12.1 Постановка задачи дискретизации

Пусть математическая модель системы имеет вид

x(t)=Ax(t)+Bu(t), y(t)=Cx(t)+Du(t), t ∈R. (12.1)

Требуется получить эквивалентную систему разностных уравнений: 1

x[k + 1]=Px[k]+Qu[k], y[k]=C ′x[k]+D′u[k], k=0, 1, . . . . (12.2)

Эквивалентность систем понимается в том смысле, что при соответствующих начальныхусловиях их реакции на одно и то же входное воздействие совпадают. Более подробно,

это означает, что при u[k]=u(tk), где tk=kT0, T0=const – интервал квантования, или

период дискретности, выполнено y[k]=y(tk) – решения уравнений (12.1) и (12.2) совпадают

при tk=kT0.

Перечислим ряд приложений, для которых решение этой задачи актуально.

1. Исследование импульсных систем. Импульсные системы фактически явля-ются системами непрерывного действия, но в силу прерывания измерений сигнала импульс-ным элементом они ведут себя, как нестационарные с периодически изменяемым коэффи-циентом. Существенно упростить исследование таких систем можно, если представлять ихдискретными моделями, описывающими процессы относительно моментов «срабатывания»импульсного звена.

2. Исследование цифровых систем управления. Это приложение являетсяодним из наиболее актуальных в связи с широким применением цифровых вычислительныхустройств в САУ.

1 Здесь и далее при указании на значение функции дискретного аргумента k = 0, 1, . . . последнийпомещается в квадратные скобки. Значения одноименной функции вещественного аргумента t ∈ R, призаписи которых использованы круглые скобки, могут быть, вообще говоря, другими.

86

Page 87: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

В таких системах управляющая ЭВМ работает в режиме реального времени совместно с

управляемой (непрерывной) системой. По принципу действия ЭВМ является устройством

дискретного времени и процесс преобразования в ней сигнала описывается разностнымиуравнениями. Таким образом, имеется «гибридная» система, модель которой имеет вид ди-фференциально-разностных уравнений. Распространенным методом исследования таких

систем является переход к единой форме описания как регулятора (закона управления),

так и объекта в виде разностных уравнений. Таким образом, в данном случае требуетсянайти дискретную модель управляемого объекта.

3. Синтез цифровых систем управления по непрерывной модели. Данныйподход является в некотором смысле альтернативным предыдущему. В соответствии с нимсистема в целом рассматривается сначала как непрерывная и для нее известными мето-дами теории непрерывных систем разрабатывается закон управления. Затем выполняетсяпереход к описанию полученного закона разностными уравнениями для цифровой реали-зации. После этого производится исследование синтезированной непрерывно-дискретнойсистемы, которое позволяет установить, насколько существенным является квантование

процесса управления на динамику. Отметим, что при достаточно малом (по сравнению со

временем t переходных процессов в замкнутой системе) интервале T0 это влияние обычно

оказывается незначительным и такой подход оправдан. 2 Данный метод находит широ-кое применение в близкой задаче синтеза цифровых частотно-избирательных фильтров по

аналоговому прототипу [15].

Обоснование и исследование применимости этого метода для широкого класса нелиней-

ных систем дано в рамках так называемого «метода непрерывных моделей» [19].

4. Численное решение дифференциальных уравнений. При решении диф-ференциальных уравнений на ЭВМ реализуется некоторая рекуррентная процедура. Этапроцедура описывается соответствующим разностным уравнением, которое может рассмат-риваться в качестве дискретной модели исходной непрерывной системы.

Следует отметить, что в общем случае поставленная выше задача не имеет точногорешения. Это связано с тем, что при дискретизации входного процесса теряется инфор-мация о его значениях между узлами квантования. Следовательно, выход дискретной мо-дели от этих значений зависеть не может, в то время как реакция исходной непрерывнойсистемы, естественно, зависит от всех значений входного процесса. Поэтому в общем слу-

2 В цифровых системах управления непрерывными объектами рекомендуется выполнение соотношенияT0 < 0.05t, так как в противном случае значения непрерывного процесса между «узлами» квантованиямогут существенно отличаться от рассчитанной дискретной последовательности. Другим ограничением наT0 является требование подавления возмущений и помех.

87

Page 88: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

чае неизбежна алгоритмическая ошибка. Однако имеются ситуации, в которых дискретнаямодель, в принципе, может быть построена точно. Для этого требуется, чтобы значения

процесса u(t) при tk−1 ≤ t < tk, tk = kT0 однозначно определялись последовательностью

{u(ti)}∣∣k−1

0. Из рассмотренных выше приложений это характерно для импульсных систем с

амплитудно-импульсной модуляцией первого рода, а также для цифровых систем управле-ния, если в качестве входного процесса рассматривается управляющее воздействие от ЭВМ.

Действительно, в последнем случае исходным является дискретный процесс u[k], который

преобразуется в непрерывный входной сигнал u(t) с помощью экстраполятора. Поэтому,

зная процесс u[k], можно однозначно восстановить u(t). Для других случаев характерна

методическая ошибка. Ее значение будет тем меньше, чем медленнее изменяется входнойпроцесс или чем меньше значение T0.

Перейдем к изложению некоторых результатов. Описанный ниже метод применим для

различных способов экстраполяции процесса u(t). Остановимся на простейшем и наиболее

распространенном случае использования экстраполятора нулевого порядка («фиксатора»),для которого

u(t)=u(tk) при tk ≤ t < tk+1, tk=kT0, k=0, 1, 2, . . . . (12.3)

12.2 Формулы перехода к разностным уравнениям

Рассмотрим задачу вычисления матриц P, Q, C ′, D′ в (12.2) по заданным матрицам

A, B, C, D в (12.1), исходя из сформулированного в п. 12.1 требования эквивалентно-

сти указанных систем по отношению к входному процессу u(t). Для простоты изложения

ограничимся кусочно-постоянными процессами вида (12.3). В классической теории управ-

ления известно решение этой задачи с использованием аппарата передаточных функций

и z-преобразования [11, 33, 42]. В соответствии с ним передаточная функция дискретной

модели WD(z) = (1−z−1)Z{W(s)s

}, где Z означает операцию z-преобразования переход-

ной функции исходной непрерывной системы. Рассмотрим решение аналогичной задачи наоснове метода пространства состояний.

Используя формулу Коши (11.9), проинтегрируем уравнение (12.1) на интервале

[tk, tk+1], полагая на нем u(t) ≡ u(tk) при x0=x(tk). Получим

x(tk+1)=eA(tk+1−tk)x(tk)+∫ tk+1

tk

eA(tk+1−τ)Bu(τ)dτ=

88

Page 89: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

=eAT0x(tk)+

(∫ tk+1

tk

eA(tk+1−τ)dτ)· Bu(tk).

Для вычисления интеграла введем новую переменную θ = tk+1 − τ. Тогда τ = tk+1−θ

и∫ tk+1

tk

eA(tk+1−τ)dτ =∫ T0

0

eAτdτ. Полагая вначале матрицу A невырожденной (detA �= 0),

получим что∫ T0

0

eAτdτ=A−1(eAT0−In), следовательно,

x(tk+1)=eAT0x(tk)+A−1(eAT0−In)Bu(tk), detA �= 0. (12.4)

Согласно уравнению выхода в (12.1), y(tk) = Cx(tk)+Du(tk). Сопоставим найденным длямоментов tk значениям непрерывного процесса значения переменных дискретной модели:

x[k] = x(tk), u[k] = u(tk), y[k] = y(tk). Сравнивая уравнение (12.2) с полученным выраже-

нием (12.4), находим, что матрицы P, Q, C ′, D′ определяются равенствами (при detA �= 0)

P =eAT0 , Q=A−1(P−In)B, C′=C, D′=D. (12.5)

Когда выполнен переход к (12.2), можно получить передаточную функцию дискретной

системы по приведенной в главе 3 формуле:

WD(z)=C (zIn−P )−1Q+D. (12.6)

Этот результат совпадает с указанным выше соотношением для WD(z), полученном на

основе изображения переходной функции, но он основан на использовании матричных опе-раций и уравнений состояния. Широкое применение излагаемого в настоящем параграфеметода обусловлено наличием достаточно эффективных вычислительных алгоритмов и ихпрограммной реализации.

При выводе формулы (12.5) для матрицы Q сделано предположение о невырожден-

ности матрицы A, которое является сильно ограничивающим. Прежде чем обсудить путипреодоления возникающих при этом трудностей, рассмотрим некоторые методы вычисле-ния матричной экспоненты.

89

Page 90: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 13

13 Методы вычисления матричной экспоненты

Как видно из предыдущих параграфов, матричная функция eAt находит широкое примене-ние при решении различных задач теории систем; следовательно, необходимо располагатьдостаточно эффективными алгоритмами ее вычисления. С некоторой условностью, мето-ды вычисления матричной экспоненты можно разбить на точные и приближенные. Точныеметоды предполагают получение точных выражений для матричной экспоненты через ска-лярные аналитические функции. Приближенные методы основаны на ее аппроксимации и

содержат алгоритмическую ошибку (значение которой зависит от способа аппроксимации

и параметров алгоритма).

13.1 Точные методы

Аналитическое выражение для матричной экспоненты eAt через скалярные элементарныефункции может быть получено достаточно просто, если исходная матрица A имеет ка-

ноническую форму Жордана, т.е. система (12.1) представлена в собственном базисе. Не

приводя эти формулы в общем виде, рассмотрим несколько важных частных случаев (см.,

например, [4, 22]).

1. Матрица A диагональная с вещественными собственными значениями.

Пусть A = diag{s1, s2, . . . , sn}, Imsi = 0, i = 1, . . . n. Непосредственным вычислением

суммы ряда (11.5) получаем, что eAt= diag{es1t, es2t, . . . , esnt}, где esit – скалярные экспо-ненты.

2. Матрица A блочно-диагональная с мнимыми собственными значениями.

Пусть сначала A=

[0 β−β 0

]; значит, собственные числа чисто мнимые, s1,2=±jβ, j2=

−1. Применяя опять формулу (11.5), убеждаемся, что справедливо выражение

eAt=

[cos βt sin βt− sin βt cos βt

].

Если матрица A имеет более общую форму A =

[α β−β α

](собственные числа

s1,2=α± jβ), то запишем ее в виде A=αIn+

[0 β−β 0

]. Учитывая, что единичная матрица

90

Page 91: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

коммутирует с любой квадратной матрицей, можем записать 1

eAt=eαInt · e

⎡⎣ 0 β−β 0

⎤⎦ t.

Теперь, используя приведенные в пп. 1,2 результаты, окончательно получаем

eAt=eαt[cos βt sin βt− sin βt cos βt

].

3. Матрица A имеет кратные вещественные собственные значения.

Пусть A=

⎡⎣0 1 00 0 10 0 0

⎤⎦ , т.е. si=0, i=1, 2, 3. Вычисляя степени этой матрицы получаем,

что

A2=

⎡⎣0 0 10 0 00 0 0

⎤⎦ , A3=A4= . . .=0n.2

Следовательно, ряд (11.5) точно выражается конечным числом слагаемых и

eAt=

⎡⎣1 t t2/20 1 t0 0 1

⎤⎦ .Если теперь рассмотреть более общий случай кратных вещественных собственных зна-

чений s1=s2=s3=α, α ∈R, т.е. если A=

⎡⎣α 1 00 α 10 0 α

⎤⎦ , аналогично п.2 получаем

eAt=eαt

⎡⎣1 t t2/20 1 t0 0 1

⎤⎦ .4. Матрица A имеет кратные мнимые собственные значения.

1 Следует обратить внимание на то, что выражение eA+B = eA · eB справедливо только для коммута-тивных квадратных матриц, т.е. таких, что AB=BA.

2 Квадратные матрицы, обладающие таким свойством, называются нильпотентными [23,51]. Известно,что все их собственные числа равны нулю.

91

Page 92: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Пусть матрица A порядка 4 имеет вид A =

[Aαβ I202×2 Aαβ

], где 2×2-матрица Aαβ =[

α β−β α

]. Матрица A имеет кратные собственные числа s1,2 = s3,4 = α ± jβ и имеет

вещественную форму Жордана. Поступая аналогично пункту 2, представим ее в виде

A =

[0 I20 0

]+

[Aαβ 00 Aαβ

]. Очевидно, что слагаемые в этой сумме коммутируют и мат-

ричная экспонента находится произведением экспонент соответствующих матриц. Оконча-тельно получаем

eAt=eαt

⎡⎢⎢⎣cos βt sin βt t cos βt t sin βt− sin βt cos βt −t sin βt t cos βt

0 0 cos βt sin βt0 0 − sin βt cos βt

⎤⎥⎥⎦ .Приведенные здесь примеры показывают, что выражения для матричной экспоненты

при жордановой форме матрицы имеют достаточно простой вид. В общем случае, когда

A=

⎡⎢⎣J1 . . . 0... . . . ...0 . . . Jl

⎤⎥⎦ , получим eAt=

⎡⎢⎣eJ1t . . . 0... . . . ...0 . . . eJlt

⎤⎥⎦ ,где J1, . . . ,Jl – клетки Жордана.

Если исходная матрица A имеет произвольный вид, то всегда существует невырожден-

ное преобразование с матрицей T такое, что подобная ей матрица A=TAT−1 – жорданова.

Тогда, по свойству 8 переходной матрицы (см. 11.3), получаем eAt=T−1eAtT. Так как имеют-

ся эффективные вычислительные алгоритмы приведения к диагональной форме (особенно,

если у матрицы A нет кратных собственных чисел), данный способ получения матричной

экспоненты представляется достаточно удобным. Другой способ вычисления опирается наприближенное представление экспоненты и будет рассмотрен в следующем параграфе.

Аналитические формулы для матричной экспоненты могут быть получены также на

основе преобразования Лапласа [4, 22, 39]. Этот метод основан на том, что резольвента

R(s) постоянной матрицы A является изображением по Лапласу ее матричной экспоненты:

L(eAt) = (sIn−A

)−1 (см. сноску 11 на с. 20). Поэтому элементы переходной матрицы можно

найти с помощью таблиц обратного преобразования Лапласа [11, 29, 33, 39, 42].

92

Page 93: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

13.2 Приближенные методы

Приближенные методы основаны на различных аппроксимациях ряда (11.5) выражениями,

содержащими конечное число слагаемых. Наиболее очевидной является аппроксимация

Тейлора порядка k, согласно которой ряд (11.5) приближенно заменяется конечной суммой

eAτ ≈ In+Aτ+(Aτ)2

2+· · ·+(Aτ)k

k!≡ In+

k∑i=1

(Aτ)i

i!. (13.1)

Например, при k=1 получаем линейное приближение

eAτ ≈ In+Aτ, (13.2)

которое будем называть аппроксимацией Эйлера 3.

Аппроксимация (13.1) не является наилучшей. Во многих отношениях более предпочти-

тельна более общая аппроксимация Паде. При такой аппроксимации экспонента ex пред-

ставляется рациональной функцией ex ≈ Fμν(x)Gμν(x)

с числителем Fμν степени μ и знаменате-

лем Gμν степени ν, определяемыми формулами

Fμν(x) = 1+μ

(μ+ν)1!x+

μ(μ−1)

(μ+ν)(μ+ν−1)2!x2+· · ·

+μ(μ−1) · · ·2 · 1

(μ+ν)(μ+ν−1) · · · (ν+1)μ!xμ,

Gμν(x) = 1− ν

(μ+ν)1!x+

ν(ν−1)

(μ+ν)(μ+ν−1)2!x2+· · ·

+ (−1)νν(ν−1) · · · 2 · 1

(μ+ν)(μ+ν−1) · · · (μ+1)ν!xν .

(13.3)

Соответственно, для матричного аргумента x=Aτ запишем

eAτ ≈ Fμν(Aτ)G−1μν(Aτ), (13.4)

где Fμν(Aτ), Gμν(Aτ) – матричные многочлены вида (13.3). В дальнейшем (13.4) будем

называть аппроксимацией Паде (μ, ν).

Приведем некоторые частные случаи (13.4). Прежде всего отметим, что аппроксимация

Тейлора (13.1) является частным случаем (13.4) при ν=0. Следовательно, формула метода3 Обоснование такого названия следует из аналогии с численным решением дифференциальных урав-

нений [8].

93

Page 94: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Эйлера (13.2) совпадает с аппроксимацией Паде (1, 0). Аппроксимация Паде (0, 1) имеетвид

eAτ ≈ (In−Aτ)−1 (13.5)

и в дальнейшем будет называться неявным методом Эйлера.

Аппроксимация Паде (1, 1) соответствует методу Тастина (см. также с. 103) и опре-

деляется формулой

eAτ ≈ (In+Aτ/2) (In−Aτ/2)−1, (13.6)

Формула Паде (2, 2) дает выражение

eAτ ≈ (12In+6Aτ+(Aτ)2

) (12In−6Aτ+(Aτ)2

)−1. (13.7)

Наконец, формула Паде (3, 3) приводит к соотношению (13.4), где

F3,3(Aτ)=120In+60Aτ+12(Aτ)2+(Aτ)3,

G3,3(Aτ)=120In−60Aτ+12(Aτ)2−(Aτ)3. (13.8)

Одним из преимуществ аппроксимаций Паде является их более высокая точность, чем

соответствующих (при k = max(μ, ν)) аппроксимаций Тейлора. Ошибка аппроксимации

(13.1) имеет порядок малости O(τk), а ошибка «диагональных» аппроксимаций (13.4) (μ, ν)

при μ=ν – порядок малости O(τ 2μ+1). Другим достоинством формулы Паде при ν �= 0 яв-ляется сохранение свойства устойчивости непрерывной системы при переходе к дискретноймодели.

Недостатком неявных методов является необходимость обращения матрицы Gμν(Aτ)

и связанная с этим проблема ее вырожденности. Следует, однако, иметь в виду, что су-ществуют достаточно эффективные алгоритмы обращения матриц и возникающие здесьдополнительные вычислительные затраты обычно оправданы. Что же касается возмож-ной вырожденности матрицы G, то заметим, что она имеет место, если у матрицы A есть

собственные числа, совпадающие с корнями γj многочлена Gμν(γ). Из (13.3) можно вы-

вести, что при μ = ν выполнено Reγj > 0, j = 1, . . . , ν. Следовательно, для устойчивых

непрерывных систем всегда выполнено detGμν(Aτ) �= 0. Если же система неустойчива, то

при вырожденности матрицы G следует использовать аппроксимацию с другими парамет-

рами μ, ν, либо несколько изменить значение τ. Заметим что при τ → 0 Gμν(Aτ) → In,

следовательно, выбор достаточно малого τ гарантирует detGμν(Aτ) �= 0.

94

Page 95: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

При вычислении матричной экспоненты может оказаться полезным предварительное

определение ее на малом интервале τ по формулам (13.1) или (13.4) (что дает высокую

точность) с последующим рекуррентным возведением в степень полученного результата

(метод Ракитского) [32]. Здесь используется свойство eAT0 =(eAτ

)k при T0=kτ.Предлагается также при определении высоких степеней матрицы A пользоваться тео-

ремой Кэли–Гамильтона [23], согласно которой каждая квадратная матрица удовлетворяет

своему характеристическому уравнению. Поэтому

An=−(a1An−1+a2An−2+· · ·+anIn

),

где ai – коэффициенты характеристического многочлена

det(λIn−A)=λn+ a1λn−1+ a2λ

n−2+· · · +an.Свойства дискретных моделей, основанных на приближенных методах вычислений eAτ ,

а также некоторые применения приведенных соотношений будут рассмотрены в 14. Сейчас

более подробно рассмотрим вопрос вычисления матрицы Q в (12.2), обращая внимание на

возможность detA=0.

13.3 Вычисление матрицы Q в общем случае

Напомним, что формула (12.5) для вычисления матрицы Q применима, если detA �= 0 .

Трудностей, связанных с вычислением Q при вырожденной матрице A, можно избежать,

если при формальной подстановке выражения для P =eAT0 , полученного из аппроксимаций

Тейлора (13.1) или Паде (13.4), в (12.5) произвести «сокращение» матрицы A. Тогда в

выражение для Q матрица A−1 входить не будет. Например, аппроксимация по методу

Эйлера (13.2) P = In + AT0 приводит к формуле Q = BT0, а аппроксимация Паде (1, 1)

(13.6) («метод Тастина») – к формуле Q=(In−AT0/2)−1BT0.

Другой способ состоит в расширении уравнений состояния исходной системы (12.1).

Входной процесс u(t) при tk ≤ t < tk+1 рассматривается как решение некоторого однород-

ного дифференциального уравнения. Тогда расширенная система тоже является однород-

ной и в вычислении по (12.5) нет необходимости. Искомые матрицы P и Q получаются какподматрицы «расширенной» матричной экспоненты.

Продемонстрируем этот подход для ступенчатого входного процесса u(t) = u(tk) при

tk ≤ t < tk+1. Для указанного промежутка времени уравнение (12.1) запишем в виде

x(t)=Ax(t) +Bu(t), x(tk)=x[k], tk ≤ t < tk+1,u(t)=0, u(tk)=u[k].

(13.9)

95

Page 96: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Введем расширенный (n+m)-мерный вектор состояния x(t)=col{x(t) , u(t)} и (n+m)×(n+m)-матрицу

A=

[A B

0m×n 0m×m

].

Уравнение (13.9) представим в виде

˙x(t)= Ax(t), x(tk)=col{x[k], u[k]}, tk ≤ t < tk+1. (13.10)

Соответствующая дискретная модель (аналогично (12.2)) принимает вид

x[k + 1]= P x[k], (13.11)

где P = eAT0 . Учитывая структуру матрицы A и формулу (11.5) для P , непосредственно

убеждаемся, что матрица P имеет следующую блочную структуру:

P =

[P ′ Q′

0 Im

].

С учетом этого из (13.11) находим, что

x[k + 1]=P ′x[k] +Q′u[k]. (13.12)

Сравнивая (13.12) с (12.2), видим, что матрицы P, Q в (12.2) совпадают с P ′, Q′. Поэтому

они могут быть получены, 4 как соответствующие подматрицы матрицы P =eAT0 .

Отметим также, что при использовании описанных в п. 13.1 аналитических методов,основанных на приведении матрицы A к канонической жордановой форме, в вычислении

Q по формуле (12.5) нет необходимости. В этом случае интеграл от матричной экспоненты

в (11.9) может быть найден аналитически и представлен элементарными функциями.

4 Oтметим, что данный метод вычислений реализован в программе c2d тулбокса CONTROL SYSTEMSпакета MATLAB [52].

96

Page 97: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 14

14 Дискретные модели для различных видов входного процесса

Выше основные результаты по переходу к дискретным моделям получены для систем с

экстраполятором нулевого порядка. Для таких систем выполнено (12.3). Рассмотрим неко-

торые обобщения результатов п. 12.2 для других видов входного процесса. Требование одно-

значности определения процесса u(t) по последовательности {u(ti)}∣∣k−1

0будем по-прежнему

считать выполненным.

14.1 Смещенное z-преобразование

В ряде приложений представляет интерес получение дискретной модели системы, в которой

значения x[k], y[k] соответствуют состоянию и выходу непрерывной системы не в моменты

времени tk=kT0 (как указано в 12.1), а в моменты tk,ε = (k+ε)T0, 0 ≤ ε < 1. 1 Итак, полагая,

как и ранее, входное воздействие кусочно-постоянным вида (12.3), получим разностные

уравнения, описывающие переход от состояния x(tk,ε) к состоянию x(tk+1,ε) при известном

u(t), tk,ε ≤ t < tk+1,ε. Для этого, как и в 12.2, проинтегрируем уравнение (12.1) на интервале

[tk,ε, tk+1,ε] по формуле (11.9). Получим

x(tk+1,ε) = eA(tk+1,ε−tk,ε)x(tk,ε)+∫ tk+1,ε

tk,ε

eA(tk+1,ε−τ) ·Bu(τ)dτ=

= eAT0x(tk,ε)+

∫ tk+1

tk,ε

eA(tk+1−τ)dτ · Bu(tk)+

+

∫ tk+1,ε

tk+1

eA(tk+1,ε−τ)dτ · Bu(tk+1).

Вычисляя интегралы, получаем аналогичное (12.4) уравнение

x(tk+1,ε)=Px(tk,ε)+Q1u(tk)+Q2u(tk+1),

y(tk,ε)=Cx(tk,ε)+Du(tk),

где по-прежнему P =eAT0 ; матрицы Q1, Q2 при detA �= 0 определяются соотношениями

Q1=A−1 (P − Pε) , Q2=A

−1 (In − Pε) , Pε=eAT0ε.

1 Рассмотренная в 12.1 задача является частным случаем данной при ε = 0. Обычно данная задачаназывается определением «смещенного z-преобразования».

97

Page 98: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Обозначив x[k] = x(tk,ε), y[k] = y(tk,ε), получим разностное уравнение

x[k+1]=Px[k]+Q1u[k]+Q2u[k+1],

y[k]=Cx[k]+Du[k], k=1, 2, . . . (14.1)

Отсюда передаточная функция дискретной модели получается в виде WD(z, ε) =

C (zIn−P )−1 · (Q1+Q2z)+D.

Прежде чем обратиться к вычислению Q1, Q2 в общем случае, заметим, что уравнение

(14.1) не имеет стандартного вида (12.2). Для устранения возникающих при этом неудобств

выполним преобразование (14.1) к виду (12.2). Обозначив x[k] = x[k]−Q2u[k], получим

x[k]= x[k]+Q2u[k] и

x[k+1]=P x[k]+(PQ2+Q1)u[k], y[k]=Cx[k]+(CQ2+D)u[k].

Данное уравнение имеет вид (12.2), где

P =eAT0 , Q=PQ2+Q1, C ′=C, D′=CQ2+D.

При вычислении матриц Q1, Q2 можно использовать метод, описанный в п. 13.3 Для

этого получим x(tk+1,ε), последовательно интегрируя уравнение (13.9) на интервале [tk,ε, tk+1]

при начальных условиях x(tk,ε)=x[k], u(tk,ε)=u[k] и на интервале [tk+1, tk+1,ε] при начальном

значении x(tk+1), полученном на конце первого интервала, взяв u(tk+1)=u[k+1]. В результатеполучаем разностное уравнение

x[k+1]=Px[k]+PεQ1−εu[k]+Qεu[k+1],

где Pε, Qε, Q1−ε – соответствующие подматрицы матриц Pε = eAT0ε, Pε = eAT0(1−ε).

Вычисления можно упростить, если учесть, что P =PεP1−ε.

14.2 Прямоугольные импульсы

Пусть теперь входное воздействие имеет вид

u(t)=

{u(tk) при tk ≤ t ≤ tk,γ, k=0, 1, 2, . . . ,0 при tk,γ < t ≤ kT0,

(14.2)

где 0 < γ ≤ 1 – скважность входного воздействия, tk,γ = (k+γ)T0.2 Снова приведем

уравнения состояния системы к виду (13.9). Проинтегрируем их на интервале [tk, tk,γ] при

начальных условиях x(tk) = x[k], u(tk,γ) = u[k] и на интервале [tkγ , tk+1], при начальном2 Входной процесс вида (12.3), рассмотренный в 12.2 является частным случаем (14.2) при γ=1.

98

Page 99: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

значении x(tk,γ), полученном на конце первого интервала и u(tk,γ)=0. Аналогично 13.3 14.1получаем разностное уравнение

x[k+1]=Px[k]+P1−γQγu[k], y[k]=Cx[k], k=0, 1, . . . , (14.3)

где P1−γ , Qγ – соответствующие подматрицы матриц

P1−γ=eAT0(1−γ), Pγ=eAT0γ.

14.3 Экспоненциальные импульсы

Получим дискретную модель системы при входном воздействии вида

u(t)=u(tk)e−α(t−tk) при tk ≤ t < tk+1, k=0, 1, 2, . . . , (14.4)

где α – параметр экстраполятора. Как и в 13.3, получим уравнения расширенной системы,которые в данном случае принимают вид

x(t)=Ax(t) +Bu(t), x(tk)=x[k], tk ≤ t < tk+1,u(t)=−αu(t), u(tk)=u[k].

(14.5)

Аналогично 13.3, вычисляя матричную экспоненту eAT0 , находим, что матрица P расши-ренной системы принимает вид

P =

[P ′ Q′

0 e−αT0Im

].

Приравнивая P =P ′, Q=Q′, получаем искомые матрицы дискретной модели (12.2).

14.4 Треугольные импульсы

Рассмотрим теперь входной процесс, имеющий вид прямоугольных треугольников с высо-

той u(tk) и основанием T0γ. Он описывается уравнением

u(t)=

⎧⎪⎪⎨⎪⎪⎩u(tk)

(1− t−tk

γT0

)при tk≤ t≤ tk,γ , k=0, 1, 2,. . . ,

0 при tk,γ < t ≤ kT0,

(14.6)

где tk,γ=(k+γ)T0. Значения x(tk) можно вычислить непосредственно, интегрируя (12.1) с

учетом (14.6); однако чтобы избежать обращения матрицы A, воспользуемся описанным в13.3 приемом.

99

Page 100: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Для tk ≤ t ≤ tk,γ запишем (14.6) в виде

x(t)=Ax(t) +Bu(t), x(tk)=x[k], tk ≤ t ≤ tk,γu(t)=v(t), u(tk)=u[k].v(t)=0, v(tk)=−u[k](γT0)−1.

(14.7)

Поступая аналогично п.п. 13.3 14.2 введем расширенный (n + 2m)-мерный вектор со-

стояния x(t) = col{x(t), u(t), v(t)

}и (n+2m)×(n+2m)-матрицу

A=

⎡⎣ A B 0n×m0m×n 0m×m Im0m×n 0m×m 0m×m

⎤⎦ .Интерируя расширенное однородное уравнение (14.7) на интервале t ∈ [tk, tk,γ], получим

дискретную модель с матрицей P вида

P =

⎡⎣ Pγ Q1,γ Q2,γ

0m×n Im ImγT00m×n 0m×m Im

⎤⎦ .Отсюда определяем значение

x(tk,γ)=Pγx(tk)+Q1,γu(tk)+Q2,γv(tk) = Pγx(tk)+Q1,γu(tk)−−Q2,γu(tk)(γT0)

−1 = Pγx(tk)++(Q1,γ−Q2,γ(γT0)

−1)u(tk).

Обозначив Qγ =(Q1,γ−Q2,γ(γT0)

−1), получим выражение для x(tk,γ): x(tk,γ)=Pγx(tk)+

Qγu(tk).

Для tk,γ < t < tk+1, (14.6) принимает вид

x(t)=Ax(t), tk,γ < t < tk+1,

следовательно, x(tk)=P1−γx(tk,γ).

Объединяя полученные выражения, получим разностное уравнение для x[k] вида (12.2),где матрицы

P =eAT0 , Q=P1−γQγ.

В работе [33] показано применение формулы Коши при построении дискретных моделей

для систем с произвольно заданной формой импульса. Решение задачи сводится к вычис-

лению матричной экспоненты eAT0 и интеграла∫ T00

eA(T0−τ)φ(τ)dτ, где функция φ(·) определяет вид импульсов, образующих входной про-цесс.

100

Page 101: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

14.5 Подстановочные формулы для вычисления передаточной функциидискретной модели

Выше, в 12.2 приведена формула (12.6), позволяющая вычислить передаточную функцию

дискретной системы по разностному уравнению (12.2), полученному преобразованием урав-

нений состояния непрерывной системы (12.1). Если исходная система задана передаточной

функцией W(s), то такой подход предполагает предварительное приведение W(s) к уравне-

ниям состояния. Для этого можно использовать описанные в 9 процедуры. Однако можно

получить приближенное решение задачи, при котором искомая функция WD(z) определя-

ется непосредственной заменой аргумента s вW(s). Эти формулы основаны на «линейных»

аппроксимациях Паде (μ, ν ), в которых значения μ и ν не превосходят единицы.

Вначале используем формулу (13.2). В соответствии с ней в (12.6) следует подставить

P =In+AT0 и, как отмечено в п. 13.3 Q=BT0. Отсюда получим

WD(z) = C (zIn−P )−1Q = C (zIn−In−AT0)−1BT0=

= C(z−1T0

In−A)−1

B.

Сравнивая полученное выражение с известной формулой

W(s) = C (sIn−A)−1B, убеждаемся, что WD(z) можно приближенно получить из W(s)

заменой аргумента

WD(z)=W(s)

∣∣∣∣s =

z−1

T0

. (14.8)

Если теперь применить формулу неявного метода Эйлера (13.5), то аналогично полу-чаем

WD(z) =1

z·W(s)

∣∣∣∣s =

z−1

zT0

. (14.9)

Наконец, аппроксимация (13.6) (Паде (1, 1 )) после несложных преобразований приво-

дит к подстановке метода Тастина:

WD(z) =2

z+1·W(s)

∣∣∣∣s =

2

T0· z−1

z+1

. (14.10)

Точность этих методов зависит от соотношения между интервалом T0 и наименьшей

постоянной времени непрерывной системы W(s). При разумном выборе T0 точность может

101

Page 102: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

оказаться достаточно высокой. Кроме того, формулы (14.9) и (14.10) сохраняют свойство

устойчивости модели при любом (а не только при достаточно малом) T0 > 0 [4, 8].

Интересно рассмотреть псевдочастотные характеристики полученных таким способомпередаточных функций дискретных систем. Как известно, эти характеристики получаются

w-преобразованием WD(z) и последующей подстановкой w= T02 · jλ, где j2=−1, а λ ∈

[0,∞) – псевдочастота [11, 29, 33, 42]. Поскольку, согласно w-преобразованию, z−1z+1 = w, a

2z+1=1−w, из формулы (14.10) получаем выражение

WD(jλ)=(1−T0

2jλ

)·W(jλ).

Таким образом, псевдочастотные характеристики дискретной системы приближенномогут быть построены непосредственно по частотным характеристикам исходной непрер-

ывной системы с введением дополнительного отрицательного фазового сдвига �ϕ(λ) =

−arctgT02 λ и изменением коэффициента передачи в

√1+

T 20

4λ2 раз. Этот подход, хоть и

является приближенным, позволяет учесть влияние квантования по времени в дискретнойсистеме и вместе с тем использовать хорошо разработанные процедуры синтеза непреры-вных систем управления для получения «непрерывных моделей» цифровых регуляторов.Точность данного метода определяется соотношением между частотой среза ω непрерыв-

ной модели (найденной с учетом указанной поправки) и интервалом квантования сигнала

управления T0. На этапе предварительного синтеза можно рекомендовать выполнение со-

отношения T0 ≤ 0.3ω−1.

З а м е ч а н и е. К подстановочным методам приближенного перехода от W(s) к

WD(z) относятся также методы, основанные на соотношении zi = esiT0 между полюсами

непрерывной системы si и ее дискретной модели zi. Действительно, сравнивая формулыдля фундаментальных составляющих решений однородного дифференциального и разн-

остного уравнений (yi(t) = P (t)esit и yi[k] = PD[k]zki соответственно), 3 убеждаемся, что

y(kT0) ≡ y[k] возможно, если zi= esiT0 при всех i=1, . . . , n. Следовательно, передаточные

функции W(s) и WD(z) должны иметь указанную связь между полюсами si и zi. Для чис-

лителей передаточных функций это соотношение не выполняется. Однако при достаточномалом T0 его можно приближенно распространить и на нули передаточных функций. Тогда

3 Здесь P (t), PD[k] – многочлены степеней, соответствующих кратностям si, zi.

102

Page 103: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

получаем подстановочную формулу WD(z)=W(s)∣∣s =

1

T0ln z

. Чтобы WD(z) была отноше-

нием многочленов от z, используется приближенное представление ln z. Например, можно

использовать аппроксимации ln z ≈ z−1, ln z ≈ z−1

zили ln z ≈ 2

z−1

z+1. Последняя аппрок-

симация приводит к формуле WD(z)=W

(2

T0· z−1

z+1

), известной в литературе как метод

Тастина . Полученная на с. 101 формула (14.10) отличается от указанной множителем2

z+1, позволяющем учесть характерное для дискретных систем фазовое запаздывание.

103

Page 104: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 15

15 Управляемость и наблюдаемость линейных систем

15.1 Основные определения

Понятия управляемости и наблюдаемости являются одними из основных понятий теорииуправления. На содержательном уровне управляемость означает принципиальную возмож-ность приведения системы в любое заданное состояние, а наблюдаемость – возможностьопределения состояния системы по результатам измерений. Эти свойства весьма суще-ственны для построения работоспособных систем автоматического управления. Приведем

некоторые определения [4, 17, 20, 22, 37].

Определение 1. Состояние x∗ достижимо из состояния x0, если существует допу-

стимое (кусочно-непрерывное) управление u[t0,t1], определенное на конечном промежутке

[t0, t1], 0 < t1−t0 < ∞ такое, что система под действием управления u[t0,t1] переводится из

начального состояния x(t0)=x0 в конечное x(t1)=x∗.

Определение 2. Система называется сильносвязной (вполне достижимой), если у нее

каждое состояние достижимо из любого другого. Другими словами, у подобных систем неттаких областей в пространстве состояний, в которые за конечное время нельзя попасть излюбых других областей под действием допустимого управления.

Для линейных систем понятие сильносвязности переходит в понятие полной управля-емости.

В качестве примера системы, для которой это свойство отсутствует, можно рассмотретьобъект, состоящий из звена с насыщением, последовательно соединенного с апериодическим

звеном: u1(t)=sat(u(t)), T x(t)+x(t)=u1(t) (u – управление, sat(·) – функция насыщения;рис. 15.1). Очевидно, что не существует функции u(t) такой, что из начальных состояний

{x0 : |x0| < 1} система переводится в область {x0 : |x0| > 1}. �

Рисунок 15.1 – Система с недостижимыми состояниями.

Как указано в п. 1 состояние детерминированной системы характеризуется тем, что при

104

Page 105: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

заданном начальном состоянии x(t0) = x0 выход системы y(t1) однозначно определяется

ее входом u(t) на промежутке [t0, t1]. Однако по отношению к x0, эта связь может бытьне взаимно-однозначной: может оказаться, что имеется множество различных состоянийтакое, что при любом начальном состоянии из этого множества и для любого входноговоздействия получаются одинаковые реакции.

Определение 3. Состояния x′0 и x′′0 называются эквивалентными, x′0 ∼ x′′0, если при

любом входном процессе u(t) выходы системы при начальном состоянии x(t0)=x′0 и x(t0)=

x′′0 совпадают (рис. 15.2).

Рисунок 15.2 – Эквивалентные состояния, x′0 ∼ x′′0.

Определение 4. Система называется редуцированной, если у нее нет различных эк-вивалентных состояний, т.е. каждое состояние эквивалентно только самому себе. Инымисловами, для редуцированных систем при любом входе и любом начальном состоянии отоб-ражение вход–состояние–выход не только однозначно, но и взаимно – однозначно.

Определение 5 (управляемости). Линейная система (ЛС) полностью управляема

(управляема), тогда и только тогда, когда для любых x∗ и t0 существуют 0 < T < ∞ и

кусочно-непрерывное управление u[t0,t1], t1 = t0 + T, такое, что при x(t0) = 0 и управлении

u[t0,t1] имеет место x(t1)=x∗.

З а м е ч а н и е 1. Для линейных систем это означает, что каждое состояние достижимоиз любого другого, т.е. управляемость для них эквивалентна сильносвязности.

З а м е ч а н и е 2. Если управляемая линейная система стационарна, то попадание в

105

Page 106: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

x∗ можно обеспечить за любое заданное T > 0.

В некоторых приложениях также представляет интерес управляемость по выходам,

которая означает возможность приведения выхода объекта в заданную точку. В работе [38]приводится группа различных понятий управляемости, куда кроме указанного понятияотносится также возможность приведения объекта из любой точки некоторой замкнутойобласти в произвольную точку этой области без выхода за ее границы, перехода из заданнойобласти в область меньшей размерности и т. д.

Определение 6 (наблюдаемости). ЛС полностью наблюдаема (наблюдаема) тогда и

только тогда, когда существует 0 < T <∞ такое, что при всех t0, x(t0), u[t0,t1], (t1= t0+T )

можно по y[t0,t1] и u[t0,t1] однозначно определить x(t0).

З а м е ч а н и е 3. Для стационарной наблюдаемой ЛС значение x(t0) можно определить

за любое заданное T > 0.

З а м е ч а н и е 4. Так как наблюдаемость, если она есть, должна быть и при нулевомвходе, можно считать, что система наблюдаема, если для нее по y[t0,t1] можно однозначно

определить x(t0) при u(t) ≡ 0. Можно показать: это условие эквивалентно тому, что из

y(t)=0 при u(t)=0 для всех t ∈ [t0, t1] следует: x(t0)=0.

Естественно, что для стационарных ЛС проверку условий управляемости и наблюда-

емости можно выполнять не для всех t0, а только для одного (например, t0=0). 1

Наиболее сильной формой управляемости является нормализуемость (нормальность).

Говорят, что система нормальна, если управляемость имеется по каждой компоненте век-тора управления. Для систем со скалярным входным процессом управляемость и норма-лизуемость совпадают.

Возможен случай частично управляемой системы, у которой не все состояния дости-жимы из нулевого за конечное время. Пространство состояний таких систем может бытьпредставлено как прямая сумма подпространств управляемых и неуправляемых состоя-ний. Аналогично пространство состояний частично наблюдаемой системы можно разбитьна подпространства наблюдаемых и ненаблюдаемых состояний.

Определение 7. ЛС называется стабилизируемой, если у нее подпространство упра-вляемых состояний принадлежит подпространству устойчивых состояний.

Стабилизируемость означает принципиальную возможность получения устойчивойзамкнутой системы: собственные движения неуправляемой части системы в этом случае

1 Для нестационарных систем рассматриваются также достижимость и восстанавливаемость [22], ко-торые в стационарном случае совпадают соответственно с управляемостью и наблюдаемостью. Посколькудалее рассматриваются, в основном стационарные системы указанные понятия здесь не уточняются.

106

Page 107: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

устойчивы, а на неустойчивую подсистему можно воздействовать соответствующим управ-

лением. Очевидно, что полностью управляемая система стабилизируема (так как у нее нет

неуправляемых состояний). Устойчивая система тоже стабилизируема, так как у нее всепространство состояний является подпространством устойчивых состояний.

Определение 8. ЛС называется обнаруживаемой, если у нее подпространство неупр-авляемых состояний принадлежит подпространству устойчивых состояний.

Полностью наблюдаемые, а также устойчивые системы обнаруживаемы.

Определение 9. Полностью наблюдаемая и полностью упраляемая линейная системаназывается невырожденной.

15.2 Критерии управляемости

Исследование управляемости линейных стационарных систем можно проводить на основеряда эквивалентных критериев. Ниже даны некоторые критерии управляемости стацио-

нарных систем [4, 17, 37].

1. (Критерий Калмана). Матрица управляемости

Q =[B,AB, . . . , An−1B

]размера (n×nm) (15.1)

имеет полный ранг, 1 rankQ=n, где n – размерность пространства состояний системы. Как

известно [22], подпространство управляемых состояний порождается столбцами матрицы

Q. Поэтому, если эта матрица имеет n линейно независимых столбцов, все пространство

состояний является подпространством управляемых состояний. Для SIMO-систем (со ска-

лярным управлением, u(t) ∈ R) матрица Q квадратная порядка n и данный критерий

означает требование невырожденности матрицы Q : detQ �= 0.

2. Не существует ни одной невырожденной матрицы T, det T �= 0, такой, что система,

полученная преобразованием подобия A=TAT−1, B=TB, имеет матрицы A, B вида

A=

[A11 A12

0n2×n1

A22

], B=

[B1

0n2×m

]. (15.2)

Такая структура матриц A, и B означает, что в соответствующем базисе вектор состоя-

ния x ∈ Rn можно представить в виде x = col{x1, x2}, x1 ∈ R

n1, x2 ∈ Rn2, n = n1+n2,

1 Напомним, что рангом матрицы называется наибольшее число линейно-независимых строк (или столб-цов) этой матрицы. Его значение совпадает также с порядком наибольшего отличного от нуля минораданной матрицы [4, 23, 29, 51].

107

Page 108: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

причем на компоненты вектора x2 входное воздействие ни прямо, ни косвенно (через x1)

влиять не может. Следовательно, такая система неуправляема по вектору x2. Множество

векторов col{0, x2} обазует подпространство неуправляемых состояний системы. Если это

подпространство принадлежит подпространству устойчивых состояний (т.е. матрица A22 –

гурвицева), 2 то система стабилизируема (неуправляемые движения затухают)

В литературе уравнения с матрицами A и B указанного вида иногда называются ка-

нонической формой управляемости [22, 53]. Структурная схема системы указанного вида

приведена на рис. 15.3, а).

Рисунок 15.3 – Канонические формы управляемости (а) и наблюдаемости (б).

3. Матрица B не принадлежит инвариантному подпространству матрицы A размер-

ности, меньшей, чем n. 3 Если вектор-столбец B принадлежит инвариантному подпро-

странству XA, dimXA < n, то вектор фазовой скорости v системы x(t) = Ax(t)+Bu(t)

будет принадлежать XA при любом входном процессе, если начальное состояние x0 ∈ XA.

Следовательно, точки вне этого подпространства недостижимы и система не полностьюуправляема.

4. Для любого многочлена D(s)=sn+d1sn−1+. . .+dn, где di ∈R – заданные постоянные

числа, найдется такая m×n- матрица K, что det(sIn−A+BK)=D(s).

2 Напомним, что гурвицевой называется матрица, все собственные числа которой имеют отрицательныевещественные части.

3 В таком виде критерий формулируется для систем со скалярным управлением. При m > 1 по этомукритерию не должно существовать инвариантного подпространства матрицы A размерности, меньшей, чемn, которое содержало бы одновременно все столбцы матрицы B.Определение инвариантного подпространства матрицы дано выше в п. 7.2 сноска на с. 49

108

Page 109: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Это свойство означает, что для полностью управляемой системы всегда имеет решениезадача модального управления по состоянию – обеспечения заданных значений коэффици-ентов характеристического многочлена замкнутой системы с помощью регулятора в цепи

обратной связи вида u(t)=−Kx(t). 4

5. Не существует ни одной отличной от нуля матрицы C такой, чтобы передаточная

функция W(s)=C(sI−A)−1B тождественно (для всех s) равнялась нулю.

6. Равенство CeAtB = 0 при всех t, t1 < t < t2 для некоторого C ∈ Rn возможно

только при C=0.

Функция веса (см. п. 11.4 с. 83) полностью управляемых систем с одним выходом об-

ращается в ноль на конечном интервале только в тривиальном случае C=0.

7. Выполнение соотношений ATz = λ0z и BTz = 0 для некоторого λ0 ∈ C и z ∈ Rn

возможно лишь при z=0 [17, 37].

Отсюда, в частности, вытекает следующий критерий:

8. Если пара (A, B) управляема, то для любой m×n-матрицы K пара (A+BK, B)также управляема.

Таким образом, замыкание управляемой системы обратной связью по состоянию u(t)=

Kx(t) при любой матрице K приводит также к управляемой системе.

9. Если пара (A,B) управляема и si – произвольное собственное число матрицы A,

то дефект d матрицы siIn−A не превосходит ранга матрицы B [17]. 5

В частности, если m=1 (или если при m > 1 rankB=1), то должно выполняться d=1,

т.е. из управляемости пары (A,B) следует, что каждому собственному значению si отвечает

лишь одна клетка канонической жордановой формы матрицы A.

10. Для любых t1 > t0 матрица

W(t0, t1) =

t1∫t0

eAτBBTeAT τdτ, (15.3)

называемая грамианом управляемости, положительно определена.

Для доказательства предположим, что указанное условие выполнено [17], W(t0, t1) =

W(t0, t1)T > 0 для всех t1>t0. Управление, u[t0,t1], переводящее систему из состояния x(t0) =

4 Более подробно решение этой задачи для скалярного управления рассматривается ниже в главе 175 Дефектом матрицы называется разность между ее порядком и рангом. Дефект матрицы siIn−A

равен числу жордановых клеток в канонической форме матрицы A, отвечающих собственному значениюsi.

109

Page 110: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

x0 в состояние x(t1) = x1 будем искать в виде u(t) = BTeAT (t1−t)C, где C – некоторый

постоянный n-мерный вектор. Согласно формуле Коши (11.9, с. 81) и в силу стационарности

системы x2 − eA(t1−t0) =∫ t1t0

eA(t1−τ)BBTeAT (t0−τ)dτ, или x2 − eAθ = W(θ), где

θ = t1 − t0 > 0, W(θ) = W(0, θ) =

∫ θ

0

eAτBBTeAT τdτ .

По условию W(θ) > 0, следовательно, detW(θ) �= 0 и поэтому C = W(θ)−1(x1 − eAθx0

).

Окончательно, получаем выражение для управления

u(t) = BTeAT (t1−t)W(θ)−1

(x1 − eAθx0

). (15.4)

Найденное таким образом управление решает задачу перевода полностью управляемой си-

стемы из любого начального состояния x(t0) = x0 в любое заданное x(t1) = x1 за указанный

положительный промежуток времени θ = t1−t0 для всех t1 > t0; следовательно, пара (A,B)управляема.

Заметим, что здесь приведено только доказательство достаточности положительной

определенности W(t0, t1) для полной управляемости системы. Необходимость этого усло-

вия, наряду с другими критериями доказывается [4, 17, 37].

Последний критерий можно использовать и для исследования управляемости нестаци-онарных систем в следующей формулировке.

Линейная система (с переменными параметрами)

x(t) = A(t)x(t)+B(t)u(t) полностью управляема тогда, и только тогда, когда для всех t0существует t1, (t0<t1<∞), что матрица

W(t0, t1) =

∫ t1

t0

Φ(t1, τ)B(τ)BT (τ)ΦT (t1, τ)dτ

невырожденная (здесь Φ(t, τ) – переходная матрица системы, см. п. 11.3).

Для SIMO-систем (u(t) ∈ R, m = 1) имеются также следующие критерии полнойуправляемости.

11. Для любой другой управляемой пары (A, B) такой, что det(sIn−A) ≡ det(sIn−A)существует единственная матрица преобразования T, det T �=0 такая, что A=TAT−1,

B=TB.

110

Page 111: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Матрица T определяется формулой T = QQ−1, где Q, Q−1 – матрицы управляемости

систем (A, B) и (A, B) соответственно. В частности, любую полностью управляемую ста-

ционарную SIMO-систему (m = 1) можно преобразовать к каноническому управляемому

представлению (см. п. 8.2), в котором матрица A – сопровождающая для своего характе-

ристического многочлена (матрица Фробениуса)

A=

⎡⎢⎢⎢⎢⎢⎣0 1 0 . . . 00 0 1 . . . 0...0 0 0 . . . 1

−an −an−1 −an−2 . . . −a1

⎤⎥⎥⎥⎥⎥⎦ ,

det(sIn−A)=sn+a1sn−1+· · ·+an,

а n×1-матрица B=[0, 0, . . . , 0, 1]T . 6

12. Всегда найдется такая (1×n)-матрица C, что передаточная функция

W(s)=C(sI−A)−1B =B(s)

det(sI−A) (15.5)

– несократимая дробь (т.е. не имеет общих нулей и полюсов и степень знаменателя W(s)

равна n).

13. Для любого заданного многочлена B(s) степени n− 1 всегда найдется такая

(1×n)-матрица C, что передаточная функция имеет вид (15.5).

Свойство 12 дает удобное достаточное условие полной управляемости систем со скаляр-

ным входом: если W(s) несократима, то система полностью управляема. Обратное можетоказаться неверным.

15.3 Критерии наблюдаемости. Теорема дуальности

Для исследования наблюдаемости систем также имеется несколько эквивалентных крите-

риев. В частности, по аналогии со свойством п.6 управляемости равенство CeAtx0=0 привсех t, t1, t2, t1 < t < t2 возможно только при x0=0. Следовательно, наблюдая за выходом

y(t) = Cx(t) такой системы при нулевом входе, всегда можно определить, находится лисистема в состоянии равновесия.

6 Полная управляемость пары (A, B) указанного вида всегда выполнена. В этом можно убедитьсянепосредственным использованием критерия п.1.

111

Page 112: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Другим критерием полной наблюдаемости является равенство rankQ = n, где n –

размерность пространства состояний системы, Q – матрица наблюдаемости, Q = [CT ,

ATCT , . . . , (AT )n−1CT ] размера n×nl. В частности, для MISO-систем (l=1) матрица наблю-

даемости должна быть невырожденной.

Анализируя указанные выше свойства, убеждаемся в справедливости теоремы дуаль-

ности Калмана, согласно которой из полной управляемости пары (A,B) следует полная

наблюдаемсть пары (AT , BT ), и, наоборот, из полной наблюдаемости пары (A,C) следу-

ет полная управляемость пары (AT , CT ). Поэтому нет необходимости рассматривать все

критерии полной наблюдаемости, достаточно в формулировках критериев управляемостипроизвести замену A на AT и B на CT .

Отсюда, в частности, получаем, что полностью наблюдаемую систему нельзя привестиневырожденным преобразованием к виду

A=

[A11 0n1

×n2

A21 A22

], C=

[C1...0l×n2

], n=n1+n2.

Данная пара матриц обладает тем свойством, что у соответствующей системы имеются

компоненты вектора состояния, которые ни прямо, ни косвенно (через другие компоненты)

не участвуют в формировании выходного процесса.

По аналогии со свойством управляемости уравнения с матрицами A и C указанного

вида называются канонической формой наблюдаемости [22, 53]. Соответствующая струк-

турная схема приведена на рис. 15.3, б).

Далее, для полностью наблюдаемой MISO-системы (y(t) ∈ R) всегда найдется

n×1-матрица B такая, что передаточная функция W(s) = C(sI−A)−1B – несократимая

дробь со степенью знаменателя, равной n. Таким образом, нетрудно показать, что несо-кратимость передаточной функции при m= l=1 является необходимым и достаточнымусловием невырожденности SISO-систем.

В общем случае MIMO-систем невырожденность системы соответствует выполнению

следующего условия для передаточных матриц [17].

Для любого собственного числа матрицы A существует такой минор M(s) матрицы

W(s), что

lims→si

A(s)M(s) �= 0, (15.6)

где A(s) = det(sIn−A) – характеристический многочлен матрицы A. Для SIMO и MISO-

112

Page 113: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

систем это свойство означает невозможность представления W(s) в виде отношения двух

многочленов (матричного и скалярного) со степенью знаменателя меньшей, чем n. Невы-

рожденность передаточной функции для SISO-систем вытекает отсюда как частный слу-чай.

Проверку условия невырожденности MIMO-систем можно упростить, если воспользо-

ваться следующим результатом [17].

Для полной управляемости системы (A, B) необходимо и достаточно, чтобы для

любого корня si многочлена A(s)=

det(sIn−A) у матрицы W(s) нашелся бы такой минор M(s) порядка, равного дефекту d

матрицы (siIn−A), что выполнено (15.6).З а м е ч а н и е . Пусть rB = rank(B), rC = rank(C). Выше отмечено, что если

хотя бы для одного корня si выполнено d > rB, то система (A, B) неуправляема, а если

d > rC , то система (A, C) ненаблюдаема. Поэтому передаточная матрицаW(s) может быть

невырожденной лишь при d ≤ rB и d ≤ rC . Значит, условие (15.6) имеет смысл проверять

лишь при выполнении указанных неравенств и для миноровM(s) порядка d. Если дефект d

неизвестен, то (15.6) следует проверять лишь для миноров, порядок которых не превосходит

max{rB, rC , pi}, где pi – кратность корня si [17].Подпространство ненаблюдаемых состояний системы представляет собой нуль-

пространство матрицы QT , т.е. является множеством таких x, что QTx= 0. Если система

полностью наблюдаема, то это подпространство вырождается в точку x=0.

Для проверки нормальности системы следует воспользоваться критерием управля-емости для матриц A, bi, где bi,

i=1, . . . , m – столбцы матрицы B.

Для проверки управляемости по выходам можно исследовать ранг матрицы L= [CB,

CAB, . . . , CAn−1B] [40].

113

Page 114: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 16

16 Оценивание состояния объекта и возмущений

16.1 Постановка задачи оценивания

При наличии информации о текущих значениях переменных состояния объекта можетбыть решена задача модального управления – обеспечения заданных значений коэффици-ентов характеристического многочлена. Кроме того, решение различных задач оптималь-ного управления процессами основано на использовании значений всего вектора состояния.Актуальной является также задача оценивания неизмеряемых возмущений для организа-ции комбинированного управления. В реальных условиях измерение вектора состояния, какправило, неосуществимо из-за необходимости установки датчиков в труднодоступных ме-стах, измерения производных высоких порядков и так далее. Еще более сложной задачей

является измерение возмущений. Преодолеть (или уменьшить) эти трудности можно, ес-

ли наиболее полно использовать имеющуюся априорную информацию о модели объекта итекущие измерения его входов и выходов. С этой целью в систему управления вводится

подсистема (алгоритм) оценивания состояния объекта и возмущений [4, 6, 8, 22, 33, 38, 40].

Различают три типа оценок состояния:• сглаживание – по текущим данным определяется поведение системы в прошлом,

т.е. по результатам измерений к моменту времени t оценивается состояние системы на мо-мент t−T, T > 0;

• фильтрация – по текущим данным определяется состояние системы в тот же самыймомент времени;

• прогноз – производится экстраполяция результатов измерений, т.е. по данным кмоменту времени t оценивается состояние системы в будущем, на момент t+T, T > 0.

Таким образом, оценивание является задачей восстановления состояния системы подоступной текущей информации о ее входах и выходах. Эта задача принципиально разре-шима, если имеется взаимно-однозначное соответствие между переменными вход-выход и

состоянием объекта. Это соответствие имеется для полностью наблюдаемых объектов. 1

В системах управления наиболее распространены оценки типа «фильтрация». При та-ких оценках темп оценивания совпадает с темпом получения информации, что существен-но для построения систем реального времени. Ниже будет рассматриваться именно задача

1 Кроме того, предполагается, что имеется достаточно полная априорная информация об объекте ввиде его математической модели и параметров. Задачи с неполной априорной информацией относятся кадаптивным..

114

Page 115: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

фильтрации применительно к линейным объектам управления.

Рассмотрим модель объекта в виде уравнений состояния:

x(t)=A(t)x(t)+B(t)u(t)+f(t),

y(t)=C(t)x(t)+v(t), x(t0)=x0, t ≥ t0. (16.1)

Здесь x(t) ∈ Rn – вектор состояния объекта; u(t) ∈ R

m, y(t) ∈ Rl - входной и выходной

векторы; A(t), B(t), C(t) – известные матричные функции. Объект подвержен действию

возмущений f(t) и «шума (погрешности) измерений» v(t). Считается, что при работе си-

стемы доступны измерению процессы u(t), y(t), а x(t), f(t), v(t) – недоступны. Рассмат-

ривается задача получения оценки состояния объекта x(t). Процесс x(t), полученный с

помощью некоторого алгоритма, должен в определенном (например, в асимптотическом)

смысле приближаться к процессу x(t) (x(t) → x(t) при t → ∞) независимо от исходного

начального состояния объекта x0. Как показано в следующем параграфе, для полностьюнаблюдаемого стационарного объекта при отсутствии возмущений можно получить асимп-тотически точную оценку состояния с любым заданным временем переходного процесса.2 Влияние возмущений и шумов измерения приводит к появлению ошибок оценивания.Некоторый анализ этого влияния будет дан в следующем параграфе.

З а м е ч а н и е . Уравнения (16.1) соответствуют системе непрерывного времени.

Задача оценивания рассматривается также для дискретных систем, поэтому ниже наряду

с (16.1) будут использованы разностные уравнения

x[k+1]=A[k]x[k]+B[k]u[k]+f [k],

y[k]=C[k]x[k]+v[k], x[t0]=x0, k=k0, k0+1, . . . (16.2)

Дискретный алгоритм оценивания задается разностным уравнением и служит для получе-

ния оценки состояния x[k].

16.2 Наблюдатели состояния

16.3 Наблюдатель полного порядка

Наблюдатель состояния (идентификатор состояния, наблюдающее устройство, наблюда-

тель) можно представить в виде модели объекта управления, на вход которой поступает то2 Более того, полная наблюдаемость теоретически позволяет построить алгоритм оценивания, обладаю-

щий конечным временем сходимости оценок состояния. Однако реализация такого алгоритма затрудненаиз-за влияния параметрических и координатных возмущений, а также сложностей вычислительного ха-рактера.

115

Page 116: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

же управляющее воздействие, что и на объект управления и, кроме того, дополнительный

сигнал коррекции (обратной связи). Этот сигнал получается из невязки между выходами

объекта и модели (рис. 16.1).

Рисунок 16.1 – Принцип построения и структурная схема наблюдателя.

Его влияние придает поведению модели качественно новые свойства (отличные от

свойств объекта). Собственные движения модели и объекта оказываются различными, но

переменные состояния модели служат оценками состояния объекта. Для систем непрерыв-ного времени наблюдатель описывается уравнением

˙x(t)=A(t)x(t)+B(t)u(t)+L(t)(y(t)−y(t)),y(t)=C(t)x(t), x(t0)= x0, t ≥ t0. (16.3)

Здесь x(t) ∈ Rn – вектор состояния наблюдателя, служащий оценкой состояния объекта;

y(t) ∈ Rl – вектор выхода; L(t) – n×l-матрица коэффициентов обратной связи по невяз-

ке между выходами объекта и наблюдателя. Синтез наблюдателя заключается в выборе

матрицы L(t).

Отметим, что мы рассматриваем наблюдатель, у которого размерность вектора состо-

яния такая же, как и у объекта (так называемый наблюдатель полного порядка, или на-

блюдатель Калмана). Однако это условие необязательно: встречаются наблюдатели как

пониженного порядка (см. ниже «наблюдатель Луенбергера»), так и повышенного порядка

(адаптивные наблюдатели) [8].

116

Page 117: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Для исследования работы наблюдателя рассмотрим ошибку оценивания ε(t) = (x(t)−x(t)). Вычитая из (16.1) уравнение (16.3), получаем уравнение для ошибки

ε(t)=(A(t)−L(t)C(t)) ε(t)+f(t)−L(t)v(t),ε(t0)=ε0 = x0−x0, t ≥ t0. (16.4)

Как видно из этого уравнения, источниками ошибки ε(t) являются начальное рассогласо-

вание ε0=x0−x0, возмущение f(t) и помеха измерений v(t). Динамика переходного процессаошибки ε(t) определяется матрицей A(t) = A(t)−L(t)C(t).

Исследуем поведение процесса ε(t) для стационарного случая, когда матрицы A,B,C, L

не зависят от времени. 3 Динамика переходного процесса в таких системах определяется

корнями характеристического многочлена наблюдателя det(sIn−A), т.е. собственными чис-лами матрицы A=A−LC. Если они имеют отрицательные вещественные части, а возму-

щения f(t) и шумы v(t) отсутствуют, то процесс оценивания асимптотически устойчив и

ε(t) → 0 при t→ ∞ для любых начальных значений x0, x0.Матрица A зависит от парамет-

ров объекта управления (матриц A, C в (16.1)) и матрицы L, выбор которой определяется

проектировщиком. Как следует из приведенных выше в п. 15.3 критериев, для полностьюнаблюдаемого объекта всегда имеется такая матрица L, что собственные числа матрицыA будут заданными. Следовательно, выбором L можно обеспечить требуемое быстродей-

ствие процесса оценивания. 4 При отсутствии сигнала коррекции (L=0) динамика процесса

оценивания полностью определяется динамикой объекта. В частности, для неустойчивыхи нейтрально-устойчивых объектов асимптотическое оценивание было бы неосуществимо.Матрица A, а следовательно и L, влияет также на точность процесса оценивания при внеш-

них воздействиях. Как видно из (16.4), это влияние оказывается разным по отношению к

возмущениям f(t), с одной стороны, и помехам измерений v(t) – с другой. Поэтому при

определении L следует учитывать характеристики внешних воздействий и обеспечиватькомпромисс между требованиями быстродействия и точности системы. Обычно повыше-ние быстродействия связано с увеличением элементов матрицы L и, следовательно, с по-давлением влияния возмущений и подчеркиванием действия помех измерения. Для болеедетального анализа можно использовать передаточные функции по ошибке от возмущений

3 Именно стационарные системы и будут рассмотрены в настоящей главе. Сведения о нестационарныхалгоритмах оценивания приведены, например, в [4, 22].

4 Следует, правда, отметить, что величина перерегулирования ε(t) может оказаться значительной. Времяпереходного процесса характеризует скорость затухания величины относительной ошибки.

117

Page 118: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

W εf (s) и помех W ε

v (s), определяемые формулами

W εf (s)=(sIn−A+ LC)−1 , W ε

v (s)=−(sIn−A+ LC)−1 L.

Оптимальный (в смысле минимума дисперсии ||ε(t)||) выбор матрицы L при действии слу-

чайных возмущений и помех приводит к оптимальному фильтру Калмана-Бьюси [22].

Рассмотрим определение L из условий быстродействия.

Характеристический многочлен наблюдателя представим в виде

det(sIn−A) ≡ det(sIn−A+LC)=sn+α1sn−1+· · ·+αn. (16.5)

Коэффициенты αi зависят от параметров объекта и матрицы L. Приравнивая их к задан-ным значениям, получаем систему n линейных алгебраических уравнений относительно ис-комых n·l элементов матрицы L. При полной наблюдаемости объекта данная система имеетрешение для любых A, C, αi (при l=1 это решение единственно). Если измерению доступно

несколько выходных переменных (l > 1), то матрица L определяется неоднозначно. Следо-

вательно, при выборе L можно учесть дополнительные требования по ошибкам от внешнихвоздействий и соответственно перераспределить коэффициенты передачи. Решение задачисинтеза можно выполнять алгебраическими методами с использованием специальных ка-

нонических форм уравнений состояния (см., например, [4]). Для определения желаемых

коэффициентов характеристического многочлена (16.5) рекомендуется использовать стан-

дартные формы, например биномиальную форму, или форму Баттерворта: [8, 22, 33]

det(sIn−A) =n∏ν=1

(sω0

− ej(π2+ 2ν−1

2nπ)

),

где параметр ω0 – среднегеометрический корень многочлена определяет быстродействиенаблюдателя.

Для дискретного объекта управления (16.2) наблюдатель состояния описывается раз-ностными уравнениями:

x[k+1]=A[k]x[k]+B[k]u[k]+L[k](y[k]−y[k]),y[k]=C[k]x[k], x(t0)= x0, t ≥ t0. (16.6)

В стационарном случае его динамика определяется характеристическим многочленом

det(zIn−A) ≡ det(zIn−A+LC), корни zi которого из условия устойчивости должны быть

118

Page 119: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

по модулю меньше единицы. Свойства дискретного наблюдателя и процедура синтеза ана-

логичны изложенным выше для непрерывного случая. Заметим, что для (16.6) матрица L

может быть выбрана из условия zi = 0, i= 1, 2, . . . , n , что дает конечное время переход-ного процесса оценивания, не превышающее nT0, где n – порядок системы, T0 – интервал

квантования. 5

Как отмечено выше, для построения систем оценивания, обладающих заданными дин-амическими свойствами, требуется полная наблюдаемость объекта управления. Если для

объекта это свойство не выполняется, но он является обнаруживаемым [8], то устойчи-

вость процесса оценивания может быть обеспечена, однако нельзя получить произвольное

заданное расположение корней многочлена (16.5).

16.4 Наблюдатели пониженного порядка

Выше рассматривались так называемые наблюдатели полного порядка, или наблюдате-ли Калмана, размерность вектора состояния которых совпадает с порядком уравненийобъекта и равна n. Можно уменьшить порядок наблюдателя, используя непосредственносодержащуюся в выходных переменных информацию о состоянии объекта. Это дает воз-

можность построить алгоритм оценивания порядка n−p, где p = rankC (обычно p = l.)

Такие идентификаторы состояния называются наблюдателями пониженного порядка, или

наблюдателями Луенбергера [4, 8, 53].

Рассмотрим стационарный полностью наблюдаемый объект, уравнения которого имеютвид

x(t) = Ax(t) + Bu(t), y(t) = Cx(t). (16.7)

Пусть ранг p×n-матрицы C равен p.

Для упрощения вида уравнения выхода выполним преобразование базиса в (16.7). Вы-

берем произвольную (n− p)×n-матрицу V так, чтобы матрица

T =

[VC

]была невырожденной. Последнее всегда возможно, так как rankC = p. Введем теперь

новый вектор состояния x(t) = Tx(t) и представим его в виде

x(t) =

[w(t)y(t)

] }n− p}p ,

5 Точнее говоря, переходный процесс завершается не более, чем за n шагов, что в системах реальноговремени с постоянным периодом квантования T0 соответствует указанному временному интервалу.

119

Page 120: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

где w(t) ∈Rn−p, y(t) ∈R

p, т.е. выходы объекта совпадают в выбранном базисе с последними

p компонентами его вектора состояния. Выполнив преобразование базиса с матрицей T ,перейдем к уравнениям состояния[

w(t)y(t)

]=

[A11 A12

A21 A22

] [w(t)y(t)

]+

[B1

B2

]u(t). (16.8)

Из этой системы можно выделить подсистему порядка n − p с известными (доступными

измерению) входами u(t), y(t). Более того, для этой подсистемы всегда можно обеспечить

заданные коэффициенты характеристического многочлена.

Для этого умножим второе уравнение в (16.8) на произвольную (n− p)×p-матрицу E и

сложим полученное выражение с первым уравнением. Получим

w(t)−Ey(t) = (A11 −EA21)w(t) + (A12 −EA22)y(t) + (B1 + EB2)u(t).

Это выражение можно переписать в виде

w(t)− Ey(t) = (A11 −EA21)(w(t)− Ey(t)

)+

+(A11E − EA21E+ A12 −EA22)y(t) + (B1 − EB2)u(t).

Введя v(t) = w(t)− Ey(t), получим

v(t) = (A11 −EA21)v(t)++(A11E − EA21E+ A12 −EA22)y(t) + (B1 − EB2)u(t).

(16.9)

Здесь v(t) – неизмеряемый вектор состояния, в то время как u(t), y(t) измеряются. Введем

наблюдатель, уравнение которого в точности повторяет уравнение для v(t), а именно

v(t) = (A11 −EA21)v(t)++(A11E − EA21E+ A12 −EA22)y(t) + (B1 − EB2)u(t).

(16.10)

Как и выше, вычитая (16.9) из (16.10), найдем уравнение для ошибки оценивания v(t)−v(t) :

˙v(t)− v(t) =(A11 − EA21

)(v(t)− v(t)

).

Из полученного уравнения следует, что v(t)− v(t) → 0, причем динамика ошибки опреде-

ляется собственными числами матрицы A11 −EA21.

Получив оценку вектора v(t), нетрудно перейти к оценке всего вектора состояния как

в каноническом (16.8), так и в исходном базисе. Оценки w(t), y(t) вектора x(t) получаютсяв виде

w(t) = v(t) + Ey(t), y(t) = y(t).

120

Page 121: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Обратным преобразованием с матрицей T−1 получаем оценку x(t) вектора состояния си-

стемы (16.7).

Качество полученной оценки состояния в значительной степени определяется матрицей

A11 −EA21. Можно показать [8], что если исходная система (16.8) полностью наблюдаема,

то этим же свойством обладает и пара (A11, A21). Следовательно, могут быть обеспечены

произвольно заданные значения коэффициентов характеристического многочлена наблю-дателя путем подходящего выбора матрицы E.

В [4,8] синтез наблюдателей Луенбергера рассмотрен более детально. Алгоритм состоитиз следующих шагов.

1. Уравнения состояния системы (матрицы A,B,C) невырожденным преобразовани-

ем приводим к виду ИКП (см. с. 44).

2. Задаемся желаемыми коэффициентами βi характеристического многочлена наблю-

дателя (det In−1 − A) = sn−1 + β1sn−2 + · · ·+ βn−1.

3. Строим матрицу преобразования P вида

P =

⎡⎢⎢⎢⎢⎣−βn−1

In−1 −βn−2

. . .−β1

0 . . . 0 1

⎤⎥⎥⎥⎥⎦ , P−1 =

⎡⎢⎢⎢⎢⎣βn−1

In−1 βn−2

. . .β1

0 . . . 0 1

⎤⎥⎥⎥⎥⎦ .

Нетрудно заметить, что если матрица A приведена к виду ИКП, то в результате пре-образования получим

A = PAP−1=

⎡⎢⎢⎢⎢⎣0 0 . . . 0 −βn−1 (α1−β1)βn−1 − αn1 0 . . . 0 −βn−2 (α1−β1)βn−2−αn−1+βn−1

. . . . . . . . . . . . . . . . . .0 0 . . . 1 −β1 (α1−β1)β1−α2+β20 0 . . . 0 1 −α1+β1

⎤⎥⎥⎥⎥⎦

и также B = PB =

⎡⎢⎢⎢⎢⎣b1 − βn−1bnb2 − βn−2bn

. . .bn−1 − β1bn

bn

⎤⎥⎥⎥⎥⎦ .

4. Из матрицы A выделим подматрицу A порядка n − 1, расположенную в верхнем

левом углу матрицы A, а также первые n-1 строк матрицы B, из которых образуем матрицу

121

Page 122: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

(вектор-столбец) B. Обозначим n− 1 верхние строки последнего столбца матрицы A черезan.

Запишем уравнения наблюдателя Луенбергера:

˙x(t) = Ax(t) + any(t) + Bu(t). (16.11)

Для вычисления оценки вектора состояния в исходном базисе (считаем, что исходная си-

стема уже имеет вид ИКП), сформируем вектор x(t) = col{x(t), y(t)}. Оценка состояния вбазисе ИКП тогда получается по формуле x(t) = P−1x(t).

16.5 Оценивание возмущений

Как видно из (16.4), неизмеряемые внешние воздействия (возмущения и помехи) приводят

к появлению дополнительных составляющих ошибки оценивания переменных состоянияи снижают точность системы управления. Уменьшить влияние возмущений можно, есливыполнять, наряду с оцениванием состояния объекта, также идентификацию неизмеряемыхвнешних воздействий.

Основная идея использования наблюдателей для оценивания возмущений и помех из-мерения состоит в следующем.

Для внешних воздействий, как и для объекта управления, строится некоторая мате-

матическая модель («модель внешней среды», или «internal model of disturbances»). Со-

гласно этой модели, возмущения представлются как решения системы однородных диффе-

ренциальных (или разностных) уравнений с известными коэффициентами и неизвестными

начальными условиями. В этих начальных условиях и содержится вся неопределенность

относительно внешних воздействий. 6 Таким образом, возмущения и помехи представля-ются, как выходы некоторой автономной динамической системы с заданными уравнениямии неизвестным начальным состоянием. Затем модель внешних воздействий объединяетсяс моделью объекта управления и для полученной расширенной системы строится наблю-датель. Полученные с помощью него оценки содержат как собственно оценки состояния

объекта, так и оценки внешних воздействий 7.

Подход к синтезу систем управления на основе постулирования динамических моделейдля отдельных подсистем и сигналов в настоящее время нашел широкое применение и

называется «принципом внутренних моделей» («internal model principle»). Для построения6 Случай неизвестных параметров модели среды рассматривается в рамках теории адаптивного оце-

нивания [8, 33, 38, 47, 48].7 Естественно, требуется полная наблюдаемость расширенной системы.

122

Page 123: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

эффективных алгоритмов проектирования, оценивания, управления системами модели ввиде уравнений состояния могут задаваться не только для возмущающих воздействий, но

и для помех измерений, командных сигналов («эталонные модели»), динамики изменения

параметров объекта и т.д. 8

Достаточно просто процедура синтеза выглядит, если внешние процессы можно пред-

ставить как квазимногочлены – выражения видаN∑i=1

eλitPi(t), где λi ∈ C – известные по-

стоянные, Pi(t) - многочлены с заданными коэффициентами. Сюда относятся степенные

функции, гармоники с заданной частотой, экспоненты с заданным показателем затухания,произведения гармоник на экспоненты и линейные комбинации этих функций. Моделя-ми источников таких процессов являются линейные дифференциальные уравнения с по-стоянными коэффициентами. Рассмотрим процедуру оценивания для этого случая болееподробно.

Пусть внешние воздействия f(t), v(t) можно представить в виде выходных процессовлинейной системы, заданной уравнениями

xs(t)=As(t)xs(t), ys(t)=Csxs(t), xs(t0)=xs0 , t ≥ t0. (16.12)

Здесь xs(t) ∈Rns – вектор состояния «среды», ys(t) ∈R

n+l - выход модели источника воз-

мущений – вектор внешних по отношению к объекту воздействий; ys(t) = col{f(t), v(t)},

As, Cs – известные матрицы, Cs=[CfCv

]; Cf , Cv – подматрицы размеров n×ns, l×ns, опре-

деляющие связь между состоянием xs(t) модели внешних воздействий и возмущениями

f(t), помехами v(t) в (16.1). Начальное состояние xs0 системы (16.12), как и (16.1), считает-

ся неизвестным. Введем расширенный («совокупный») вектор состояния объекта и среды

x(t) = (x(t), xs(t)) ∈Rn+ns. Объединяя уравнения (16.1), (16.12), получим уравнения рас-

ширенной системы в виде

˙x(t)= Ax(t)+Bu(t), y(t)= Cx(t), x(t0)= x0, t ≥ t0, (16.13)

в которых матрицы A, B, C имеют следующую блочную структуру:

A=

[A Cf

0ns×n As

], B=

[B

0ns×m

], C=[C, Cv].

8 Иллюстраций применения этого принципа может служить и алгоритм перехода к дискретной модели,описанный в 13.3

123

Page 124: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Расширенная система (16.13) рассматривается как некоторый новый объект порядка n =

n+ns, для которого строится наблюдатель (16.3).

124

Page 125: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 17

17 Синтез модальных и терминальных регуляторов

17.1 Задача модального управления

Характер переходных процессов в системе определяется расположением корней si ее харак-

теристического многочлена. 1 Действительно, решение y(t) однородного дифференциаль-

ного уравнения n-го порядка имеет вид y(t)=∑n

i=1Ciyi(t), где постоянные Ci определяются

начальными условиями, а составляющие yi(t) («моды») имеют вид yi(t) = esit - при простых

si или yi(t) = Pi(t)esit – при кратных корнях (здесь Pi(t) – многочлены, степени которых

определяются кратностью корня). Поэтому обеспечение «хороших» переходных процессов в

системе может быть достигнуто если характеристический многочлен имеет заданные корни.Это непосредственно приводит к условию получения заданных коэффициентов характери-стического многочлена замкнутой системы. Регуляторы, построенные исходя из указанноготребования, называются модальными регуляторами.

17.2 Модальное управление по состоянию объекта

Рассмотрим вначале решение этой задачи при полном измерении вектора состояния объ-екта. Для простоты изложения будем также предполагать, что управление скалярное,

u(t) ∈R.

Пусть динамика объекта управления описывается уравнением

x(t)=Ax(t)+Bu(t). (17.1)

Вектор состояния x(t) объекта (17.1) считаем доступным измерению. Рассмотрим законуправления вида

u(t)=−Kx(t), (17.2)

гдеK – подлежащая определению n×l-матрица коэффициентов регулятора (в нашем случае

m = 1). Замкнутая система объект-регулятор описывается уравнением

x(t)=(A−BK)x(t). (17.3)

Ставится задача определения коэффициентов регулятора (элементов матрицы K) таких,

что характеристический многочлен det(sIn − A+BK) = D(s) = sn+d1sn−1+ . . .+dn−1+dn

1 Здесь рассматриваются стационарные системы.

125

Page 126: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

имел заданные коэффициенты di. Принципиальная возможность решения этой задачи для

полностью управляемых объектов следует из указанного в 15.2 свойства 4. 2

Рассмотрим процедуру синтеза более подробно.

Предположим вначале, что уравнения (17.1) соответствуют управляемому канониче-

скому представлению, т.е. матрицы A, B имеют вид

A=

⎡⎢⎢⎢⎢⎢⎣0 1 0 . . . 00 0 1 . . . 0...0 0 0 . . . 1

−an −an−1 −an−2 . . . −a1

⎤⎥⎥⎥⎥⎥⎦ , B=

⎡⎢⎢⎢⎢⎢⎣00...01

⎤⎥⎥⎥⎥⎥⎦ , (17.4)

det(sIn −A) = sn + a1sn−1 + · · ·+ an. При использовании регулятора (17.2) с матрицей

K = [k1, k2, . . . , kn], как легко убедиться непосредственной подстановкой, матрица A − BK

замкнутой системы (17.3) также имеет вид матрицы Фробениуса и ее характеристический

многочлен det(sIn − A+BK) = = sn+(a1+kn)sn−1+. . .+(an−1+k2)s+an+k1. Приравнивая

коэффициенты зтого многочлена заданным значениям di, сразу получаем выражения дляпараметров регулятора: ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

k1 = dn−an,k2 = dn−1−an−1,

· · ·kn−1 = d2−a2,kn = d1−a1.

(17.5)

Пусть теперь уравнения состояния системы записаны в произвольном, а не в канони-

ческом базисе. По-прежнему предполагаем полную управляемость объекта (17.1). В этом

случае, согласно свойству 8 управляемых систем (см. п. 15.2), имеется матрица T пре-

образования подобия, приводящая уравнения состояния к указанному каноническому ви-

ду.3 Следовательно, полагаем, что матрицы A= TAT 1, B= TB имеют вид (17.4), причем

det(sIn−A) ≡ det(sIn−A). Найдем для системы (A, B) коэффициенты модального регуля-

тора K по формуле (17.5). После этого выполним переход к исходному базису. Для этого

заметим, что поскольку x(t)=Tx(t), то u(t)=−Kx(t)=−KTx(t)=−Kx(t), если

K=KT. (17.6)2 Оттуда же следует, что если объект не обладает полной управляемостью, получить любые заданные

коэффициенты многочлена D(s) в принципе невозможно.3 Формула для вычисления матрицы T через матрицы управляемости приведена там же.

126

Page 127: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Таким образом, для полностью управляемой системы со скалярным управлением полученалгоритм решения задачи модального управления. Этот алгоритм включает:

– вычисление коэффициентов характеристического многочлена системы;

– вычисление матрицы преобразования к канонической форме (если исходные урав-

нения имеют неканонический вид);

– вычисление коэффициентов регулятора по формулам (17.5), (17.6).

Вместе с тем здесь содержится доказательство того, что для полностью управляемых

систем (со скалярным управлением) свойство 4 выводится из свойства 11. Отметим также,что в силу дуальности задач управления и оценивания изложенный здесь метод применим ив рассмотренной в п. 16.2 задаче синтеза наблюдателя состояния. Более подробные сведения

по этому вопросу приведены в [4].

Определение значений желаемых полюсов замкнутой системы является самостоятель-ной задачей, решение которой связано с предъявляемыми к системе требованиями.

Изложенные в настоящем параграфе результаты непосредственно переносятся на реше-ние задачи модального управления для дискретных систем. Для стационарных дискретныхсистем имеется возможность получить конечное время переходного процесса. Это обеспе-чивается выбором характеристического многочлена замкнутой дискретной системы с ну-левыми коэффициентами, что дает время переходного процесса, не превышающее n шаговдискретности.

17.3 Модальное управление по выходу объекта. Теорема разделения

Рассмотрим теперь более характерную для практики задачу, когда измерению доступен

не вектор состояния x(t), а выход объекта y(t). Объект будем считать невырожденным

(полностью управляемым и наблюдаемым). В этом случае представляется естественным

использовать в законе управления не сами переменные состояния объекта x(t), а их оценки

x(t), полученные с помощью наблюдателя (рис. 17.1). Уравнения замкнутой системы тогдапринимают вид

x(t) = Ax(t)+Bu(t), y(t)=Cx(t), x(t0)=x0, (17.7)

u(t) = −Kx(t), (17.8)

˙x(t) = (A−LC)x(t)+Bu(t)+Ly(t), x(t0)= x0. (17.9)

Уравнения (17.8), (17.9) описывают регулятор, входом которого является процесс y(t), вы-

ходом – управляющее воздействие u(t).

127

Page 128: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 17.1 – Система стабилизации с динамическим компенсатором.

В отличие от регулятора (17.2) данный регулятор является динамической системой,

порядок которой совпадает с порядком уравнений объекта управления (17.7). Регуляторы

такого вида называются иногда динамическими компенсаторами [33]. 4

Возникает вопрос: каковы динамические свойства системы (17.7)–(17.9), как влияет на

свойства системы замена в модальном регуляторе значений состояния на его оценки? Дляответа на него найдем характеристический многочлен замкнутой системы.

Упростить вычисление данного многочлена можно преобразованием уравнений состоя-

ния. Для этого снова используем ошибку оценивания ε(t)=x(t)−x(t). Тогда можем записать

x(t)=x(t)−ε(t), и уравнения (17.7) – (17.9) преобразуются к виду

x(t) = Ax(t)+Bu(t), x(t0)=x0, (17.10)

u(t) = −Kx(t)+Kε(t), (17.11)

ε(t) = (A−LC)ε(t), ε(t0)=x0−x0. (17.12)

Переход от уравнений (17.7)–(17.9) к (17.10)–(17.12) соответствует преобразованию вектора

состояния системы (17.7)–(17.9) x(t) = col{x(t), x(t)

}к вектору x(t) = col

{x(t), x(t)−

x(t)}=col

{x(t), ε(t)

}, которое, конечно, является невырожденным. Относительно вектора

x(t) получим однородную систему ˙x(t) = Ax(t), где матрица A имеет следующую блочную4 Использование наблюдателей Луенбергера позволяет уменьшить порядок уравнений компенсатора на

величину p=rankC.

128

Page 129: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

структуру:

A=

[A−BK BK

0 A−LC].

Поскольку матрица A имеет блочную треугольную форму, ее характеристический многоч-лен равен произведению характеристических многочленов диагональных блоков

det(sIn−A)=det(sIn−A+BK) · det(sIn−A+LC).

Ввиду того что система (17.10)–(17.12) получена невырожденным преобразованием урав-

нений (17.7)–(17.9), исходная замкнутая система (17.7)–(17.9) имеет такой же характерис-

тический многочлен. Следовательно, справедлива следующая теорема.

Теорема разделения [4,22]. Характеристический многочлен замкнутой системы с ре-

гулятором, использующим оценки состояния объекта, и набюдателем равен произведению

характеристического многочлена системы с "идеальным"модальным регулятором (17.2) и

характеристического многочлена (16.5) наблюдателя (17.9).

Корни характеристического многочлена системы (17.7)–(17.9) получаются объединени-

ем корней системы с модальным регулятором и собственных чисел наблюдателя состояния.

Таким образом, задачи синтеза модального регулятора (определения матрицы K) и наблю-

дателя (вычисления матрицы L) могут решаться независимо. �Заметим, что аналогичная теорема справедлива и при использовании наблюдателей

пониженного порядка, описанных в п. 16.4 [4].

Уравнения (17.10)–(17.12) позволяют также сделать вывод, что при отсутствии внеш-

них воздействий процессы в системе (17.7) – (17.9) будут асимптотически приближаться к

процессам в системе с модальным регулятором по состоянию (17.2), как если бы система

(17.3) была подвержена действию затухающих возмущений. Роль этих возмущений играет

составляющая Kε(t) в уравнении (17.11). Скорость затухания ошибки ε(t) определяется

при синтезе наблюдателя. Практически рекомендуется выбирать время переходного про-цесса наблюдателя t в несколько раз меньшим требуемого времени переходного процесса всистеме с модальным регулятором.

Нетрудно убедиться, что для SISO-систем (l=m=1) уравнения (17.8), (17.9) приводят-

ся к передаточной функции динамического регулятора в цепи обратной связи. 5 Поэтому5 Это положение иллюстрируется рассмотренным в 17.5.1 примером.

129

Page 130: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

изложенный метод синтеза можно рассматривать как подход к определению параметровкорректирующего звена, обеспечивающего заданное расположение корней характеристиче-ского многочлена замкнутой системы. Решение этой задачи на основе операций с много-

членами приведено, например, в [33]. Следует также отметить, что и в том, и в другом

случае требуется невырожденность объекта управления. Если в передаточной функцииразомкнутой системы имеются совпадающие нули и полюса, то их значения неизбежно бу-

дут содержаться среди корней характеристического многочлена замкнутой системы D(s).

Действительно, D(s) = A(s)+B(s), где A(s), B(s) – знаменатель и числитель передаточной

функции разомкнутой системы. Пусть A(s) = A′(s)R(s), B(s) = B′(s)R(s), т.е. имеются об-

щие нули и полюса. Тогда D(s) = R(s)(A′(s) + B′(s)

)и среди корней многочлена D(s) при

любых A′(s),B′(s) содержатся корни R(s). Устойчивость замкнутой системы может быть

обеспечена только в том случае, когда они имеют отрицательные вещественные части, чтосоответствует стабилизируемости и обнаруживаемости объекта управления.

17.4 Терминальное управление

Как отмечено при определении понятия управляемости (с. 105), полностью управляемую

стационарную систему можно (теоретически) перевести из любого начального состояния в

любое другое за произвольно заданный конечный промежуток времени. Рассмотренное вы-ше модальное управление обеспечивает лишь асимптотическую стабилизацию системы, т.е.– приведение из любого исходного состояния в нулевое при t→ ∞. Во многих приложенияхтребуется именно решение задачи попадания в заданное состояние к назначенному момен-ту времени. Такие задачи называются задачами терминального, или финитного, управле-

ния [4,13]. Они возникают, например, при выведении ракет-носителей, сближении и посадке

космических аппаратов [12, 13], выполнении типовых маневров самолетов [14], при управ-

лении манипуляционными роботами и транспортными средствами. 6 Решение этой задачидля стационарных систем фактически дано при доказательстве положительной определен-

ности грамиана управляемости в п. 15.2 (п. 10, с. 109). Там показано, что для приведения

стационарного, полностью управляемого объекта x(t) = Ax(t)+Bu(t) из начального состо-

яния x0 в заданное состояние x1 за указанный временной интервал θ = t1 − t0 > 0 можно6 Стоит заметить, что под термином "терминальное управление"обычно подразумевается управление,

минимизирующее функционал, который зависит от значения управляемого процесса в конце рассматри-ваемого интервала. В отличие от термина «финитное управление» здесь не обязательно подразумеваетсятребование приведения состояния системы в конкретную точку [2, 4, 14, 38].

130

Page 131: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

использовать программное управление [4, 17, 37].

u(t) = BTeAT (t1−t)W(θ)−1

(x1 − eAθx0

), (17.13)

где грамиан управляемости

W(θ) =

∫ θ

0

eAτBBTeAT τdτ. (17.14)

Таким образом, найдено управление не в форме обратной связи по состоянию (или

другой текущей информации о поведении объекта), а в виде функции времени, которая

должна быть рассчитана заранее, исходя из заданных значений x0, x1, θ.

Управление (17.13) для решения данной задачи не является единственным [4]. Оно

определяется с точностью до некоторой аддитивно добавляемой функции r(t), удовлетво-

ряющей условиюt1∫t0

eA(t1−τ)Br(τ)dτ = 0. Действительно, данный интеграл (по формуле Ко-

ши (11.9), с. 81) выражает реакцию системы на воздействие r(t). При равенстве его нулю

реакции на u(t) и u(t) + r(t) совпадают. Как показано в [4], управление u(t) (17.13) из

всех воздействий, переводящих x0 в x1, обладает минимальной нормой (т.е. минимизирует

интегралt1∫t0

u(t)Tu(t)dt).

Перечислим некоторые свойства функции W(t0,t1) [4, 22]:

W(t0, t1) =

t1∫t0

Φ(t0, t)B(t)B(t)TΦ(t0, t)Tdt.

Это n×n матричная функция, которая

1) симметрична – W(t0, t1) = W(t0, t1)T ;

2) неотрицательно определена для всех t0, t1 ≥ t0;

3) удовлетворяет линейному матричному дифференциальному уравнению (уравнению

Ляпунова) 7:

W(t, t1) = A(t)W(t, t1) +W(t, t1)A(t)T− B(t)B(t)T ,

W(t1, t1) = 0.(17.15)

7 Более подробно дифференциальное и алгебраическое уравнения Ляпунова рассматриваются в п. 20.4на с. 187 в связи с исследованием устойчивости.

131

Page 132: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

В частности, для стационарных систем при θ → ∞ матрицаW(θ) приближается к решению

W алгебраического уравнения Ляпунова

AW +WAT −BBT = 0);

4) удовлетворяет функциональному уравнению

W(t0, t1) = W(t0, t) + Φ(t0, t)W(t, t1)Φ(t0, t)T .

При вычислении грамиана управляемости (17.14) можно также учесть следующие соот-

ношения. Введем функцию w(t) = eAtB. Как показано в 11.4 (с. 83), при скалярном входном

воздействии (m = 1) можно трактовать w(t), как функцию веса рассматриваемой системы

и находить, решая однородное уравнение x(t) = Ax(t) при x(0) = B. Если m > 1, то в ка-

честве начальных условий берутся столбцы bi матрицы B = [b1...b2... . . .

...bm] и w(t) находится

объединением m решений.

Эти свойства можно использовать при решении задач финитного и терминальногоуправления.

Полученное выше решение задает программное управление. Представляет интерес по-лучить управление в форме обратной связи, как это обычно принято в системах автомати-ческого управления. Покажем, как это сделать при решении задачи стабилизации, – когдатребуется привести состояние объекта в начало координат, x1 = 0.

Обратимся к формуле (17.13). Обозначив C = W(θ)−1(x1−

−eAθx0), C ∈R, получим

u(t) = BTeAT (t1−t)C = BTe−A

T (t−t0)eAT θ, θ = t1 − t0.

Введем сопряженное уравнение 8

ψ(t) = −ATψ(t), ψ(t0) = eAθ. (17.16)

Согласно формуле Коши, его решение ψ(t) = e−AT (t−t0)ψ(t0) = eA

T (t1−t). Сравнивая получен-

ное выражение для ψ(t) с формулой для u(t), видим, что управляющее воздействие можно8 Линейное однородное дифференциальное уравнение для ψ(t) называется сопряженным уравнению

относительно x(t), если для любых начальных условий скалярное произведение x(t)Tψ(t) = const. Нетрудноубедиться, что уравнения x = Ax и ψ = −ATψ являются сопряженными [4].

132

Page 133: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

выразить как u(t) = BTψ(t), где ψ(t) удовлетворяет уравнению (17.16), ψ(t0) = eAT θC. Объ-

единяя уравнения объекта, закон управления и сопряженное уравнение, получим систему

⎧⎨⎩x(t) = Ax(t) +Bu(t), x(t0) = x0,u(t) = BTψ(t),

ψ(t) = −ATψ(t), ψ(t0) = eAT θC.

(17.17)

Подставляя второе уравнение в первое, получим систему

{x(t) = Ax(t) +BBTψ(t), x(t0) = x0,

ψ(t) = −ATψ(t), ψ(t0) = eAT θC.

(17.18)

Для решения этой системы можно использовать преобразование Риккати [4, 22, 40]. Бу-

дем искать ψ(t) в виде ψ(t) = S(t)x(t), где S(t) – подлежащая определению матрица-

функция. Подстановкой ψ(t) во второе уравнение и путем дифференцирования получаем

Sx+Sx = −ATSx. Учитывая первое уравнение системы, после подстановок получаем Sx+

SAx+ SBBTSx = −ATSx. Чтобы полученное равенство было выполнено при всех x, S(t)

должна удовлетворять следующему матричному дифференциальному уравнению:

S(t) + S(t)A + ATS(t) + S(t)BBTS(t) = 0. (17.19)

Чтобы найти начальное значение S(t0), учтем, что рассматривается задача стабилизации

и x1 = 0. Поэтому

C = −W(θ)−1eAθx0, ψ(t0) = −eAT θW(θ)−1eAθx0. (17.20)

Так как должно выполняться условие ψ(t0) = S(t0)x(t0), то получим S(t0) = −eAT θW(θ)−1

eAθ. Таким образом, управление, переводящее состояние объекта из x(t0) = x0 в нулевое за

заданное время θ > 0, выражается в виде обратной связи

u(t) = BTS(t)x(t), (17.21)

где S(t) удовлетворяет уравнению (17.19). Данное уравнение является частным случаем

так называемого уравнения Риккати, которое часто встречается при решении различных

оптимизационных задач [2, 4, 14, 22, 38].

133

Page 134: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

17.5 Примеры систем модального и терминального управления

17.5.1 Стабилизация углового движения ИСЗ с компенсацией возмущений

Рассмотрим задачу стабилизации ИСЗ. Пусть требуется обеспечить движение без вращенияпо крену. Пропорциональный закон стабилизации угловой скорости имеет вид

u(t) = −kωωx(t). (17.22)

Рассмотрим также комбинированный закон стабилизации, при котором в сигнал управле-

ния (в данном случае – в управляющий момент) вводится также компенсирующее воздей-

ствие по возмущению. Так как возмущающий момент непосредственно измерен быть не

может, используем его оценку M(t), полученную наблюдателем. Тогда комбинированныйзакон управления принимает вид

u(t) = −kωωx(t)− kmM(t). (17.23)

Выбор коэффициента kω выполним исходя из условия быстродействия процесса стабилиза-ции в замкнутом контуре. Соответствующий этому контуру характеристический многочлен

имеет вид D(s) = s + kωJx, откуда kω = −Jxs1, где s1 – заданное значение корня D(s). Оче-

видно, что для данной системы коэффициент передачи по возмущению km = 1. Результаты

моделирования системы стабилизации при s1 = 0.2 с−1 приведены на рис. 17.2.

Рисунок 17.2 – Процессы стабилизации ИСЗ. 1 – пропорциональный регулятор (17.22),2 – динамический компенсатор (17.23).

134

Page 135: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Как видно из рисунка, при пропорциональном законе управления устанавливается рав-ноускоренное вращательное движение. Использование комбинированного закона управле-ния с оценкой и компенсацией возмущения в данных условиях приводит к асимптотическо-

му стремлению скорости к нулю. Пунктирной линией на графике u(t) показана "идеаль-

ная"компенсирующая составляющая в управляющем воздействии, равная −M(t).

Вычисляя передаточную функцию компенсатора от входа ωx к управлению u получим,

что рассмотренный закон управления можно реализовать звеном W(s) = kτs2 + 2ξτs+ 1s2(Ts+ 1)

,

где k = 1.13 с−2, T = 0.83 с, τ = 5.3 с.

17.5.2 Возбуждение колебаний в цепочке осцилляторов

Рассмотрим систему, состоящую из последовательности осцилляторов (например, маятни-

ков), соединенных упругими связями. Такая модель используется для описания различных

физических и механических систем [8]. В отсутствии сил трения и при линейных упругих

деформациях связей (в области действия закона Гука) цепочка N маятников описываетсясистемой уравнений⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

ϕ1(t) + ω2 sinϕ1(t) = k(ϕ2(t)− ϕ1(t)

)+ u(t),

. . .ϕi(t) + ω2 sinϕi(t) = k

(ϕi+1(t)− 2ϕi(t) + ϕi+1(t)

),

. . . (i = 2, 3, . . . , N − 1),ϕN (t) + ω2 sinϕN(t) = k

(ϕN−1(t)− ϕN(t)

),

(17.24)

где ϕi(t) (i = 1, 2, . . . , N) – углы поворота маятников; u(t) – внешнее управляющее воздей-

ствие, пропорциональное моменту, приложенному к первому маятнику; ω, k – параметры

системы (ω – собственная частота малых колебаний маятников, k – коэффициент жесткости

пружин).

Далее будем использовать линеаризованную модель, предполагая, что амплитуда коле-баний маятников незначительна. Такая модель имеет вид⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

ϕ1(t) + ω2ϕ1(t) = k(ϕ2(t)− ϕ1(t)

)+ u(t),

. . .ϕi(t) + ω2ϕi(t) = k

(ϕi+1(t)− 2ϕi(t) + ϕi+1(t)

),

. . . (i = 2, 3, . . . , N − 1),ϕN(t) + ω2ϕN (t) = k

(ϕN−1(t)− ϕN(t)

).

(17.25)

Введем вектор состояния x(t) ∈R2N x(t) = col{ϕ1, ϕ1, ϕ2, ϕ2, . . . , ϕN , ϕN}. В стандартной

форме уравнений состояния

135

Page 136: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

x(t) = Ax(t) +Bu(t) модель (17.25) задается матрицами

A =

⎡⎢⎢⎢⎢⎢⎢⎢⎣

A1 A12 0 . . . 0 0A12 A2 A12 . . . 0 0

0 A12 A2. . . 0 0

...... . . . . . . ...

...0 0 0 . . . A2 A12

0 0 0 . . . A12 A1

⎤⎥⎥⎥⎥⎥⎥⎥⎦, B =

⎡⎢⎢⎢⎢⎢⎢⎢⎣

B1

00...00

⎤⎥⎥⎥⎥⎥⎥⎥⎦,

где A1 =

[0 1

−ω2 − k 0

], A2 =

[0 1

−ω2 − 2k 0

], A12 =

[0 0k 0

],

B1 =[0 1

]T.

Рассмотрим задачу возбуждения "волны"колебаний заданной амплитуды, при которыхсоседние маятники находятся в противофазе. При этом ограничимся требованием приведе-ния их в это состояние за заданное время из любого начального состояния. Для ее решениявоспользуемся изложенным в п. 17.4 методом. Управление будем искать в виде программ-

ной функции времени (17.13).

Рисунок 17.3 – Волна колебаний.

времени (17.13).

Результаты решения задачи для N = 10, k = 5 с−2, ω = 0.4π с−1, ϕi(0) = 0, ϕi(0) = 0

(i = 1, 2, . . . , N), θ = 50 c, ϕi(θ) = (−1)i+1 ·30 град., ϕi(θ) = 0 показаны на рис. 17.3, 17.4. На

136

Page 137: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 17.4 – Углы поворота маятников и управление.

первом изображены последовательности положений маятников в разные моменты времени

(отмечены цифрой внизу). На втором 17.4 показаны графики углов поворота ϕ9(t), ϕ10(t) и

управляющее воздействие u(t) на промежутке t ∈ [30, 50] с. Заметим, что в данном примере

(как и в общем случае) приведение системы в заданное состояние не означает, вообще

говоря, что она останется в этом состоянии и дальше или будет совершать предписанное

движение. Если из полученного состояния x(θ) построить управление, переводящее систему

в это же состояние к моменту t = θ +Δ, (Δ > 0), то получим колебания сложной формы,

симметричные относительно середины интервала [θ, θ +Δ].

137

Page 138: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 18

18 Уравнения и характерные свойства нелинейных систем

18.1 Общие сведения о нелинейных системах

В предыдущих главах изучались линейные системы. Рассмотрим подробнее значение это-го термина. Упрощенно можно считать, что линейные системы – это такие системы, длякоторых справедлив принцип суперпозиции – реакция системы на линейную комбина-

цию (суперпозицию) воздействий совпадает с такой же линейной комбинацией реакций на

каждое воздействие в отдельности. 1 Из этого общего принципа следует, например, что

линейное статическое звено должно описываться линейной (пропорциональной) зависимо-

стью y=Ku между входом u(t) ∈Rm и выходом y(t) ∈R

l, где K – l×m-матрица, зависящая

от t в нестационарном случае. Если рассматривается динамическая система непрерывноговремени, то в линейном конечномерном случае она описывается линейными дифференциа-льными уравнениями, дискретная система – линейными разностными уравнениями и т.д.

Системы, для которых этот принцип не выполняется, относятся к нелинейным. Заме-тим, что данное определение носит «негативный« характер в том смысле, что оно указываетна свойство, которое у определяемых систем отсутствует. Правильнее сказать, что свой-

ство линейности выделяет класс линейных систем из всех (вообще говоря, – нелинейных)

систем, Однако и в терминологическом, и в методическом отношении удобнее считать, чтолинейные и нелинейные системы относятся к разным классам.

Отметим, что если в состав системы входит хотя бы одно нелинейное звено, то и всясистема в целом становится нелинейной. Это дает основание иногда определять линейныесистемы, как системы, состоящие только из линейных звеньев. Нелинейной системой тогданазывается система, содержащая хотя бы один нелинейный элемент.

Следует подчеркнуть, что все реальные системы являются нелинейными. Физическимзвеньям свойственны явления насыщения, гистерезиса, люфта и т.д. Однако линейным си-стемам не случайно уделено такое большое внимание в теории систем. Прежде всего, теориялинейных систем достаточно проста. Можно даже считать ее практически завершенной.Теория нелинейных систем существенно сложнее, значительные усилия по исследованиюнелинейных систем обычно приводят к менее детальному описанию процессов, чем в линей-

1 Такое определение линейной системы является достаточно общим. Оно применимо как к конечномер-ным, так и к бесконечномерным дифференциальным системам, а также к дискретным системам. Однакооно является не совсем полным, так как не отражает влияния начального состояния. Полное определениесвойства линейности систем будет дано ниже, в 18.3.1

138

Page 139: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ном случае. Нелинейные системы могут обладать такой сложностью и таким разнообразиемсвойств, что представляется невозможным говорить о завершении теории таких систем вобозримом будущем. Конечно, простота исследования не является сама по себе достаточ-ным основанием для применения линейной теории. Однако очень во многих случаях испо-льзование линеаризованной модели дает практически те же результаты, что и применениеболее точной нелинейной модели. Следует также учесть, что при составлении модели си-стемы неизбежно возникают ошибки, связанные, например, с погрешностью определениязначений параметров объекта. Влияние этих ошибок может оказаться более существен-ным, чем погрешностей, вызванных линеаризацией модели. Определенным теоретическимобоснованием применимости линейной теории систем служит первый метод А.М. Ляпуно-ва, согласно которому при «гладкой« нелинейной характеристике устойчивость нелиней-

ной системы можно исследовать по первому (линейному) приближению [18]. 2 Поэтому

на практике обычно выполняется предварительное исследование линеаризованной модели,для которой и производится синтез закона управления. Затем осуществляется анализ по-лученной системы с использованием более полной, нелинейной, модели. Во многих случаяхоказывается, что нелинейные свойства системы не играют существенной роли. При такомподходе целесообразно обеспечивать выполнение заданных технических требований с опре-деленным «запасом«, что позволяет предотвратить нарушение требуемых показателей привлиянии неучтенных нелинейностей.

Вместе с тем имеется обширный класс систем, для которых нелинейные свойства яв-ляются принципиально важными и применение линейных моделей приводит к качественноневерным результатам. Выше уже упоминалось о ситуации, в которой устойчивость состоя-ния равновесия не может быть исследована по линейному приближению. Более существен-ным является то, что для многих систем линеаризация в рабочей области значений просто

невыполнима из-за негладкости (недифференцируемости) нелинейных характеристик. Этоявление имеет место, когда в систему входят «разрывные» нелинейности, например ре-лейные звенья. Кроме того, даже в тех случаях, когда линеаризация возможна и дажеможно сделать вывод об устойчивости состояния равновесия, применение линейных моде-лей может привести к весьма существенным количественным ошибкам. Наконец, в науке итехнике все чаще возникают задачи, когда исследуемые или создаваемые режимы системыявляются неравновесными, например колебательными. При этом система может демон-

2 Напомним, что, согласно первому методу Ляпунова, если линеаризованная система асимптотическиустойчива, то состояние равновесия нелинейной системы устойчиво в малом; если линеаризованная си-стема неустойчива, то неустойчиво и состояние равновесия нелинейной системы; если линеаризованнаясистема находится «на границе устойчивости«, то нельзя исследовать устойчивость состояния равновесияпо первому приближению.

139

Page 140: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

стрировать сложное (мультистабильное, хаотическое) поведение, которое принципиально

не может быть описано в рамках линейной теории и требует новых подходов (см. главу 13).

Во всех перечисленных ситуациях требуется использование методов теории нелинейныхсистем.

Таким образом, нелинейности, свойственные реальным физическим системам, можно

(со значительной степенью условности) разбить на два класса:

• существенные нелинейности, влиянием которых нельзя пренебречь без существен-ной ошибки при определении характеристик системы;

• несущественные нелинейности, влиянием которых пренебречь можно. 3

Имеется и другой способ классификации нелинейных звеньев, основанный на причинахих появления в системе. С этой точки зрения нелинейности можно разбить на естествен-

ные и искусственные (преднамеренно вводимые).

Естественные нелинейности присутствуют в системе в силу физических свойств мате-риалов, из которых изготовлены входящие в нее устройства, особенностей уравнений, опи-сывающих происходящие в объекте управления процессы, и т.д. В этой связи уже упоми-нались насыщение, люфт, гистерезис, свойственные реальным физическим звеньям разнойприроды. В цифровых системах управления присутствует специфичная ступенчатая нели-нейность, вызванная конечностью разрядной сетки ЭВМ и преобразователей сигналов. Присинтезе закона управления эти нелинейности можно учитывать, или нет, в зависимости отих уровня, однако они считаются заданными, не изменяемыми без переработки конструк-ции объекта или узлов системы.

Искусственные нелинейности вводятся проектировщиком в закон управления, чтобы

обеспечить требуемое (оптимальное) качество работы системы. В зависимости от требов-

аний, предъявленных к системе управления и условий ее функционирования, могут бытьразличные варианты введения нелинейных зависимостей в закон управления. Эти вариан-ты образуют целые, иногда весьма обширные, направления в теории управления. Перечис-лим некоторые из них.

Оптимальные по быстродействию системы управления. Оптимальное по быст-родействию управление при ограниченном уровне управляющего воздействия достигается

при существенно нелинейном (релейном) законе управления, когда сигнал управления при-

нимает крайние значения в зависимости от текущего состояния системы [2, 33, 38, 39].3 Условность такой классификации связана с тем, что в разных ситуациях данная нелинейность может

оказаться либо существенной, либо несущественной. Поэтому часто не удается определить a priori, мож-но ли не учитывать ее влияние. Кроме того, требуется указать количественно, какая ошибка считается«существенной«.

140

Page 141: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Адаптивные (самонастраивающиеся) системы управления. Эти системы

предназначены для работы в условиях значительной априорной неопределенности пара-метров объекта и условий среды. Недостающая информация об объекте получается авто-матически в процессе работы системы на основе текущих измерений. В подавляющем боль-

шинстве случаев адаптивные системы являются существенно нелинейными [6,33,38,47,48].

Экстремальные системы управления. Экстремальные системы должны обеспечить

в процессе работы минимальное (или максимальное) значение некоторого функционала

качества, зависящего от значений процесса в системе. В таких системах, следовательно,цель управления задана не в виде требуемого значения выхода объекта, а через функци-онал качества. В процессе работы должна быть обеспечена автоматическая настройка наэкстремум данного функционала, положение которого может меняться в зависимости от

разных условий и быть неизвестным до начала работы системы [6, 38].

Системы с переменной структурой. Такие системы включают в себя несколько,

как правило, линейных регуляторов («структур«), между которыми происходит переклю-

чение при формировании управляющего воздействия, причем выбор структуры выполня-

ется на основе текущей информации о состоянии объекта (а не программно во времени).

Это приводит к тому, что закон управления в целом оказывается существенно нелиней-

ным [6, 17, 38, 46].

Системы с нелинейными корректирующими устройствами (НКУ). При разра-

ботке нелинейных корректирующих устройств обычно ставится задача «развязать» зави-симость между амплитудной и фазовой частотными характеристиками, свойственную длявсех линейных звеньев. Достижение этого эффекта позволяет, например, осуществить ам-плитудное подавление влияния колебаний, вызванных упругими свойствами конструкцийбез внесения нежелательного фазового запаздывания. НКУ могут оказаться эффективны-

ми и для повышения точности систем управления [50].

Имеются и другие классы систем с преднамеренно вводимыми нелинейностями. Изу-чение всех возможных вариантов использования нелинейных законов управления, как иразработанных методов теории нелинейных систем, конечно же выходит за рамки этойкниги, поэтому в дальнейшем кратко ознакомимся лишь с некоторыми из них.

18.2 Уравнения нелинейных звеньев и систем

Как и для линейных систем, можно выделить статические (безынерционные) и динами-

ческие (инерционные) нелинейные звенья. Напомним, что поведение статических звеньев

141

Page 142: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

полностью определяется их статической характеристикой, то есть зависимостью выходнойвеличины от входной в тот же момент времени:

y(t)=F (u(t)), −для стационарных звеньев;

y(t)=F (u(t), t), −для нестационарных звеньев.Статическим описанием пользуются, когда можно пренебречь инерционностью звена для

данной задачи (более подробно см. [32]).

Для конечномерных дифференциальных систем (непрерывного времени) динамическиезвенья можно описать уравнениями состояния{

x(t) = f(x, u, t), −уравнение состояния,y(t) = g(x, u, t). − уравнение выхода. (18.1)

Здесь x(t) ∈Rn, u(t) ∈R

m, y(t) ∈Rl – векторы состояния, входа и выхода системы; f(·) ∈

Rn, g(·) ∈R

l – вектор-функции векторных аргументов. Для стационарных систем функции

f(·), g(·) не зависят явно от времени.Данное описание применимо к MIMO-системам. Для SISO-систем (m= l=1) использ-

уется запись в виде одного дифференциального уравнения n-го порядка

F

(y,

dy

dt,d2y

dt2, . . . ,

dny

dtn, u,

du

dt, . . . ,

dsu

dts, t

)=0.

Это уравнение во многих случаях разрешимо относительно старшей производной и можетбыть записано в виде

dny(t)

dtn=ϕ

(y,dy

dt,d2y

dt2, . . . ,

dn−1y

dtn−1, u,

du

dt, . . . ,

dsu

dts, t

). (18.2)

Из этого уравнения естественным образом может быть получена нормальная форма Коши

(18.1). Действительно, введем переменные x1(t) = y(t), x2(t) =dy

dt, . . . , xn(t) =

dn−1y

dtn−1. То-

гда, учитывая, что введенные переменные являются последовательными производными и

принимая во внимание уравнение (18.2), получим систему уравнений⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

x1(t) = x2(t),x2(t) = x3(t),

· · ·xn−1(t) = xn(t),

xn(t) = ϕ(x1, x2, x3, . . . , xn, u,

du

dt, . . . ,

dsu

dts, t

),

(18.3)

142

Page 143: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

y(t)=x1(t).

Обратимся теперь к некоторым «типовым» статическим звеньям, уравнения которыхчасто встречаются при описании нелинейных зависимостей. Рассматриваем стационарные

звенья y=F (x) с одним входом и одним выходом.

1. Насыщение. Функция F (x) ограничена значениями F−, F+, т.е. для всех x ∈ R

выполнено F− ≤ F (x) ≤ F+. Часто рассматриваются кусочно-линейные функции, которые

в соответствующем масштабе могут быть выражены зависимостью y(x)=sat(x), где

sat(x)=

⎧⎨⎩1, x > 1x, −1 ≤ x ≤ 1,−1, x < 1.

2. Нечувствительность. Функция F (x) обращается в ноль для всех x, лежащих в

некоторой окрестности нуля, F (x) = 0 при x ∈ [x−, x+], x− < 0 < x+. Обычно рассматри-ваются кусочно-линейные симметричные зависимости, которые можно задать выражением

F (x)=

⎧⎨⎩x−Δ, x > Δ,0, −Δ ≤ x ≤ Δ,x+Δ, x <−Δ,

где Δ > 0 – порог чувствительности (зона нечувствительности).

3. Нечувствительность с насыщением. Сочетание характеристик указанных в пп. 1,2 типов. При кусочно-линейной аппроксимации эта характеристика может быть задана ввиде

F (x)=

⎧⎨⎩sat(x−Δ), x > Δ,0, −Δ ≤ x ≤ Δ,sat(x+Δ), x <−Δ.

Группа релейных («разрывных«) характеристик:

4. «Идеальное» двухпозиционное реле, сигнум-функция. y(x)=c · sign(x), где сигнум-функция (функция знака) sign(x) описывается выражением

sign(x)=

⎧⎨⎩1, x > 0,0, x=0,−1, x > 0.

где параметр c > 0 – величина «полки реле» . 4

4 Вообще говоря, значение sign(0) необязательно должно быть нулевым. По некоторым соображениям,удобнее использовать включение и считать, что sign(0) является отрезком [−1, 1]; тогда y(x) ∈ csign (x),см. [17, 46].

143

Page 144: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

5. Двухпозиционное реле с нечувствительностью. Сочетание характеристик пп. 2,4:

F (x)=

⎧⎨⎩c, x > Δ0, −Δ ≤ x ≤ Δ,−c+Δ, x <−Δ.

6. Ступенчатая характеристика. Такой вид нелинейности свойственен аналого-циф-ровым преобразователям, выполняющим операции округления или усечения, вызванныеограниченностью разрядной сетки управляющей ЦВМ, а также свойственное некоторымвидам датчиков систем управления.

Группа неоднозначных характеристик:

7. Гистерезис (положительный или отрицательный),

8. Люфт, консервативный люфт,

а также комбинации этих характеристик релейными зависимостями и нечувствитель-ностью. Сюда относятся характеристики двухпозиционного и трехпозиционного реле.

З а м е ч а н и е 1 . Строго говоря, нелинейности с неоднозначными характеристикамиотносятся не к статическим, а к динамическим звеньям со специфичными уравнениямии пространством состояний. Выход этих звеньев зависит не только от текущего значениявхода, но и от его предыстории и начального состояния. Поэтому для них правильнее исп-

ользовать запись y(t)=F (u[t0, t], t) [39].

З а м е ч а н и е 2 . В некоторых случаях рассматриваются характеристики ви-

да y(t) = F (u(t), u(t), t). Звенья с такими характеристиками не описываются уравнения-

ми состояния (18.1), но фактически являются динамическими. Выход y(t) таких звеньев

определяется поведением входного процесса на некотором (бесконечно малом) интервале

времени [20]. Исходя из этого, нелинейности указанного вида называют динамическиминелинейностями.

Рассмотрим замкнутую динамическую систему, состоящую из динамического объектаи регулятора, заданных уравнениями

xp(t) = fp (xp(t), u(t), t) , y(t)=gp (xp(t), u(t), t) , (18.4)

xc(t) = fc (xc(t), y(t), t) , u(t)=gc (xc(t), y(t), t) , (18.5)

в которых через xp(t) ∈Rnp, xc(t) ∈R

nc обозначены векторы состояния объекта управле-

ния и регулятора, через y(t) ∈Rl – выход объекта, который считается выходом замкнутой

системы, а через u(t) ∈Rm – управляющее воздействие, которое поступает с выхода регу-

144

Page 145: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

лятора. Задающее (командное) воздействие и возмущения отражены зависимостью вектор-

функций f(·), g(·) от времени. Подстановкой выражений для u(t) и y(t) из уравнений вы-хода в соответствующие уравнения состояния получаем уравнения состояния замкнутой

системы относительно общего вектора состояния x(t) = col{xp(t), xc(t)} ∈Rn, n=np+nc, в

виде

˙x(t) = f (x(t), t) , y(t)=g (x(t), t) . (18.6)

З а м е ч а н и е 1 . Далеко не во всех случаях и объект, и регулятор являютсядинамическими звеньями. Распространены ситуации, в которых регулятор – статическое

(например, релейное, или линейное) звено. Тогда векторы состояния расширенной и ис-ходной систем совпадают, а для статической подсистемы записываются только уравнениявыхода.

З а м е ч а н и е 2 . Если оба уравнения выхода содержат «прямую связь« между вхо-дом и выходом соответствующей подсистемы, т.е. если и объект, и регулятор не являютсястрого реализуемыми звеньями, то при указанной подстановке возникает «замкнутый кон-тур«, появление которого приводит к необходимости разрешения системы алгебраическихуравнений

{gp (xp(t), u(t), t) = 0,gc (xc(t), y(t), t) = 0.

При моделировании таких систем можно использовать процедуры решения алгебро-диф-

ференциальных уравнений [32].

Такое представление уравнений замкнутой нелинейной системы соответствует делению

по функциональному признаку (на объект управления и регулятор). Это естественно при

составлении уравнений системы, однако для дальнейших исследований более удобной быва-ет запись уравнений замкнутой системы в форме так называемой системы Лурье, в которойвыделяются линейная и нелинейная части, причем вся динамика системы сосредоточена

в линейной части, а нелинейность является статической (с учетом приведенного выше за-

мечания относительно неоднозначных нелинейных характеристик). Рассмотрим эту форму

записи более подробно.

Пусть линейная часть системы задается уравнениями состояния

x(t) = A(t)x(t)+B(t)ξ(t)+r(t),

σ(t) = C(t)x(t)+D(t)ξ(t), (18.7)

145

Page 146: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

а нелинейная часть описывается своей статической характеристикой

ξ(t) = ϕ(σ, t). (18.8)

Здесь x(t) ∈Rn – вектор состояния линейной части системы (18.7), одновремено служащий

вектором состояния системы в целом; σ(t) ∈Rl – вектор выхода линейной части системы;

ξ(t) ∈Rm – вектор выхода нелинейной части системы (18.8). Вектор-функция r(t) ∈R

n и

зависимость ϕ(·) от t в уравнениях (18.7), (18.8) позволяют учесть внешние воздействия насистему (рис. 18.1).

Рисунок 18.1 – Структура нелинейной системы в виде взаимосвязанных линейнойи нелинейной подсистем.

При кажущейся ограниченности такой формы записи уравнений замкнутой системы

она является достаточно общей. Действительно, если положить в (18.7), (18.8) A(t) ≡ 0n×n,

B(t) ≡ C(t) ≡ In, D(t) ≡ 0n×n, т.е. если принять, что линейная часть – совокупность

независимых интеграторов, все выходы которых образуют вектор σ(t), а на входы каждого

из них поступают соответствующие компоненты вектора ξ(t), получим x(t) = ξ(t), σ(t) =

x(t). Положив ϕ(x, t) ≡ f(x, t), получаем, что к системе Лурье приводятся общие уравнения

нелинейной и нестационарной системы x(t)=f(x, t).

Если в системе имеется один нелинейный блок со скалярным выходом ξ(t) ∈ R (либо

если преобразованием нелинейных звеньев ее можно привести к такому виду), 5 то линей-5 Такое преобразование выполнимо, если несколько нелинейных статических звеньев связаны непосред-

ственно между собой и между ними нет промежуточных динамических звеньев (более подробно см. [11,33]).

146

Page 147: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ную часть (ЛЧ) системы в стационарном случае можно описать передаточной функцией

между входом ЛЧ ξ и выходом σ : Wl(s)=C(sI−A)−1B+D. Получаем распространенный

вид системы, замкнутой обратной связью. Особенность состоит в том, что обратная связьнелинейна.

З а м е ч а н и е . Поскольку в теории управления принято обычно рассматриватьсистемы, замкнутые отрицательной обратной связью, можно изменить знак передаточной

функции линейной части Wl(s), либо считать, что выход нелинейного блока определяется

выражением ξ(t)=−ϕ(σ, t).

18.3 Особенности процессов в нелинейных системах

Как отмечено выше, нелинейные системы отличаются от линейных весьма сложным и раз-нообразным поведением. Можно считать, что причиной этого является невыполнение прин-ципа суперпозиции для нелинейных систем. Рассмотрим некоторые, наиболее характерные,особенности поведения таких систем.

18.3.1 Принцип суперпозиции

Обратимся теперь к общему определению линейных динамических систем [20].

Как отмечено в п. 1 выход y(t) динамической системы определяется функциональнымуравнением

y(t)=S(x(t0); u[t0, t]

),

где x(t0) –начальное состояние системы, u[t0, t] – входное воздействие, заданное на интервале

[t0, t], t > t0.

Определение [20]. Система называется линейной, если она:

• Линейна относительно всех начальных состояний, т.е. для всех t0, t > t0, x(t0)=

x0, u[t0, t], v[t0, t], k выполнено:

k(S(x0; u[t0, t])−S(x0; v[t0, t])

)=S(

0; k(u[t0, t]−v[t0, t])), (18.9)

т.е. при любом начальном состоянии разность между реакциями на произвольные входныевоздействия равна реакции на разность этих же воздействий, полученную при нулевомначальном состояниии.

• Линейна при нулевом входе, т.е. для всех t, t0, x′(t0)=x′0, x′′(t0)=x′′0, k выполнено:

k(S(x′0; O)−S(x′′0; O)

)=S(

k(x′0−x′′0); O), (18.10)

147

Page 148: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

т.е. при нулевом входе реакция на линейную комбинацию начальных состояний равна такой

же линейной комбинации реакций при каждом начальном состоянии в отдельности. 6

Из свойства (18.9), в частности при k=1, v=O, следует S(x0; u[t0, t])−S(x0; O)=S(0;u[t0, t]), откуда

y(t)=S(x0; O)+S(0; u[t0, t]).

Другими словами, справедливо свойство разделения – движение линейной системы прилюбых начальных условиях и любом входном воздействии можно получить как сумму пе-

реходной и вынужденной составляющих. Переходная составляющая S(x0; O) есть процесс,полученный при нулевом входе и заданных начальных условиях x0, а вынужденная состав-

ляющая S(0; u[t0, t]

)есть реакция системы на заданное входное воздействие при нулевых

начальных условиях.

Свойство (18.10) приводит к тому, что характер собственных движений системы не

зависит от размеров области пространства состояний, в которой эти движения рассматри-

ваются. Более точно, полагая в (18.10) x′0=x0, x′′0=0, получим для всех k, x0

S(kx0; O)=kS(x0; O).

Следовательно, вид фазовых портретов линейных стационарных систем не зависит от раз-мера окрестности начала координат – эти фазовые портреты можно преобразовать друг кдругу изменением масштаба.

Совокупности этих свойств (либо одного из них) лишены нелинейные системы. Это

приводит к эффектам, некоторые из которых рассмотрены ниже. Основное внимание уде-лим собственным движениям в нелинейных системах – характер вынужденных процессовоказывается еще более сложным и разнообразным.

18.3.2 Сепаратрисные поверхности

Как отмечено выше, у нелинейных систем может быть различный характер собственныхдвижений в разных областях пространства состояний. Поэтому при исследовании такихсистем недостаточно, вообще говоря, рассматривать лишь некоторую окрестность состоя-ния равновесия – исследование должно охватывать все возможные области пространствасостояний. Естественно, это сильно усложняет анализ. При использовании численных ме-

тодов исследования (например, моделирования на ЭВМ) количество вычислений оказыва-6 Здесь через 0 обозначен нулевой элемент пространства состояний X , а через O – нулевой элемент

пространства функций, u(t) ≡ 0.

148

Page 149: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ется значительно выше, чем для линейных систем. Это показывает необходимость развитияаналитических методов исследования.

В качестве иллюстрации рассмотрим следующий простой пример. Пусть система опи-сывается уравнением

x(t)=x(t)2−x(t), x(0)=x0.

Система имеет два состояния равновесия: x∗1 = 0 и x∗2 = 1. Нетрудно убедиться, что при

x0 < 1 знаки x(t) и x(t) противоположны и решение будет стремиться к точке x∗1, x(t) → 0.

При x0 > 1 выполнено x(t) > 0 и решение расходится, x(t) → ∞ (причем значение x(t)

становится неограниченно большим за конечное время). Таким образом, x∗1 – устойчивое

состояние равновесия, а x∗2 – неустойчивое. Точка x=1 разделяет пространство состояний

X =R на области с устойчивым и неустойчивым характером поведения.

Определение [36]. Поверхность, разделяющая пространство состояний системы на об-

ласти с разными типами фазовых траекторий (т.е. видов собственных движений) называет-

ся сепаратрисной поверхностью (при n=2 разделяющая поверхность является некоторой

кривой, называемой сепаратрисой).

Более точное определение – сепаратрисная поверхность есть поверхность, являющаясялибо элементом притяжения, либо элементом отталкивания для всех близких траекторий.

Иногда (как в приведенном примере) сепаратрисой является некоторая фазовая траек-

тория. Возможно также, что сепаратрисы образуются из участков различных траекторий

(рис. 18.2, а). В 22 рассмотрены системы, для которых движение происходит по сепара-трисной поверхности, но само понятие соответствующего решения уравнений нуждается вдополнительном определении.

18.3.3 Предельные циклы. Автоколебания

Для некоторых систем могут, как известно, существовать периодические процессы с пери-

одом T такие, что x(t) = x(t+T ) (более подробное определение периодических процессов

дано выше в 10.1 и [36,38]). Соответствующие им фазовые траектории представляют собой

замкнутые кривые. Для стационарных линейных систем периодические собственные дви-

жения имеют место, если характеристический многочлен A(s) = 0 при некотором s = jΩ.

(Период T = 2π/Ω.) Такой вид движений свойствен, например, колебательным консерва-тивным звеньям.

Важно отметить, что колебания, возникающие у линейных систем, являются негрубымив том смысле, что сколь угодно малое отклонение параметров системы от исходных можетпривести к исчезновению периодических движений. Кроме того, малое изменение началь-

149

Page 150: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 18.2 – Сепаратрисы и предельный цикл.

ного состояния системы приводит к пропорциональному изменению амплитуды колебаний,

как это видно из формулы Коши (11.8) для решений линейных систем (см. [33]). У нели-

нейных систем возможно существование грубых периодических процессов, характеристики

которых не меняются (качественно) при изменении в определенных пределах параметров

или начальных условий. Рассмотрим это явление подробнее.

Пусть автономная система описывается уравнением

x(t)=f(x(t)

). (18.11)

Определение [36]. Периодическое решение x(t), а также соответствующая ему траекто-

рия G, считается изолированным периодическим решением и называется предельным цик-

лом, если существует такое ρ > 0, что какова бы ни была точка x′ ∈ X , находящаяся от

кривой G на положительном расстоянии ρG(x′), 7 меньшем, чем ρ, 0 < ρG(x′) < ρ; проходя-

щее через нее решение уравнения (18.11) не является периодическим.

Это означает, что при n=2 на фазовой плоскости вблизи предельных циклов не прохо-

дит других замкнутых траекторий решений уравнения (18.11). Отметим, что у линейныхконсервативных систем замкнутые траектории лежат «всюду плотно» – на сколь угодномалом расстоянии от данной замкнутой кривой находятся другие замкнутые траектории.

7 Расстояние ρG(x) от точки x до кривой G в пространстве Rn можно определить как ρG(x) =infxG∈G(||x − xG ||), где || · || – некоторая (например, евклидова) векторная норма в Rn.

150

Page 151: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Как для внешних, так и для внутренних по отношению к предельному циклу G 8 име-ются две взаимно исключающие возможности поведения вблизи G : все внутренние траек-тории, начинающиеся вблизи G «наматываются« на G, как спирали либо при t→ ∞, либо

при t→−∞. То же самое относится и ко внешним траекториям [36].

Если все внутренние и внешние траектории, начинающиеся вблизи G «наматываются»на G при t→ ∞, то предельный цикл называется устойчивым. Соответственно, возможны

(вполне) неустойчивые и полуустойчивые предельные циклы.

Определение (А.А. Андронов, см. [36]). Устойчивый предельный цикл называ-

ется автоколебанием.Таким образом, автоколебания представляют собой процесс, характерный исключи-

тельно для нелинейных систем. Практически можно считать, что такой процесс имеетместо, когда состояние равновесия системы неустойчиво «в малом«, но система облада-ет диссипативностью, так что процессы при «больших» начальных отклонениях затухают.В качестве примера на рис. 18.2, б показан фазовый портрет автоколебательной системы

T 2x + 2ξT x+ x = ku, u = c signx, (T = 0.1 c, ξ = 0.25), являющейся упрощенной моделью

генератора колебаний [36, 39]. Заметим, что предельный цикл является и сепаратрисой.

Нелинейным системам свойственны не только периодические собственные процессы.Возможны также квазипериодические режимы, соответствующие колебательным движе-ниям с несоизмеримыми частотами. Более того, возможно возникновение хаотическихколебательных процессов, имеющих непрерывный спектр частот и, следовательно, облада-ющих свойствами, характерными для случайных процессов. Установившиеся хаотическиепроцессы отличаются от предельных циклов и описываются притягивающими множества-ми – аттракторами. Сведения о хаотических системах и методах их исследования можно

найти в [8].

Наиболее общее из известных определений колебательных процессов, включающее какпериодические, так и нерегулярные, хаотические, предложено В.А. Якубовичем в 1973 г.

(см. [33, 38])

Определение. Решение x(t), σ(t) системы (18.7), (18.8) называется колебательным

(или колебательным по Якубовичу) по выходу σ, если выполнены следующие условия: 1)

||x(t)|| ≤ const; 2) Число изменений знака функции σ(t) бесконечно на t ∈ [0,∞); 3) Число

выходов σ(t) за пределы заданного интервала [−α, β], α > 0, β > 0, бесконечно на t ∈ [0,∞).

8 Для простоты изложения сейчас рассматриваем случай фазовой плоскости, n=2.

151

Page 152: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

18.3.4 Состояния равновесия. Отрезки покоя

Обратимся теперь к состояниям равновесия нелинейных систем. Выше было отмечено, чтотакими состояниями являются особые точки, в которых вектор фазовой скорости v об-

ращается в ноль. Для линейных стационарных систем x(t) = Ax(t) выполнено v(x) = Ax,

поэтому множество состояний равновесия {x∗} – либо начало координат (при detA �= 0),

либо многообразие более высокой размерности, но всегда – некоторое линейное подпро-

странство (аннулируемое подпространство N (A) матрицы A) пространства состояний,

{x∗}=N (A), N (A) ⊆ X , см. сноску 3 на с. 67.Для нелинейных систем особые точки определяются из уравнения (18.11), согласно

которому состояния равновесия x∗ должны удовлетворять нелинейному алгебраическому

уравнению (точнее – системе уравнений относительно компонент x∗i вектора x∗):

f(x∗)=0. (18.12)

Отсюда видно, что в зависимости от правых частей уравнения (18.11), множество состояний

равновесия {x∗} могут иметь сложную структуру. Это может быть совокупность изолиров-

анных точек либо отрезок прямой («отрезок покоя«), часть плоскости («пластинка покоя«,

«зона застоя«) и т.д.

Для иллюстрации на рис. 18.3 приведены примеры фазовых портретов систем с мно-

жеством изолированных состояний равновесия (а) и с отрезком покоя (б). 9

Рисунок 18.3 – Состояния равновесия нелинейных систем.

9 а – фазовый портрет системы x+ 0.5x+ 5 sinx = 0; б – системы x+ signx+ x = 0.

152

Page 153: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

18.3.5 Неединственность решений. Пересечение траекторий

Как известно из теории дифференциальных уравнений [10], уравнение (18.11) имеет реше-

ние, притом единственное, при выполнении так называемого условия Липшица, согласно

которому для всех x′, x′′ ∈ X существует константа (константа Липшица) L>0 (L< ∞)

не зависящая от x′, x′′, что имеет место

||f(x′)−f(x′′)|| ≤ L||x′−x′′||. (18.13)

Это утверждение является одной из теорем о существовании и единственности решений

нормальной системы дифференциальных уравнений (18.11) [10,36]. Условие Липшица озна-

чает, что функция f(x) не должна изменяться в любой области пространства X быстрее

некоторой линейной функции с константой, не зависящей от выбора области.

Для линейных систем условие (18.13), очевидно, выполнено, что позволило в п. 10.1

сформулировать общие свойства фазовых портретов таких систем. Для нелинейных системусловие Липшица может быть нарушено. Например, система может содержать «разрыв-

ную» (релейную) нелинейность. Тогда в окрестности точек разрыва правые части урав-

нения (18.11) растут неограниченно быстро. Другим примером являются квадратичные,

кубичные нелинейности, произведения переменных состояния в f(x) и т.д. 10

В зависимости от вида функции f(x) для нелинейных систем возможны разные про-

цессы, вызванные нарушением указанного условия. Например, возможно слияние различ-ных фазовых траекторий в одну. Такой вид поведения свойствен, прежде всего системамс разрывными нелинейностями. Например, в оптимальных по быстродействию системахво многих случаях все траектории сливаются в одну, проходящую через заданную точ-

ку [33]. В системах с релейно-логическим управлением также возможен предельный цикл,

состоящий из участков фазовых кривых, на который изображающая точка попадает из

различных начальных условий за конечное время (см. рис. 18.4, a). Характерно также по-явление скользящих режимов, при которых разные траектории попадают через конечное

время на некоторую поверхность (не являющуюся, вообще говоря, решением (18.11)). Какчастный случай движение по некоторой траектории может за конечное время привести ксостоянию равновесия системы. Это означает, что переходный процесс в непрерывной нели-нейной системе может иметь конечную длительность, что исключено для стационарных

10 Иногда используется так называемое локальное условие Липшица (в отличие от глобального (18.13)),согласно которому константа L должна «обслуживать» лишь некоторую ограниченную область простран-ства состояний [19]. Тогда, например для f(x) = x2, выполнено локальное условие Липшица, а дляf(x) = sign(x) в окрестности точки 0 оно не выполнено. Глобальное условие Липшица (18.13) не выпол-нено в обоих случаях.

153

Page 154: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

непрерывных линейных систем.

Заметим, что для таких систем теряется возможность определить развитие процессав прошлом по его текущему состоянию. Ранее динамические детерминированные системыбыли определены как системы, у которых по начальному состоянию и входному процессуможно однозначно определить будущее поведение. Отмеченное выше свойство не противо-речит данному определению, так как последнее относится к будущему, а не к прошломуразвитию процесса. Рассмотрим теперь следующий пример.

Пусть система описывается уравнением первого порядка

x(t)=sign(x(t))√

|x(t)|, x(0)=x0.

Положим x0 =0. Очевидно, уравнение имеет тривиальное решение x1(t) ≡ 0. Кроме того,

непосредственной подстановкой убеждаемся, что функции x2(t) =t2

4и x3(t) =−t

2

4также

есть решения данного уравнения при указанном начальном условии.

Заметим, что в данном примере условие Липшица нарушено в окрестности начала ко-ординат.

Следовательно, нелинейность уравнений системы может привести к сложности в опре-делении самого понятия ее состояния. Конечно, при технической реализации такой системыили ее моделировании развитие процесса пойдет по конкретной траектории, однако полу-ченное решение будет сильно зависеть от начальных условий, погрешностей, возмущений.Здесь мы обращаем внимание на возникающие теоретические затруднения.

18.3.6 Скользящие режимы

Важным классом нелинейных систем с разрывной правой частью являются системы, длякоторых свойственно существование скользящих режимов – движения изображающей точ-ки по поверхности разрыва, вызванное тем, что векторы фазовой скорости направленыотносительно этой поверхности в противоположные области. В результате изображающаяточка движется по поверхности разрыва, причем вектор фазовой скорости не может бытьопределен по уравнениям системы ни для одной из областей.

Возникновение скользящего режима на кривой, заданной уравнением σ(x) = 0, пока-

зано на рис. 18.4, б. Как видно из рисунка, векторы фазовой скорости вблизи границыразрыва направлены в противоположные области. Это приводит к тому, что изображаю-

щая точка за конечное время попадает на кривую σ(x) = 0 и далее движется по ней. Здесь

также наблюдается пересечение различных фазовых траекторий.

154

Page 155: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 18.4 – Пересекающиеся траектории и скользящий режим

Возникает задача определения движения системы по указанной поверхности, другими

словами – определения решения уравнения (18.11), если функция f(x) претерпевает разрыв

(по x) в каждый момент времени. Известен ряд подходов к решению этой задачи (см.

[17, 46]). Некоторые из них будут рассмотрены в п. 22

18.3.7 Влияние внешних воздействий

Для нелинейных нестационарных систем, систем подверженных внешним воздействиям,характер поведения становится еще более сложным. Как отмечено выше, в нелинейном слу-чае отсутствует свойство разделения, поэтому как устойчивость, так и качество процессовв таких системах следует изучать, вообще говоря, с учетом одновременно как начальныхусловий, так и внешних воздействий.

При внешних воздействиях могут возникать такие явления, как подавление и возбужде-

ние автоколебаний (в зависимости от входного процесса), принудительная синхронизация

колебаний, режим биений, явление скачкообразного и параметрического резонанса, возник-

новение хаотических процессов и т.д. [11, 32, 33].

Актуальным является вопрос изучения влияния нелинейных звеньев на свойства си-стемы, для которой в основном применимо линейное описание. Здесь могут быть самыеразнообразные ситуации. Остановимся лишь на некоторых.

При наличии нечувствительности датчиков систем управления прежде всего падаетточность системы. Кроме того, для статически неустойчивых объектов управления из-за

155

Page 156: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

вызванного нечувствительностью уменьшения коэффициента передачи при малых откло-нениях состояние равновесия становится неустойчивым. Это может привести к автоколеба-

тельному (или даже расходящемуся) процессу [50]. Аналогичное влияние оказывает кванто-

вание сигналов по уровню в системах с цифровыми регуляторами [11, 33].

Влияние насыщения аналогично уменьшению коэффициента усиления для сигналовбольшой амплитуды. Если для абсолютно устойчивых систем это приводит к потере точ-ности, то для условно устойчивых систем насыщение может привести к неустойчивости.Кроме того, при насыщении сигнала управления доля демпфирующих составляющих вуправляющем воздействии уменьшается, что также может привести к нежелательным с

точки зрения устойчивости системы явлениям [50].

Релейные (разрывные) характеристики при малых отклонениях входного сигнала про-

являют себя как звенья с большим коэффициентом усиления. Это приводит к повышениюточности, однако может вызвать нежелательные автоколебания или нарушение устойчиво-

сти системы [33,39, 46, 48].

156

Page 157: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 19

19 Методы исследования нелинейных систем

19.1 Задачи и методы теории нелинейных систем

Имеются две основные задачи теории нелинейных систем управления.

Первая основная задача – анализ. Анализ состоит в исследовании известной математи-ческой модели системы с целью определения ее свойств и установления зависимости этихсвойств от параметров системы. Различают следующие задачи анализа.

Анализ при фиксированных параметрах. При исследовании свободного движениясистемы устанавливается разбиение пространства состояний на траектории. Выясняются

существование и устойчивость установившихся режимов (к которым относятся состояния

равновесия, предельные циклы), выясняются области притяжения этих режимов. Произ-водится оценка качества переходных процессов.

Выполняется исследование характера вынужденных режимов при влиянии на системувнешних воздействий. Здесь требуется учитывать виды и уровни воздействий, возникаю-щих в процессе эксплуатации системы.

Анализ при различных параметрах. Рассматривается класс нелинейных систем

одинаковой структуры, но обладающих различными параметрами {μ1, μ2, . . . , μk}. Точка впространстве параметров {μ} отвечает конкретной системе из данного класса. Простран-ство параметров разбивается на области с топологически эквивалентными фазовыми порт-ретами. Границы этих областей называются бифуркационными поверхностями, построениекоторых и входит во вторую задачу анализа.

Вторая основная задача – синтез. Синтез заключается в определении закона управле-

ния, обеспечивающего требуемое (например, оптимальное, в каком-либо смысле) качество

работы системы. Синтез может выполняться при заданной или свободной структуре регу-лятора.

Синтез при заданной структуре регулятора. Вид закона управления считаетсязаданным, задача состоит в параметрическом синтезе, т.е. в определении параметров ре-гулятора, обеспечивающих наилучшее значение заданного показателя качества.

Наиболее простой с точки зрения привлекаемой теории является параметрический син-тез. Он выполняется посредством анализа и отбора вариантов с помощью известных вматематическом программировании алгоритмов оптимизации. Здесь, правда, следует учи-тывать, что объем работ при анализе может оказаться недопустимо большим для его мно-

157

Page 158: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

гократного выполнения. Кроме того, важно правильно построить функцию качества си-стемы, которая бы адекватно отражала характерную для практики многокритериальностьпри формализации задачи. Поэтому при параметрическом синтезе имеют большое значениеи теоретические исследования.

Синтез при свободной структуре регулятора. Вид закона управления не задани должен быть получен в результате синтеза. При такой постановке задачи используются

методы перечисленных в п. 18.1 направлений теории систем (оптимальное, адаптивное иэкстремальное управление, методы нелинейной коррекции, систем с переменной структурой

и т.д.). Вопрос об использовании того, или иного, метода решается на основе предъявленных

к системе требований и сведений об условиях ее работы.

Несмотря на то что синтез при свободной структуре регулятора кажется еще болеесложным, чем параметрический синтез, надо заметить, что в теории известны некоторыеподходы, при которых структура, а иногда и параметры закона управления, получаются«автоматически» исходя из цели управления. Это относится, например, к решению ряда

оптимизационных задач [33,39], к синтезу адаптивных законов управления [47,48] и регуля-

торов с переменной структурой на скользящих режимах [46]. Некоторые из перечисленныхметодов рассматриваются ниже.

Теория нелинейных систем прошла длительный путь становления и продолжает интен-сивно развиваться в настоящее время. Эта теория постоянно обогащается результатами, вее рамках появляются новые направления.

Методы теории нелинейных систем можно разбить на аналитические и численные. Ана-литические методы в свою очередь можно разделить на точные и приближенные. Средичисленных методов исследования основную роль играют сейчас машинные методы, связан-ные с изучением свойств нелинейных систем на ЭВМ, хотя находят применение и графиче-ские, или графо-аналитические, методы.

Точные методы в отличие от приближенных имеют строгое теоретическое обоснование,ясна область их применения, полученные с помощью этих методов результаты дают точ-

ные (с учетом выполненных предварительных допущений) сведения о системе. К недостат-

кам этих методов относится обычно сравнительно узкая область применения – некоторыеусложнения модели системы могут привести к невозможности найти подходящий точныйметод. Другим их недостатком могут оказаться высокие требования к теоретической подго-товке исследователя. Приближенные методы менее зависят от сложности рассматриваемойзадачи и, кроме того, ориентированы на использование инженерных методик проектирова-ния.

Аналитические методы в принципе позволяют получить результат в общем виде – в

158

Page 159: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

форме соотношений, связывающих параметры системы с ее характеристиками. Это упро-щает процедуру параметрического синтеза. Но аналитические методы обладают меньшейуниверсальностью, чем численные. Это связано с известной сложностью аналитическо-го исследования нелинейных систем. Другой проблемой, возникающей при использованиианалитических методов, может стать сложность полученных выражений для последую-щего использования. В этом случае может оказаться, что непосредственное применениечисленных методов позволяет с меньшими предварительными затратами и допущениямиполучить требуемый результат.

Ниже будут рассмотрены некоторые известные методы исследования нелинейных си-стем.

19.2 Методы фазового пространства

Методы фазового пространства относятся к наиболее ранним точным аналитическим мето-

дам теории нелинейных систем. К ним относится метод фазовой плоскости (Леоте, 1885)

и метод точечных отображений (Пуанкаре, Биркгоф) [36].

19.2.1 Метод фазовой плоскости

Метод фазовой плоскости используется для исследования автономных систем второго по-рядка и заключается в построении фазовых портретов. Для этого из уравнений состоянияисключается время и определяются уравнения фазовых кривых. При использовании этогометода целесообразно приведение уравнений системы к канонической форме.

Задача становится достаточно простой, если рассматривается система с кусочно-линей-ной характеристикой. Тогда в разных областях пространства состояний система описывает-ся линейными уравнениями, в соответствии с которыми строятся фазовые траектории. Да-лее выполняется «сшивание» траекторий по линиям переключения, определяемым видомнелинейной зависимости. Это позволяет построить фазовый портрет исследуемой нелин-

ейной системы.1 Далее, поскольку состояния на границах интервалов определены, можно

получить и вид переходных процессов в системе (метод припасовывания).

Хотя этот метод имеет ограниченное применение, он остается удобным средством ис-следования нелинейных систем невысокого порядка с «простыми» нелинейными характе-ристиками.

1 Здесь используется свойство, согласно которому конечные значения состояния системы на некотороминтервале могут использоваться в качестве начальных для следующего интервала, см. 1

159

Page 160: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

19.2.2 Метод точечных отображений

Метод точечных отображений, или отображений Пуанкаре, состоит в построении некото-рой секущей поверхности L и траекторий, выпущенных из L. Одно из основных приме-

нений метода – анализ устойчивости и определение параметров (частоты и амплитуды)

предельных циклов при n = 2. Изложим вкратце основные положения данного метода,

следуя [36].

Пусть G есть некоторый предельный цикл. Выберем кривую L – секущую, без касанияпересекающую G. Пусть точка x0 ∈ G, x0 ∈ L – точка пересечения кривых G и L. Выберемблизкую к ней точку x′ ∈ L. Пусть соответствующая x′ траектория пересекает в следующийраз кривую L в некоторой точке x′′ ∈ L. Зависимость x′′ = Ψ(x′) есть точечное отобра-жение, переводящее исходную точку пространства состояний в другую в соответствии суравнениями системы. Точка x0, находящаяся на траектории предельного цикла, является

неподвижной точкой отображения Ψ(·), т.е. выполнено равенство x0 = Ψ(x0).

Введем ρ(x) – расстояние вдоль линии L от начальной точки O этой кривой до точки

x. Обозначим g = ρ(x′), h = ρ(x′′). Используя точечное отображение, получаем функцию

последования h = ϕ(g). Очевидно, что если g0 = ρ(x0), то неподвижная точка, принадле-жащая предельному циклу, находится из решения уравнения

g0 = ϕ(g0). (19.1)

Графически решение этого уравнения можно представить как отыскание точек пересече-

ния биссектрисы координатной плоскости (g, h) с функцией последования h = ϕ(g). Изуче-

ние поведения функции последования в точках пересечения дает возможность определить

устойчивость соответствующего предельного цикла. Если 0 <dϕ(g)

dg

∣∣∣g=g0

< 1, то имеется

устойчивый предельный цикл (автоколебания); еслиdϕ(g)

dg

∣∣∣g=g0

> 1, то предельный цикл

неустойчив (более подробные сведения приведены в [36]). Наибольшую сложность в исполь-

зовании метода точечных отображений вызывает определение функции последования.

Пример использования метода точечных отображений для исследования генератораколебаний рассмотрен в п. 19.3.4 с. 169.

В последнее время появились публикации, в которых метод точечных отображений

используется для исследования хаотических процессов, см. [8, 9, 32].

160

Page 161: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

19.2.3 Условия существования предельных циклов для систем второго порядка

В рамках метода фазовой плоскости получены следующие результаты, имеющие важное

значение при исследовании наличия предельных циклов у систем второго порядка [39]. К

ним, в первую очередь, относятся теоремы Пуанкаре–Бендиксона.

Теорема 1 (А. Пуанкаре). Для произвольной замкнутой области фазовой плоскости2 разница между числом находящихся внутри нее особых точек типа «узел» , «центр» ,«фокус» N и особых точек типа «седло» S равна 1, т.е. индекс Пуанкаре IP = N − S = 1.

Теорема 2 ( первая теорема И. Бендиксона). Если для системы второго порядка

{x1(t) = f1(x1, x2),x2(t) = f2(x1, x2)

функции f1(x1, x2), f2(x1, x2) имеют частные производные по x1, x2, то предельный цикл не

существует в той области P фазовой плоскости, где ∂f1(x1, x2)∂x1

+∂f2(x1, x2)

∂x2не равна нулю

или не изменяет знака.

Теорема 3 ( вторая теорема Бендиксона). Если траектория автономной системы

второго порядка находится внутри ограниченной области P и при этом не стремится кположению равновесия, то эта траектория является либо устойчивым предельным циклом,либо стремится к нему.

Теорема 4 (А. Пуанкаре). Замкнутая траектория G автономной системы второго по-

рядка является устойчивым 3 предельным циклом, если∫G

(∂f1(x1, x2)

∂x1+∂f2(x1, x2)

∂x2

)dt <

0.

19.3 Метод гармонической линеаризации (гармонического баланса)

Метод гармонической линеаризации (по другой терминологии – гармонического баланса) от-

носится к приближенным аналитическим методам исследования нелинейных систем. Этотметод имеет давнюю историю. Он восходит к работам

Н.М. Крылова и Н.Н. Боголюбова (1934), Л.С.Гольдфарба (1957), Р.Коченбургера (1950),

Е.П.Попова (1960). Метод широко используется в инженерной практике, применяется втеоретических исследованиях и продолжает развиваться.

2 В том числе и предельного цикла.3 Точнее – орбитально асимптотически устойчивым, см. с. 178.

161

Page 162: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Метод гармонической линеаризации предназначен прежде всего для исследования пе-

риодических (автоколебательных) процессов в нелинейных системах, однако известно при-

менение метода и для исследования колебательных переходных процессов, а также для

решения более широкого круга задач [11, 33, 39, 50].

19.3.1 Основные положения. «Свойство фильтра»

Рассмотрим замкнутую нелинейную систему с одним нелинейным блоком, уравнения ко-

торой имеют вид (см. также п. 18.6)

x(t) = Ax(t) +B(− ξ(t)

), σ(t) = Cx(t),

ξ(t) = ϕ(σ(t)).

Здесь x(t) ∈ Rn – вектор состояния линейной части системы; σ(t) ∈ R – выход линейной

части системы; ξ(t) ∈R – поступающий на вход линейной части выход нелинейной части

со статической характеристикой ϕ(·). 4 Первое из уравнений (19.2) задает линейную часть

системы. Ему соответствует передаточная функция

Wл(s) = C(sIn − A)−1B =

B(s)

A(s)(19.2)

от входа (−ξ) к выходу σ.

Используя операторную форму записи 5 с оператором дифференцирования p =d

dt,

уравнения (19.2) можем переписать в виде

A(p)σ(t) = −B(p)ξ(t), (19.3)

ξ(t) = ϕ(σ(t)),

в котором коэффициенты операторных многочленов A(p), B(p) совпадают с коэффициен-тами многочленов A(s), B(s) передаточной функции (19.2).

Пусть в системе (19.3) имеет место периодический процесс с некоторой частотой Ω (и

периодом T = 2π/Ω). Нас прежде всего будет интересовать определение характеристик4 Знак «минус» при входном процессе в первом уравнении взят для того, чтобы сохранить традиционное

для классической теории линейных систем правило знаков в главной обратной связи системы.5 Заметим, что такая форма записи является, по существу, компактной записью дифференциального

уравнения n-го порядка, полученного из (19.2).

162

Page 163: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

этого процесса (амплитуды и частоты), а также анализ его устойчивости. Итак, полагаем,

что σ(t) ≡ σ(t+ T ). Тогда и ξ(t) ≡ ξ(t+ T ).

Основное допущение, принятое в методе гармонической линеаризации, так называемая

гипотеза (свойство) фильтра, состоит в том, что для амплитудно-частотной характери-

стики линейной части системы H(ω) = |Wл(jω)| выполнено неравенство

H(Ω) � H(kΩ), k = 2, 3, 4, . . . , (19.4)

т.е. коэффициент передачи линейной части системы на основной частоте значительно пре-

восходит коэффициент передачи для высших частот. 6

Дальнейший план действий состоит в следующем. Предполагая гипотезу фильтра вы-полненной, заметим, что можно пренебречь составляющими процесса на выходе линейной

части с высшими частотами 2Ω, 3Ω, . . . (ввиду малости для них коэффициента передачи)

и считать, что на выходе линейной части имеется гармонический сигнал с частотой Ω. Навыходе нелинейной части системы конечно появятся составляющие с высшими частотами

(не высказывается предположений о фильтрующих свойствах нелинейного звена). Но из-затого что высшие гармоники не вызывают существенной реакции на выходе линейной частисистемы, можно не учитывать их влияния на динамику замкнутой системы. Следователь-

но, при исследовании замкнутой системы (19.2) можно приближенно считать, что как вход,

так и выход нелинейного звена являются гармоническими колебаниями, 7 благодаря чему

и выполняется (гармоническая) линеаризация нелинейности.

19.3.2 Коэффициенты гармонической линеаризации

Согласно сделанному выше предположению, как на входе, так и на выходе нелинейногозвена имеются гармонические процессы одинаковой частоты Ω. Какой вывод можно сделатьотносительно свойств этого звена?

Рассмотрим следующие примеры.

Пример 1. Пусть σ(t) = A sinΩt – гармонический процесс с амплитудой A �= 0 и

частотой Ω. Предположим, что выходной процесс данного звена есть тоже гармоника ча-стоты Ω, совпадающая по фазе со входным процессом, но имеющая амплитуду A1, т.е.

ξ(t) = A1 sinΩt.

6 Как видно, данное свойство формулируется в нечетких терминах. Кроме того, для его проверки следуетзнать основную частоту, которая еще подлежит определению. Поэтому можно считать свойство фильтраa priori выполненным, а затем проводить анализ H(ω) для найденной основной частоты, см. также [50].

7 Возможно, что эти колебания несимметричные и содержат постоянную составляющую.Метод гармони-ческой линеаризации применяется и для исследования таких процессов [11,33,39,50], однако для простотыизложения мы здесь считаем колебания симметричными.

163

Page 164: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Из первого выражения находим, что sin Ωt =σ(t)

A. Подставляя это выражение в фор-

мулу для ξ(t), получим

ξ(t) =A1

Aσ(t) = qσ(t), где q =

A1

A– некоторый коэффициент.

Таким образом, при сделанном предположении, рассматриваемое звено ведет себя как

линейное безынерционное звено ξ(t) = qσ(t) с коэффициентом передачи q. Такое звено

можно описать передаточной функцией W(s) = q.

З а м е ч а н и е . Полученный результат не позволяет сделать вывод о том, чтоданное звено является линейным и безынерционым, так как не рассмотрены произвольныевходные процессы. Утверждается лишь, что по отношению ко входному гармоническомувходному процессу с данными частотой и амплитудой рассматриваемое звено ведет себякак линейное.

Высказанному допущению о возможности учитывать только основную гармонику непротиворечит зависимость отношения амплитуд A1 и A и, следовательно, также коэффи-

циента передачи q от амплитуды или от частоты входного процесса: q = q(A), q = q(A,Ω).

Соответственно получим W(s, A) = q(A), W(s, A,Ω) = q(A,Ω) – передаточные функции

гармонически линеаризованных звеньев зависят от A (или от A и Ω), как от параметра. Втакой зависимости и проявляется принципиальное отличие характеристик линейных зве-ньев от нелинейных.

Пример 2. Пусть теперь при том же входном процессе σ(t) = A sinΩt выходной процесс

имеет фазовый сдвиг, т.е. ξ(t) = A1 sinΩt+B1 cosΩt. Дифференцируя выражения для σ(t)

по t и предполагая, что A �= 0, Ω �= 0, получим выражение для cosΩt через σ(t) : cosΩt =1

AΩσ(t). Подставляя его в формулу для ξ(t) и с учетом найденного в примере 1 выражения

для sinΩt получим ξ(t) =A1

Aσ(t) +

B1

A

1

Ωσ(t). Обозначив q =

A1

A, q′ =

B1

A, перепишем

выражение для ξ(t) в виде

ξ(t) = qσ(t) +q′

Ωσ(t).

Как и в предыдущем примере, коэффициенты q, q′, называемые коэффициентами гармони-ческой линеаризации нелинейных звеньев, могут зависеть от амплитуды и частоты входного

процесса: q = q(A), q′ = q′(A), или q = q(A,Ω), q′ = q′(A,Ω). Полученному выражению

соответствует передаточная функция звена форсирующего типа:W(s, A,Ω)=q(A)+q′(A)Ω

s.

164

Page 165: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

8

Рассмотрим теперь «технику» вычисления коэффициентов гармонической линеариза-ции. Пусть по-прежнему

σ(t) =A sinΩt. Представим периодический выходной процесс ξ(t) в виде ряда Фурье [11,

29, 33, 39]:

ξ(t) ≡ ϕ(σ(t)) ≡ ϕ(A sinΩt) = A0 + A1 sin Ωt +B1 cosΩt +

+ A2 sin(2Ωt) +B2 cos(2Ωt) + · · · .

Согласно принятой гипотезе, ограничимся слагаемыми с частотой не выше частоты основ-

ной гармоники, т.е. примем ξ(t) ≈ A0+A1 sin Ωt+B1 cosΩt, где коэффициенты разложения

Фурье определяются выражениями [29]

A0 =1

∫ 2π

0

ϕ(A sinψ)dψ,

A1 =1

π

∫ 2π

0

ϕ(A sinψ) sinψdψ, (19.5)

B1 =1

π

∫ 2π

0

ϕ(A sinψ) cosψdψ

Подстановкой полученных значений в выражения для q(A),

q′(A) найдем, что

q(A,Ω) =1

πA

∫ 2π

0

ϕ(A sinψ) sinψdψ, (19.6)

q′(A,Ω) =1

πA

∫ 2π

0

ϕ(A sinψ) cosψdψ (19.7)

Вычисления по приведенным формулам достаточно просты, и для многих типовых нели-нейных звеньев выполняются аналитически. Например, для релейного звена с характери-

стикой ϕ(σ) = c sign(σ) получается q(A) =4c

πA, q′(A) = 0.

Обратим внимание на то, что в данном методе в виде ряда представляется не нели-

нейная зависимость (как при обычной линеаризации по Тейлору), а процесс (функция от8 Для звеньев с пассивной гистерезисной характеристикой q′(A) < 0, поэтому линеаризованное звено,

как правило, неминимально-фазовое.

165

Page 166: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

времени), что позволяет учесть специфические автоколебательные свойства нелинейныхсистем.

Заметим, что при симметричных колебаниях и нечетной однозначной статической нели-

нейности ϕ(·), как видно из (19.7) q′ = 0, что упрощает дальнейший анализ.

Отметим также, что коэффициенты гармонической линеаризации можно получить и

при наличии постоянной (медленно меняющейся) составляющей на выходе линейной части

системы: σ(t) = σ0+A sin Ωt. Это позволяет исследовать несимметричные колебания и вли-

яние внешнего воздействия на систему (более подробные сведения приведены, например,

в [39, 50]).

Обратимся теперь непосредственно к исследованию замкнутой системы (19.2).

19.3.3 Уравнение гармонического баланса

Рассмотрим уравнение замкнутой системы (19.2), записанное в виде (19.3). Прежде чем

обратиться к исследованию предельных циклов в нелинейной (линеаризованной) системе,повторим приведенные в п. 3.4.1 с. 26, рассуждения о реакции линейной системы на гар-моническое входное воздействие применительно к рассматриваемому случаю.

Пусть линейная стационарная система описывается дифференциальным уравнением,

которое для компактности записи представим в операторной форме (см.(19.3)):

A(p)σ(t) = −B(p)ξ(t).

Найдем частное решение этого уравнения при ξ(t) = ξ0eλt для некоторого постоянного

λ ∈ C. Это решение будем искать в виде σ(t) = σ0eλt. Подстановкой выражений для

ξ(t), σ(t) в данное уравнение получим, что если имеет место нерезонансный случай, т.е.

A(λ) �= 0, где A(s) – многочлен от переменной s ∈ C, коэффициенты которого совпадают

с соответствующими коэффициентами операторного многочлена A(p), функция σ(t) ука-

занного вида является решением, причем σ0 = −B(λ)

A(λ)ξ0. Окончательно, искомое решение

имеет вид σ(t) = −Wл(λ)ξ(t), где Wл(λ) = Wл(s)∣∣s=λ

, Wл(s) – передаточная функция,

соответствующая уравнению (19.3) (см. (19.2) и п. 3.4). Положим теперь λ = jΩ. Тогда

σ(t) = −W(jΩ)ξ(t), Wл(jΩ) – частотная передаточная функция рассматриваемой системы.

Полученное выражение дает возможность найти реакцию на гармоническое входное воз-

действие в нерезонансном случае. Действительно, представив процесс ξ(t) = ξ0 cosΩt как

166

Page 167: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ξ(t) =ξ02

(ejΩt + e−jΩt

), используя свойство суперпозиции, получим

σ(t) = −ξ02

(Wл(jΩ)e

jΩt +Wл(−jΩ)e−jΩt).

Представив теперь Wл(jΩ)=H(Ω)ejψ(Ω), где H(Ω)=abs(Wл(jΩ)) – амплитудночастотная, а

ψ(Ω) = arg(Wл(jΩ)) – фазочастотная характеристики линейной части системы, получим

σ(t)=−ξ02H(Ω)

(ej(Ωt+ψ(Ω)+e−j(Ωt+ψ(Ω))

)= −ξ0H(Ω) cos(Ωt + ψ(Ω).

Рассмотрим теперь замкнутую систему с линейной обратной связью, полагая ξ(t) =

qσ(t). Полагая по-прежнему, что ξ(t) = ξ0ejΩt, ξ0 �= 0, получим систему уравнений

σ(t) = −W(jΩ)ξ(t),

ξ(t) = qσ(t).

Подстановкой выражения для ξ(t) из первого уравнения во второе находим, что данные

уравнения будут совместны для всех t, если справедливо выражение

qWл(jΩ) = −1, (19.8)

которое является уравнением гармонического баланса для линейных систем. Итак, длясуществования незатухающих колебаний в автономной линейной системе с передаточной

функцией Wл(s), замкнутой отрицательной обратной связью с коэффициентом q необходи-

мо, чтобы при некотором значении ω = Ω амплитудно-фазовая характеристика «линейной

части» системы Wл(jω) проходила на комплексной плоскости через точку (−q, 0). 9 За-

метим, что выражение (19.8) не позволяет определить амплитуды колебаний ξ0, σ0 (так

как условие баланса (19.8) не содержит этих величин). В этом проявляется отмеченное длялинейных систем отсутствие изолированных замкнутых траекторий и, следовательно – ав-токолебаний. Разные начальные условия в таких системах приводят к разным амплитудамколебаний.

Обратимся теперь непосредственно к задаче исследования периодических режимов внелинейной системе, предполагая, что вместо нелинейного звена взяты линеаризованные

9 Полученный результат полностью соответствует известному критерию устойчивости Найквиста ли-нейных систем [11, 29, 33]. Заметим, что здесь не обсуждался вопрос об устойчивости замкнутой системы.Найденные условия есть необходимые условия существования незатухающих колебаний. В системе такжеимеются переходные составляющие, которые могут быть и расходящимися.

167

Page 168: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

уравнения, полученные рассмотренным в предыдущем параграфе методом. Итак, будемсчитать, что система описывается уравнениями

A(p)σ(t) = −B(p)ξ(t), (19.9)

ξ(t) = q(A,Ω)σ(t) +q′(A,Ω)

Ωσ(t),

в котором коэффициенты гармонической линеаризации q(A,Ω), q′(A,Ω) определяются соот-

ношениями (19.6), (19.7). Пусть опять ищется решение в предположении, что ξ(t) = ξ0ejΩt.

Из первого уравнения получаем σ(t) = ξ0Wл(jΩ)ejΩt, тогда

σ(t) = −jΩξ0Wл(jΩ)ejΩt.

Имеем цепочку равенств

ξ(t) = q(A,Ω)σ(t)+q′(A,Ω)

Ωσ(t) = ξ0e

jΩtWл(jΩ)(q(A,Ω)+jq′(A,Ω)

). Как и выше, учитывая

что ξ(t) = ξ0ejΩt, получаем следующее уравнение гармонического баланса для нелинейной

(линеаризованной) системы:

(q(A,Ω) + jq′(A,Ω)

)Wл(jΩ) = −1. (19.10)

Найденное выражение является основным соотношением метода гармонической линеари-зации и служит для определения параметров колебаний нелинейной системы. Важно от-

метить, что в условие гармонического баланса (19.10) входит и амплитуда колебаний. 10

Следовательно, оно нарушается при изменении амплитуды. Таким образом, метод гармо-нической линеаризации позволяет учесть возможность существования предельных циклову нелинейных систем.

Уравнение (19.10) записано в комплексных величинах. Ему соответствует система из

двух уравнений с вещественными коэффициентами. В этой системе имеются две неизвест-ные величины – параметры A и Ω. Следующим шагом использования метода является

разрешение (19.10) относительно указанных переменных.

Уравнение (19.10) записывают в разной форме [11, 33, 39, 50].10 Заметим, что, поскольку при выводе коэффициентов гармонической линеаризации использовалась

амплитуда A процесса на выходе линейной части системы, то именно она определяется уравнением (19.10).Для определения амплитуд колебаний в других точках (например, на выходе системы, который может несовпадать с выходом ее линейной части), следует учитывать частотные характеристики промежуточныхзвеньев.

168

Page 169: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Например, можно представить его в виде соотношения между многочленами в числи-теле и знаменателе передаточной фукнции линейной части. Тогда оно принимает вид

A(jΩ) + ((q(A,Ω) + jq′(A,Ω)

)B(jΩ) = 0 (19.11)

Если определить характеристический многочлен замкнутой системы как D(s) = A(s)+(q(A,Ω)+ s

q′(A,Ω)Ω

)B(s), то (19.11) соответствует прохождению амплитудно-фазовой ха-

рактеристики многочлена D(s) 11 через начало координат, D(jΩ) = 0.

В некоторых случаях удобнее рассматривать (19.10) как равенство двух параметриче-

ски заданных функций Wл(jω) и

− 1

q(a, ω) + jq′(a, ω). Такой способ удобен, когда коэффициенты гармонической линеа-

ризации не зависят явно от частоты. В этом случае строятся две параметрические кривые

– годограф линейной части системы от параметра ω и годограф функции − 1

q(a) + jq′(a)

– от параметра a. Точки их пересечения отвечают уравнению гармонического баланса. Вэтих точках определяются Ω = ω – по первой кривой и A = a – по второй кривой.

Следующим шагом является анализ устойчивости периодического режима. Данныйанализ без строгого обоснования выполняется в рамках рассматриваемого метода с исполь-зованием отмеченных интерпретаций уравнения гармонического баланса с помощью крите-

риев устойчивости линейных систем (амплитудно-фазового критерия Эрмита–Михайлова,

критериев Найквиста, Гурвица). Достаточно подробные сведения приведены в литературе

(см., например, [11, 29, 33, 39, 50]).

19.3.4 Пример. Исследование генератора колебаний

Рассмотрим упрощенную модель генератора незатухающих колебаний [36,39]. Модель пред-

ставляет собой колебательное звено с передаточной функцией W(s) = kT 20 s

2 + 2ζT0s+ 1, за-

мкнутое положительной обратной связью по скорости через релейный элемент u = c signx

(рис. 19.1).

Обратимся вначале к описанному в п. 19.2.2 методу точечных отображений.11 Амплитудно-фазовой характеристикой многочлена D(s) (кривой Эрмита–Михайлова) называется

годограф функции D(jω) на комплексной плоскости при изменении ω от −∞ до +∞ [11, 33].

169

Page 170: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 19.1 – Структурная схема генератора колебаний.

Для исследования системы используем каноническую форму фазовой переменной (см.

с. 42), в которой переменные состояния связаны как функция и производная:

x1(t) = x(t), x2(t) = x(t). Предполагая наличие в системе предельного цикла G, получимфункцию последования. Для этого проведем из начала координат в сторону положитель-

ных значений x луч L (рис. 19.2,а, а также рис. 18.2,б на с. 150). Выберем начальную точку

x′ ∈ L. Требуется получить координаты точки x′′ ∈ L, в которой происходит следующеепересечение траектории и линии L. В выбранном базисе точкам на луче L соответству-ют нулевые значения x, в верхней полуплоскости x > 0, следовательно u = c; в нижнейполуплоскости x < 0 и u = −c. Поэтому чтобы получить функцию последования надорассмотреть переходную характеристику колебательного звена при начальных условиях

x(0) = g, x(0) = 0 и x(0) = g′, x(0) = 0 (рис. 19.2,б). Как известно [11,33], эта характеристи-

ка стремится к установившемуся значению x∞ = limt→∞ x(t) = ku, где k – коэффициент

передачи, u – величина входного воздействия (в рассматриваемом случае u = ±c, поэтомуx−∞ = −ck, x+∞ = ck). Если известно перерегулирование σ, 12 то, как нетрудно убедиться,

при произвольном x(0) и x(0) = 0 выполнено maxt x(t) = x∞ + σ(x∞ − x(0)

). Применяя эту

формулу дважды (при x∞ = −ck, x(0) = g и x∞ = ck, x(0) = g′), находим g′ = −(1+ck)−σg,h = ck+σ(ck−g′) = ck(1+σ)2+σ2g. Следовательно, функция последования ϕ(g) в рассмат-

риваемом примере линейная и имеет ϕ(g) = ck(1 + σ)2 + σ2g. Для определения амплитуды

12 При нулевых начальных условиях перерегулирование σ определяется как σ =max

tx(t)− x∞x∞ .

170

Page 171: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

предельного цикла следует решить уравнение g0 = ϕ(g0), что приводит к формуле

g0 = ck1 + σ1− σ . (19.12)

Рисунок 19.2 – Точечное отображение (а) и переходная характеристикаколебательного звена (б).

Рисунок 19.3 – Функция последования h = ϕ(g).

У устойчивых колебательных звеньев параметр 0 < σ < 1, поэтому формула (19.12)

приводит к конечным положительным значениям амплитуды колебаний на выходе системы

(очевидно, что для предельного цикла Ax = maxt x(t) ≡ g0). Граничным является случай

σ = 1, соответствующий консервативному звену (ζ = 0). При этом положительная обратная

171

Page 172: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

связь с ограниченным по уровню сигналом приводит к неограниченному росту «амплиту-ды» выходного процесса. Графически это явление представляется отсутствием пересече-

ния функции последования ϕ(g) с биссектрисой координатного угла плоскости (g, h). Ис-следование устойчивости периодического режима производится по значению производной

dϕ(g)dg

∣∣∣g=g0

. В рассматриваемом примере эта производная равна 0 < σ2 < 1, следовательно,

в системе устанавливаются автоколебания с амплитудой, определяемой формулой (19.12).

Графически сходимость колебаний к предельному циклу из разных начальных значений

x(0) = g′ и x(0) = g′′ показана на рис. 19.3.

Частоту автоколебаний можно определить исходя из вида весовой функции w(t) коле-

бательного звена. Так как w(t) = kT0λ

exp(− ζT0t)sin

(λT0t)( t ≥ 0), где λ =

√1− ζ2 [11,33],

то точки пересечения предельного цикла с линией L отстоят во времени на 2πT0√1− ζ2

. По-

этому частота автоколебаний Ω связана с параметрами T0, ζ звена W(s) соотношением

Ω =

√1− ζ2

T0.

Рассмотрим теперь решение той же задачи методом гармонического баланса. Выходом

линейной части системы является сигнал σ(t) ≡ x(t). Линейная часть описывается пере-

даточной функцией Wл(s) =ks

T 20 s

2 + 2ζT0s+ 1от входа ξ(t) ≡ u(t) к выходу σ(t). Следует

учесть, что в рассматриваемом примере обратная связь положительная (рис. 19.1), поэто-

му уравнение гармонического баланса (19.10) записывается с противоположным знаком в

правой части:(q(A,Ω)+

+jq′(A,Ω))Wл(jΩ) = 1. Уравнение нелинейной части системы имеет вид ξ(t) = c signσ(t).

Для релейного звена q(A) = 4cπA. Получаем следующее уравнение:

4ckjΩπA

(−T 20Ω

2 + 2ζT0jΩ+ 1) = 1.

Отсюда находим параметры предельного цикла Ω = 1T0,

A = 2ckπζT0

. Поскольку выходом линейной части системы здесь является производная от

выхода колебательного звена, для вычисления Ax следует найденную амплитуду A раз-делить на значение АЧХ дифференцирующего звена на частоте ω = Ω. Итак, по методу

172

Page 173: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

гармонического баланса получаем

Ω = 1T0, Ax =

2ckπζ

. (19.13)

Рисунок 19.4 – Амплитуда колебаний генератора и ошибка ее определенияметодом гармонического баланса.

Интересно сравнить полученный результат с точной формулой (19.12). Для этого следу-

ет установить связь между относительным коэффициентом демпфирования ζ колебатель-ного звена и перерегулированием σ. Исходя из аналитического выражения для переходной

функции [11, 33], нетрудно получить, что σ = exp

(− ζπ√

1− ζ2

). Используя эту зависи-

мость, найдем абсолютную ΔA = Ax −Ax и относительную δA =|ΔA|Ax

ошибки (Ax вычис-

ляется по формуле (19.12), Ax – по формуле (19.13)). Результаты отражены на рис. 19.4,

где показаны графики относительных (к величине коэффициента передачи ck) амплитуд

колебаний Ax и Ax, а также график относительной ошибки формулы (19.13) в зависимости

от параметра ζ. Из графиков видно, что при ζ < 0.5 относительная ошибка не превышает

10%, что является вполне удовлетворительной точностью определения характеристик си-

стемы с учетом погрешностей, неизбежно имеющихся в ее математической модели [9, 32].

Заметим, что относительная ошибка определения частоты колебаний Ω несколько больше.Как следует из точной и приближенной формул, при ζ = 0.5 эта ошибка составляет около

15%, а при ζ = 0.6 она равна 25%.

Рассмотренный пример показывает, что метод гармонического баланса может служить

173

Page 174: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

достаточно надежным способом определения параметров предельных циклов, однако по-

лученные с его помощью результаты нуждаются в проверке (см. сноску 6 на с. 163). Есливернуться к рассмотренному примеру, то отношение амплитудно-частотных характеристик

линейной части системы на частотах Ω = 1T0

и 2Ω составляет при ζ = 0.2 величину 3.9,

при ζ = 0.5 – 1.8, при ζ = 1.0 – 1.25 . Следовательно, гипотезу фильтра при ζ, близкой кединице, нельзя считать выполненной.

174

Page 175: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 20

20 Метод функций Ляпунова

Метод функций А.М.Ляпунова (прямой, или второй метод Ляпунова) относится к точным

аналитическим методам. Он является фундаментом теории нелинейных систем. Основыэтого метода заложены А.М. Ляпуновым в 90-х годах XIX столетия. Имеется большоечисло публикаций по развитию результатов Ляпунова и еще большее – по применениюметода Ляпунова в различных областях теории систем управления.

20.1 Основные определения

Рассмотрим вначале однородное уравнение

x(t)=f(x(t)

), x(0)=x0, (20.1)

полагая, что f(0)=0. Тогда точка x=0 является особой точкой – состоянием равновесия

системы. Этому начальному состоянию соответствует тривиальное решение x(t) ≡ 0, ко-

торое называется невозмущенным движением (20.1). При x0 �= 0 получаем возмущенное

движение. Ставится задача исследования устойчивости положения равновесия. На содер-жательном уровне она означает определение характера поведения возмущенного решения:будет ли оно при возрастании t приближаться к состоянию равновесия или удаляться отнего. Прежде чем дать точные формулировки, рассмотрим более общую задачу.

Выше принято, что f(0)=0. Насколько общим является это условие? Пусть, например,

для некоторого x∗ �= 0 выполнено f(x∗)=0. Тогда состоянием равновесия является точка x∗,

которой соответствует решение x(t) ≡ x∗. Чтобы свести задачу к указанной выше, сделаем

замену переменных Δx(t) = x(t)−x∗. ТогдаΔx0=x0−x∗, x(t)=Δx(t)+x∗, x(t)=Δx(t).Отсюда

получаем уравнение Δx(t) = f(Δx(t)

), где функция f

(Δx(t)

)= f

(Δx+x∗(t)

)удовлетво-

ряет условию f(0)=0. Поэтому получаем задачу исследования устойчивости тривиального

решения Δx(t) ≡ 0.

Аналогично, если требуется исследовать устойчивость движения по некоторой тра-

ектории x∗(t), являющейся решением неоднородного (в общем случае) уравнения x(t) =

f(x(t), t

), x(0)=x∗0, после замены переменных и подстановки Δx0=x0−x∗, x(t)=Δx(t)+x∗,

x(t) = Δx(t)+ x∗(t), приходим к уравнению в отклонениях Δx(t) = f(Δx(t), t

), в котором

функция f(0, t)=0 для всех t.

175

Page 176: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Следовательно, рассмотренные задачи сводятся к исследованию невозмущенного дви-

жения уравнения (20.1) либо более общего неоднородного уравнения

x(t)=f(x(t), t

), f(0, t)=0.

Приведем некоторые определения [8, 10, 29, 33, 39].

Определение 1. Положение равновесия устойчиво (по Ляпунову) при t→ ∞, если для

любого ε > 0 можно указать такое δ > 0, что для всех ||x0|| < δ справедливо неравенство

||x(t)|| < ε для всех t > 0.

Рисунок 20.1 – Устойчивость по Ляпунову.

Если через Sρ обозначить область ||x|| < ρ, то данное определение означает, что любая

траектория, начинающаяся в Sδ, не достигнет Sε.З а м е ч а н и е 1 . В приведенном определении Sδ, Sε – сферические области (в задан-

ной нормой || · || метрике). Их можно считать произвольными замкнутыми ограниченнымиобластями Sδ ⊂ Sε, Sδ �= {0} (рис. 20.1).

З а м е ч а н и е 2 . Фактически такой вид устойчивости означает непрерывную

зависимость решений от начальных условий, равномерную по t [10, 36].

З а м е ч а н и е 3 . Про устойчивость по Ляпунову иногда говорят, что это «усто-йчивость в малом» . Область Sδ, обеспечивающая заданные ограниченные отклонения отсостояния равновесия, может иметь малые размеры. Важно, что она ненулевая. В качествепримера, можно рассмотреть «обращенный маятник» с сухим трением. Имеется конечная

(пусть небольшая) область начальных состояний, в котором его вертикальное положениеустойчиво.

176

Page 177: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

З а м е ч а н и е 4 . Положение равновесия устойчивых линейных систем устойчивопо Ляпунову. Положение равновесия и предельный цикл автоколебательных нелинейныхсистем, вообще говоря, неустойчивы по Ляпунову.

Рисунок 20.2 – Асимптотическая устойчивость по Ляпунову.

Определение 2. Положение равновесия асимптотически устойчиво, если: 1) оно

устойчиво по Ляпунову; 2) существует Δ > 0 такое, что для любого ||x0|| < Δ выполнено

limt→∞ x(t)=0 (рис. 20.2).

Область SΔ называется областью притяжения, или областью асимптотической ус-

тойчивости, а точка x0=0 – притягивающей (в SΔ).

Определение 3. Положение равновесия асимптотически устойчиво в целом (гло-

бально асимптотически устойчиво), если в условиях Определения 2, SΔ = X – все про-странство состояний.

Определение 4. Положение равновесия неустойчиво (по Ляпунову), если для всех

δ > 0 найдется x0 ∈ Sδ), такое, что соответствующее решение за конечное время достигнетграниц области Sε (рис. 20.3).

Заметим, что асимптотически устойчивые линейные системы глобально асимптотиче-ски устойчивы. Также отметим, что, хотя у линейной системы, фазовый портрет которойимеет вид узла, имеются асимптотически стремящиеся к состоянию равновесия траекто-рии, такая система неустойчива по Ляпунову.

20.2 Устойчивость множеств и частичная устойчивость

Для расширения класса рассматриваемых задач используются и другие определения ус-тойчивости. Многие из них связаны с переходом от устойчивости точки или конкретной

177

Page 178: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 20.3 – Неустойчивость по Ляпунову.

траектории к устойчивости множеств.

Например, для исследования автоколебательных систем и движущихся по замкну-тым траекториям объектов, вводится понятие орбитальной устойчивости. Для него ис-

пользуется расстояние ρ(x, G) между точкой x и множеством G, определяемое, какρ(x, G) = infxz∈G ||x−xz||.Определение 5. Траектория G орбитально устойчива, если для любого ε > 0 можно

указать такое δ > 0, что для всех x0 таких, что ρ(x0, G) < δ, справедливо неравенство

ρ(x(t),G) < ε для всех t > 0.

Аналогично, можно дать и определения асимптотической орбитальной устойчивости,глобальной асимптотической орбитальной устойчивости и т.д. В данном определении рас-сматривается близость решения к процессу, как к некоторому множеству точек. Поэтомурасстояния между точками возмущенного и невозмущенного движений в каждый данный

момент времени могут оказаться большими, но траектории остаются близкими (рис. 20.4).

Будем предполагать, что решения уравнения (20.1) определены на бесконечном интер-

вале времени 0 ≤ t < +∞. Траектории, продолженные на весь этот интервал, называютсяцелыми траекториями. Заметим, что движение изображающей точки, начинающееся вположении равновесия, или на замкнутой траектории, будет оставаться там для всех мо-ментов времени. Соответствующие множества точек образуют инвариантные множества в

пространстве состояний [8, 18, 39].

Определение 6. Инвариантным множеством M называется множество {x} точек

таких, что из x(t0) ∈ M для некоторого t0 следует, что x(t) ∈ M для всех −∞ < t < +∞.

Если это множество включает все возможные значения x(t0), для которых выполнено

178

Page 179: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 20.4 – Орбитальная асимптотическая устойчивость.

указанное условие, то оно называется наибольшим инвариантным множеством.

Имеется следующее определение устойчивости инвариантного множества, обобщающее

понятия орбитальной устойчивости и устойчивости положения равновесия [16, 41].

Определение 7. Инвариантное множество M устойчиво (относительно системы

(20.1)), если для всех ε > 0 можно указать такое δ > 0, что для всех x0 таких, что

ρ(x0, M) < δ выполнено ρ(x, M) < ε для всех t > 0.

Аналогично дается и определение асимптотической устойчивости инвариантного мно-жества.

Устойчивость множеств относится к классу свойств частичной устойчивости систем.Другим подобным свойством является устойчивость по отношению к функции. Рассмот-рим систему с выходом

x = f(x), (20.2)

ξ = h(x), (20.3)

где x ∈ Rn, ξ ∈ R

nu , nu ≤ n, f(x) и h(x) – непрерывные вектор-функции. Пусть система

(20.2) имеет равновесие x = x∗ (общий случай сводится к этому заменой координат и

рассмотрением уравнений возмущенного движения).

Определение 8. Решение x = x∗ системы (20.2) называется устойчивым по отно-

шению к функции h(x), если для любого ε > 0 найдется δ(ε) > 0, такое, что для всех

начальных значений x0, удовлетворяющих условию |x0−x∗| < δ решение x(t) с начальным

179

Page 180: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

условием x(0) = x0 определено при всех t ≥ 0 и выполняется неравенство

|h(x(t))− h(x∗)| < ε t ≥ 0. (20.4)

Если решение x = x∗ устойчиво по отношению к h(x) и, кроме того, выполняется условиеаттрактивности

limt→∞

h(x(t)) = h(x∗), (20.5)

то решение x∗ называется асимптотически устойчивым по отношению к функции h(x).

Если решение x = x∗ устойчиво по отношению к функции h(x), все решения системы

(20.2) определены при всех t ≥ 0 и условие аттрактивности (20.5) выполняется для лю-

бых начальных условий x0, то решение x = x∗ (и система (20.2)) называется глобально

асимптотически устойчивой по отношению к функции h(x).

Очевидно, при nu = n и h(x) = x определение 8 совпадает со стандартными опреде-

лениями устойчивости по Ляпунову и асимптотической устойчивости. Сам А.М. Ляпуновзанимался исследованиями именно этого частного случая. В 1957 г. В.В. Румянцев сфор-мулировал критерии устойчивости по отношению к части переменных, соответствующей

случаю x = col{y, z}, h(x) = y. Отметим, что устойчивость по отношению к функции h(x)

не сводится к устойчивости множества {x : h(x) = h(x∗)}, как показывает следующий при-мер.

Пример. Рассмотрим систему 2-го порядка{x1 = x1

x2 = − 2x21+x21

.(20.6)

При начальных условиях x1(0) = 1, x2(0) = a система имеет решение

x1(t) = et, x2(t) =a(1 + e−2t)

2. (20.7)

Рассмотрим функцию выхода

h(x1, x2) =x22

1 + x21

и вычислим скорость ее изменения вдоль решений системы:

h(x1, x2) = − 4x221 + x21

+x22x

21

(1 + x21)2= −4h(x1, x2)

(1− x21

4(1 + x21)

).

180

Page 181: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Следовательно, −4h ≤ h ≤ −3h ≤ 0 и, значит, h(x1(t)x2(t)) → 0 и h(x1(t), x2(t)) → 0 при

t → ∞. Однако, никакое решение (20.6) с начальным условием x2(0) = a �= 0 не стремится

к множеству S = {(x1, x2) : h(x1, x2) = 0} = {(x1, x2) : x2 = 0}. Это легко видно из (20.7).При исследовании систем, подверженных ограниченным возмущениям, оказываются

полезными следующие два определения [8, 18, 30].

Определение 9. Система называется устойчивой по Лагранжу, если каждое ее ре-шение неограниченно продолжаемо вправо, т.е. имеет смысл при 0 ≤ t ≤ ∞ и все фазовые

траектории ограничены на [0, ∞) (рис. 20.5).

Рисунок 20.5 – Устойчивость по Лагранжу.

Определение 10. Система называется предельно ограниченной (диссипативной по Ле-

винсону), если существуют области SΔ, Sδ такие, что SΔ ⊂ Sδ и для всех x0 ∈ SΔ существует

момент времени t∗ <∞ (возможно, зависящий от x0), что при всех t ≥ t∗ выполнено x0 ∈ Sδ.В данном определении SΔ называют иногда областью диссипации, а Sδ – предельным

множеством.Если SΔ – все пространство, то система называется предельно ограниченной в целом

(рис. 20.6).

Данные определения являются наиболее распространенными, хотя представляют собоймалую часть определений устойчивости, используемых в теории систем.

181

Page 182: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 20.6 – Диссипативность в целом.

20.3 Функции Ляпунова

Перейдем теперь непосредственно к изложению основных идей и некоторых результатовметода функций Ляпунова.

Начнем рассмотрение со следующего примера.

Рассмотрим систему первого порядка, n=1, уравнение которой имеет вид

x(t)=f(x), f(0)=0. (20.8)

Пусть функция f(x) удовлетворяет дополнительному условию xf(x) < 0 при x �= 0, т.е. ее

график лежит целиком во втором и четвертом квадрантах, причем f(x)=0 только в точке

x=0. Другой информации о виде этой функции нет. Требуется исследовать устойчивость

состояния равновесия системы (20.8).

Введем вспомогательную функцию V (x) =1

2x2. Заметим, что V (0)=0 и V (x) > 0 при

x �= 0. Значения x = x(t) меняются в соответствии с уравнением (20.8). Следовательно,

в силу этого уравнения будут также изменяться и значения функции V (x) = V(x(t)

).

Найдем производную этой функции по времени в силу уравнения (20.8). По правилу

дифференцирования сложной функции получаем V (x) = x(t)x(t) = xf(x), т.е. для каждо-

го момента времени значение V (x) определяется в каждой точке пространства состояний

по координатам этой точки и значению функции f(x). Поэтому для нахождения V (x) не

требуется получать решения (20.8).

Далее заметим, что при всех x �= 0 выполнено V (x) < 0, значит, функция V (t) моно-

182

Page 183: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

тонно убывает, стремясь при t → ∞ к нулю. Следовательно, величина |x(t)| также будетмонотонно убывать (что следует из вида функции V (x)) и x(t) → 0 при t → ∞) Поэтому

можно сделать вывод, что система (20.8) асимптотически устойчива в целом. 1 Следует

обратить внимание на то, что вывод об устойчивости состояния равновесия получен без

решения уравнения (20.8), более того, – при самых общих предположениях о виде функции

f(x).

Данный пример относился к системе первого порядка. Излагаемые ниже теоремы ляп-уновского типа применимы для произвольного n.

Рассмотренная в данном примере функция является представителем функций Ляпуно-ва. Имеется несколько определений этих функций. Поэтому уместно обратиться к разъяс-

нению, данному самим А.М. Ляпуновым в его основополагающем труде 1892 г. [25].

«К другому [методу] мы причислим все те, которые основываются на принципах, не

зависящих от разыскания каких-либо решений дифференциальных уравнений возмущен-ного движения. ... ; и вообще в основании всех тех из них, с которыми встретимся далее,всегда будет лежать разыскание функций переменных x1, x2, . . . , xn, t по некоторым дан-ным условиям, которым должны удовлетворять их полные производные по t, составленныев предположении, что x1, x2, . . . , xn суть функции t, удовлетворяющие уравнениям.»

Сам А.М. Ляпунов применял разработанный им метод к задачам исследования устой-чивости систем. Однако во второй половине XX в. выяснилось, что этот подход с успехомработает и для анализа качества систем, устойчивости множеств, колебательности и другихдинамических свойств нелинейных систем, а также для решения задач синтеза. Это приве-ло к пониманию метода функций Ляпунова как ведущего метода исследования нелинейныхсистем.

В данной главе мы рассмотрим лишь основные теоремы метода функций Ляпунова, атакже типичные примеры их применения для анализа устойчивости систем.

20.4 Устойчивость непрерывных систем

Будем рассматривать функции V (x), удовлетворяющие следующим требованиям: 1) V (x)

непрерывна и непрерывно-дифференцируема по x в некоторой области Ω ⊂ X , содержа-щей начало координат; 2) V (x) обращается в ноль в начале координат: V (0) = 0; 3) V (x)

положительно определена, т.е. положительна всюду, кроме начала координат: V (x) > 0

при x �= 0.

1 Мы здесь описываем схему использования метода Ляпунова. Доказательства приведенных положенийсодержатся, например, в [10, 18, 36, 43].

183

Page 184: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Функция W (x) называется отрицательно определенной, если−W (x) положительно оп-ределена.

Если неотрицательная функция может обращаться в ноль не только при x=0, то она

называется неотрицательно определенной (знакоположительной).

Для формулировки дальнейших результатов понадобится производная по времени фу-

нкции Ляпунова в силу сиcтемы (18.11) (уравнения которой при n=1 совпадают с (20.1)).

Используя правило дифференцирования сложной функции и операцию вычисления пр-

оизводной скалярной функции по векторному аргументу получим 2

V (x)=∇xV (x)f(x)=∂V

∂x1f1(x)+

∂V

∂x2f2(x)+· · ·+∂V

∂xnfn(x). (20.9)

Приведем теперь формулировки некоторых теорем.

Теорема 1. Об устойчивости (А.М. Ляпунов).

Если при x ∈ Ω существует положительно-определенная функция V (x) такая, что ее

производная в силу системы (18.11) знакоотрицательна, то состояние равновесия устойчиво

по Ляпунову.

Теорема 2. Об асимптотической устойчивости (А.М.Ляпунов).

Если при x ∈ Ω существует положительно-определенная функция V (x) такая, что ее

производная в силу системы (18.11) отрицательно определена, то состояние равновесия

асимптотически устойчиво по Ляпунову.

Теорема 3. Об асимптотической устойчивости в области SΔ (асимптотической устой-

чивости «в большом» ) [8, 38, 39].

Если при выполнении условий теоремы 2 для некоторого C > 0 неравенство V (x) ≤ C

выполнено в замкнутой окрестности начала координат SΔ, {0} ∈ SΔ, то состояние рав-

новесия {0} асимптотически устойчиво с областью притяжения SΔ (см. определение 2, с.

177).

Теорема 4. Об асимптотической устойчивости в целом (теорема Барбашина–2 Полезно иметь в виду следующие правила дифференцирования [14]: производная скалярной функции

V (x) по вектору x ∈Rn является 1×n-матрицей частных производных (т.е. транспонированной к вектору-

столбцу градиента V по x): ∂V∂xi

= (∇xV (x))T ; производная вектор-функции f(x) ∈R

m по вектору x ∈Rn

являетсяm×n-матрицей, элементами которой являются частные производные ∂fj∂xi; производная скалярной

функции V по m×n-матрице A = {aij} является m×n-матрицей, элементами которой являются частныепроизводные ∂V

∂aij; производная квадратичной формы xTHx по вектору x ∈R

n равна 2xTH ≡ xTH +HxT .

184

Page 185: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 20.7 – Функция Ляпунова асимптотически устойчивой системы.

Красовского).

Если в условиях Теоремы 2 множество Ω совпадает со всем пространством, т.е. Ω = X ,а V (x) → ∞ при ‖x‖ → ∞, то система асимптотически устойчива в целом.

Функция Ляпунова, удовлетворяющая приведенному в данной теореме условию роста,

иногда называется радиально неограниченной [30,38]. Про функцию V (x, t), зависящую явно

от времени и удовлетворяющую для всех t неравенству V (x, t) > W (x), где W (x) → ∞ при

‖x‖ → ∞, говорят, что она допускает бесконечно большой нижний предел.

Теорема 5. О неустойчивости (А.М.Ляпунов).

Если V (x) положительно определенная функция и сколь угодно близко от начала ко-

ординат есть точки, где V (x) > 0, то начало координат неустойчиво по Ляпунову.

Заметим также, что устойчивость по Лагранжу имеет место, если V (x) ≤ 0 и V (x) → ∞при ‖x‖ → ∞, а предельная ограниченность в целом – если V (x) → ∞ при ‖x‖ → ∞ и

V (x) < 0 при всех x /∈ Sδ.Приведенные условия имеют достаточно наглядную геометрическую интерпретацию.

Согласно выражению (20.9), значение V представляет собой скалярное произведение гра-

диента функции V на вектор фазовой скорости в данной точке. Поэтому V (x) есть скорость

прохождения изображающей точки по нормали к линиям равного уровня функции V (x)

(рис. 20.7). Если вследствие отрицательной определенности функции V движение по всем

траекториям (в области SΔ) направлено внутрь поверхностей V = const, то состояние рав-новесия устойчиво асимптотически.

185

Page 186: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Знакоотрицательность, или отрицательная определенность, функции V (x), согласно

(20.9), может быть выражена уравнением в частных производных

∂V (x)∂x

f(x) = −Q(x), (20.10)

где Q(x) – некоторая знакоположительная или положительно определенная функция.

Уравнение (20.10) часто называют, аналогично соответствующему матричному уравнению,

уравнением Ляпунова [38]. В более общем случае, когда функции V (·), f(·) зависят явно отвремени, V = V (x, t), f = f(x, t) получается дифференциальное уравнение Ляпунова

∂V (x, t)∂t

+∂V (x, t)∂x

f(x, t) = −Q(x, t). (20.11)

Эти уравнения находят различные применения в теории систем (см. [4,14,22,34,38], а также

с. 131).

Использование приведенного выше (с. 178, п. 6) понятие инвариантного множества поз-

воляет обобщить метод функций Ляпунова и расширить область его применения [39, 53].

Прежде всего это относится к возможности определения предельных циклов и анализа ихустойчивости а также к доказательству асимптотической устойчивости если не удается по-

казать, что V (x) является отрицательно определенной (а не только знакоотрицательной).

Для этого заметим, что из неравенства V (x) ≤ 0, выполненного для всех x, принадле-

жащих некоторой ограниченной области ΩC , следует, что в области ΩC функция V (x(t))

не может возрастать (а только убывать или оставаться постоянной). Отсюда следует, что

при ограниченной снизу функции V (x) точки, в которых V (x) < 0 не могут служить пре-

дельными точками для решений системы. Следовательно, представляют интерес точки, в

которых V (x) = 0. Этот путь рассуждений отражен следующей теоремой [24].

Теорема 6. О сходимости к множеству (Ла-Салль).

Пусть V (x) – скалярная функция, непрерывно дифференцируемая по x, и область ΩC

определяется как ΩC={x :V (x)< C}. Пусть ΩC ограничена и Ω ⊆ ΩC есть множество точек,

для которых V (x) ≤ 0. Пусть также M ⊆ Ω есть наибольшее инвариантное множество в

ω. Тогда с ростом t каждое решение ΩC стремится к M.

Можно заметить, что теорема 3 об асимптотической устойчивости вытекает из данной

как частный случай при Ω = {0}, но теорема 6 позволяет получить и дополнительные

результаты (см. 20.6).

186

Page 187: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

При исследовании устойчивости используется понятие ω-предельного множества Γ+

решения x(t) уравнения (20.8), как множества точек, к которым это решение стремится

при t → ∞. Если x(t) ограничено, то оно при t → ∞ всегда стремится к Γ+. Известно,

что если x(t) ограничено (для всех t ≥ 0), то его ω-предельное множество Γ+ непусто,

компактно и является инвариантным множеством. 3

Основной проблемой при использовании данного метода является выбор подходящейфункции Ляпунова: если функция данного вида «не подходит» , то это еще не означаетнеустойчивости системы – возможно, другой выбор функции Ляпунова позволит доказать

устойчивость (или неустойчивость) системы. Хотя общего аналитического метода построе-

ния функций Ляпунова не существует, для их конструирования имеются некоторые реко-

мендации [29, 33, 38, 39].

Часто функции Ляпунова берут в виде квадратичных форм, т.е. выражений вида

V (x)=xTHx,

где матрица H симметрична и положительно определена (в смысле положительной опреде-

ленности полученной функции), H=HT > 0. Такие функции удовлетворяют сформулиро-

ванным выше (пп. 1-3 на с. 183) требованиям и, кроме того, условию роста V (x) → ∞ при

‖x‖ → ∞, что важно при доказательстве глобальной устойчивости.

Для проверки положительной определенности матрицы

H=HT можно использовать критерий Сильвестра, согласно которому (аналогично крите-

рию Гурвица) требуется положительность главных угловых миноров матрицы H. Известно

также, что матрица H положительно определена, если все ее собственные числа положи-тельны.

Если рассматриваемая система линейная, f(x, t) = A(t)x, и функция Ляпунова выбрана

в виде некоторой квадратичной формы V (x, t) = xTH(t)x, то уравнение Ляпунова (20.11)принимает вид

H(t) + A(t)TH(t) +H(t)A(t) = −Q(t), (20.12)

где Q(t) = Q(t)T ≥ 0 (> 0) – некоторая симметричная матрица. 4 В стационарном случае,

V = V (x), A(t) ≡ A, Q(t) ≡ Q, представляет интерес установившееся решение (20.12),3 МножествоM, лежащее в пространстве Rn компактно, если оно замкнуто (содержит все свои пре-

дельные точки) и ограничено. Для целей данной книги это свойство компактных множеств можно рас-сматривать в качестве определения.

4 Использованы правила дифференцирования, приведенные в сноске 2 на с. 184.

187

Page 188: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

которое находится из уравнения

ATH +HA = −Q. (20.13)

Уравнения (20.12), (20.13) называются матричными (дифференциальным и алгебраиче-

ским) уравнениями Ляпунова. Как известно из теории матриц [23], существование един-

ственной положительно определенной матрицы H, являющейся решением (20.13), эквива-

лентно гурвицевости (устойчивости) матрицы A. Более подробно [4, 17], если матрица A

- гурвицева, то уравнение (20.13) относительно n×n-матрицы H = HT имеет решение и

притом – единственное которое выражается формулой

H =

∞∫0

eAT tQeAtdt.

Если Q = QT ≥ 0, то H = HT ≥ 0 и нуль-пространство матрицы H инвариантно относи-тельно A : из Hx0 = 0 следует HAx0 = 0.

Изучение устойчивости линейных стационарных систем через построение функций Ля-пунова не представляет практического интереса, но, как отмечено выше, уравнения Ляпу-нова находят применение при решении многих задач теории управления.

Для механических, электрических и других систем, не содержащих вносящих дополни-

тельную энергию элементов (такие системы называются пассивными), в качестве функции

Ляпунова целесообразно использовать полную энергию (см. пример в п. 20.6).

Если в рассматриваемой системе реализуется движение в направлении градиента неко-

торой целевой функции [6,19,35,38] (такие системы называются градиентными), то целе-

сообразно в качестве функции Ляпунова брать саму целевую функцию.

Если система содержит (одну) скалярную нелинейность ϕ(σ) (рис. 18.1, с. 146), функ-

цию Ляпунова удобно брать в виде «квадратичная форма плюс интеграл от нелинейности», предложенном А.И. Лурье т.е.

V (x) = xTHx+ ϑ

∫ σ

0

ϕ(σ)dσ, ϑ ∈R

– так называемая «функция Ляпунова–Лурье»

Для систем с k нелинейностями аналогично используется функция

V (x) = xTHx+

k∑j=1

ϑj

∫ σj

0

ϕj(σj)dσj , ϑj ∈R, j = 1, . . . , k.

188

Page 189: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Подробнее использование функций этого типа рассмотрено в [27].

Находит также применение аппарат векторных функций Ляпунова [8, 38]. Эти функ-

ции получаются как набор отдельных функций, построенных для подсистем, из которыхсостоит рассматриваемая система.

20.5 Устойчивость дискретных систем

Рассмотрим вкратце некоторые подходы и результаты применения метода Ляпунова для

исследования дискретных систем [19,35,49,53]. Основные идеи совпадают с теми, которыеизложены выше для систем непрерывного времени.

Пусть стационарная дискретная система описывается нелинейным разностным уравне-нием

x[k + 1] = f(x[k]), k = 0, 1, 2, . . . . (20.14)

Предполагаем, что точка x = 0 есть состояние равновесия системы (20.14), т.е. f(0) = 0 и

x[k] ≡ 0 есть тривиальное решение (20.14). Как и для непрерывных систем, при исследова-

нии устойчивости некоторого другого состояния равновесия x∗ (т.е. такого состояния, для

которого выполнено x∗ = f(x∗)), можно перейти к исследованию устойчивости нулевого

состояния через уравнения в отклонениях, которые получаются из (20.14) относительно

отклонения Δx[k] = x[k]− x∗.

Как и выше (с. 183), введем положительно определенную функцию V (x). Приведем

некоторые теоремы ляпуновского типа для дискретного случая [49].

Теорема 1. Об устойчивости систем дискретного времени.

Если существует положительно определенная функция V (x) такая, что в силу системы

(20.14) при всех x ∈ Ω выполнено

ΔV (x) ≤ 0 ( < 0 при x �= 0), (20.15)

то состояние равновесия устойчиво (асимптотически устойчиво) по Ляпунову.

Теорема 2. Об устойчивости в целом дискретных систем. Если функция V (x) асимп-

тотически устойчивой системы удовлетворяет условию роста V (x) → ∞ при k → ∞, тосостояние равновесия асимптотически устойчиво в целом.

Формулировка теоремы об инвариантных множествах для дискретного случая, как итеорем 1, 2, получается из формулировок соответствующих теорем для непрерывных систем

заменой условия V ≤ 0 на ΔV (x) ≤ 0.

189

Page 190: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотрим применение метода Ляпунова к линейным дискретным системам. Пустьсистема описывается линейным разностным уравнением

x[k + 1] = Ax[k], x[0] = x0, k = 0, 1, 2, . . . . (20.16)

Введем функцию Ляпунова V (x) = xTHx, H = HT > 0. Вычислим ΔV (x) = V (f(x))−V (x)в силу системы (20.16). Так как f(x) = Ax, получим

ΔV (x) = (Ax)THAx− xTHx = xT(ATHA−H

)x.

Асимптотическая устойчивость системы обеспечивается отрицательной определенно-стью полученной квадратичной формы; другими словами – существованием положительноопределенного решения H = HT > 0 алгебраического уравнения Ляпунова для дискретныхсистем

ATHA−H = −G, G = GT > 0. (20.17)

Как и в непрерывном случае, этот результат не имеет самостоятельного значения для ис-

следования устойчивости линейных систем, но уравнение (20.17) находит применение в

других задачах [22, 34].

Кроме прямого метода Ляпунова, для исследования устойчивости дискретных системиспользуются и несколько иные подходы. К ним относится применение принципа сжима-

ющих отображений и теоремы о неявной функции [35].

Напомним, что отображение f = f(x), x ∈ Rn, f ∈ R

n называется сжимающим, если

‖f(x)− f(y)‖ ≤ L‖x− y‖, L < 1. 5

Принцип сжимающих отображений [35] гласит, что если f – сжимающее отображение,

то оно имеет единственную неподвижную точку x∗ (т.е. такую, что x∗ = f(x∗), см. также

с. 160), к которой сходится процесс (20.14) при любом x0 со скоростью геометрическойпрогрессии

‖x[k]− x∗‖ ≤ Lk

1− Lk‖f(x0)− x0‖.

Заметим, что здесь не утверждается необходимость выполнения указанного условия для

устойчивости системы (20.14). Например, устойчивость линейной системы (20.16) не обя-

зательно вытекает из данного принципа [35].

Теорема о неявной функции служит для анализа устойчивости неявных дискретных

моделей [8, 32, 35].5 Другими словами, если функция f удовлетворяет глобальному условию Липшица (см. (18.13) на с.

153) с константой L < 1.

190

Page 191: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

В заключение заметим, что прямой метод Ляпунова весьма плодотворен, но из-за слож-ности выбора функций Ляпунова остается, в основном, инструментом теоретиков, позвол-яющим получить общие сведения о поведении систем разных классов.

Рассмотренные ниже в п. 21 методы теории абсолютной устойчивости иллюстрируютвозможности применения метода Ляпунова для получения инженерных критериев устой-

чивости [17, 37, 39].

Более подробно применение функций Ляпунова к синтезу нелинейных и адаптивных

систем рассмотрено в книге [30].

20.6 Примеры

Пример 1. Собственные движения маятника. Рассмотрим уравнения математическо-

го маятника массойm и длиной l (см. также с. 14). Учтем влияние момента сил сопротивле-

ния, вызванного «вязким» трением. Полагаем, что этот момент пропорционален величине

угловой скорости. Угол отклонения маятника от вертикальной оси ϕ(t) подчиняется урав-

нению Jϕ(t)+ρϕ(t)+ mgl sinϕ(t) = 0, в котором J = ml2 – момент инерции маятника; ρ ≥ 0

– коэффициент трения (считаем, что ϕ = 0 соответствует положению «вертикально вниз»

). После деления на J запишем это уравнение в виде

ϕ(t) + �ϕ(t) + ω20 sinϕ(t) = 0, (20.18)

где параметр ω0 =√gl.

Полная энергия H маятника включает кинетическую и потенциальную составляющиеи определяется выражением

H(ϕ, ϕ) = Jϕ2

2 +mgl(1− cosϕ). (20.19)

Введем вектор состояния x = col{ϕ, ϕ} и перепишем уравнение (20.18) в виде{x1(t) = x2(t),x2(t) = −ω2

0 sin x1(t)− �x2(t).(20.20)

Зададимся функцией Ляпунова V (x), пропорциональной H(ϕ, ϕ), а именно, положим

V (x) =x222 +ω2

0(1−cos x1) (x = col{ϕ, ϕ}). Как нетрудно убедиться, данная функция удовле-творяет перечисленным на с. 183 условиям положительной определенности за исключением

п. 3, так как H(ϕ, ϕ) = 0 на множестве точек с координатами ϕ = ±2kπ, ϕ = 0

191

Page 192: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

(k = 0, 1, 2, . . .), а не только в начале координат. Поэтому ограничимся в дальнейшем обла-

стью Ω = {x : |ϕ| ≤ π, V (x) < 2ω20}. Границей данной области является кривая с коорди-

натами (ϕ, ϕ), при которых полная энергия маятника HΩ равна наибольшему значению ее

потенциальной составляющей, HΩ = maxϕ(mgl(1− cosϕ)

)= 2mgl. Эта линия выражается

формулой x2 = ω0

√2(cosx1 + 1). Очевидно, что Ω является ограниченной окрестностью

начала координат, внутри которой функция V (x) обращается в ноль только при x = 0.

Вычислим производную V (x(t)) в силу системы (20.20). В соответствии с формулой

(20.9), с. 184, получим

V (x) = −�x22. (20.21)

Поскольку выполнено неравенство V (x) ≤ 0 при x ∈ Ω, то согласно теореме 1 (с. 184)

положение равновесия устойчиво по Ляпунову.

Рассмотрим теперь отдельно случаи � = 0 (демпфирование отсутствует) и � > 0 (демп-

фирование есть).

При � = 0 из (20.21) следует, что V (x) ≡ 0, т.е. функция Ляпунова остается неиз-

менной. Так как выбранная функция V (x) пропорциональна полной энергии системы, тополученное выражение означает, что энергия маятника при отсутствии трения постоянна,

т.е. рассматриваемая система является консервативной. Из равенства V (x) = C для неко-

торого заданного 0 < C < HΩ следует, что фазовые траектории удовлетворяют уравнению

x22 − 2ω20 cos x1 = 2(C − ω2

0). (20.22)

Заметим, что это же выражение можно получить исходя из (20.20). Действительно, исклю-

чая из (20.20) время t, получим уравнение x2dx2 = −ω20 sin x1dx1, интегрирование которого

дает (20.22). 6 Метод Ляпунова позволяет определить свойства системы без вычисления ее

решений или нахождения фазовых траекторий.

Таким образом, исследуя поведение функции V (x) находим, что для всех t переменные

состояния системы подчиняются уравнению (20.22). В области Ω имеется единственное со-

стояние равновесия x = 0. Оно не удовлетворяет (20.22) при C �= 0; следовательно, движе-

ние маятника будет иметь характер незатухающих колебаний с амплитудой, зависящей от

начальных условий (от константы C). Фазовые траектории (и совпадающие с ними линии

равного уровня функции V (x)) при � = 0 показаны на рис. 20.1, с. 176.6 См. также с. 76, п. 10.3.1

192

Page 193: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рассмотренный пример позволяет также проследить связь между функцией Ляпуноваконсервативной системы и известным в теории дифференциальных уравнений понятиемпервых интегралов.

Как известно [10, 36], первым интегралом уравнения

x = f(x), x ∈Rn называется функция Q(x) определенная и непрерывная вместе со своими

частными производными в некотором открытом множестве Ω (содержащемся в области, где

определена и непрерывна вместе со своими частными производными вектор-функция f(x)),

если при подстановке в Q(x) произвольного решения, траектория которого расположена

целиком во множестве Ω, получается постоянная относительно t величина. Любой первый

интеграл удовлетворяет условию [36] ∂Q(x)∂x

f(x) = 0. Сопоставляя это условие с формулой

(20.9) видим, что если имеется возможность использовать первый интеграл в качестве фу-

нкции Ляпунова, V (x) = Q(x), то V (x) ≡ 0 и система консервативна.

Перейдем теперь к рассмотрению системы с демпфированием, � �= 0. Заметим, что из

(20.21) следует, что V (x) = 0 только при x2 = 0. Для остальных точек пространства со-

стояний она отрицательна. Следовательно, указанное в теореме 6 множество ω являетсяпрямой x2 = 0. Но в рассматриваемой области нет ни одной целой траектории, для которой

x2(t) ≡ 0, за исключением начала координат. Поэтому M = {0}. Согласно утверждениютеоремы, при t → ∞ каждая траектория стремится к множеству M, т.е. к точке x = 0.

Таким образом, доказана асимптотическая устойчивость в большом положения равновесия

системы (20.20), несмотря на отсутствие отрицательной определенности функции Ляпуно-ва.

Фазовая траектория и линии равного уровня функции V (x) показаны на рис. 20.7, с.

185. Поведение функции Ляпунова и ее производной во времени для выбранной фазовойкривой показано на рис. 20.8.

Пример 2. Возбуждение колебаний маятника. Обратимся снова к движению ма-

ятника, полагая, что на него действует внешний управляющий моментM(t). Введем управ-

ляющее воздействие u(t) = M(t)J . Пренебрежем силами трения. Тогда, вместо (20.18) по-

лучим уравнение

ϕ(t) + ω20 sinϕ(t) = u(t). (20.23)

Для полной энергии маятника H выполнено соотношение (20.19). Рассмотрим задачу воз-

буждения колебаний маятника, которая сводится к выводу на заданный уровень и стаби-

193

Page 194: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Рисунок 20.8: Графики функций V(x(t)

)и V

(x(t)

)для одной из реализаций процесса

(20.20).

лизации энергии H маятника (подробнее см. [5, 30]). Для этой цели можно использоватьпропорциональный

u = −γ(H −H∗)ϕ(t) (20.24)

или релейный

u = −γsign ((H −H∗)ϕ(t)

)(20.25)

алгоритмы управления [5, 8, 30]. Они являются разновидностями алгоритмов скоростного

градиента [5,8,30,48]. В выражениях (20.24), (20.25) через H∗ обозначен требуемый уровень

энергии, а γ > 0 – параметр алгоритма (для (20.24) это коэффициент усиления, а для (20.25)

– величина «полки» реле).

Как и выше, возьмем функцию Ляпунова пропорциональную полной энергии маятника,

V (x) =x222 + ω2

0(1 − cosx1), где x = col{ϕ, ϕ}, и вычислим ее производную в силу системы.

Получим

V = ϕϕ+ ω20ϕ sinϕ = uϕ. (20.26)

При использовании пропорционального закона управления (20.24) находим, что

V = −γ(H −H∗)ϕ2, (20.27)

а для релейного закона управления (20.25) –

V = −γsign(H −H∗)|ϕ|. (20.28)

194

Page 195: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Отсюда видно, что при H < H∗ и ϕ �= 0 производная V > 0. Поскольку ϕ(t) ≡ 0 сов-

местимо с уравнениями системы только при ϕ(t) ≡ 0, начало координат (ϕ = ϕ = 0)

неустойчиво по Ляпунову. Вне этой точки следует рассмотреть множество, определяемоеусловием H = H∗. Нетрудно убедиться, что оно является инвариантным множеством, так

как при u(t) ≡ 0 и соответствующих начальных условиях (таких, что H(ϕ(0), ϕ(0)

)= H∗)

получается траектория, для которой H(t) = H∗ (см. выше уравнение (20.22), с. 192). Так

как при H > H∗ имеет место V < 0, а функция V – положительно определенная в области

Ω = {x : V (x) ≤ 2ω20} (см. с. 192), то все траектории, начинающиеся внутри этой области

(кроме тривиального решения ϕ(t) ≡ 0) будут асимптотически стремиться к предельно-

му циклу, определяемому условием H(t) ≡ H∗. Следовательно, в системе возбуждаются

автоколебания заданной амплитуды.

На рис. 20.9 показана последовательность положений маятника при возбуждении ко-

лебаний по знаковому алгоритму (а) и соответствующий фазовый портрет (б).

Рисунок 20.9 – Процесс раскачки маятника.

Пример 3. Исследование автоколебательной системы. В данном примере рас-

смотрим так называемое уравнение Баутина: [26]

{x1(t) = ωx2(t) + a2x1(t)− x1(t)

(x1(t)

2 + x2(t)2),

x2(t) = ωx1(t) + a2x2(t)− x2(t)(x1(t)

2 + x2(t)2),

(20.29)

где ω > 0, a > 0 – параметры. Состояние x = 0 является состоянием равновесия Исследуемустойчивость этого состояния наличие у системы предельных циклов. Введем квадратич-

ную функцию Ляпунова V (x) = x21 + x22. Заметим что условие роста (см. теорему 4, с. 185)

195

Page 196: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

для этой функции выполнено. Производная V (x) в силу системы (20.29) определяется вы-

ражением V (x) = (x21 + x22)(a2 − x21 − x22). Нетрудно заметить, что V (x) > 0 при ‖x‖ < a и

x �= 0. Следовательно, состояние равновесия неустойчиво по Ляпунову. В области ‖x‖ > a

выполнено V (x) < 0, поэтому система является диссипативной и все траектории, начина-

ющиеся вне области ‖x‖| ≤ a стремятся к ней. Так как V (x) = 0 при ‖x‖ = a и в силу того,

что решение x1(t)2 + x2(t)2 = a2 удовлетворяет (20.29), то данное решение является асимп-

тотически устойчивым предельным циклом – система (20.29) является автоколебательной.

Для иллюстрации на рис. 20.10 а. показаны графики функций V (x), V (x), (принято

a = 1, ω = π) на которых отражены траектории процессов V (x(t)) при начальных усло-

виях x0 = [−0.1, 0]T (расходящиеся колебания) и x0 = [−3, 0]T (затухающие колебания).

Соответствующие фазовые траектории приведены на рис. 20.10 б.

Рисунок 20.10 – Функция Ляпунова и фазовый портрет автоколебательной системы.

Пример 4. Преследование зайца. Рассмотрим погоню собаки за зайцем [53]. Пред-положим, что заяц движется вдоль оси x с постоянной скоростью vr, а гончая - с постояннойпо модулю скоростью vh, причем вектор скорости в каждый момент времени направлен на

зайца (траектория сближения в этом случае представляет собой трактрису, или «собачью

тропу» ). Обозначим через xh, yh и xr, yr, соответственно, координаты гончей и зайца. Тогда

xr(t) = vr, yr(t) = 0, yr(0) = 0. Учитывая направление вектора скорости гончей, получим,

что для некоторой постоянной k > 0 выполнено

{xh(t) = −k(xh(t)− xr(t)

),

yh(t) = −k(yh(t)− yr(t)).

Постоянную k определим из очевидного соотношения

196

Page 197: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

xh(t)2 + yh(t)

2 = v2h. Тогда⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩xh(t) = − xh(t)− xr(t)√(

xh(t)− xr(t))2

+ yh(t)2vh,

yh(t) = − yh(t)√(xh(t)− xr(t)

)2+ yh(t)2

vh.

В относительных координатах x = xh − xr, y = yh эта система принимает вид⎧⎪⎪⎨⎪⎪⎩xh(t) = − x(t)√

x(t)2 + y(t)2vh − vr,

yh(t) = − yh(t)√x(t)2 + y(t)2

vh.(20.30)

Спрашивается, поймает ли собака зайца? В терминах рассматриваемой модели это зна-

чит: всякое ли решение с начальным состоянием (x0, y0) стремится к началу координат?

Для ответа на поставленный вопрос исследуем устойчивость решений (20.30). Заметим,

что уравнения (20.30) не определены в точке x = y = 0 (когда заяц пойман).

Для выбора подходящей функции Ляпунова учтем, что целью преследования являетсяуменьшение расстояния между собакой и зайцем. Именно расстояние и будем использовать

в качестве функции Ляпунова: V (x, y) = x2+ y2. Производная этой функции в силу (20.30)

равна V (x, y) = −2vh√x2+y2−2vrx. Видно, что при vh > vr функция V (x, y) < 0 во всех

точках, кроме начала координат. 7 Следовательно, если гончая бежит быстрее зайца (а

заяц – по прямой), то она его поймает (асимптотически).

Пример 5. Устойчивость нелинейной дискретной системы. Рассмотрим систему

[53]

⎧⎪⎨⎪⎩x1[k + 1] =

x2[k]1 + x2[k]

2 ,

x2[k + 1] =x1[k]

1 + x2[k]2 .

(20.31)

Состояние x = 0, x = col{x1, x2} является состоянием равновесия (действительно, условие

x∗ = f(x∗) при x∗ = 0, очевидно, выполнено). Введем функцию Ляпунова V (x) = x21 + x22.

Чтобы проверить, убывает ли она вдоль траекторий системы (20.31), вычислим V (f(x)).

7 Действительно, при x = 0 это очевидно, а при x �= 0 получим −vh√x2 + y2 − vrx < −(vh − vr)|x| < 0.

197

Page 198: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Получим

V (f(x)) =x22(

1 + x22)2 +

x21(1 + x22

)2 =x21 + x22(1 + x22

)2 =V (x)(1 + x22

)2 .Отсюда видно, что V (f(x)) < V (x) при x �= 0. Несложно проверить выполнение и другихусловий теоремы 2 с. 189, следовательно, состояние равновесия x = 0 дискретной системы

(20.31) асимптотически устойчиво в целом.

198

Page 199: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 21

21 Методы теории абсолютной устойчивости

21.1 Задача абсолютной устойчивости

Предпложим, что нелинейная система представлена в виде системы Лурье: линейной ди-намической подсистемы и нелинейного статического звена в цепи обратной связи. Дляпростоты ограничимся случаем системы с одним нелинейным блоком, уравнения которой,

следовательно, можно представить в виде ( см. 19.3)

A(p)σ(t)=−B(p)ξ(t), (21.1)

ξ(t)=ϕ(σ(t)), (21.2)

где p ≡ d

dt– оператор дифференцирования A(p), B(p) – операторные многочлены.

Линейная часть рассматриваемой системы имеет передаточную функцию от входа (−ξ)к выходу σ:

W(s)=B(s)

A(s), (21.3)

где аргумент s ∈ C, а многочлены B(s), A(s) получаются заменой аргумента p в A(p), B(p)на s.

Займемся задачей исследования устойчивости замкнутой системы (21.3) не для кон-

кретной функции ϕ(σ), а для всех таких функций, принадлежащих некоторому множес-

тву (классу) Φ. 1 Таким образом, рассмотрим некоторые общие условия устойчивости, независящие от того, какая конкретно нелинейная зависимость имеет место.

Определение [17]. Линейная часть системы (или, короче, система (21.1)) абсолютно

устойчива в классе Φ нелинейных блоков (21.2), если любая замкнутая система (21.1), (21.2)

с функцией ϕ(·) ∈ Φ абсолютно устойчива в целом. �Физически это означает, что система имеет достаточно хорошие свойства, которые не

пропадают при замене одних блоков из данного класса другими.1 Такая постановка задачи соответствует рассмотренному в предыдущем параграфе примеру, в кото-

ром достаточные условия устойчивости устанавливались для любой нелинейной характеристики, графиккоторой лежит в заданном секторе.

199

Page 200: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Обычно рассматриваются так называемые секторные нелинейности, удовлетворяющиеусловию

k1 ≤ ϕ(σ)

σ≤ k2, σ �= 0, ϕ(0)=0.

Заметим, что условия (21.4) можно переписать в виде одного квадратичного неравенства(k2σ−ϕ(σ)

)(ϕ(σ)−k1σ) ≥ 0.

Прежде чем перейти к критериям абсолютной устойчивости нелинейных систем, рас-

смотрим подобную задачу для линейного случая, т.е. будем считать, что ϕ(σ) = k0σ для

некоторого постоянного коэффициента k0. С помощью известных в теории линейных си-стем методов можно установить граничные значения параметра k0, при которых сохра-

няется устойчивость линейной системы k0 ∈ [k1, k2].2, Этот промежуток определяет так

называемый сектор (угол) Гурвица. Графически условие устойчивости выглядит в виде

сектора на плоскости (ϕ, σ), ограничивающего график зависимости ϕ=ϕ(σ).

В конце 40-х годов М.А.Айзерманом была выдвинута гипотеза, согласно которой секторабсолютной устойчивости нелинейной системы совпадает с сектором Гурвица, т.е. каждая

нелинейная система, у которой график зависимости ϕ = ϕ(σ) лежит внутри гурвицевого

угла, устойчива в целом [11,33,39]. Впоследствии были найдены опровергающие примеры,

хотя гипотезу Айзермана можно использовать для многих практически важных случаев.Известны попытки уточнить формулировку этой гипотезы с тем, чтобы расширить об-ласть ее применения. Например, Р. Калманом предъявлены более жесткие ограничения:согласно гипотезе Калмана, устойчивость линейной системы должна иметь место для всех

k0, ограниченных не только сектором, содержащим нелинейность ϕ(σ), но и граничными

значениями производной dϕ(σ)dσ

[39]. Заметим, что функции ϕ(σ), удовлетворяющие гипо-

тезе Калмана, удовлетворяют и гипотезе Айзермана. Но, хотя данная гипотеза оказываетсясправедливой для более широкого класса систем, для нее также найдены опровергающиепримеры.

Перейдем к строгим критериям.

Для последующего изложения пригодится трактовка секторного условия устойчивостилинейной системы по частотному критерию Найквиста. Как нетрудно заметить, устойчив-ость линейной системы в секторе Гурвица означает, что амплитудно-частотная характери-

стика линейной части системыW(jω) не пересекает отрезок вещественной оси[− 1

k1, − 1

k2

],

2 Возможно, граничных пар будет несколько.

200

Page 201: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

охватывая его требуемое (по количеству "неустойчивых"полюсов разомкнутой системы)число раз.

Сформулируем основные положения наиболее известных критериев абсолютной устой-чивости: кругового критерия и критерия Попова. Более подробное изложение, включаю-

щее и доказательства, можно найти в [27]. Доказательства основаны на так называемой

частотной теореме (лемме) В.А.Якубовича–Р.Калмана, (см. [1, 8, 17, 31, 33]) 3.

21.2 Круговой критерий

Пусть выполнены следующие условия:

1) k1 ≤ ϕ(σ)

σ≤ k2, σ �= 0, ϕ(0)= 0 (т.е. выполнено секторное условие (21.4)), причем

k1 �= ∞, k2 �=−∞; 2) существует такое k0, k1 ≤ k0 ≤ k2, что линейная система с обратной

связью вида ϕ(σ)=k0σ асимптотически устойчива; 3) разомкнутая системаW(s) =B(s)A(s)

не

имеет полюсов на мнимой оси, т.е. A(jω) �= 0 для всех ω; 4) при всех ω ∈ [−∞,+∞] выполнено

частотное условие Re((1+k1W(jω)

)∗(k2W(jω)+1

))>0. 4

Тогда замкнутая нелинейная система абсолютно устойчива в заданном классе нелин-ейных блоков, более того, имеет место равномерная экспоненциальная устойчивость, т.е.

существуют такие постоянные c > 0, ε > 0, что для любого решения системы (19.2) и

любых t > t0 выполнено |x(t)| ≤ c|x(t0)|e−ε(t−t0) [17].Частотное условие 4 графически интерпретируется, как отсутствие общих точек у АФХ

линейной части системы с окружностью с центром на вещественной оси, проходящей на

этой оси через точки − 1

k1, − 1

k2.

Видно, что круговой критерий задает более жесткие условия для линейной части систе-мы, чем гипотеза Айзермана. Подчеркнем, что он является только достаточным условиемабсолютной устойчивости в том смысле, что невыполнение условия 4 означает непримени-мость к данной системе этого критерия. Возможно, посредством другого критерия абсо-лютную устойчивость удастся обосновать.

Круговой критерий исчерпывает все критерии, которые могут быть получены с помо-3 Отметим, что первоначальное доказательство В.М. Попова было получено другим методом: так назы-

ваемым методом априорных оценок, который имеет и иные применения в теории нелинейных систем [27].4 Звездочкой здесь обозначена операция комплексного сопряжения, как частный случай эрмитового

сопряжения, означающего для матриц, кроме того, и транспонирование.

201

Page 202: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

щью квадратичной функции Ляпунова V (x) = xTHx, H = HT > 0 [17]. Рассмотрим те-

перь следующий, более "тонкий"частотный критерий В.М. Попова, который для простоты

сформулируем лишь для случая k1 = 0 (общий случай может быть сведен к этому заменой

ϕ = ϕ+ k1σ).

21.3 Критерий В. М. Попова

Частотный критерий В.М. Попова гласит, что если выполнены условия: 1) линейная часть

системы асимптотически устойчива; 2) нелинейность ϕ(·) – однозначная и стационарная

(допускаются изолированные точки разрыва первого рода), 5 0 ≤ ϕ(σ)

σ≤ k, σ �= 0, ϕ(0)=0

(k = ∞ не исключается); 3) существует ϑ такое, что для всех ω ∈ [0, ∞] справедливо

частотное неравенство1

k+Re

((1+jωϑ

)W(jω)

)> 0, то имеет место абсолютная устойчи-

вость в заданном классе нелинейных блоков [11, 17, 33, 37, 39].

Данный критерий имеет удобную геометрическую интерпретацию. Для этого вводится

видоизмененная частотная характеристика W∗(jω) =U∗(ω)+jV∗(ω), где U∗(ω) = U(ω) =

Re(W(jω)), V∗(ω) = ωV(ω)=ωIm(W(jω)). Тогда, в соответствии с частотным неравенством,

годограф видоизмененной частотной характеристики должен лежать "правее"некоторой

прямой, проходящей через точку − 1

kна вещественной оси.

Заметим, что выполнение приведенных условий Попова означает существование у си-

стемы функции Ляпунова вида V (x)=xTHx+ϑ∫ σ0ϕ(σ)dσ. [17, 39].

Подробные сведения о более общем методе получения частотных условий устойчивос-

ти – частотной теореме Якубовича–Калмана приведены в [17, 27], см. также тематический

выпуск журнала Автоматика и телемеханика [1] и сборник [31], посвященные 80-летнему

юбилею проф. В. А. Якубовича.

5 Это условие может быть несколько ослаблено, [17].

202

Page 203: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 22

22 Исследование скользящих режимов. Метод эквивалентногоуправления

22.1 Понятие о скользящих режимах

Пусть (замкнутая) система описывается уравнениями вида (18.6):

x(t)=f (x(t), t) (22.1)

либо эквивалентными им уравнениями вида (18.7), (18.8):

x(t)=Ax(t)+Bξ(t), σ(t)=Cx(t),ξ(t)=ϕ(σ, t).

(22.2)

Кроме того, используем следующую форму записи уравнений системы [46], в которой явно

выделено управляющее воздействие u(t) : 1

x(t)=ψ (x(t), u(t), t) ,u(t)=U(x, t).

(22.3)

Известно много систем, для которых нелинейные зависимости (функции в правых частях

(22.3)) претерпевают разрыв. Типичными примерами служат механические системы с су-

хим (кулоновским) трением, различные системы с релейным законом управления, в том

числе и оптимальные по быстродействию системы управления, а также системы с регуля-

торами переменной структуры (СПС) ( [6, 8, 33, 38, 46]).

Для таких систем возникают трудности, связанные с определением движений на мно-жестве точек разрыва. В некоторых ситуациях решение можно получить, рассматриваядвижение системы до и после точки разрыва, используя конечные значения переменныхсостояния в качестве начальных на следующем участке траектории. Такая ситуация имеетместо, когда фазовые траектории «прошивают» поверхность разрыва. Но возможны слу-чаи, в которых фазовые кривые «стыкуются» на поверхности разрыва. Тогда изображаю-щая точка не может покинуть эту поверхность и остается на ней. Возникает «скользящий

1 Заметим, что эти уравнения можно рассматривать как представление модели замкнутой системы «пофункциональному признаку», в которых выделены уравнения объекта управления (18.4) и уравнения регу-лятора (18.6). Однако в (22.3) не указано, что является выходом и состоянием объекта. Поэтому регуляторможет быть динамическим и некоторые компоненты вектора состояния могут относиться к регулятору.

203

Page 204: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

режим» – движение изображающей точки по поверхности разрыва в течение некоторогоконечного интервала времени. Существенно, что в этом случае решение бесконечно многораз попадает на поверхность разрыва. Здесь моменты разрыва не являются изолированны-ми точками, как в предыдущем случае, а образуют отрезки оси времени. Возникает вопросопределения понятия решения уравнений с разрывной правой частью, когда моменты, длякоторых наступает разрыв, плотно лежат на некотором интервале. Данные определениядолжны учитывать как инженерно-физические, так и математические соображения. Они

должны обеспечивать возможность математического исследования систем (включая теоре-

мы существования и продолжимости решений, теоремы устойчивости), а также адекватно

описывать физическую реальность [17].

Известно несколько способов определения движений в скользящем режиме. Рассмотримнекоторые из них.

Среди указанных методов можно выделить физический и аксиоматический подходы

[8, 17, 46].

Физический подход развит в работах М.А. Айзермана и Е.С. Пятницкого и вкратцесостоит в следующем. Для рассматриваемой системы составляется более точная матема-тическая модель, в которой учитываются такие факторы, как запаздывание, гистерезис,инерционность, ограниченность скорости изменения сигнала и коэффициента усиления, ит.д. Действие этих факторов приводит к тому, что в рассматриваемой модели системы от-сутствует описанный выше «идеальный» скользящий режим и возникает «реальный» сколь-зящий режим с изолированными моментами разрыва правых частей уравнений. Изобра-жающая точка не остается на поверхности разрыва, а «прошивает» ее в противоположных

направлениях. 2 Для таких систем исчезает отмеченная выше специфическая проблема,связанная с тем, что моменты принадлежности изображающей точки поверхности разры-ва образуют отрезки времени, следовательно решение может быть получено обычным об-разом. После того, как получены уравнения реального скользящего режима, выполняетсяпредельный переход. Движение системы в идеальном скользящем режиме рассматриваетсякак предел, к которому стремится реальный скользящий режим при стремлении указанныхфакторов к нулю.

С одной стороны, такой подход оправдан с инженерной точки зрения. С другой сто-роны, он является трудоемким. Кроме того, нет гарантии, что при составлении модели

учтены все (или именно те, которые необходимы) факторы. Эти обстоятельства препят-2 Можно также сказать, что если в идеальном скользящем режиме изображающая точка совершает

колебания с бесконечной частотой и нулевой амплитудой относительно поверхности разрыва, то в реальномскользящем режиме частота колебаний конечна, а амплитуда не равна нулю.

204

Page 205: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

ствуют применению физического подхода, в том числе и в практических приложениях.

Аксиоматический подход состоит в доопределении уравнений системы при движении вскользящем режиме таким образом, чтобы получились уравнения с гладкой правой частью,решения которых описывали бы движение по поверхности разрыва. Применение аксиома-тического подхода существенно проще, чем физического, но полученные с помощью егорезультаты нуждаются в проверке с точки зрения соответствия физической реальности. В

качестве критерия адекватности иногда используют физический подход [46].

В следующих параграфах аксиоматический подход рассмотрен более подробно.

22.2 Определение движения в скользящем режиме

Задача определения движений в скользящем режиме разными авторами рассматриваетсяв несколько отличающихся постановках.

В большом числе математических работ рассматриваются уравнения вида (22.1) и счи-

тается, что на некоторой поверхности, заданной уравнением σ(x, t)= 0, функция f(·) пре-терпевает разрыв первого рода, т.е. 3

f(x, t)=

{f+(x, t), σ(x, t) > 0,f−(x, t), σ(x, t) < 0.

Требуется определить такую непрерывную (по x) функцию f 0(x, t), чтобы уравнение

x(t)=f0(x, t) описывало движение изображающей точки по поверхности разрыва, т.е. при

σ(x, t) ≡ 0 на некотором временном интервале.

Другими словами, если векторы фазовой скорости по разные стороны от поверхно-

сти разрыва v+(x), v−(x) направлены в противоположные области, то в системе возникает

скользящий режим. Требуется определить вектор фазовой скорости v0 на поверхности

σ(x, t)=0, при котором изображающая точка двигалась бы по указанной поверхности.

В работе [17] дается несколько другая постановка данной задачи. Рассматриваются

уравнения (22.2) и считается, что при некоторой σ = σ0(t) функция ϕ(σ, t) имеет разрыв.

Ставится задача определения выходов нелинейных блоков ϕ(σ, t) при σ(t) ≡ σ0(t).

Для таких систем в [17] рекомендуется использовать запись уравнений нелинейной ча-

сти системы в виде включений ξ(t) ∈ ϕ(σ, t), где функция ϕ(σ, t) принимает конкретные

значения вне точек разрыва (и тогда включение превращается в обычное равенство) ли-3 Заметим: это означает, что вектор фазовой скорости v(x) имеет разные направления в соседних точках,

разделенных поверхностью разрыва σ(x, t)=0.

205

Page 206: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

бо имеет значения из некоторого выпуклого множества Ξ, например промежутка [ξ−, ξ+].

Тогда задача определения движения в скользящем режиме сводится к определению кон-

кретного значения ξ0(t) ∈ Ξ при σ(t) = σ0(t). Заметим, что если вернуться к предыдущей

постановке задачи, то такой подход аналогичен использованию вместо дифференциального

уравнения (22.1) дифференциального включения x(t) ∈ f (x(t), t) .

В работе [46] рассматриваются уравнения вида (22.3), причем считается, что управля-

ющее воздействие имеет разрыв на поверхности σ(x, t)=0, т.е.

u(t)=

{u+(x, t), σ(x, t) > 0,u−(x, t) σ(x, t) < 0

Требуется найти такое непрерывное управление ueq(t) (называемое «эквивалентным»), ко-

торое отвечало бы движению системы по поверхности разрыва σ(x, t)=0.

Рассмотрим теперь некоторые методы определения решений систем с разрывной правойчастью.

22.3 Методы определения движения в скользящем режиме

Одним из наиболее известных методов определения решений разрывных систем являетсяметод А.Ф. Филиппова.

В этом методе используются уравнения вида (22.1). Для определения поля фазовых

скоростей на поверхности разрыва в соответствии с определением Филиппова следует по-

строить отрезок, соединяющий концы векторов v+(x) и v−(x) для данной точки на поверх-

ности разрыва и провести из точки x вектор v0(x) в точку пересечения данного отрезка

с касательной плоскостью. 4 Полученный вектор и является искомым вектором фазовойскорости на поверхности разрыва.

Как показано в [17], определению Филиппова соответствует минимально возможное

множество ϕ(σ, t) из всех допустимых, поэтому для данного метода чаще, чем для других,

имеется единственность решений. Однако, как отмечено там же, имеется много случаев,когда физически осмысленные решения не являются решениями в смысле Филиппова.

Согласно [17], решения разрывных систем должны удовлетворять уравнениям вида4 В данном изложении дается геометрическая интерпретация метода Филиппова, который может быть

представлен и аналитическими соотношениями. Кроме того, здесь рассматривается частный вид функцииf(·) и поверхность разрыва считается гладкой [17, 46].

206

Page 207: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

(22.2), где уравнения нелинейных блоков понимаются как включения, т.е. выполнено

x(t) = Ax(t)+Bξ(t),

ξ(t) ∈ ϕ(Cx(t), t).

Вектор-функция ξ(t) называется тогда доопределенной нелинейностью. Каждому реше-

нию x(t) соответствует своя доопределенная нелинейность. При detBTB �= 0, ξ(t) можно

получить из уравнений системы единственным образом, а именно, как

ξ(t)=(BTB)−1B (x(t)−Ax(t)) .

Таким образом, согласно [17], неоднозначная нелинейная функция ϕ(·) в (22.2) принима-ет конкретные (и различные в разные моменты времени) значения согласно поведениюлинейной части системы.

Далее будем рассматривать системы, у которых dimξ(t)=dimσ(t) = m и i-я компонента

вектора ϕ зависит от i-й компоненты вектора σ: ϕi=ϕi(σi).

Для того чтобы определить, как ведет себя решение в скользящем режиме, надо при-

нять, что по условию должно выполняться равенство σ(t) = σ0(t). Таким образом, для

линейной части можно записать систему алгебро-дифференциальных уравнений

x(t)=Ax(t)+Bξ(t), Cx(t)=σ0(t),

где σ0(t) – заданная функция времени. Характеристический многочлен этой системы имеетвид

D(s)=det

[sIn−A BC 0

].

По леммеШураD(s)=det(sIn−A) det(−C(sIn−A)−1B

). 5 Поскольку полученное выражение есть

произведение характеристического многочлена линейной части системы на определительее передаточной матрицы, то имеем следующий результат.

Характеристический многочлен системы линейных дифференциальных уравнений,

описывающих полный (т.е. для всех компонент вектора σ(t)) скользящий режим системы5 Леммой Шура называются следующие тождества [17]:

при detA �= 0, det

[A BC D

]= detA · det(D − CA−1B),

а при detD �= 0, det

[A BC D

]= detD · det(A−BD−1C)

.

207

Page 208: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

(22.2), с точностью до знака совпадает с произведением характеристического многочлена

линейной части системы на определитель ее передаточной матрицы [17].

Для систем с одной скалярной нелинейностью характеристический многочлен сколь-

зящего режима с точностью до знака совпадает с числителем передаточной функции (вслучае вырожденности которой предполагается, что степень знаменателя равна порядку

уравнений состояния системы, сокращений не произведено).

22.4 Метод эквивалентного управления

Рассмотрим теперь изложенный в [46] метод эквивалентного управления. В данном методе

используются уравнения вида (22.3). Предполагая наличие в системе скользящего режима

по поверхности σ(x)=0, получаем, что в производная по времени от σ(x(t)) в силу систе-

мы (22.3) должна равняться нулю. Так как эта производная зависит от управления, то

можем найти соответствующее эквивалентное управление ueq(t) из уравнения σ(t) = 0.

Найденное управление подставляется в уравнения (22.3), которые решаются совместно

с уравнением скользящего режима σ(x(t)) = 0. Как и выше, получаем систему алгебро-

дифференциальных уравнений, которая в данном случае имеет вид

x(t)=ψ (x(t), ueq(t), t) , σ(x(t))=0.

Рассмотрим более подробно применение метода эквивалентного управления для систе-

мы вида (22.2), полагая σ0(t)≡ 0. Сравнивая (22.2) и (22.3), получим

x(t)=Ax(t)+Bu(t), σ(t)=Cx(t).

Вычисляя σ(t) находим, что σ(t) = C(Ax(t)+Bu(t)

), откуда по методу эквивалентного

управления ueq(t) = −(CB)−1CAx(t) (полагаем detCB �= 0). Отсюда получаем систему

алгебро-дифференциальных уравнений

x(t)=(A−B(CB)−1CA

)x(t), Cx(t)=0.

Нетрудно убедиться, что данная система имеет характеристический многочлен D(s) =

det(sIn−A) det(−C(sIn−A)−1B

), совпадающий с полученным выше по методу работы [17]

многочленом.Таким образом, мы видим, что часто разные способы определения движений в сколь-

зящем режиме приводят к одинаковым результатам. Более подробные сведения имеются в

работах [17, 46].

208

Page 209: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Столь большое внимание к определению поведения систем в скользящих режимах свя-зано не только со стремлением к полноте математических методов теории систем или споявлением разрывных зависимостей при описании некоторых физических процессов. Какотмечено выше, имеется целый класс систем с искусственно введенной нелинейностью, ко-торые работают в принудительно возбужденном скользящем режиме – системы с перемен-

ной структурой (СПС) со скользящими режимами [6, 8, 45, 46]. Сведения о построении ииспользовании таких систем приведены в п. 23

209

Page 210: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 23

23 Системы с переменной структурой в задаче управления

Для управления в условиях неполной информации о параметрах объекта могут оказаться

эффективными так называемые системы с переменной структурой (СПС) [6–8,46]. Основ-

ная идея построения СПС состоит в использовании переключающихся законов управления

(соответствующим различным структурам замкнутой системы) [8,46]. Переключение про-

исходит на основе текущей информации о состоянии объекта управления в соответствии свыбранной функцией переключения.

Возможны различные способы построения СПС. Наиболее универсальным и разрабо-танным методом является принудительная организация в замкнутой системе скользящихрежимов, при которых изображающая точка в пространстве состояний системы движетсяпо выбранной поверхности. На эту поверхность точка попадает за конечное время после

начала переходного процесса [45, 46], а затем остается на ней неограниченно долго (или

в течение конечного промежутка времени). В результате, поведение замкнутой системы

мало зависит (или совсем не зависит) от параметров объекта управления, а определяется

выбранным при синтезе регулятора уравнением поверхности переключений. 1

Как будет показано ниже, принудительные скользящие режимы позволяют снизитьчувствительность системы к параметрическим и координатным возмущениям, а также до-биться инвариантности по отношению к задающему воздействию. Это связано с тем, что" разрывный"характер управления сближает СПС с системами, имеющими бесконечный

коэффициент усиления (в то же время, само управление в СПС остается ограниченным).

Создание устойчивых скользящих режимов в СПС достигается с помощью переключения

закона управления (обычно – путем изменения его параметров) на основе информации о

текущем состоянии объекта [6, 8, 46]. Этот режим является желательным для обеспече-

ния инвариантности системы [46]. 2 Требуемые динамические свойства замкнутой системы

обеспечиваются надлежащим выбором поверхности переключения, вид которой задаетсяпри синтезе. Полезной особенностью скользящих режимов является также возможностьдекомпозиции задачи проектирования. Синтез регулятора разбивается на две более про-

1 Следует иметь в виду, что данное утверждение относится именно к установившемуся скользящемурежиму. Траектория движения вне этого режима зависит от свойств объекта. Существенным являетсявозникновение устойчивого скользящего режима за конечное время.

2 Заметим, что кроме положительного свойства инвариантности, для СПС в скользящем режиме, каки для систем с неограниченным коэффициентом усиления имеется проблема обеспечения устойчивостипри неполной текущей информации о состоянии объекта, а также возможность появления нежелательныхколебательных процессов.

210

Page 211: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

стые подзадачи:

– создание устойчивых скользящих режимов;

– выбор поверхности переключения, движение по которой обладает желаемыми свой-ствами.

Скользящие режимы могут использоваться также для идентификации параметров и

состояния объекта, построения экстремальных и адаптивных систем [8, 46].

Рассмотрим задачу стабилизации линейного стационарного объекта со скалярнымуправлением. Динамика объекта задается уравнением

x(t) = Ax(t) +Bu(t), x(t) ∈Rn, u(t) ∈R. (23.1)

Зададим (как это обычно делается) линейное уравнение желаемой поверхности скольжения

σ(x(t)) = Cx(t) ≡n∑i=1

cixi(t), (23.2)

где C = [c1, c2, . . . , cn] – вектор-строка постоянных параметров, значения которых опреде-ляется при синтезе системы.

Скользящему режиму в системе соответствует тождество σt ≡ 0 (через σt обозначено

значение σ(x(t)) при функции x(t), удовлетворяющей (23.2)).

При синтезе СПС с принудительно организованными скользящими режимами требуется

обеспечить выполнение следующих условий [6, 46]:

– попадание изображающей точки на поверхность разрыва (23.2);

– возникновение скользящего режима на этой поверхности;

– устойчивость скользящего режима.

Скользящий режим возникает, если отклонение от поверхности σt и скорость его изме-нения σt имеют разные знаки, т.е.

limσ→−0

σ > 0, limσ→+0

σ < 0. (23.3)

Другими словами, в окрестности поверхности скольжения должно иметь место неравенство

σ (x(t), t) σ (t) < 0. (23.4)

Выполнение этого неравенства для всех x ∈ X , t ∈R является достаточным (но не необ-

ходимым, [46]) условием попадания изображающей точки на поверхность разрыва.

211

Page 212: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Движение системы в скользящем режиме описывается системой уравнений (23.1),

(23.2), которые эквивалентны уравнению порядка n − 1. Как отмечено выше, характери-

стический многочлен этого уравнения совпадает с числителем передаточной функции от uк σ :

W(s) = (sIn − A)−1B =B(s)A(s)

(23.5)

и, следовательно, зависит от коэффициентов ci вектор-строки (1×n-матрицы) C.

Эти коэффициенты определяются методами теории линейных систем, исходя из требо-ваний устойчивости и качества процесса стабилизации. Возможность использования СПСсо скользящими режимами для решения задач адаптивного управления определяется тем,что при соответствующем выборе переменных состояния динамика движения системы по

поверхности скольжения зависит от вектора C, а не от параметров объекта (матриц A, B).3

Управляющее воздействие должно быть выбрано так, чтобы обеспечить устойчивый

скользящий режим по заданной поверхности (гиперплоскости). Здесь проявляется упомя-

нутая декомпозиция задачи синтеза СПС – обеспечение качества процессов в системе (в

скользящем режиме) и обеспечение устойчивого скользящего режима являются разными

подзадачами. Возможность их независимого решения упрощает процедуру синтеза.

Рассмотрим сначала управление в виде линейной комбинации переменных состояния

системы [45]

u(t) = −n∑i=1

ki(x(t))xi(t), (23.6)

где коэффициенты регулятора претерпевают разрыв на поверхности σ(x) = 0 и определя-ются выражением

ki(x) =

{k+i , если xiσ(x) > 0,k−i , если xiσ(x) < 0, i = 1, 2, . . . , n.

σ (x) = x.(23.7)

Здесь k+i , k−i – постоянные коэффициенты закона управления, определяемые при синтезе.

Для их выбора используем неравенство (23.4) σtσt < 0. Исходя из этого условия, получим3 Точное утверждение, позволяющее установить количественные соотношения сформулировано на с. 206.

Отметим, что если уравнения объекта имеют вид управляемого канонического представления (см. [4,8,46],п. 6), то при σ(x) = x для (23.5) выполнено B(s) = c1 + c2s+ · · ·+ cns

n−1 и движение в скользящем режимене зависит от параметров объекта (23.1).

212

Page 213: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

[45] неравенства

(sign (B)) k+i > |B|−1ai,(sign (B)) k−i < |B|−1ai, i = 1, 2, . . . , n ,

(23.8)

где ai – столбцы матрицы A =[a1, a2, . . . , an

]. Эти же условия достаточны и для попа-

дания на плоскость x = 0 из любого исходного состояния. Следовательно, в такой системе

за конечное время возникает устойчивый (не прекращающийся) скользящий режим, дви-

жение в котором за счет надлежащего выбора вектора может быть наделено желаемымисвойствами.

Количество используемых переменных и коэффициентов в законе управления можно

уменьшить. Например, можно использовать алгоритм [45]

u (x) = −n−1∑i=1

ki(x)xi − δ0sign(σ(x)), (23.9)

где δ0 = const > 0 – выбираемый при синтезе параметр алгоритма так, чтобы выполнялось

условие sign(δ0) = sign(B). Достаточные условия возникновения и устойчивости скользя-щего режима при этом несколько усложняются и принимают вид

(sign (B)) k+i ≥ |B|−1ai − ci (an) ,

(sign (B)) k−i ≤ |B|−1ai − ci (an) , i = 1, 2, . . . , n ,

an < 0.(23.10)

Рассмотрим теперь некоторое линейное непрерывное управление

ul (t) = γTx(t), (23.11)

где γ – выбранный вектор коэффициентов (которые могут иметь и нулевые значения).

Пусть n− 1 корень характеристического многочлена замкнутой системы (23.1), (23.11) со-ответствует желаемому расположению корней в скользящем режиме, а оставшийся корень

принимает произвольное (вещественное) значение.

Рассмотрим также разрывное управление в СПС-регуляторе

u(x) =

{u+(x), если σ(x) > 0,u−(x), если σ(x) < 0,

(23.12)

где u+(x), u−(x) – непрерывные функции состояния.

213

Page 214: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Можно показать [46], что условия, при которых в системе (23.1), (23.12) на всей плос-

кости x = 0 существуют устойчивые скользящие режимы, следуют из неравенств (23.3) иимеют вид

Bu+(x) > Bul(x), Bu−(x) > Bul(x) (23.13)

Поскольку ul является линейной комбинацией некоторых координат вектора состояния, то

видно, что неравенства (23.13) можно выполнить, если брать u кусочно-линейным относи-тельно тех же координат:

u(t) = −Ψ(x(t))x(t)− δ(x(t)), (23.14)

где Ψ = [ψ1, . . . , ψk, 0, . . . , 0],

ψi(x) =

{αi, если (B)xiσ(x) > 0,βi, если (B)xiσ(x) < 0, i = 1, 2, . . . k,

δ(x) = δ0sign(Bσ(x)),

где δ0 > 0, αi ≥ −γi. Поэтому управление можно выбирать и в более простом виде

u(t) = −ψl(x(t))ul(x(t))− δ(x(t)), (23.15)

где ψl(x) =

{αl, если (B)ulσ(x) > 0,βl, если (B)ulσ(x) < 0,

δ(x) = δ0sign(Bσ(x)),αl ≥ −1, βl ≤ −1.

Во всех приведенных выше уравнениях СПС-регуляторов предполагается наличие ин-

формации о полном векторе состояния объекта x(t) (в первую очередь – при формировании

сигнала σ(x)). Это обстоятельство существенно затрудняет применение СПС на практике,

так как обычно приходится работать в условиях неполной текущей информации.

Одним из путей устранения этой трудности является применение наблюдающих

устройств (см. гл. 16 а также [4, 6, 8, 22, 46]). Но при синтезе "обычных"наблюдающих

устройств требуется достаточно точное знание динамических свойств объекта управления.

При использовании наблюдающих устройств со скользящими режимами, описанными

в [7, 8, 46] уменьшается чувствительность наблюдателей к параметрическим возмущениям,

что позволяет получить оценки состояния при изменении параметров объекта в широкихпределах.

214

Page 215: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Более сложная (но потенциально имеющая более широкие возможности) процедура,

предполагающая совмещение процессов оценки состояния и параметров объекта, реализу-

ется в адаптивных наблюдающих устройствах [2, 8, 48].

Задача построения систем со скользящими режимами, в которых используются изме-

рения только выходной координаты объекта рассматривается в [7, 8].

Рассматривается объект управления

x(t) = Ax(t) +Bu(t), y(t) = Lx(t), (23.16)

где x(t) ∈Rn, u(t) ∈R, y(t) ∈R

l. Требуется обеспечить возникновение (за конечное время)

устойчивого скользящего режима по поверхности y = 0, где c – заданный l-мерный вектор.Для достижения поставленной цели используем релейный закон управления

u = −γsignσ(y), σ(y) = y, (23.17)

с некоторым γ > 0.

Будем говорить, что передаточная функция W(s) =B(s)A(s)

соответствует строго

минимально-фазовой системе, если B(s) – гурвицев (устойчивый) многочлен степени n− 1

с положительными коэффициентами [1, 8, 48], где n = degA(s). Определение на случай

векторного управления (MIMO-объект) дано в [1,30,48]. На основе применения частотной

теоремы с обратной связью показано, что если передаточная функцияWσu(s) от управления

u к переменной σ

Wσu(s) = L (sIn − A)−1B (23.18)

строго минимально-фазовая, то при достаточно большом γ за конечное время возникает

скользящий режим и обеспечивается цель управления limt→∞ x(t) = 0. 4 Для уменьшения

зависимости устойчивости системы от начальных условий и параметров объекта в [7] пред-

лагается алгоритм с адаптивной настройкой вектора коэффициентов усиления K ∈Rl :

u(t) = −KT (t)y(t)− γsign (σ(y(t))) , σ(y(t)) = y(t),

K(t) = −σ(y(t))Γy(t), (23.19)

где Γ = ΓT > 0, γ > 0 – параметры алгоритма.4 Доказательство, основанное на использовании функции Ляпунова V (x) = |σ(y(x))| дано в [48].

215

Page 216: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

24 Системы с переменной структурой в задаче оценивания со-стояния

Известным методом получения более полной текущей информации о поведении объектауправления является использование рассмотренных в гл. 16 с. 114 наблюдателей. При син-тезе алгоритма оценивания имеет смысл не ограничиваться описанными в гл. 16 линейнымиструктурами, а использовать и возможности нелинейных методов управления, в том числе

– организации скользящих режимов в системах с переменной структурой [8, 46]. Посколь-

ку такие системы обладают, в некотором смысле, адаптивными свойствами, близкими к

свойствам систем с сигнальной адаптацией (по этому поводу см., например, [7, 8]), анало-

гичных свойств можно ожидать и от систем оценивания состояния. Использование скользя-щих режимов в наблюдателях предназначено, в первую очередь, для уменьшения ошибок,связанных с неточностью математической модели объекта. Рассмотрим этот подход болееподробно.

Запишем уравнения линейного стационарного объекта в виде

x(t)=Ax(t)+Bu(t), y(t)=Cx(t), x(t)∈Rn, y(t)∈R

l. (24.20)

Объект (24.20) считаем полностью наблюдаемым. Не нарушая общности рассуждений,

можно принять, что rankC = l.

Следуя [46], рассмотрим возможность осуществления декомпозиции движения наблю-

дателя за счет преднамеренного введения скользящего режима. Представим выход объекта

в виде y(t) = C1x1(t)+ C2x2(t), причем

x(t) = col{x1(t), x2(t)}, x2(t) ∈Rl, detC2 �= 0. Заметим, что выполнение указанного пред-

ставления всегда возможно, так как, по условию, rankC = l. Перейдем к новым переменным

состояния. В качестве нового вектора состояния используем вектор x(t) = col{x1(t), y(t)}(ср. с описанными в п. 16.4 с. 119 наблюдателями Луенбергера). Очевидно, переход к век-

тору x выполняется невырожденным преобразованием с матрицей

T =

[In−l 0C1 C2

] }n− l}l .

Уравнения состояния системы в результате преобразования принимают вид ˙x(t) = Ax(t) +

Bu(t), где A = TAT−1, B = TB. Более подробно их можно записать как{x1(t) = A11x1(t) + A12y(t) +B1u(t),y(t) = A21x1(t) + A22y(t) +B2u(t).

(24.21)

216

Page 217: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

З A =

[A11 A12

A21 A22

] }n− l}l , B =

[B1

B2

] }n− l}l .

Как показано в работе [46], из наблюдаемости пары (A,C) следует и наблюдаемость пары

(A11, A21), т.е. наблюдаемость системы x1 = A11x1 с выходом z = A21x1.

Запишем теперь уравнения наблюдателя со скользящим режимом. Они имеют вид [46]

{˙x1(t) = A11x1(t) + A12y(t) +B1u(t)− Lv(t),˙y(t) = A21x1(t) + A22y(t) +B2u(t) + v(t),

(24.22)

где v(t) = Msign σt, σt = y(t)− y(t), постоянная M > 0 – величина "полки реле функция

sign(·) от векторного аргумента понимается покомпонентно.Вычитая из (24.21) уравнения (24.22), получим уравнения относительно ошибок оцени-

вания: {ε(t) = A11ε(t) + A12σt + Lv(t), ε = x1(t)− x1(t).σ(t) = A21ε(t) + A22σt − v(t).

(24.23)

Разрывная вектор-функция v(t) выбирается таким образом, чтобы на многообразии

σ = 0 возникло движение в скользящем режиме. Этим обеспечивается равенство y(t) ≡ y(t).

Как показано в [46], при ограниченном начальном рассогласовании всегда найдется такое

(достаточно большое) M, при котором скользящий режим возникает.

Матрица L определяется исходя из требования устойчивости движения в скользящемрежиме и желаемой динамики системы относительно рассогласования ε. По методу экви-

валентного управления (см. с. 208) для получения уравнения скольжения следует решить

уравнение σt = 0 относительно v(t) и найденное решение v = veq подставить в первое урав-

нение системы (24.23), полагая σt ≡ 0. Выполняя эти преобразования, получаем veq = A21x1,

поэтому

ε(t) = A11ε(t) + LA21.ε(t) (24.24)

В силу наблюдаемости пары (A11, A21) всегда можно подобрать матрицу L так, чтобы обес-

печить любое заданное расположение собственных чисел системы (24.24), и, следовательно

– желаемую динамику движения в скользящем режиме (по этому поводу см. п. 15.3 , с.

111, и п. 16.5 с. 118).

Можно заметить общие и отличительные свойства наблюдателя (24.22) и рассмотрен-

ного в п. 16.4 на с. 120 наблюдателя Луенбергера (16.10). При синтезе обоих наблюдателей

217

Page 218: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

выполняются однотипные преобразования базиса переменных состояния, сходным образомнаходится матрица коэффициентов обратной связи, а также и в том, и в другом случаеобеспечивается равенство нулю рассогласования σ между выходом объекта и его оценкой.Разница состоит в том, что наблюдатель Луенбергера является системой пониженного по-рядка, в которой последнее условие выполняется тождественно в силу самой процедуры

синтеза. Порядок наблюдателя (24.22) равен порядку объекта управления и условие σt ≡ 0

обеспечивается организацией скользящих режимов и наступает по истечении некоторого

промежутка времени. 5

5 Выше, на с. 212, уже отмечено, что в скользящем режиме система описывается уравнениями пони-женного порядка.

218

Page 219: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Лекция 25

25 Методы адаптивного управления

25.1 Задача адаптивного управления

В конце XX столетия развитие теории систем автоматического управления и ее прак-тических приложений характеризовалось интенсивной разработкой методов адаптивно-го управления. Эти методы служат для построения систем управления при значительной

неопределенности параметров объекта управления и условий его функционирования (ха-

рактеристик среды), имеющейся на стадии проектирования или до начала эксплуатации

системы. Рассматриваются такие задачи управления, при которых динамические свойстваобъекта могут изменяться в широких пределах неизвестным заранее образом. Имеющей-

ся начальной (априорной) информации недостаточно для построения систем управления

с оптимальными (или заданными) показателями качества. В адаптивных системах управ-

ления недостаток априорной информации восполняется в процессе ее функционированияна основе текущих данных о поведении объекта. Эти данные обрабатываются в реаль-

ном масштабе времени (в темпе протекания управляемого процесса) и используются дляповышения качества системы управления.

Применение принципов адаптации позволяет:

– обеспечить работоспособность системы в условиях значительного изменения дина-мических свойств объекта;

– произвести оптимизацию режимов работы объекта при изменении его параметров;

– снизить технологические требования к изготовлению отдельных узлов и элементовсистемы;

– унифицировать отдельные регуляторы или блоки регуляторов, приспособив их дляработы с различными видами однотипных объектов;

– сократить сроки конструкторских испытаний;– повысить надежность системы.

В настоящее время этот раздел теории управления достиг высокой степени зрелости.Ниже рассматриваются основные положения теории адаптивных систем. Более подробно

об этой теории можно прочесть [8, 30, 47, 48].

219

Page 220: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

25.2 Структура адаптивных систем управления

Процесс адаптивного управления можно рассматривать как процесс взаимодействия трех

подсистем [8, 38, 47, 48]:

– объекта;

– настраиваемого регулятора основного контура (собственно регулятора);

– блока адаптации («адаптора»).

Два последних блока объединяются в адаптивный регулятор, который имеет двухуров-невую иерархическую структуру. Регулятор основного контура непосредственно формиру-

ет управляющее воздействие u(t), поступающее на объект управления. Закон (алгоритм)

управления в основном контуре зависит от некоторого набора настраиваемых параметроврегулятора θ. Настройка этих параметров производится на втором уровне в соответствиис некоторым законом, называемым алгоритмом адаптации на основе доступной текущейинформации и без непосредственного использования значений параметров, априорно неизвестных.

Располагаемая априорная информация о значениях параметров характеризуется зада-

нием некоторого множества Ξ их возможных значений [8, 47]. Конкретный набор пара-

метров объекта (и характеристик среды) образует вектор неизвестных параметров ξ ∈ Ξ.

Считается заданной некоторая цель управления. Адаптивный регулятор должен привести квыполнению поставленной цели управления для любого ξ ∈ Ξ. Если то условие выполнено,

то система называется адаптивной в классе Ξ [47] (или просто адаптивной). 1

Цель управления обычно задается с помощью некоторого фукнционала качества, значе-ния которого вычисляются по измеряемым выходам объекта. В зависимости от конкретнойзадачи цель управления считается достигнутой, если указанный функционал либо прини-мает экстремальное значение, либо его величина находится в заданных пределах.

Кроме цели управления используется и цель адаптации. Она также формализуетсяс помощью некоторого функционала и может либо совпадать с целью управления, либоотличаться от нее, являясь некоторой вспомогательной целью, служащей для решения ос-новной задачи управления. Такой целью может быть, например, идентификация объекта

– получение оценок ξ неизвестных параметров ξ.

При аналоговой реализации адаптивного регулятора процессы в системе описываются в1 Ниже для конкретных типов систем это общее определение будет уточнено и в некоторых случаях

модифицировано. Например, имеются системы с сигнальной адаптацией [8], у которых задача адаптивногоуправления решается с помощью дополнительного сигнала управления, а не путем настройки параметроврегулятора. Кроме того, для систем других типов возможно использование других обозначений.

220

Page 221: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

виде функций непрерывного аргумента (времени). Такие системы называются непрерывны-

ми адаптивными системами. При цифровой реализации процессы в системе являются дис-кретными последовательностями и такие системы называются дискретными адаптивнымисистемами. Впрочем, такое разделение не означает, что непрерывный алгоритм адаптивно-го управления не может быть реализован цифровым регулятором. Это значит только, чтопри синтезе адаптивного регулятора процессы считаются непрерывными и не учитываетсяих квантование по времени при реализации системы, а синтез регулятора выполняется наоснове аналогового прототипа. Существенным является сохранение с заданной точностьюсвойств системы при дискретизации закона управления. Достаточно общие результаты по

обоснованию такого перехода получены в рамках метода непрерывных моделей [19, 28].

25.3 Методика решения задач адаптивного управления

Пусть задача адаптивного управления поставлена на содержательном уровне и формали-зована. Это означает, что задано математическое описание объекта управления и внеш-них воздействий с точностью до неизвестных параметров ξ. Указано также множество Ξ

значений этих параметров, дана спецификация управляющих воздействий и измеряемыхвыходов объекта. Кроме того, должна быть сформулирована цель управления.

Процесс синтеза адаптивного регулятора можно разбить на следующие этапы [2, 8, 38,

47, 48].

Этап 1. Выбор «идеального» закона управления. Находится закон управления,обеспечивающий принципиальную возможность достижения указанной цели управления.Вектор параметров ξ предполагается известным. Полученный закон управления непосред-ственно реализован быть не может, так как он зависит, в общем случае, от неизвестныхпараметров объекта. В этом смысле его можно назвать идеальным законом управления.Например, такой закон управления может строиться на основе решения задачи оптималь-

ного управления [2, 22, 38]. Но и не оптимальные (в общепринятом смысле этого слова)законы управления также могут рассматриваться как «идеальные», поскольку речь идето том, что при их синтезе предполагается наличие достаточно точной информации о пара-метрах объекта и среды.

Обычно при синтезе идеального закона управления делают некоторые упрощающиепредположения относительно динамики объекта, а также пренебрегают некоторыми воз-мущениями и помехами измерений.

Иногда основную цель управления заменяют некоторой вспомогательной (вторичной)целью, выполнение которой косвенно позволяет достигнуть и исходную цель.

221

Page 222: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Этап 2. Выбор настраиваемых параметров и цели адаптации. Неизвестные па-раметры, от которых зависит найденный идеальный закон управления заменяются настра-иваемыми параметрами. В результате получается алгоритм управления, в который уже невходят неизвестные параметры, поэтому он может быть реализован регулятором.

Известны два подхода к синтезу адаптивных регуляторов.

При прямом подходе настраиваемыми параметрами являются непосредственно коэф-

фициенты закона управления (т.е. регулятора нижнего уровня). Количество настраивае-

мых параметров выбирается по возможности наименьшим.

При идентификационном (непрямом) подходе выполняется оценивание значений, необ-

ходимых для синтеза регулятора неизвестных параметров объекта и характеристик внеш-них воздействий. Далее выполняется процедура совмещенного синтеза – оценки парамет-ров используются для вычисления коэффициентов, входящих в закон управления.

Кода настраиваемые параметры выбраны, ставится цель адаптации. Это – некотороевспомогательное целевое условие, являющееся основой для последующей разработки алго-ритма адаптации. При прямом подходе цель адаптации совпадает с исходной, либо вспо-могательной, целью управления. При идентификационном подходе цель адаптации обычносводится к обеспечению совпадения, или близости, оценок неизвестных параметров к их«истинным» значениям. Вспомогательная цель адаптации при таком подходе может выра-жаться, например, как совпадение реакций объекта управления и настраиваемой моделиобъекта на внешнее воздействие. Настраиваемая модель описывается уравнениями, анало-гичными уравнениям объекта управления, в которых неизвестные параметры заменены их

(настраиваемыми) оценками.

Требуемые свойства системы управления обычно задаются эталонной моделью [2,8,38].

Эта модель может включаться в систему явно, в виде некоторого динамического звена,

обладающего заданной реакцией на командное (задающее) воздействие, либо неявно – при-

сутствовать в виде некоторых «уставок» (параметров) алгоритма адаптации. Соответствен-

но, системы первого типа называются системами с явной эталонной моделью, а системывторого типа – с неявной эталонной моделью.

Системы с явной эталонной моделью могут быть подразделены, в свою очередь, исходяиз способа достижения цели на системы с параметрической и сигнальной адаптацией.

В системах с сигнальной настройкой эффект адаптации достигается без изменения па-раметров регулятора путем увеличения его коэффициентов или обеспечением скользящих

режимов (см. п. 23). Такие системы безусловно проще в реализации, однако они обеспе-

222

Page 223: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

чивают желаемое поведение только в относительно узком диапазоне значений параметровобъекта.

В системах с параметрической адаптацией цель достигается изменением параметроврегулятора. Эти системы более универсальны, однако обладают более сложной структу-рой. Алгоритмы адаптации используют сигнал рассогласования между выходами системыи эталонной модели. Сложность этих систем определяется количеством настраиваемых па-раметров.

Для повышения точности систем и скорости адаптации можно использовать сигна-льно-параметрические алгоритмы, в которых сочетается сигнальная и параметрическаяадаптация. В таких системах сигнальная адаптация обеспечивается обычно быстрым ре-лейным алгоритмом. Параметрическая адаптация имеет «узкую полосу пропускания» ислужит для стабилизации коэффициентов передачи в заданных пределах. Такие системы,кроме быстродействия и точности, также более просты в реализации, поскольку присут-ствие сигнальной компоненты позволяет уменьшить число настраиваемых параметров.

Этап 3. Выбор алгоритма адаптации. Как правило, алгоритмы адаптации пред-ставляют собой рекуррентные процедуры, относящиеся к классу методов последователь-

ного улучшения [2, 35, 38, 47]. Так как в условиях неопределенности добиться сразу выпол-

нения цели управления, вообще говоря, невозможно, то алгоритм адаптации осуществляетпоследовательное изменение настраиваемых параметров, приближаясь к выполнению цели.Такого рода алгоритмы обычно строятся на основе процедур градиентного типа.

Решающее влияние на работоспособность алгоритма адаптации оказывает выбор ко-

эффициента усиления (параметра шага) алгоритма. Для решения этой задачи известны

такие методы, как метод наименьших квадратов, метод стохастической аппроксимации

и метод рекуррентных целевых неравенств [6, 8, 47].

Этап 4. Исследование работоспособности адаптивной системы. Заключитель-ным этапом синтеза адаптивного регулятора, предваряющим разработку его техническойреализации, является исследование работоспособности системы с учетом характера воз-мущений, внешних воздействий, ограничений на переменные состояния объекта и другихфакторов, которые не учитывались при синтезе. На этом этапе также уточняются пара-метры алгоритма адаптации и, возможно, выполняется его модификация.

Значительную роль в обосновании работоспособности адаптивных систем управления

играет прямой метод Ляпунова [17, 29, 30, 33, 38, 47]. Но этот метод является в основноминструментом для теоретических исследований и не может дать ответы на все вопросы, ка-сающиеся устойчивости и качества работы адаптивных регуляторов в реальных условиях.

223

Page 224: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Поэтому большое место в исследовании адаптивных систем управления играет моделирова-ние. Особенно велико значение моделирования на этапе получения количественных харак-теристик системы. Для упрощения процедуры моделирования и многовариантного анализасистем применяются проблемно-ориентированные пакеты прикладных программ. В насто-

ящее время получили наибольшее распространение пакеты MATLAB и Simulink [8, 9, 32].

Надо заметить, что характерной особенностью процесса проектирования адаптивныхсистем управления является его цикличность. Как правило, алгоритм адаптации удает-ся синтезировать при значительном упрощении модели объекта, и на следующих стадияхпроектирования может оказаться, что выбранный алгоритм, или даже метод адаптивногоуправления, не отвечает условиям поставленной задачи и процесс проектирования повто-ряется.

224

Page 225: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Автоматика и телемеханика. Тематический выпуск. 2006. тт. 11, 12.

2. Александров А.Г. Оптимальные и адаптивные системы: Учебное пособие. М.: Высш.шк., 1989. 263 с.

3. Алгоритмы и программы проектирования автоматических систем / П.Д. Крутько,

А.И. Максимов, Л.М. Скворцов: Под ред. П.Д. Крутько. М.: Радио и Связь, 1988. 306с.

4. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976.424 с.

5. Андриевский Б.Р., Гузенко П.Ю., Фрадков А.Л. Управление колебаниями механиче-

ских систем методом скоростного градиента// Автоматика и телемеханика. 1996. N0=

4. С. 4–17.

6. Андриевский Б. Р., Козлов Ю.М. Методы управления в условиях неопределенности:Учебное пособие. Л.: ЛМИ, 1989. 88 с.

7. Андриевский Б. Р., Стоцкий А.А., Фрадков А.Л. Алгоритмы скоростного градиента в

задачах управления и адаптации. Обзор //Автоматика и телемеханика. 1988. N0= 12. С.

3–39.

8. Андриевский Б.Р., Фрадков А.Л.Избранные главы теории автоматического управленияс примерами на языке MATLAB. - Санкт-Петербург: Наука, 1999. - 467 с.

9. Андриевский Б.Р., Фрадков А.Л. Элементы математического моделирования в про-

граммных средах MATLAB 5 и Scilab (учебное пособие). - Санкт-Петербург: Наука,2001. - 286 с.

10. Арнольд В.И. Обыкновенные дифференциальные уравнения. М.: Наука, 1975. 240 с.

11. Бесекерский В.А., Попов Е.П. Теория систем автоматического регулирования. М.: На-ука, 1975. 768 с.

12. Боднер В.А. Системы управления летательными аппаратами. М.: Машиностроение,1973. 697 c.

13. Бортовые терминальные системы управления: Принципы построения и элементы тео-

рии /Б.Н. Петров, Ю.П. Портнов-Соколов, А.Я. Андриенко, В.П. Иванов. М.: Маши-ностроение, 1983. 200 с.

225

Page 226: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

14. Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М.: Наука,1987. 230 с.

15. Верешкин А.Е. , Катковник В.Я. Линейные цифровые фильтры и методы их реали-зации. М. Сов. радио, 1973. 151 с.

16. Воротников В.И. Устойчивость динамических систем по отношению к части перемен-ных. М.: Наука, 1991.

17. Гелиг А.Х., Леонов Г.А., Якубович В.А. Устойчивость нелинейных систем с неедин-ственным состоянием равновесия. М.: Наука, 1978. 400 с.

18. Демидович Б.П. Лекции по математической теории устойчивости. 2-е изд. М.: Изд-воМГУ, 1998.

19. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных системуправления. М.: Наука, 1981. 216 с.

20. Заде Л., Дезоер Ч. Теория линейных систем. Метод пространства состояний. М.: На-ука, 1970. 704 с.

21. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир,1971.

22. Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1986.650 с.

23. Ланкастер П. Теория матриц. М.: Наука, 1978. 280 с.

24. Ла-Салль Ж., Лефшец С. Исследование устойчивости прямым методом Ляпунова. М.:Мир, 1964. 168 с.

25. Ляпунов А. М. Общая задача об устойчивости движения. М.: Гостехиздат, 1950.

26. Ланда П.С. Нелинейные колебания и волны. М.: Наука, Физматлит, 1997. 496 с.

27. Леонов Г.А., Смирнова В.Б. Математические проблемы теории фазовой синхрониза-ции. СПб.: Наука, 2000.

28. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991. 432 с.

29. Математические основы теории автоматического регулирования: Учебное пособие

/Под ред. Б.К. Чемоданова. М.: Высшая школа, 1977. Т. 1. 366 с.; т. 2. 455 с.

226

Page 227: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

30. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управлениесложными динамическими системами. СПб.: Наука, 2000.

31. Нелинейные системы. Частотные и матричные неравенства/ Под ред. А. Х. Гелига,

Г. А. Леонова, А. Л. Фрадкова. М.: Физматлит. 2008.

32. Основы математического моделирования: Учебное пособие. 2-е изд. /Под ред. А.Л.

Фрадкова. БГТУ. СПб.: 1996. 192 с.

33. Первозванский А.А. Курс теории автоматического управления: Учебное пособие. М.:Наука, 1986. 615 с.

34. Острем К.Ю. Введение в стохастическую теорию управления. М.: Мир, 1973. 321 с.

35. Поляк Б.Т. Введение в оптимизацию. М.:Наука, 1983.

36. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974, 332с.

37. Попов В.М. Гиперустойчивость автоматических систем М.: Наука, 1970.

38. Справочник по теории автоматического управления /Под ред. А.А. Красовского. М.:

Физматлит, 1987. 712 с.

39. Сю Д., Мейер А. Современная теория управления и ее приложения. М.: Машиностро-ение, 1972. 544 с.

40. Рей У. Методы управления технологическими процессами. М.: Мир, 1983. 638 с.

41. Румянцев В.В., Озиранер А.С. Устойчивость и стабилизация движения по отношениюк части переменных. М.: Наука, 1987.

42. Теория автоматического управления: Учеб. для вузов. В 2-х частях /Под ред. А.А.

Воронова. 2-е изд. М.: Высшая школа, 1986.

43. Тихонов А.Н., Васильева А.Б., Свешников А.Г. Дифференциальные уравнения. 2-еизд. М.: Наука, 1998. 232 с.

44. Уилкинсон Дж. Х. Алгебраическая проблема собственных значений. М.: Наука, 1970.564 с.

45. Уткин В.И. Скользящие режимы и их применение в системах с переменной структу-рой. М.: Наука, 1974.

227

Page 228: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

46. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М.: Наука,1981. 367 с.

47. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическимиобъектами. М.: Наука, 1981, 448 с.

48. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990. 292 с.

49. Фурасов В.Д. Устойчивость и стабилизация дискретных процессов. М.: Наука, 1982.–192 с.

50. Шаров С.Н. Приближенные методы анализа нелинейных систем автоматическогоуправления: Учебное пособие. СПб.: БГТУ. 1993. 161 c.

51. Шилов Г. Е. Математический анализ (конечномерные линейные пространства). М.:

Наука, 1969. 432 с.

52. Etter D.M. Engineering Problem Solving with MATLABR. New Jersey.: Prentice Hall,Englewood Cliffs, 1993. 434 P.

53. Luenberger D.G. Introduction to dynamic systems. NY: Wiley, 1979, 446 P.

228

Page 229: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

Список иллюстраций

1.1 Аксиомы совместности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Структурная схема системы (2.2). . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3 Электротехнические устройства . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.4 Искусственный спутник Земли. . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.1 Структурные схемы систем (2.15) (а) и (4.5) (б). . . . . . . . . . . . . . . . . 33

5.1 Структурная схема, соответствующая жордановой форме (5.4). . . . . . . . . 38

6.1 Структурная схема системы (6.3) (форма УКП). . . . . . . . . . . . . . . . . 43

6.2 Структурная схема системы (6.6) (форма НКП). . . . . . . . . . . . . . . . . 45

10.1 Поле фазовых скоростей. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

10.2 Фазовые портреты систем второго порядка. . . . . . . . . . . . . . . . . . . . 72

10.3 Фазовые портреты и переходные процессы в (10.8). . . . . . . . . . . . . . . . 78

15.1 Система с недостижимыми состояниями. . . . . . . . . . . . . . . . . . . . . . 104

15.2 Эквивалентные состояния, x′0 ∼ x′′0. . . . . . . . . . . . . . . . . . . . . . . . . 105

15.3 Канонические формы управляемости (а) и наблюдаемости (б). . . . . . . . . 108

16.1 Принцип построения и структурная схема наблюдателя. . . . . . . . . . . . . 116

17.1 Система стабилизации с динамическим компенсатором. . . . . . . . . . . . . 128

17.2 Процессы стабилизации ИСЗ. 1 – пропорциональный регулятор (17.22), . . . 134

17.3 Волна колебаний. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13617.4 Углы поворота маятников и управление. . . . . . . . . . . . . . . . . . . . . . 137

18.1 Структура нелинейной системы в виде взаимосвязанных линейной . . . . . . 146

18.2 Сепаратрисы и предельный цикл. . . . . . . . . . . . . . . . . . . . . . . . . . 150

18.3 Состояния равновесия нелинейных систем. . . . . . . . . . . . . . . . . . . . . 152

18.4 Пересекающиеся траектории и скользящий режим . . . . . . . . . . . . . . . 155

19.1 Структурная схема генератора колебаний. . . . . . . . . . . . . . . . . . . . . 170

19.2 Точечное отображение (а) и переходная характеристика . . . . . . . . . . . 171

19.3 Функция последования h = ϕ(g). . . . . . . . . . . . . . . . . . . . . . . . . . 171

19.4 Амплитуда колебаний генератора и ошибка ее определения . . . . . . . . . . 173

20.1 Устойчивость по Ляпунову. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

229

Page 230: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО …i373.spb.ru/file/AndrLectTAU.pdf · ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО

20.2 Асимптотическая устойчивость по Ляпунову. . . . . . . . . . . . . . . . . . . 177

20.3 Неустойчивость по Ляпунову. . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

20.4 Орбитальная асимптотическая устойчивость. . . . . . . . . . . . . . . . . . . 179

20.5 Устойчивость по Лагранжу. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

20.6 Диссипативность в целом. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

20.7 Функция Ляпунова асимптотически устойчивой системы. . . . . . . . . . . . 185

20.8 Графики функций V(x(t)

)и V

(x(t)

)для одной из реализаций процесса (20.20).194

20.9 Процесс раскачки маятника. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

20.10Функция Ляпунова и фазовый портрет автоколебательной системы. . . . . . 196

230