АДАПТИВНОЕ ПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ КВАДРАТНО-КОРНЕВЫМИ ИНФОРМАЦИОННЫМИ АЛГОРИТМАМИ
Содержание
Введение

1. Общие выкладки из теории

1.1. Общая постановка проблемы идентификации

1.2. Оценки максимального правдоподобия

1.3. Методы минимизации функций многих переменных

1.4. Метод квадратно-корневого информационного фильтра(ККИФ)

2. Оценивание параметров по методу максимального правдоподобия с использова-нием квадратно-корневых информационных фильтров

2.1. Постановка задачи

2.2. Функция правдоподобия и ее представление в терминах ККИФ

2.3. Градиент функции максимального правдоподобия

2.4. Значения производных переменных ККИФ

2.5. Описание алгоритма

3. Эксперименты и выводы

Заключение

Список используемой литературы

 
Задача идентификации формул и ру е тся следующим образом: по результатам наблюде н ий н ад вход н ыми и выходными переменным и системы должна быть построена оптимальная в некотором смысле модель, т. е. формал и зован н ое пр е дставление этой с и стемы
В зав и с и мост и от апр и орной информац и и об объекте управления различают задач и идентификац ии в узком и ш и роком смысле. Задача идент и фикаци и в у з ком смысле состоит в оцен и ван ии параметров и состоя н ия системы по результатам н аблюден и й над вход н ыми и выходными п е ременными, получен н ыми в условиях функционирования объ е кта. Пр и этом и звестна структура системы и задан класс мод е лей, к которому данный объ е кт относ и тся. Априорная информация об объект е достаточно велика
Апр и орная ин формация об объекте п р и идент и фикации в ш и роком смысл е отсутствует или оче н ь бедная, п оэтому пр и ходится предварительно р е шать большое ч и сло до п олн и тельных задач, такие как выбор структуры системы и задание класса модел е й, оце н ивание линейности объекта и действующих п ерем ен ных, оценивани е степени и формы влия н ия вход н ых переменных на выход н ые и др
Целью данной дипломной работы является исследование нового метода параметрической идентификации основанного на синтезе метода максимального правдоподобия и метода квадратно-корневого информационного фильтра, а также сравнение методов минимизации, использованных для минимизации выбранного функционала, с точки зрения сходимости, вычислительной точности, сложности, а также реализация данного метода на ЭВМ
 
Задача оценивания может быть сформулирована как задача нахождения наибольшего (наименьшего) значения некоторого функционала. Но т.к. значения параметров непосредственному наблюдению не доступны, то критерием выбора оптимума должен быть функционал от выходных значений . Примером такого функционала может служить либо функция правдоподобия, либо ее логарифм. Т.е. если - это выход объекта, -соответствующий выход модели и, также когда, невязки ошибок предсказания являются независимыми и имеют гауссовское совместное распределение с нулевым средним и матрицами ковариаций , тогда выражение для обратного логарифма функции максимального правдоподобия имеет следующий вид:
(1)
Тогда критерием выбора оптимума выберем выражение (2), которая является функцией многих переменных и для ее минимизации будем использовать наиболее известные и часто применяемые методы минимизации функций многих переменных: градиентный метод, метод Ньютона, метод сопряженных направлений.
Оценкой максимального правдоподобия является такое значение оцениваемых параметров , которое максимизирует вероятность события, при котором наблюдения, сгенерированные с подстановкой оцениваемых параметров, совпадают с действительными значениями наблюдений . Эта процедура эквивалентна минимизации обратного логарифма функции плотности условной вероятности невязок, представленный в формуле (2)
Вычисление оценки максимального правдоподобия может быть итеративно выполнено при помощи характеристического уравнения, которое включает в себя градиент обратного логарифма функции правдоподобия и информационную матрицу Фишера, если используется метод Ньютона для минимизации функционала. Вычисления функции правдоподобия и информационной матрицы Фишера требуют применения фильтра Калмана (а также его производных для каждого параметра оценивания), который, как известно, не обладает достаточной устойчивостью. Поэтому для вычисления оценки максимального правдоподобия итеративным образом использовался ККИФ, т.к. данный метод позволяет избежать численной неустойчивости, являющейся результатом вычислительных погрешностей, поскольку вместо матриц ковариаций ошибки оценок на этапах экстраполяции и обработки измерений, по своей природе положительно определенных, ККИФ оперирует с их квадратными корнями. А это значит, что вычисления квадратного корня равносильно счету с двойной точностью для ковариации ошибок и, кроме того, устраняется опасность утраты матрицей ковариаций свойства положительно определенности. Недостатком данного метода является присутствие операций извлечения квадратного корня
Для эффективного вычисления оценки максимального правдоподобия при использовании ККИФ, величины, входящие в выражение для (2) и его градиента, непосредственно выражаются либо через выходные значения КИИФ, либо легко находятся путем решения треугольных систем
 
Факт сходимости алгоритма максимального правдоподобия к оптимальным значениям параметров теоретически является недоказанным, поэтому в качестве основного метода исследования будем считать вычислительные эксперименты
Стоит заметить, что метод является достаточно сложным в вычислительном отношении, поскольку метод максимального правдоподобия с использованием ККИФ требует больших объемов вычислений: для перемножения, обращения, ортогональных преобразований матриц и поэтому для проведения экспериментов данный метод был реализован на ЭВМ
Модель, используемая в экспериментах, представленных на графиках, имеет следующий вид:……
В данной дипломной работе проведены эксперименты на сходимость метода максимального правдоподобия, используя различные алгоритмы минимизации. При этом варьировалось количество и расположение оцениваемых параметров в матрице перехода из состояния в состояние , которая, в данной случае, является устойчивой, а модель – наблюдаемой (на рисунках 1-3 представлены изменения оцениваемых параметров, используя при минимизации функционала градиентный метод; на рисунках 4-6 – изменение компонент градиента обратного логарифма функции правдоподобия; на рисунке 7 – нормализованная ошибка оценки параметров; на рисунках 6-21 – соответствующие графики для других методов минимизации). Также проведены эксперименты на выявление зависимости количества времени для одной итерации от количества измерений (рисунок 26), количества времени для одной итерации от размерности вектора оцениваемых параметров (рисунок 27), точности оценивания от количества наблюдений (рисунок 28), на выявления влияния соотношения сигнал/шум на точность оценивания (рисунок 29). На рисунках 22-25 представлена зависимость обратного логарифма функции максимального правдоподобия от параметров
 
После проведения серии вычислительных экспериментов были получены следующие результаты:
Как видно из графиков для обратного логарифма функции максимального правдоподобия по параметрам, минимум функции является не единственным, и как следствие этого возникают ситуации, когда методы минимизации сходятся не к истинному значению оцениваемых параметров. Так же стоит заметить, что график функционала, при больших отклонениях от истинных значениях параметров, идет практически параллельно горизонтальной оси координат. Из выше сказанного можно сделать вывод, что выбор начального приближения для параметров может оказать существенное влияние как на сходимость алгоритмов, так и на истинность полученных оценок.
На оценки параметров особенно сильное влияние оказывает наблюдаемость динамической системы объекта (наблюдаемость динамической системы является необходимым условием сходимости методов параметрической идентификации), а также соотношение сигнал/шум, причем с ростом соотношения точность оценок увеличивается.
Из исследованных алгоритмов наилучшей сходимостью обладает метод сопряженных направлений, а более точным является метод Ньютона, при этом он тоже обладает достаточно хорошей сходимостью. Поэтому предпочтительней использовать метод Ньютона, т.к. при использовании ККИФ матрица вторых производных функционала (в нашем случае это информационная матрица Фишера) вычисляется естественным путем из выходных данных.
Установлено, что в общем случае скорость сходимости с ростом размерности вектора параметров и количества наблюдений сильно падает, однако с увеличением количества входных данных растет точность оценок параметров. Но существует некоторый предел, при котором рост точности приостанавливается (при количестве наблюдений более 2500). Поэтому следует искать компромисс между скоростью и точностью.
 
 
Введение
С давних пор человеч е ство затрач и вает огромные усилия на установлен ие зако н омер н остей происходящих в пр и роде явл ен ий. П е рв и ч н ым в проц е сс е познания вс е гда являются результаты наблюдени