В данной главе представлены:
Осмысление опыта эксплуатации Когнитивной аналитической системы "ЭЙДОС" [169, 171, 228-230] и новые теоретические исследования авторов в области адаптивного управления и принятия решений
[268-269, 275-286] привели к созданию принципиально новой Адаптивной системы анализа и прогнозирования состояний сложных систем "ДЕЛЬТА" [227].
Из результатов, полученных в предыдущих главах, следует, что основные функции системы следующие:
Применение системы “ДЕЛЬТА” включает следующие этапы:
Рассмотрим эти вопросы подробнее.
3.1.1. Разработка информационной модели объекта управления
Для разработки информационной модели объекта управления необходимо владеть основными принципами формализованного описания предметной области.
Сама разработка модели включает следующие этапы:
Формирование справочников классов распознавания
Основными объектами обработки информации в Системе являются классы распознавания и признаки.
Справочники классов распознавания и признаков является иерархической системой шкал, градациями которых и являются классы распознавания и признаки. Полная классификация измерительных шкал дана в источниках [118].
В системе обеспечена возможность использования всех видов шкал: номинальной (наименований), порядковой, интервальной и шкалы отношений.
Очень плодотворным является представление классов распознавания как некоторых областей в фазовом пространстве, в котором в качестве осей координат выступают некоторые шкалы. Классы распознавания могут рассматриваться, также как градации (конкретные значения, заданные с некоторой точностью, или диапазоны – зоны), заданные на этих шкалах. Количество шкал, тип шкал и количество градаций на них в системе должен определять сам пользователь (причем на количество шкал и градаций не должно быть ограничений, кроме суммарного количества классов).
Классы распознавания (признаки) могут относиться к различным уровням организации системы. Сами эти уровни могут иметь любой смысл, какой именно – определяет сам пользователь. Классификаторы уровней классов и признаков входят в состав нормативно–справочной информации. Этот механизм представляет собой еще один независимый способ классификации классов и признаков.
Для технологии и системы “ДЕЛЬТА
” нет формальной разницы между первичными и вторичными параметрами (признаками, фиксируемыми непосредственно и получающимися после определенной математической обработки).Подготовка и ввод обучающей выборки
Обучающая выборка предварительно подготавливается для ввода в компьютер в виде бумажных документов. Ввод ее осуществляется в двухоконном интерфейсе: в первом окне вводится классификационная информация, а во втором – описательная.
При вводе обучающей информации имеется возможность автоматического кодирования классов и признаков. Кроме того, возможен ввод информации с автоматическим кодированием из текстовых файлов и баз данных.
Цель управления – выделить определенные подмножества обучающей выборки по различным критериям.
В системе управление обучающей выборкой включает три функции:
Автоматический ремонт обучающей выборки – это операция, выделяющая из всех объектов обучающей выборки такое подмножество, которое дает частотное распределение логических объектов по классам распознавания, в наименьшей степени отличающееся от заданного частотного распределения (т.е. распределения генеральной совокупности)
.Первоначальное выделение объектов репрезентативной выборки является логическим, т.е. осуществляется без физического удаления введенных данных. Если результаты работы режима устраивают пользователя, то он может и физически удалить объекты, ранее удаленные логически.
Пользовательский интерфейс данной подсистемы должен быть реализован в виде двух окон. Результаты работы данного режима представляются в текстовом и графическом виде.
В Системе имеется ряд критериев, которые позволяют обоснованно принять решение об окончании процесса обучения.
Запуск процесса обучения и его контроль
В процессе обучения Система использует обучающую выборку для формирования статистики встреч признаков по классам распознавания и на этой основе рассчитает какое количество информации каждый признак содержит о принадлежности к каждому классу распознавания. Кроме того, рассчитывается интегральная информативность каждого признака (его селективная сила).
В процессе расчета базы абсолютных частот Система осуществляет довольно полную проверку корректности информации в обучающей выборке и формирует протокол ошибок.
Оптимизация системы признаков и классов распознавания. Исключение артефактов
В системе реализована возможность корректного исключения из системы признаков наименее значимых из них при заданных ограничениях (в т.ч. избыточности). Кроме того, могут быть исключены признаки маловероятной группы, по которым в обучающей выборке нет достаточной статистики (артефакты).
По желанию пользователя из системы классов распознавания могут быть исключены все классы, по которым образы не сформированы либо из-за отсутствия примеров в обучающей выборке, либо из-за высокой вариабельности представляющих их конкретных реализаций.
Данные процедуры относятся к классу робастных.
Под валидностью системы распознавания в данном исследовании понимается способность системы давать адекватные результаты идентификации и прогнозирования.
При исключении классов и признаков, по которым нет достаточной статистики из анализа, повышается качество исследуемой совокупности.
Проверка работоспособности методики и ее сертификация
В Системе имеется режим, обеспечивающий расчет дифференциальной и интегральной валидности на основе распознавания обучающей выборки. Если эти характеристики приложения удовлетворяют заказчиков, то методика сертифицируется, т.е. признается инструментом, пригодным для достижения тех целей, которые ставились при ее разработке.
Предполагается, что после оптимизации системы признаков, т.е. после корректного удаления признаков с низкой селективной силой, валидность Системы распознавания возрастет. Это связано с тем, что в первую очередь удаляются признаки с шумоподобными статистическими свойствами, затем сильно коррелирующие признаки (статистические), и лишь в последнюю очередь признаки слабокоррелирующие, т.е. признаки детерминистского типа. Ожидается, что при удалении признаков детерминистского типа валидность системы начнет уменьшаться. Очевидно, что если удалить слишком много существенных признаков, то корректная работа системы может нарушиться.
После завершения оптимизации и сертификации методики целесообразно выполнить операцию перекодирования, которое предназначено для удаления пропусков в кодировке справочников, которые возникают после оптимизации
.Перекодируются справочники первичных и обобщенных признаков, объектов обучающей и распознаваемой выборки и статистические базы данных.
Таким образом, перекодированием
завершается разработка оптимальной модели предметной области.
3.1.2. Решение задач идентификации, прогнозирования и выработки управляющих воздействий
Данный вид работ включает:
Подобно режиму ввода обучающей выборки, режим ввода объектов для распознавания включает следующие этапы работ:
В данном режиме система подсчитывает, какое количество информации содержится в системе признаков, описывающих каждый распознаваемый объект, о принадлежности данного объекта к каждому из классов распознавания. Кроме того, алгоритмом распознавания учитывается общая форма профиля объекта, т.е. корреляции между признаками.
Вывод результатов распознавания и их оценка
Результаты распознавания выводятся в двух вариантах:
Оба варианта дополняют друг друга. В каждом из этих режимов сначала отображается сводная форма, которая служит также в качестве меню для вывода более подробных результатов:
3.1.3. Углубленный анализ информационной модели предметной области
Углубленный анализ выполняется в подсистеме "Типология" и включает:
Так как обучение Системы может проводиться периодически согласно определенному регламенту (в данном случае это будет мониторинг СОУ), и, кроме того, в различных регионах, то могут исследоваться территориальные и динамические зависимости обобщенных образов классов распознавания, что представляет специальный интерес.
Таким образом, в данном разделе описываются:
3.2. СТРУКТУРА И ОСНОВНЫЕ ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ "ДЕЛЬТА"
Для применения на практике предложенной методологии синтеза адаптивных АСУ СОУ она должна быть доведена до определенного уровня конкретизации и детализации.
Для этого необходимо:
Инструментальная программная система, удовлетворяющая сформулированным в данной работе требованиям, была создана: это система "ДЕЛЬТА".
3.2.1. Общие сведения о системе "ДЕЛЬТА"
В качестве инструментальной оболочки, реализующей предложенную в данной работе методологию, математическую модель и алгоритм и синтеза адаптивных АСУ сложными объектами, применена, разработанная авторами, универсальная автоматизированная система распознавания образов "ДЕЛЬТА".
Система "ДЕЛЬТА" является довольно большой системой, имеющей разветвленную функциональную структуру. Достаточно сказать, что объем исходных текстов системы составляет более 2 Мб, система выдает 50 видов текстовых (приложение 1) и 50 видов графических форм (приложение 2), работает более чем с 60 связанными базами данных.
Все входные и выходные формы системы записываются в виде файлов и, как и ее базы данных, легко доступны из приложений Windows.
Требования к конфигурации компьютера, предъявляемые системой "ДЕЛЬТА", не являются жесткими: она может эффективно эксплуатироваться практически на всех имеющихся в настоящее время IBM–совместимых персональных компьютерах.
Система включает следующие семь подсистем:
Первая подсистема обеспечивает формализацию входной информации, как обучающей, так и распознаваемой.
Вторая и третья подсистемы являются инструментальными, т.е. позволяют (совместно с первой) разрабатывать новые приложения (методики тестирования, диагностики, прогнозирования и т.д.).
Четвертая подсистема предоставляет возможность эксплуатировать эти приложения в промышленном режиме, решая задачи идентификации и прогнозирования.
Пятая и шестая подсистемы позволяют провести углубленный анализ данных, представленных в форме обучающей выборки, в том числе решить обратные задачи декодирования (распознавания), т.е. выработать управляющее воздействие, а также обеспечивают возможность проверить работоспособность приложения.
Седьмая подсистема обеспечивает возможность для выполнения служебных функций, необходимых для надежной эксплуатации приложения, а также содержит дескрипторную информационную систему, основанную на принципах распознавания образов.
3.2.2. Структура системы "ДЕЛЬТА"
Данной обобщенной структуре соответствует и дерево диалога системы. На рис. 2.5 представлена обобщенная функциональная структура системы "ДЕЛЬТА". Более подробно данная структура отображена в форме иерархической табл.
3.1.
Таблица
3. 1ДЕТАЛИЗИРОВАННАЯ СТРУКТУРА СИСТЕМЫ "ДЕЛЬТА"
Подсистема |
Функция |
Операция |
||
Словари |
Классификационные шкалы и градации |
|||
Описательные шкалы и градации |
Наименования шкал |
|||
Наименования градаций |
||||
Градации описательных шкал (признаки) |
||||
Иерархические уровни организации систем |
Уровни классов |
|||
Уровни признаков |
||||
Почтовая служба по нормативной информации |
Обмен по классам |
|||
Обмен по признакам |
||||
Печать объектов |
||||
Обучение |
Ввод–корректировка обучающей выборки |
|||
Управление составом обучающей выборки |
Параметрическое задание объектов для обработки |
|||
Статистическая характеристика, ручной ремонт |
||||
Автоматический ремонт обучающей выборки |
||||
Пакетное обучение системы распознавания |
Накопление абсолютных частот |
|||
Исключение артефактов (робастная процедура) |
||||
Расчет информативностей признаков |
||||
Расчет условных процентных распределений |
||||
Автоматическое выполнение режимов 1–2–3–4 |
||||
Почтовая служба по обучающей информации |
||||
Оптимизация |
Формирование ортонормированного базиса классов |
|||
Исключение признаков с низкой селективной силой |
||||
Удаление классов и признаков, по которым недостаточно данных |
||||
Распознавание |
Ввод–корректировка распознаваемой выборки |
|||
Пакетное распознавание |
||||
Вывод результатов распознавания |
Разрез: один объект – много классов |
|||
Разрез: один класс – много объектов |
||||
Почтовая служба по распознаваемой выборке |
||||
Типология |
Типологический анализ классов распознавания |
Информационные (ранговые) портреты (классов) |
||
Кластерный и конструктивный анализ классов |
Расчет матрицы сходства образов классов |
|||
Генерация кластеров и конструктов классов |
||||
Просмотр и печать кластеров и конструктов |
||||
Автоматическое выполнение режимов: 1,2,3 |
||||
Вывод 2d семантических сетей классов |
||||
Когнитивные диаграммы классов |
Продолжение
Подсистема |
Режим |
Функция |
Операция |
||
Типологический анализ первичных признаков |
Информационные (ранговые) портреты признаков |
||||
Кластерный и конструктивный анализ признаков |
Расчет матрицы сходства образов признаков |
||||
Генерация кластеров и конструктов признаков |
|||||
Просмотр и печать кластеров и конструктов |
|||||
Автоматическое выполнение режимов: 1,2,3 |
|||||
Вывод 2d семантических сетей признаков |
|||||
Когнитивные диаграммы признаков |
|||||
Типология |
Типологический анализ первичных признаков |
Информационные (ранговые) портреты признаков |
|||
Кластерный и конструктивный анализ признаков |
Расчет матрицы сходства образов признаков |
||||
Генерация кластеров и конструктов признаков |
|||||
Просмотр и печать кластеров и конструктов |
|||||
Автоматическое выполнение режимов: 1,2,3 |
|||||
Вывод 2d семантических сетей признаков |
|||||
Когнитивные диаграммы признаков |
|||||
Анализ |
Оценка достоверности заполнения объектов |
||||
Измерение интегральной и дифференциальной валидности системы распознавания |
|||||
Измерение независимости классов и признаков |
|||||
Просмотр профилей классов и признаков |
|||||
Сервис |
Генерация (сброс) баз данных |
Все базы данных |
|||
Нормативная информация |
Всех баз данных |
||||
БД классов |
|||||
БД первичных признаков |
|||||
БД обобщенных признаков |
|||||
Обучающая выборка |
|||||
Распознаваемая выборка |
|||||
Базы данных статистики |
|||||
Переиндексация всех баз данных |
|||||
Печать БД абсолютных частот |
|||||
Печать БД условных процентных распределений |
|||||
Печать БД информативностей |
|||||
Дескрипторная информационно–поисковая система |
Подробнее подсистемы, режимы, функции и операции, реализуемые системой "ДЕЛЬТА", описаны в [196].
3.3. МЕТОДИКА ПРИМЕНЕНИЯ СИСТЕМЫ
Универсальная когнитивная аналитическая система "ДЕЛЬТА" представляет собой программную систему, и для ее эксплуатации, как и для эксплуатации любой программной системы, необходима определенная инфраструктура. Без инфраструктуры эксплуатации любая программная система остается лишь файлом, записанным на винчестере.
В зависимости от масштабности решаемых задач управления и специфики предметной области данная структура может быть как довольно малочисленной, так и более развитой. Однако в любом случае ее основные функциональные и структурные характеристики остаются примерно одними и теми же.
Кратко рассмотрим эту инфраструктуру на примере гипотетической организации, производящей определенные виды продукции.
Основная цель: обеспечивать информационную и аналитическую поддержку деятельности организации, направленную на достижение запланированного объема и качества продукции, высокой эффективности управления и устойчивого поступательного развития.
Данная основная цель предполагает выполнение информационных и аналитических работ с различными объектами деятельности, находящимися на различных структурных уровнях как самой организации, так и ее окружения: персональный уровень; уровень коллективов (подразделений); уровень организации в целом; окружающая среда (непосредственное, региональное, международное окружение).
Для достижения основной цели для каждого класса объектов должны регулярно выполняться следующие работы: оценка (идентификация) текущего состояния с накоплением данных (мониторинг); прогнозирование развития (оперативное, тактическое и стратегическое); выработка рекомендаций по управлению.
Необходимо особо подчеркнуть, что основная цель может быть достигнута только при условии соблюдения вполне определенной наукоемкой технологии.
Для достижения основной цели и решения задач управления необходимо выполнять работы по следующим направлениям: