Универсальная когнитивная аналитическая система «Эйдос»,
по-видимому, является одной из первых реально работающих отечественных
универсальных систем искусственного интеллекта, широко применяемых и
развивающихся и в настоящее время [108]. Она является лицензионным программным
продуктом [158-182, 194-195], находящимся в полном открытом бесплатном доуступе
на сайте ее автора проф.Е.В.Луценко[1] по
адресу: http://lc.kubagro.ru/aidos/_Aidos-X.htm.
Математическая модель Универсальной когнитивной аналитической
системы "Эйдос", а также методика численных расчетов (алгоритмы и
структуры данных) и функциональная структура системы разработаны автором в 1979
году, когда он работал старшим инженером на вычислительном центре
Краснодарского медицинского института[2] и занимался разработкой математических
моделей и алгоритмов медицинских диагностических систем. Впервые математическая
модель системы «Эйдос» прошла экспериментальную апробацию в ходе численного
эксперимента в 1981 году. С 1981 по 1992 система "Эйдос" неоднократно
реализовалась автором в предметно-зависимых приложениях на платформе Wang (на
компьютерах Wang-
Для IBM-совместимых персональных компьютеров система
"Эйдос" была реализована в универсальной постановке (не зависящей от
предметной области) в 1992 году и с тех она пор совершенствуется постоянно,
вплоть до настоящего времени. В 1993 году впервые была опубликована
математическая модель системы «Эйдос». В 1994 году (т.е. за 2 года до создания системы
Windows 95) на систему "Эйдос"
и связанные с ней разработки получены 3 свидетельства РосПатента: №№ 940217,
940328 и 940334, ставшие первыми в Краснодарском крае, а возможно и в России,
патентами на системы искусственного интеллекта. Отметим, что именно в 1994 году
в Российской Федерации впервые появилась возможность правовой защиты авторских
прав на программы для ЭВМ. Позже были получены еще ряд свидетельств РосПатента[3].
Система «Эйдос» применялась для решения задач прогнозирования,
поддержки
принятия решений и научных исследований во многих предметных областях. Обзор
применений системы «Эйдос» до 2002 года приведен в 7-й главе работы [7][4], где приведена и ссылка на
акты внедрения. О применениях системы «Эйдос» с 2002 года по настоящее время
можно судить по работам [3-267], публикациям в Научном журнале КубГАУ: http://ej.kubagro.ru/a/viewaut.asp?id=11
и материалам сайта автора: http://lc.kubagro.ru.
Система "Эйдос" является высокоэффективным инструментом научных
исследований в самых различных предметных областях, в которых требуется
обобщение (многопараметрическая типизация), системная (многопараметрическая)
идентификация, прогнозирование и принятие решений, сравнение, классификация, и
была успешно применена в экономике, технических науках, педагогике, социологии,
психологии, психофизиологии, биологии, медицине, агрономии, сельскохозяйственных
науках (растениеводстве и плодоводстве), рекламных и маркетинговых
исследованиях, геофизике, климатологии, мелиорации и других науках. Она была
применена также при выполнении ряда кандидатских и докторских диссертационных
работ по экономическим, техническим и психологическим наукам[5]:
- 3 докторов экономических
наук;
- 2 доктора технических
наук;
- 4 кандидата
психологических наук;
- 1 кандидата технических
наук;
- 1 кандидата экномических
наук;
- 1 кандидата медицинских
наук.
С 1999 по 2002 год система «Эйдос» применялась в
учебном процессе в Кубанском государственном технологическом университете
(КубГТУ) при преподавании дисциплин: "Новые информационные технологии в
учебном процессе", "Комплексные технологии в науке и
образовании". С 2002 года и по настоящее время система «Эйдос» применяется
в Кубанском государственном аграрном университете (КубГАУ) и Адыгейском
государственном университете (АГУ) при преподавании дисциплины «Интеллектуальные
информационные системы», а в КубГАУ также и при преподавании дисциплин:
"Основы теории управления" и «Компьютерные технологии в строительной
науке и образовании» (магистерский курс).
Разработанный автором автоматизированный
системно-когнитивный анализ (АСК-анализ) и его программный инструментарий –
Универсальная когнитивная аналитическая система "Эйдос", нашли свое
широкое отражение в Internet[6].
Универсальная
когнитивная аналитическая система "Эйдос" (система «Эйдос») является
отечественным лицензионным программным продуктом, созданным с использованием
официально приобретенного лицензионного программного обеспечения. Система
«Эйдос» включает базовую систему, ряд систем окружения и программные интерфейсы
импорта данных из внешних баз данных различных стандартов.
По системе
"Эйдос" и различным аспектам ее практического применения имеется
более сотни публикаций автора с соавторами, в т.ч. 25 монографий и три учебных
пособия с грифами УМО и министерства.
Система
"Эйдос" является программным инструментарием, реализующим
теоретическую концепцию, математическую модель и методику численных расчетов
Системно-когнитивного анализа (СК-анализ) [7] и обеспечивает реализацию
следующих основных функций:
1. Синтез и адаптация
семантической информационной модели предметной области, включая активный объект
управления и окружающую среду.
2. Идентификация и
прогнозирование состояния активного объекта управления, а также разработка
управляющих воздействий для его перевода в заданные целевые состояния.
3. Углубленный анализ
семантической информационной модели предметной области.
Синтез модели в
СК-анализе осуществляется с применением подсистем: "Словари",
"Обучение", "Оптимизация", "Распознавание" и
"Анализ". Он включает следующие этапы:
1) формализация (когнитивная
структуризация предметной области);
2) формирование исследуемой
выборки и управление ею;
3) синтез или адаптация модели;
4) оптимизация модели;
5) измерение адекватности модели
(внутренней и внешней, интегральной и дифференциальной валидности), ее скорости
сходимости и семантической устойчивости.
Данный вид работ
осуществляется с помощью подсистем "Распознавание" и
"Анализ". Эти подсистемы обеспечивают: ввод распознаваемой выборки;
пакетное распознавание; вывод результатов распознавания и их оценку, в т.ч. с
использованием данных по дифференциальной валидности модели.
Этот анализ выполняется
в подсистеме "Типология", которая включает:
1. Информационный и
семантический анализ классов и признаков.
2.
Кластерно-конструктивный анализ классов распознавания и признаков, включая
визуализацию результатов анализа в оригинальной графической форме когнитивной
графики (семантические сети классов и признаков).
3. Когнитивный анализ
классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина).
Система
"Эйдос-12.5" включает семь подсистем, состоящих из режимов,
подрежимов, функций и подфункций (включающих в свою очередь функциональное
меню, пункты которого здесь не приводятся):
1. Формализация предметной области (ПО)
1.1. Классификационные шкалы и градации
1.2. Описательные шкалы (и градации)
1.3. Градации описательных шкал (признаки)
1.4. Иерархические уровни систем
1.4.1. Уровни классов
1.4.2. Уровни признаков
1.5. Программные интерфейсы для импорта данных
1.5.1. Импорт данных из
TXT-фалов стандарта DOS-текст
1.5.2. Импорт данных из
DBF-файлов стандарта проф. А.Н.Лебедева
1.5.3. Импорт из
транспонированных DBF-файлов проф. А.Н.Лебедева
1.5.4. Генерация шкал и
обучающей выборки RND-модели
1.5.5. Генерация шкал и
обучающей выборки для исследования чисел
1.5.6. Транспонирование
DBF-матриц исходных данных
1.5.7. Импорт данных из
DBF-файлов стандарта Евгения Лебедева
1.5.8. Системно-когнитивный
анализ стандартных графических шрифтов[7]
1.6. Почтовая служба по НСИ
1.6.1. Обмен по классам
1.6.2. Обмен по обобщенным признакам
1.6.3. Обмен по первичным признакам
1.7. Печать анкеты
2. Синтез СИМ
2.1. Ввод–корректировка обучающей выборки
2.2. Управление обучающей выборкой
2.2.1. Параметрическое задание объектов для обработки
2.2.2. Статистическая характеристика, ручной ремонт
2.2.3. Автоматический ремонт обучающей выборки
2.3. Синтез семантической информационной модели СИМ
2.3.1. Расчет матрицы
абсолютных частот
2.3.2. Исключение
артефактов (робастная процедура)
2.3.3. Расчет матрицы
информативностей СИМ-1 и сделать ее текущей
2.3.4. Расчет условных
процентных распределений СИМ-1 и СИМ-2
2.3.5. Автоматическое
выполнение режимов 1–2–3–4
2.3.6. Зависимость
достоверности СИМ от объема обучающей выборки, сходимость и устойчивость СИМ,
поиск периодов эргодичности и точек бифуркации
2.3.7. Расчет матрицы
информативностей СИМ-2 и сделать ее текущей
2.4. Почтовая служба по обучающей информации
2.5. Синтез СИМ и измерение ее адекватности
3. Оптимизация СИМ
3.1. Формирование
ортонормированного базиса классов
3.2. Исключение признаков с
низкой селективной силой
3.3. Удаление классов и
признаков, по которым недостаточно данных
3.4. Разделение классов на
типичную и нетипичную части
3.5. Генерация сочетанных
признаков и перекодирование обучающей выборки
4. Распознавание
4.1. Ввод–корректировка распознаваемой выборки
4.2. Пакетное распознавание
4.3. Вывод результатов распознавания
4.3.1. Разрез: один объект – много классов
4.3.2. Разрез: один класс – много объектов
4.4. Почтовая служба по
распознаваемой выборке
4.5. Построение когнитивных
функций влияния
4.6. Докодирование
сочетаний признаков в распознаваемой выборке
4.7. Назначения объектов на
классы (задача о назначениях)[8]
4.7.1. Задание ограничений на ресурсы по классам
4.7.2. Ввод затрат на объекты
4.7.3. Назначение объектов на классы (LC-алгоритм)
4.7.4. Сравнение эффективности LC и RND алгоритмов
5. Типология
5.1. Типологический анализ классов распознавания
5.1.1. Информационные (ранговые) портреты (классов)
5.1.2. Кластерный и конструктивный анализ классов
5.1.2.1 Расчет матрицы сходства образов классов
5.1.2.2. Генерация кластеров и конструктов классов
5.1.2.3. Просмотр и печать кластеров и конструктов
5.1.2.4. Автоматическое выполнение режимов: 1,2,3
5.1.2.5. Вывод 2d семантических сетей классов
5.1.3. Когнитивные диаграммы классов
5.2. Типологический анализ первичных признаков
5.2.1. Информационные (ранговые) портреты признаков
5.2.2. Кластерный и конструктивный анализ признаков
5.2.2.1. Расчет матрицы сходства образов признаков
5.2.2.2. Генерация кластеров и конструктов признаков
5.2.2.3. Просмотр и печать кластеров и конструктов
5.2.2.4. Автоматическое выполнение режимов: 1,2,3
5.2.2.5. Вывод 2d семантических сетей признаков
5.2.3. Когнитивные диаграммы признаков
6. СК-анализ СИМ
6.1. Оценка достоверности
заполнения объектов
6.2. Измерение адекватности
семантической информационной модели
6.3. Измерение
независимости классов и признаков
6.4. Просмотр профилей
классов и признаков
6.5. Графическое
отображение нелокальных нейронов
6.6. Отображение
Паретто-подмножеств нейронной сети
6.7. Классические и
интегральные когнитивные карты
6.8. Восстановление
значений функций по признакам аргумента[9]
6.8.1. Восстановление
значений и визуализация 1d-функций
6.8.2. Восстановление
значений и визуализация 2d-функций
6.8.3. Преобразование
2d-матрицы в 1d-таблицу с признаками точек
6.8.4. Объединение многих
БД: Inp_001.dbf и т.д., в Inp_data.dbf
6.8.5. Помощь по подсистеме
(требования к исходным данным)
7. Сервис
7.1. Генерация (сброс) БД
7.1.1. Все базы данных
7.1.2. НСИ
7.1.2.1. Всех баз данных НСИ
7.1.2.2. БД классов
7.1.2.3. БД первичных признаков
7.1.2.4. БД обобщенных признаков
7.1.3. Обучающая выборка
7.1.4. Распознаваемая выборка
7.1.5. Базы данных статистики
7.2. Переиндексация всех
баз данных
7.3. Печать БД абсолютных
частот
7.4. Печать БД условных
процентных распределений СИМ-1 и СИМ-2
7.5. Печать БД
информативностей СИМ-1 и СИМ-2
7.6. Интеллектуальная
дескрипторная информационно–поисковая система
7.7. Копирование основных
баз данных СИМ
7.8. Сделать текущей
матрицу информативностей СИМ-1
7.9. Сделать текущей
матрицу информативностей СИМ-2
Структура и функции универсальной когнитивной аналитической
системы "Эйдос-Х++" версии от 15.01.2017
(показана глубина диалога главного меню, т.е. без меню,
кнопок и переключателей на экранных формах)
'1. Администрирование'
'Подсистема администрирования'
'1.1. Авторизация
' F1_1() 'Авторизация сисадмина, администратора приложения или пользователя'
'1.2. Регистрация
администратора приложения ' F1_2() 'Регистрация и удаление регистрации
администраторов приложений и задание паролей пользователей. Этот режим доступен
только системному администратору и администраторам приложений.'
'1.3. Диспетчер
приложений ' F1_3() 'Это подсистема администрирования приложений. Она
предназначена для создания новых приложений, как пустых, так и на основе
учебных примеров (лабораторных работ), имеющихся в системе, а также для выбора
приложения для работы из уже имеющихся и удаления приложения. Выбор приложения
для работы осуществляется путем отметки его любым символом. Удалять любые
приложения разрешается только сисадмину, а Администратору приложений - только
те, которые он сам создал.'
'1.4. Выбор режима
использования системы ' F1_4() 'Монопольный или многопользовательский (задается
при инсталляции системы, но может быть изменен когда угодно сисадмином)'
'1.5. Задание
путей на папки с группами приложений' F1_5() 'Папки с различными группами
приложениями могут быть на локальном компьютере, в локальной сети или в
Internet. Пути на них задаются сисадмином при инсталляции системы и могут быть
изменены им когда угодно. Один из этих путей, а именно первый из отмеченный
специальных символов, считается текущим и используется при СОЗДАНИИ приложений
в диспетчере приложений 1.3, а в последующем при запуске приложений на
исполнение пути берутся уже из БД диспетчера приложений'
'1.6. Задание
цветовой схемы главного меню ' F1_6() 'Задается по умолчанию если в папке с
системой нет файла: ColorSch.arx при инсталляции системы, но может быть
изменена когда угодно сисадмином'
'1.7. Задание
размера главного окна в пикселях ' F1_7() 'Задается по умолчанию 1024 x 769
если в папке с системой нет файла: _MainWind.arx при инсталляции системы, но
может быть изменена когда угодно сисадмином'
'1.8. Задание
градиентных фонов главного окна ' F1_8() 'Градиентные фоны главного окна
задаются по умолчанию при инсталляции системы, но могут быть изменены когда
угодно сисадмином'
'1.9. Прописывание
путей по фактическому положению' F1_9() 'Доступно только сисадмину. Определяет
фактическое месторасположение системы и приложений и прописывает пути на них в
БД: PathGrAp.DBF и Appls.dbf, а также восстанавливает имена приложений в
Appls.dbf на данные им при их создании'
'1.10.
Экспериментальная графика Роджера ' DC_Graph()'Графика Роджера. Операции с
графикой на основе манипулирования массивами. Определение характеристик
пикселей.'
'1.11. Локализация
и инициализация (сброс) системы' F1_11() 'Доступно только сисадмину.
Прописывает все пути по фактическому месторасположению системы, пересоздает
общесистемные базы данных, удаляет все приложения и всех пользователей. Определяет
фактическое месторасположение системы и приложений, удаляет все директории
приложений с поддиректориями и всеми файлами в них, а затем прописывает все
пути на них по фактическому месторасположению, т.е. пересоздает и
переиндексирует БД: PathGrAp.DBF, Appls.dbf и Users.dbf'
'1.12. Режим
специального назначения ' F1_12() 'Комментарий: "Без комментариев"'
'2. Формализация
предметной области' 'Разработка классификационных и описательных шкал и
градаций и формирование обучающей выборки'
'2.1. Классификационные
шкалы и градации ' F2_1("Close") 'Ручной ввод-корректировка
классификационных шкал и градаций'
'2.2. Описательные
шкалы и градации ' F2_2("Close") 'Ручной ввод-корректировка
описательных шкал и градаций'
'2.3. Ввод
обучающей выборки' ''
'2.3.1. Ручной
ввод-корректировка обучающей выборки ' F2_3_1()' '
'2.4. Просмотр
эвентологических баз данных ' F2_4() 'Просмотр эвентологических баз данных (баз
событий), в которых исходные данные закодированы с помощью классификационных и
описательных шкал и градаций и представлены в форме кодов событий, между
которыми существуют причинно-следственные связи'
'2.3.2.
Программные интерфейсы с внешними базами данных' 'Автоматизированная
формализация предметной области'
'2.3.2.1. Импорт
данных из текстовых файлов ' F2_3_2_1() 'Универсальный программный интерфейс
ввода данных из TXT, DOC и Internet (HTML) файлов неограниченного объема.
Атрибуция текстов, АСК-анализ мемов'
'2.3.2.2.
Универсальный программный интерфейс импорта данных в систему'
F2_3_2_2("") 'Режим представляет собой УНИВЕРСАЛЬНЫЙ ПРОГРАММНЫЙ
ИНТЕРФЕЙС ФОРМАЛИЗАЦИИ ПРЕДМЕТНОЙ ОБЛАСТИ И ИМПОРТА ДАННЫХ В СИСТЕМУ
"ЭЙДОС-Х". Данный программный интерфейс обеспечивает автоматическое
формирование классификационных и описательных шкал и градаций и обучающей выборки
на основе XLS, XLSX или DBF-файла с исходными данными стандарта, описанного в
Help режима. Кроме того он обеспечивает автоматический ввод распознаваемой
выборки из внешней базы данных. В этом режиме может быть до 1000000 объектов
обучающей выборки до 1500 шкал.'
'2.3.2.3. Импорт
данных из транспонированных внешних баз данных ' F2_3_2_3() 'Режим представляет
собой ПРОГРАММНЫЙ ИНТЕРФЕЙС ФОРМАЛИЗАЦИИ ПРЕДМЕТНОЙ ОБЛАСТИ И ИМПОРТА ДАННЫХ В
СИСТЕМУ "ЭЙДОС-Х". Данный программный интерфейс обеспечивает автоматическое
формирование классификационных и описательных шкал и градаций и обучающей
выборки на основе XLS, XLSX или DBF-файла с исходными данными стандарта,
описанного в Help режима стандарта, представляющего собой ТРАНСПОНИРОВАННЫЙ
файл стандарта режима 2.3.2.2. Кроме того он обеспечивает автоматический ввод
распознаваемой выборки из внешней базы данных. В этом режиме может быть до
1000000 шкал и до 1500 объектов обучающей выборки.'
'2.3.2.4.
Оцифровка изображений по внешним контурам ' F2324ok() 'Данный режим
обеспечивает оцифровку изображений по внешним контурам, т.е. кодирование и ввод
в систему "Эйдос" изображений и формирование файла исходных данных
"Inp_data" в стандарте режима 2.3.2.2 в котором каждое изображение
представлено строкой'
'2.3.2.5. Оцифровка
изображений по всем пикселям ' F2_3_2_5() 'Данный режим обеспечивает оцифровку
изображений по всем пикселям, т.е. кодирование и ввод в систему
"Эйдос" изображений и формирование файла исходных данных
"Inp_data" в стандарте режима 2.3.2.3 в котором каждое изображение
представлено столбцом'
'2.3.2.6. Импорт
данных из DOS-TXT-рядов чисел (цифр) и слов (букв) ' F2_3_2_6() 'Данный режим
обеспечивает импорт данных из DOS-TXT-рядов чисел (цифр) и слов (букв), а также
генерацию рядов для расчета асимптотического информационного критерия качества
шума - критерия степени выраженности закономерностей в модели'
'2.3.2.7.
Транспонирование файлов исходных данных ' F2_3_2_7() 'Данный режим обеспечивает
транспонирование базы данных Inp_data.xls и ее запись в виде файла
Out_transp.xls'
'2.3.2.8.
Объединение нескольких файлов исходных данных в один ' F2_3_2_8() 'Данный режим
обеспечивает объединение нескольких одинаковых по структуре баз данных с
именами вида: "Input####.xls", где: "####" - номер файла
вида: 0001,0002,...,9999, в один файл с именем: "Add_data.xls"'
'2.3.2.9.
Разбиение TXT-файла на файлы-абзацы"' F5_11() 'Данный режим
обеспечивает: обнаружение в папке: ../AID_DATA/INP_DATA/ TXT-файлов, загрузку
этих файлов, нахождение в них абзацев, запись этих абзацев в виде TXT-файлов с
именами вида: "######, <ИМЯ TXT-ФАЙЛА>" из сквозного номера
абзаца ###### и имени исходного TXT-файла'
'2.3.3. Управление
обучающей выборкой ' ' '
'2.3.3.1.
Параметрическое задание объектов для обработки ' Razrab() ' '
'2.3.3.2. Статистическая
характеристика, ручной ремонт ' Razrab() ' '
'2.3.3.3.
Автоматический ремонт обучающей выборки ' Razrab() ' '
'2.3.3.4.
Распределение объектов обуч. выборки по классам' F2_3_3_4()'Формирование отчета
о распределении объектов обучающей выборки по классам'
'2.3.4.
Докодирование сочетаний признаков в обучающей выборке' Razrab()' '
'3. Синтез,
верификация и улучшение модели' 'Создание модели, повышение ее качества и
оценка достоверности'
'3.1. Формирование
базы абсолютных частот' F3_1(.T., 0, 0, 0, .T.,"")'Загрузка по
очереди описаний всех объектов обучающей выборки и расчет количества встреч
различных сочетаний: Принадлежность объекта к j-му классу - наличие у него i-го
признака'
'3.2. Расчет
процентных распределений' F3_2(.T., 0, 0, 0, .T.,"")'Расчет условных
и безусловных процентных распределений'
'3.3. Расчет
заданных из 7 моделей знаний' F3_3(.T., 0, 0, 0, .T.,"")'Inf1~Prc1,
Inf2~Prc2, Inf3-хи-квадрат, Inf4-roi~Prc1, Inf5-roi~Prc2, Inf6-Dp~Prc1,
Inf7-Dp~Prc2'
'3.4.
Автоматическое выполнение режимов 1-2-3' F3_4(.T., 0, 0, 0,
.T.,"")'По очереди исполняются режимы: 3.1., 3.2. и 3.3. для заданных
стат.моделей и моделей знаний и затем заданная делается текущей'
'3.5. Синтез и
верификация заданных из 10 моделей' F3_5(.T.)'Оценивается достоверность
(адекватность) заданных стат.моделей и моделей знаний. Для этого осуществляется
синтез заданных моделей, обучающая выборка копируется в распознаваемую и в
каждой заданной модели проводится распознавание с использованием двух
интегральных критериев, подсчитывается количество верно идентифицированных и не
идентифицированных, ошибочно идентифицированных и не идентифицированных
объектов (ошибки 1-го и 2-го рода)'
'3.6. Синтез и
верификация заданной группы моделей' Razrab() 'В различных приложениях текущей
группы приложений создаются и верифицируются модели: Abs, Prc1, Prc2,
Inf1~Prc1, Inf2~Prc2, Inf3-хи-квадрат, Inf4-roi~Prc1, Inf5-roi~Prc2,
Inf6-Dp~Prc1, Inf7-Dp~Prc2 с фиксированными и адаптивными интервалами со
сценариями и без и для каждого класса определяется модель, в которой его
идентификация осуществляется наиболее достоверно'
'3.7. Повышение
качества модели' ' '
'3.7.1. Поиск и
удаление артефактов (робастная процедура) ' F3_7_1()'Строится частотное
распределение абсолютных частот встреч признаков в классах по матрице
сопряженности Abs.dbf и пользователю предоставляется возможность удалить редко
встречающиеся факты (сочетания), как случайные выбросы или артефакты. Для
работы профессиональной графики нужна MS Windows 7 или выше'
'3.7.2. Значимость
классификационных шкал ' Razrab()'В данном режиме классификационные шкалы
ранжируются в порядке убывания значимости, т.е. средней значимости их градаций,
т.е. классов'
'3.7.3. Значимость
градаций классификационных шкал (классов)' Razrab()'В данном режиме все
градации классификационных шкал (классы) ранжируются в порядке убывания
значимости, т.е. вариабельности значений частных критериев статистических баз и
баз знаний'
'3.7.4. Значимость
описательных шкал ' F3_7_4()'В данном режиме описательные шкалы ранжируются в
порядке убывания значимости, т.е. средней значимости их градаций, т.е.
признаков'
'3.7.5. Значимость
градаций описательных шкал (признаков) ' F3_7_5()'В данном режиме все градации
описательных шкал (признаки) ранжируются в порядке убывания значимости, т.е.
вариабельности значений частных критериев статистических баз и баз знаний'
'3.7.6. Разделение
классов на типичную и нетипичную части ' F3_7_6()'Из файла исходных данных
"Inp_data.dbf" стандарта программного интерфейса 2.3.2.2 либо
удаляются объекты обучающей выборки, которые привели к ошибкам неидентификации
или ложной идентификации, либо для таких объектов создаются новые классы. В
данном режиме используются результаты распознавания.'
'3.7.7. Генерация
подсистем классов и докод.об.и расп.выб. ' F3_7_7()'На основе сочетания классов
по 2, 3, N формируются подсистемы классов, которые добавляются в качестве
градаций в классификационные шкалы подсистем классов и в объекты обучающей и
распознаваемой выборки'
'3.7.8. Генерация
подсистем признаков и докод.об.и расп.выб.' F3_7_8()'На основе сочетания
признаков по 2, 3, N формируются подсистемы признаков, которые добавляются в
качестве градаций в описательные шкалы подсистем признаков и в объекты
обучающей и распознаваемой выборки'
'4. Решение задач
с применением модели' 'Применение модели для решения задач идентификации
(распознавания), прогнозирования и поддержки принятия решений (обратная задача
прогнозирования), а также для исследования моделируемой предметной области
путем исследования ее модели'
'4.1.
Идентификация и прогнозирование' ' '
'4.1.1. Ручной
ввод-корректировка распознаваемой выборки' F4_1_1() ' '
'4.1.2. Пакетное
распознавание в текущей модели' F4_1_2(0,.T.,"4_1_2")'Распознаются по
очереди все объекты распознаваемой выборки в стат.модели или базе знаний,
заданной текущей в режиме 3.3 или 5.6.'
'4.1.3. Вывод
результатов распознавания' ' '
'4.1.3.1. Подробно
наглядно: "Объект - классы" ' F4_1_3_1()'Визуализация результатов
распознавания в подробной наглядной форме в отношении: "Один объект -
много классов" с двумя интегральными критериями сходства между конкретным
образом распознаваемого объекта и обобщенными образами классов:
"Семантический резонанс знаний" и "Сумма знаний"'
'4.1.3.2. Подробно
наглядно: "Класс - объекты" ' F4_1_3_2()'Визуализация результатов
распознавания в подробной наглядной форме в отношении: "Один класс - много
объектов" с двумя интегральными критериями сходства между конкретным
образом распознаваемого объекта и обобщенными образами классов: "Семантический
резонанс знаний" и "Сумма знаний"'
'4.1.3.3. Итоги
наглядно: "Объект - класс" ' F4_1_3_3()'Отображение итоговых
результатов распознавания в наглядной форме: отображаются пары:
"Объект-класс" у которых наибольшее сходство по двум интегральным
критериям сходства: "Семантический резонанс знаний" и "Сумма
знаний". Приводится информация о фактической принадлежности объекта к
классу.'
'4.1.3.4. Итоги
наглядно: "Класс - объект" ' F4_1_3_4()'Отображение итоговых
результатов распознавания в наглядной форме: отображаются пары:
"Класс-объект" у которых наибольшее сходство по двум интегральным
критериям сходства: "Семантический резонанс знаний" и "Сумма
знаний". Приводится информация о фактической принадлежности объекта к
классу.'
'4.1.3.5. Подробно
сжато: "Объекты - классы"' F4_1_3_5()'В подробной сжатой (числовой)
форме приводится информация об уровне сходства всех объектов со всеми классами
по двум интегральным критериям сходства: "Семантический резонанс
знаний" и "Сумма знаний", а также о фактической принадлежности
объекта к классу.'
'4.1.3.6.
Обобщ.форма по достов.моделей при разных интегральных крит.' 'Отображаются
обобщенные результаты измерения достоверности идентификации по всем моделям и
интегральным критериям из БД: Dost_mod.DBF'
'4.1.3.7.
Обобщ.стат.анализ результатов идент. по моделям и инт.крит.' 'Отображаются
результаты обобщенного стат.анализа достоверности идентификации по всем моделям
и интегральным критериям из БД: VerModClsIT.dbf'
'4.1.3.8.
Стат.анализ результ. идент. по классам, моделям и инт.крит.' 'Отображаются
результаты стат.анализа достоверности идентификации по всем классам, моделям и
интегральным критериям из БД: VerModCls.dbf'
'4.1.3.9.
Достоверность идент.объектов при разных моделях и инт.крит.' 'Отображается
достоверность идентификации объектов по классам (F-мера Ван Ризбергена) в
разрезе по объектам при разных моделях (т.е. разных частных критериях) и при
разных интегральных критериях из БД: Dost_clsF.dbf. Позволяет удалять из
обучающей выборки плохо распознаваемые объекты.'
'4.1.3.10.Достоверность
идент.классов при разных моделях и инт.крит.' 'Отображается достоверность
идентификации объектов по классам (F-мера Ван Ризбергена) в разрезе по классам
при разных моделях (т.е. разных частных критериях) и при разных интегральных
критериях из БД: Dost_clsF.dbf'
'4.1.3.11.Распределения
уровн.сходства при разных моделях и инт.крит.' 'Отображаются частотные
распределения уровней сходства верно и ошибочно идентифицированных и
неидентифицированных объектов при разных моделях и интегральных критериях из БД:
DostRasp.dbf'
'4.1.4. Пакетное
распознавание в заданной группе моделей' Razrab()'Распознаются по очереди все
объекты распознаваемой выборки в стат.модели или базе знаний, заданной текущей,
в всех моделях заданной группы моделей'
'4.1.5.
Докодирование сочетаний признаков в распознаваемой выборке' Razrab()' '
'4.1.6.
Рациональное назначение объектов на классы (задача о ранце)'
F4_1_6()'Управление персоналом на основе АСК-анализа и
функционально-стоимостного анализа (задача о назначениях)'
'4.1.7. Интерактивная
идентификация - последовательный анализ Вальда' Razrab()' '
'4.1.8.
Мультираспознавание (пакетное распознавание во всех моделях)' Razrab()'При
идентификации объекта распознаваемой выборки с каждым классом он сравнивается в
той модели, в которой этот класс распознается наиболее достоверно, как в
системе "Эйдос-астра"'
'4.2. Типология
классов и принятие решений' ''
'4.2.1.
Информационные портреты классов' F4_2_1()'Решение обратной задачи
прогнозирования: выработка управляющих решений. Если при прогнозировании на
основе значений факторов оценивается в какое будущее состояние перейдет объект
управления, то при решении обратной задачи, наоборот, по заданному целевому
будущему состоянию объекта управления определяется такая система значений
факторов, которая в наибольшей степени обуславливает переход в это состояние'
'4.2.2. Кластерный
и конструктивный анализ классов' ' '
'4.2.2.1. Расчет
матриц сходства, кластеров и конструктов ' F4_2_2_1()' '
'4.2.2.2.
Результаты кластерно-конструктивного анализа ' F4_2_2_2()'Состояния,
соответствующие классам, расположенные около одного полюса конструкта,
достижимы одновременно, т.к. имеют сходную систему детерминации, а находящиеся
около противоположных полюсов конструкта являются альтернативными, т.е.
одновременно недостижимы.'
'4.2.2.3.
Агломеративная древовидная кластеризация классов' Razrab() 'Кластеризация,
путем объединения классов'
'4.2.2.4.
Дивизивная древовидная кластеризация классов' F3_7_6() 'Кластеризация, путем
разделения классов на типичную и нетипичную части пока релизоавна в упрощенной
форме (по сравнению с DOS-весрией системы "Эйдос". Из файла исходных
данных "Inp_data.dbf" стандарта программного интерфейса 2.3.2.2 либо
удаляются объекты обучающей выборки, которые привели к ошибкам неидентификации
или ложной идентификации, либо для таких объектов создаются новые классы. В
данном режиме используются результаты распознавания.). '
'4.2.3.
Когнитивные диаграммы классов' F4_2_3()'Данный режим показывает в наглядной
графической форме какими признаками сходны и какими отличаются друг от друга
заданные классы'
'4.3.
Типологический анализ признаков' ''
'4.3.1.
Информационные портреты признаков' F4_3_1()'Семантический (смысловой) портрет
признака или значения фактора, т.е. количественная характеристика силы и
направления его влияния на поведение объекта управления'
'4.3.2. Кластерный
и конструктивный анализ признаков' PARENT oMenu4_3 MESSAGE ' '
'4.3.2.1. Расчет
матриц сходства, кластеров и конструктов ' PARENT oMenu4_3_2 ACTION
{||F4_3_2_1()' '
'4.3.2.2.
Результаты кластерно-конструктивного анализа ' PARENT oMenu4_3_2 ACTION
{||F4_3_2_2()'Признаки или градации факторов, расположенные около одного полюса
конструкта, оказывают сходное влияние на объект управления, т.е. на его
принадлежность к классам или его переход в состояния, соответствующие классам и
могут быть заменены одни другими, а находящиеся около противоположных полюсов
конструкта оказывают сильно отличающееся влияние на объект управления и не
могут быть заменены одни другими.'
'4.3.2.3. Агломеративная
древовидная кластеризация признаков' PARENT oMenu4_3_2 ACTION {||Razrab()
'Кластеризация, путем объединения признаков'
'4.3.3.
Когнитивные диаграммы признаков' F4_3_3()'Данный режим показывает в наглядной
графической форме какими классами сходны и какими отличаются друг от друга
заданные признаки'
'4.4. Исследование
предметной области путем исследования ее модели' ' '
'4.4.1. Оценка
достоверности обучающей выборки ' Razrab()'Выявление объектов с нарушенными
корреляциями между классами и признаками. Выявление очень сходных друг с другом
объектов обучающей выборки'
'4.4.2. Оценка
достоверности распознаваемой выборки ' Razrab()'Выявление очень сходных друг с
другом объектов распознаваемой выборки'
'4.4.3. Измерение
адекватности 3 стат.моделей и 7 моделей знаний ' Razrab()'Любой заданной или
всех'
'4.4.4. Измерение
сходимости и устойчивости 10 моделей ' Razrab()' '
'4.4.5.
Зависимость достоверности моделей от объема обучающей выборки ' Razrab()' '
'4.4.6. Измерение
независимости классов и признаков (анализ хи-квадрат)' Razrab()' '
'4.4.7.
Графические профили классов и признаков ' Razrab() ' '
'4.4.8.
Количественный SWOT-анализ классов средствами АСК-анализа ' F4_4_8()
'АСК-анализ обеспечивает построение SWOT-матрицы (модели) для заданного класса с
указанием силы влияния способствующих и препятствующих факторов непосредственно
на основе эмпирических данных и поэтому является инструментом
автоматизированного количественного SWOT-анализа (прямая задача SWOT-анализа).
Классы интерпретируются как целевые и нежелательные состояния фирмы, факторы
делятся на внутренние, технологические, описывающие фирму, и внешние,
характеризующие окружающую среду, а количество информации, содержащееся в
значении фактора, рассматривается как сила и направление его влияния на переход
фирмы в те или иные будущие состояния'
'4.4.9.
Количественный SWOT-анализ факторов средствами АСК-анализа ' F4_4_9()
'АСК-анализ обеспечивает построение количественной SWOT-матрицы (модели) для
заданного значения фактора с указанием степени, в которой он способствует или
препятствует переходу объекта управления в различные будущие состояния,
соответствующие классам (обратная задача SWOT-анализа). Эта модель строится
непосредственно на основе эмпирических данных и поэтому АСК-анализ может рассматриваться
как инструмент автоматизированного количественного SWOT-анализа. Факторы
делятся на внутренние, технологические, описывающие саму фирму, и внешние,
характеризующие окружающую среду'
'4.4.10.Графическое
отображение нелокальных нейронов ' F4_4_10()' '
'4.4.11.Отображение
Паретто-подмножеств нелокальной нейронной сети ' Razrab() ' '
'4.4.12.Классические
и интегральные когнитивные карты ' Razrab() ' '
'4.5. Визуализация
когнитивных функций: текущее приложение, разные модели' F4_5() 'В данном режиме
осуществляется визуализация и запись когнитивных функций, созданных в текущем
приложении на основе различных стат.моделей и моделей знаний'
'4.6. Подготовка
баз данных для визуализация когнитивных функций в Excel ' F4_6() 'Данный режим
готовит базы данных для визуализации в MS Excel прямых и обратных, позитивных и
негативных точечных и средневзвешенных редуцированных когнитивных функций,
созданных на основе различных стат.моделей и моделей знаний'
'4.7. АСК-анализ
изображений ' F4_7() 'Данный режим обеспечивает АСК-анализ изображений, как
сгенерированных в учебных целях, так и внешних для системы
"Эйдос-Х++", относящихся к какой-либо предметной области. АСК-анализ
изображений возможен: по пикселям, по внешним контурам, по внутренним и внешним
контурам (в разработке)'
'4.8.
Геокогнитивная подсистема ' F4_8() 'Обеспечивает восстановление значений
функций по признакам аргумента. Преобразует 2D Excel-таблицу с именем
"Inp_map.xls" в файл исходных данных "Inp_data.dbf",
содержащий координаты X,Y,Z точек и их признаки (модель описательной информации
картографической базы данных). Визуализирует исходные данные из БД
"Inp_data.dbf" или итоговые результаты распознавания из БД:
"Rsp_it.dbf" в картографической форме (сетка и градиентная заливка
цветом) с применением триангуляции Делоне. Обеспечивает пакетный ввод и
оконтуривание изображений и формирование соответствующих файлов
"Inp_data" и др. для создания и применения модели, созданной на
основе этих изображений'
'5. Сервис'
'Конвертирование, печать и сохранение модели, пересоздание и переиндексация
всех баз данных'
'5.1. Конвертер
приложения OLD => NEW' F5_1() 'Преобразование модели из стандарта БД системы
Эйдос-12.5 в стандарт Эйдос-X++. Для конвертирования старого приложения надо
скопировать в папку: <OldAppls> файлы: Object.Dbf, Priz_Ob.Dbf,
Priz_Per.Dbf, Priz_Per.Dbt, Obinfzag.Dbf, Obinfkpr.Dbf'
'5.2. Конвертер
приложения NEW => OLD' F5_2() 'Преобразование модели из стандарта БД системы
Эйдос-X++ в стандарт Эйдос-12.5 в папку OldAppls. Все файлы из этой папки надо
скопировать в текущую папку системы "Эйдос-12.5", выполнить режимы
7.2 и 2.3.5'
'5.3. Конвертер
всех PCX (BMP) в GIF ' Razrab()' '
'5.4. Конвер.
результатов расп.для SigmaPlot' F5_4() 'Конвертирует результаты распознавания,
т.е. БД Rasp.dbf в параметрическую форму в стиле: "X, Y, Z", удобную
для картографической визуализации в системе SigmaPlot. Это возможно, если
предварительно были выполнены режимы 3.7.7 и 3.4(3.5.) и 4.1.2.'
'5.5. Просмотр
основных БД всех моделей' F5_5() 'Обеспечивает просмотр и экспорт в Excel
основных баз данных всех статистических моделей: Abs, Prc1, Prc2 и моделей
знаний: Inf1~Prc1, Inf2~Prc2, Inf3-хи-квадрат, Inf4-roi~Prc1, Inf5-roi~Prc2,
Inf6-Dp~Prc1, Inf7-Dp~Prc2'
'5.6. Выбрать
модель и сделать ее текущей' F5_6(4,.T.,"MainMenu")'Данная функция
позволяет выбрать среди ранее рассчитанных в 3-й подсистеме статистических баз
Abs, Prc1, Prc2 и моделей знаний INF#, текущую модель для решения в 4-й
подсистеме задач идентификации, прогнозирования, приятия решений и исследования
предметной области путем исследования ее модели'
'5.7.
Переиндексация всех баз данных' F5_7() 'Заново создаются все необходимые для
работы системы индексные массивы общесистемных баз данных (находящихся в папке
с исполнимым модулем системы), а также баз данных текущего приложения,
необходимые для работы с ним'
'5.8. Сохранение
основных баз данных модели' Razrab()' '
'5.9.
Восстановление модели из основных БД' Razrab()' '
'5.10.Выгрузка
исходных данных в "Inp_data"' F5_10() 'Данный режим выполняет функцию,
обратную универсальному программному интерфейсу с внешними базами данных
2.3.2.2(), т.е. не вводит исходные данные в систему, а наоборот, формирует на
основе исходных данных файлы: Inp_data.dbf и Inp_data.txt, на основе которых в
режиме 2.3.2.2() можно сформировать эту же модель'
'5.11. Внешнее
управление системой "Эйдос"' F5_11() 'Данный режим обеспечивает
управление системой "Эйдос" в реальном времени со стороны внешней
программы путем задания ею последовательности функций системы "Эйдос"
для исполнения (по сути программы, написанной на языке "Эйдос") в
специальной базе данных: "ExternalControl.dbf" и программного
контроля их исполнения'
'5.12. Печать
структур всех баз данных' F5_12() 'Распечатка структур (даталогических моделей)
всех баз данных текущего приложения'
'5.13.
Редактирование БД лемматизации' F5_13()'Ввод-корректировка базы данных
лемматизации: "Lemma.dbf"'
'5.14. Пояснения
по лабораторным работам' F5_14()'Пояснения по смыслу частных и интегральных
критериев и описания лабораторных работ'
'6. О системе' ''
'6.1. Информация о
системе, разработчике и средствах разработки' F6_1() ' '
'6.2. Ссылки на
патенты, документацию и текущую версию системы ' F6_2() 'Internet-ссылки на
патенты, монографии, учебные пособия, научные статьи и самую новую (на текущий
момент) версию системы "Эйдос-Х++, а также полный комплект документации на
нее одним файлом"'
'6.3. Карта
системы (дерево диалога) ' Razrab()' '
'6.4. Порядок
преобразования данных в информацию, а ее в знания' F6_4() 'В режиме
раскрывается соотношение содержания понятий: "Данные",
"Информация" и "Знания", а также последовательность
преобразования данных в информацию, а ее в знания в системе
"Эйдос-Х++" с указанием имен баз данных и ссылками на основные
публикации по этим вопросам'
'6.5. Графическая
заставка системы "Эйдос-12.5" ' F6_5() ' '
'6.6. Roger
Donnay, Professional Developer, Developer eXPress++' F6_6() 'Roger Donnay,
профессиональный разработчик программного обеспечения, разработчик
высокоэффективной инструментальной системы программирования eXPress++, широко
использованной при создании системы "Эйдос-Х++". Roger Donnay,
Professional Developer, Developer eXPress++'
'6.7. Логотипы мультимоделей '
F6_7() ' '
'6.8.
Свидетельство РосПатента РФ на систему "Эйдос-Х++" ' F6_8() ' '
'6.9. География
пользователей системы "Эйдос-Х++" F6_9() 'Когда кто-либо в мире
запускает систему "Эйдос-Х++" на исполнение на компьютере,
подключенном к Internet, то на она программно обращается к специально
созданному сайту, на котором размещен PHP-код, определяющий дату и время
обращения, а также IP-адрес компьютера, с которого произошло это обращение, и
по нему определяет страну, регион и город пользователя. Вся эта информация
отображается в текстовой, табличной и картографической форме'
'7. Выход'
F7()'Закрыть все базы данных и корректно выйти из системы'
Необходимо отметить, что
все эти режимы, за исключением подсистемы администрирования и диспетчера
приложений, были реализованы в предыдущей версии системы “Эйдос» и системах
окружения. В текущей версии системы «Эйдос-Х++» пока реализованы не все режимы
системы «Эйдос», версии 12.5 (это последняя версия системы «Эйдос» под MS DOS
от июня 2012 года). Такие режимы отмечены как разрабатываемые:, Razrab().
Структура и
взаимодействие этих подсистем и режимов позволяют полностью реализовать все
аспекты СК-анализа в удобной для пользователя форме. Обобщенной структуре
соответствуют и структура управления и дерево диалога системы. Подробнее
теоретическая концепция системы «Эйдос», ее подсистемы и режимы, реализуемые ей
функции и операции, описаны в работах [3-267]. В данной монографии, в связи с
ограниченностью ее объема, приводится лишь краткая характеристика некоторых из
них.
Не смотря на то, что данный раздел посвящен интерфейсу
системы "Эйдос", видеограммы и экранные формы в нем не приводятся в
связи с ограничениями на объем монографии, кроме того, они есть в работах
[1-267]. В наименованиях разделов с описаниями подсистем и режимов системы
"Эйдос" указаны коды реализуемых ими базовых когнитивных операций
системного анализа (БКОСА) в соответствии с обобщенной схемой СК-анализа [7].
Подсистема "Словари" обеспечивает
формализацию предметной области. Она реализует следующие режимы: классификационные
шкалы и градации; описательные шкалы и градации; градации описательных шкал;
иерархические уровни организации систем; автоматический ввод первичных
признаков из текстовых файлов; ряд программных интерфейсов импорта данных из из
внешних баз данных различных стандартов; почтовая служба по нормативно-справочной
информации; печать анкеты.
Классификационные шкалы и градации предназначены для
ввода справочника будущих состояний активного объекта управления – классов.
Режим: "Классификационные шкалы и градации" обеспечивает ведение базы
данных классификационных шкал и градаций классов: ввод; корректировку;
удаление; распечатку (в текстовый файл); сортировку; поиск по базе данных.
Описательные шкалы и градации предназначены для ввода
справочников факторов, влияющих на поведение активного объекта управления –
признаков. В этом режиме обеспечивается ввод, удаление, корректировка,
копирование наименований описательных шкал и связанных с ними градаций.
Характерной особенностью системы "Эйдос" является возможность
использования неальтернативных градаций, которых может быть различное
количество по различным шкалам (в широких пределах). Справочник позволяет
работать непосредственно с градациями (с учетом связей со шкалами), видеть их
общее количество, а также просматривать и распечатывать процентное
распределение ответов респондентов по классам.
Уровни организации систем (уровни Вольфа Мерлина) являются
независимым способом классификации классов и факторов, что позволяет легко
создавать и анализировать различные их подмножества как сами по себе, так и в
сопоставлении друг с другом. В.С.Мерлин предложил интегральную концепцию индивидуальности,
в которой рассматривал взаимодействие и взаимообусловленность различных уровней
свойств личности: от генетически предопределенных, до
социально-обусловленных и отражающих сиюминутное состояние. В системе
"Эйдос" предусмотрен аппарат, позволяющий классифицировать факторы таким
образом, что становится возможным исследовать различные уровни их организации и
взаимообусловленности. Уровни организации классов предназначены
для классификации будущих состояний активного объекта управления, как целевых,
так и нежелательных с точки зрения самого объекта управления и управляющей системы,
а также различных вариантов сочетаний этих
вариантов. Возможны и другие виды классификации.
Система "Эйдос" обеспечивает решение задач
атрибуции анонимных и псевдонимных текстов (установления вероятного авторства),
датировки текстов, определения их принадлежности к определенным традициям,
школам или течениям мысли. При этом различные структуры, из которых состоят
тексты, рассматриваются как их атрибуты. В системе "Эйдос" реализован
специальный режим, обеспечивающий автоматическое выявление и ввод этих
атрибутов текстов непосредственно из текстовых файлов.
Технология работы в системе "Эйдос" текущей
версии не предусматривает одновременной работы многих пользователей с одними и
теми же базами данных в режиме корректировки записей. Поэтому возможна
эффективная организация распределенной работы по многомашинной технологии без
использования ЛВС. Для обеспечения необходимой тождественности справочников на
различных компьютерах служит режим "Почтовая служба по НСИ".
Классификационные шкалы и градации в экономических, социально-психологических
и политологических исследованиях часто представляют собой опросники (анкеты).
Для их распечатки в файл (в поддиректорию "TXT") служит режим:
"Печать анкеты". В системе "Эйдос" все текстовые и
графические входные и выходные формы автоматически сохраняются в виде файлов,
удобных для использования в различных приложениях под Windows.
Данная
подсистема обеспечивает ввод и корректировку обучающей выборки, управление ею,
синтез и адаптацию модели на основе данных обучающей выборки, экспорт и импорт
данных с других компьютеров.
Для
ввода-корректировки обучающей выборки служит соответствую-
щий режим, имеющий двухоконный
интерфейс, позволяющий ввести в обучающую выборку двухвекторные описания объектов.
Левое окно служит для ввода классификационной характеристики объекта. В этом
окне каждому объекту соответствует одна строка с прокруткой. В
правом окне вводится описательная характеристика объекта на языке признаков.
Каждому объекту соответствует окно с прокруткой. Переход между окнами осуществляется
по нажатию клавиши "TAB". Количество объектов в обучающей выборке не
ограничено. Имеется практический опыт проведения расчетов с объемами обучающей
выборки до 70000 объектов, суммарным количеством градаций описательных шкал до
4000 и количеством классов до 3900. Реализована также возможность
автоматического формирования объектов обучающей выборки путем кодирования текстовых
файлов.
В системе
реализован ряд программных интерфейсов, обеспечивающих автоматическое
формирование классификационных и описательных шкал и градаций, а также
обучающей выборки:
– импорт
данных из файлов стандарта "Текст DOS";
– импорт
данных из DBF-файлов, стандарта проф. А.Н.Лебедева;
– импорт
данных из транспонированных DBF-файлов, стандарта профессора А.Н.Лебедева;
– генерация
случайной модели;
– генерация
учебной модели для исследования свойств натуральных чисел.
Данный режим
предназначен для управления обучающей выборкой путем параметрического задания
подмножеств анкет для обработки, объединения классов, автоматического ремонта
обучающей выборки ("ремонт или взвешивание данных"). Параметрическое
выделение подмножества анкет для обработки может осуществляться логически и
физически (рекомендуется 2-й вариант), это осуществляется путем сравнения с
анкетой-маской. В ней задаются коды тех классов и признаков, которые обязательно должны присутствовать во всех анкетах
обрабатываемого подмножества. Режим: "Статистическая характеристика обучающей
выборки. Ручной ремонт" предназначен для выявления слабо представленных
классов (по которым недостаточно данных) и объединения нескольких классов в
один. При этом производится переформирование справочника классов и автоматическое
перекодирование анкет обучающей выборки. В
режиме "Автоматический ремонт обучающей выборки (ремонт или взвешивание данных)"
реализуется БКОСА-2.2:
задается частотное распределение объектов по категориям, характерное для
генеральной совокупности (или другое), затем автоматически осуществляется формирование последовательных подмножеств
анкет обучающей выборки (с увеличивающимся числом анкет), на каждом этапе максимально соответствующих заданному
частотному распределению генеральной совокупности. При этом используется
метод последовательных приближений по минимаксному критерию: максимизация корреляции
и минимизация максимального отклонения. Система рекомендует оптимальное (по
этим двум критериям) подмножество и позволяет исключить остальные анкеты из
рассмотрения. При достижении минимакса можно говорить об обеспечении
структурной репрезентативности [7].
Данный режим
обеспечивает: расчет матрицы абсолютных частот, поиск и исключение из дальнейшего
анализа артефактов, расчет матрицы информативностей, расчет матрицы условных
процентных распределений, пакетный режим автоматического выполнения
вышеперечисленных 4-х режимов, а также исследовательский режим, обеспечивающий
измерение скорости сходимости и семантической устойчивости сформированной
содержательной информационной модели.
В данном режиме осуществляется последовательное считывание
всех анкет обучающей выборки и использование описаний объектов для формирования
статистики встреч признаков в разрезе по классам. На экране в наглядной форме
отображается стадия этого процесса, который может занимать значительное время
при больших размерностях задачи и объеме обучающей выборки. Кроме того, на
качественном уровне красным отображается заполнение матрицы абсолютных частот
данными: классы соответствуют столбцам, а признаки – строкам. Поэтому
значительная фрагментарность данных легко обнаруживается еще на этой стадии.
Данный режим обеспечивает полную "развязку по данным" и независимость времени исполнения процессов
синтеза модели и ее анализа от объема обучающей выборки. Кроме того, в
данном режиме выявляются 4 типа формально-обнаружимых ошибок в исходных данных
и по ним формируется файл отчета.
В данном режиме на основе исследования частотного распределения
частот встреч признаков в матрице абсолютных частот, делаются выводы:
– об отсутствии статистики и невозможности обнаружения
и исключения артефактов;
– о наличии статистики и возможности выявления артефактов
(если частоты встреч признаков растут пропорционально объему обучающей выборки,
то это нормально, артефактами считаются признаки, по которым эта закономерность
нарушается).
На основе этих выводов рекомендуется частота, которая
признается
незначимой и
характерной для артефактов и осуществляется переформирование баз данных с
исключенными артефактами.
В этом режиме непосредственно на основе матрицы абсолютных
частот с применением системного обобщения формулы Харкевича, предложенного
автором в рамках СТИ, рассчитывается матрица информативностей, определяются
значимость признаков, степень сформированности обобщенных образов классов, а также обобщенный
критерий сформированности модели Харкевича для всей матрицы информативностей в
целом. На экране монитора наглядно отображается стадия выполнения процесса и
структура заполнения матрицы информативностей значимыми данными (на
качественном уровне). На основе матрицы абсолютных частот рассчитывается и
матрица условных процентных распределений.
Автоматическое
выполнение режимов 1-2-3-4. В данном
пакетном режиме последовательно выполняются ранее перечисленные режимы обучения
системы (кроме режима исключения артефактов).
Для измерения сходимости и устойчивости модели
СК-анализа задаются параметры, определяющие исследование скорости сходимости:
– порядок выборки анкет (физический, случайный, в
порядке возрастания соответствия генеральной совокупности, в порядке убывания
степени многообразия, вносимого анкетой в модель);
– количество и коды признаков, по которым исследуется
сходимость модели;
– интервал сглаживания для расчета скользящей погрешности.
В данном режиме организован цикл по объектам обучающей
выборки, в котором после учета каждой анкеты в матрице абсолютных частот перерассчитывается
матрица информативностей и в отдельной базе данных запоминаются информативности
для заданных признаков. Это позволяет измерять и графически отображать скорость
сходимости и семантическую устойчивость модели. В
работе [7] на примере прогнозирования фондового рынка, подробно рассматриваются
вопросы сходимости и семантической устойчивости содержательной информационной
модели.
Почтовая служба по обучающей информации обеспечивает экспорт и импорт баз данных обучающей
выборки при решении задач в системе "Эйдос" по многомашинной
технологии.
В данной подсистеме реализовано несколько различных подходов
к повышению адекватности модели: контролируемое существенное снижение
размерности семантических пространств классов и атрибутов при несущественном
уменьшении их объема без уменьшения адекватности модели; разделение классов на типичные
и нетипичные части и друге, некоторые из которых кратко будут рассмотрены ниже.
Формирование ортонормированного базиса классов реализуется
с применением одного из трех итерационных алгоритмов оптимизации, относящиеся к
методу последовательных приближений:
1) исключение из модели заданного количества наименее
сформированных классов;
2) исключение заданного процента количества классов от
оставшихся (адаптивный шаг);
3) исключение классов, вносящих заданный процент
степени сформированности от оставшегося суммарного (адаптивный шаг).
Критерий остановки процесса последовательных приближений
– срабатывание хотя бы одного из заданных ограничений:
а) достигнуто заданное минимальное количество классов
в модели;
б) достигнута заданная полнота описания признака.
Прокрутка окна вправо позволяет просмотреть дополнительные
характеристики, позволяющие оценить степень сформированности образов классов и
ортонормированность пространства классов.
С этой целью реализовано три итерационных алгоритма оптимизации,
относящиеся к методу последовательных приближений:
– путем исключения из модели заданного количества наименее
значимых признаков;
– путем исключения заданного процента количества признаков
от оставшихся (адаптивный шаг);
– путем исключения признаков, вносящих заданный
процент значимости от оставшейся суммарной (адаптивный шаг).
Критерий остановки процесса исключения признаков с низкой
селективной силой – срабатывание одного из заданных ограничений:
а) достигнуто заданное минимальное количество
признаков в модели;
б) достигнуто заданное минимальное количество
признаков на класс (полнота описания класса).
В данном режиме реализована возможность удаления из модели
всех классов и признаков, по которым или вообще нет данных, или их недостаточно
в соответствии с заданным критерием. Этот режим сходен с режимом выявления и
исключения артефактов.
Если объекты, относящиеся к классу, обладают
незначительной вариабельностью по признакам, то обобщенный образ класса
получается четким и хорошо идентифицируемым, если же эта вариабельность высока,
то он получается аморфным, расплывчатым и класс плохо идентифицируемым, в
результате чего во втором случае объекты, в действительности принадлежащие к
данному классу иногда не относятся системой к нему, т.е. рассматриваются как
нетипичные. В данном режиме (_34) реализован эффективный итерационный алгоритм,
в котором на основе этих нетипичных объектов создаются новые классы с тем же
названием, что и исходный и с указанием номера итерации, на которой они
созданы. В результате классы с высокой внутренней вариабельностью входящих в
них объектов разбиваются на подклассы с низкой внутренней вариабельностью и
достоверность модели быстро возрастает.
Данный режим исполняется после синтеза модели. Верификация
модели осуществляется путем копирования обучающей выборки в распознаваемую,
пакетного распознавания и последующего анализа в режиме "Измерение
валидности системы распознавания" подсистемы "Анализ". Он
показывает средневзвешенную погрешность идентификации (интегральная валидность)
и погрешность идентификации в разрезе по классам. При этом объект считается
отнесенным к классу, с которым у него наибольшее сходство. Необходимо отметить,
что остальные классы, находящиеся по уровню сходства на второй и последующих позициях
не учитываются. Это обусловлено тем,
что их учет привел бы к завышению
оценки валидности модели.
Классы, по которым дифференциальная валидность неприемлемо
низка считаются не сформированными. Причинами этого может быть очень высокая
вариабельность объектов, отнесенных к данным классам (тогда имеет смысл
разделить их на несколько), а также недостаток достоверной классификационной и
описательной информации по этим классам (некорректная работа экспертов).
Данная подсистема реализует режимы ввода и
корректировки распознаваемой выборки; пакетного распознавания; вывода результатов
и межмашинного обмена данными. Ввод-корректировка распознаваемых анкет
осуществляется в двухоконном интерфейсе: в левом окне показаны заголовки идентифицируемых
объектов, в которых отображаются их коды и условные наименования, а в правом
окне – описания объектов на языке признаков. В левом окне каждому объекту
соответствует строка, а в правом – окно с прокруткой. Переход между окнами
происходит по нажатию клавиши "TAB". В данном режиме каждая анкета
распознаваемой выборки последовательно идентифицируется с каждым классом. Вывод
результатов распознавания (идентификации и прогнозирования) возможен в двух
разрезах:
а) информация о сходстве каждого объекта со всеми
классами;
б) информация о сходстве каждого класса со всеми
объектами.
Система
генерирует обобщающий отчет по итогам идентификации, в котором в каждой строке
дана информация о классе, с которым распознаваемый объект имеет наивысший
уровень сходства (в процентах). Качество результата идентификации – это
эвристическая оценка качества, учитывающая максимальную величину сходства,
различие между первым и вторым классами по уровню сходства и в (меньшей
степени) общий вид распределения классов по уровням сходства с данным объектом.
Каждой строке обобщающего отчета соответствует карточка результатов идентификации
(прогнозирования), которая по сути дела представляет собой результат разложения
вектора объекта в ряд по векторам классов. Эти карточки распечатываются в файл
с полными наименованиями классов и содержат классы, с уровнем сходства выше
заданного.
Почтовая
служба по распознаваемым анкетам обеспечивает
запись на дискету распознаваемой выборки и считывание распознаваемой выборки с
дискеты с добавлением к имеющейся на текущем компьютере. Этот режим служит для
объединения информации по идентифицируемым объектам, введенной на различных
компьютерах.
Подсистема
"Типология" обеспечивает
типологический анализ классов и признаков.
Типологический
анализ классов включает:
информационные (ранговые) портреты; кластерно-конструктивный и когнитивный
анализ классов.
Информационный
портрет класса представляет собой список признаков в порядке убывания
количества информации о принадлежности к данному классу. Такой список представляет собой результат решения обратной задачи
идентификации (прогнозирования). Фильтрация (F6) позволяет выделить из
информационного портрета класса диапазон признаков (по кодам или уровням
Мерлина) и, таким образом, исследовать влияние заданных признаков на переход
активного объекта управления в состояние, соответствующее данному классу.
Кластерный и конструктивный анализ классов обеспечивает: рас-
чет матрицы сходства классов; генерацию кластеров и
конструктов; просмотр и печать кластеров и конструктов; пакетный режим,
обеспечивающий автоматическое выполнение первых трех режимов при установках
параметров "по умолчанию"; визуализацию результатов
кластерно-конструктивного анализа в форме семантических сетей и когнитивных диаграмм.
В данном режиме
непосредственно на основе оптимизированной матрицы информативностей
рассчитывается матрица сходства классов. На экране в наглядной форме
отображается информация о текущей стадии выполнения этого процесса.
В данном
режиме пользователем задаются параметры для генерации кластеров и конструктов
классов, позволяющие исключить из форм центральную часть конструктов (оставить
только полюса), а также сформировать кластеры и конструкты для заданных (кодами
или уровнями Мерлина) подматриц. В данном режиме обеспечивается отображение
отчета по конструктам и вывод его в виде текстового файла. Реализован режим
быстрого поиска заданного конструкта и быстрый выход на него по заданному классу.
В данном
пакетном режиме автоматически выполняются вышеперечисленные 3 режима с
параметрами "по умолчанию". Выполнение пакетного режима целесообразно
в самом начале проведения типологического анализа для общей оценки его результатов.
Более детальные результаты получаются при выполнении отдельных режимов с
конкретными значениями параметров.
В данном
режиме пользователем в диалоге с системой "Эй-
дос" задаются коды от 3 до 12 классов (ограничение
связано с тем, что больше классов не помещается на мониторе при используемом
разрешении), а затем на основе данных матрицы сходства классов отображается
ориентированный граф, в вершинах которого находятся классы, а ребра соответствуют
знаку (красный – "+", синий – "-") и величине (толщина
линии) сходства/различия между ними. Посередине каждой линии уровень сходства/различия
соответствующих классов отображается в числовой форме (в процентах). Такие
графы в данной работе называются 2d-семантическими сетями классов (2d означает
"двухмерные").
В системе
"Эйдос" реализован двухоконный интерфейс ввода задания
на формирование когнитивных диаграмм и пример такой диаграммы.
Переход между окнами осуществляется по клавише "ТАВ", выбор класса
для когнитивной диаграммы – по нажатию клавиши "Enter". В верхней
левой части верхнего окна отображаются коды выбранных классов. Генерация и
вывод когнитивной диаграммы для заданных классов выполняется по нажатию клавиши
F5. Отображаемые диаграммы всегда записываются в виде графических файлов в
соответствующие поддиректории. Имеются также пакетные режимы генерации
диаграмм: генерацию когнитивных диаграмм для полюсов конструктов (F6), генерация всех
возможных когнитивных диаграмм (F7), а также генерация диаграмм Вольфа
Мерлина (F8). При задании всех этих режимов имеется возможность задания
большого количества параметров, определяющих вид диаграмм и содержание отображаемой
на них информации.
Типологический
анализ атрибутов обеспечивает:
формирование и отображение семантических портретов атрибутов (признаков), а
также кластерно-конструктивный и когнитивный анализ атрибутов.
В данном режиме обеспечивается формирование семантического
портрета заданного признака и его отображение в текстовой и графической формах. Окно для просмотра текстового отчета имеет прокрутку
вправо, что позволяет отобразить количественные характеристики. Графическая
диаграмма выводится по нажатию клавиши F5, и может быть непосредственно
распечатана или записана в виде графического файла в соответствующую
поддиректорию.
Кластерный и
конструктивный анализ атрибутов обеспечивает:
расчет матрицы сходства признаков; генерация кластеров и конструктов признаков:
просмотр и печать результатов кластерно-конструктивного анализа; автоматическое
выполнение перечисленных режимов;
отображение результатов кластерно-конструктивного анализа в форме семантических
сетей и когнитивных диаграмм.
Стадия выполнения расчета матрицы сходства признаков наглядно
отображается на мониторе.
В данном режиме имеется возможность задания ряда параметров,
детально определяющих обрабатываемые данные и форму вывода результатов анализа
и отображаются результаты кластерно-конструктивного анализа. Имеются также
многочисленные возможности манипулирования данными (различные варианты поиска,
сортировки и фильтрации).
Автоматическое выполнение режимов 1-2-3. Автоматически
реализуются три вышеперечисленные режима.
Результаты кластерно-конструктивного анализа признаков
отображаются для заданных признаков в наглядной графической форме семантических
сетей.
Это новый вид когнитивных диаграмм, не встречающийся в
литературе. Частным случаем этих диаграмм являются инвертированные диаграммы
Вольфа Мерлина (терм. авт.). При их генерации имеется возможность задания ряда
параметров, определяющих обрабатываемые данные и форму отображения результатов.
В подсистеме
"Анализ" реализованы
режимы:
– оценки анкет по шкале лживости;
– измерения внутренней интегральной и дифференциальной
валидности модели;
– измерения независимости классов и признаков (стандартный
анализ c2);
– генерации большого количества разнообразных 2d &
3d графических форм на основе данных матриц абсолютных частот, условных процентных
распределений и информативностей (2d & 3d означает: "двухмерные и
трехмерные");
– генерации и графического отображения нелокальных нейронов,
нейронных сетей, классических и интегральных когнитивных карт.
В данном режиме исследуются корреляции между ответами
в каждой анкете, эти корреляции сравниваются с выявленными на основе всей
обучающей выборки и все анкеты ранжируются в порядке уменьшения типичности
обнаруженных в них корреляций. Считается, что если корреляции в анкете
соответствуют "среднестатистическим", которые принимаются за
"норму", то анкета отражает обнаруженные макрозакономерности, если же
нет, то возникает подозрение в том, что она заполнена некорректно.
В режиме
"Измерение независимости объектов и признаков" реализован
стандартный анализ c2, а также
рассчитываются коэффициенты Пирсона, Чупрова и Крамера, популярные в экономических,
социологических и политологических исследованиях. В системе задание на расчет
матриц сопряженности вводится в специальный бланк, который служит также для
отображения обобщающих результатов расчетов. На основе этого задания рассчитываются
и записываются в форме текстовых файлов одномерные и двумерные матрицы
сопряженности для заданных подматриц.
В отличие от матриц сопряженности, выводимых в
известной системе SPSS, здесь они выводятся с текстовыми пояснениями на том языке, на котором сформированы
классификационные и описательные шкалы, с констатацией того, обнаружена ли статистически-значимая
связь на заданном уровне значимости. Необходимо также отметить, что в
системе "Эйдос" не используются табулированные теоретические значения
критерия c2 для различных
степеней свободы, а необходимые теоретические значения непосредственно рассчитываются
системой, причем со значительно
большей точностью, чем они приведены в таблицах (при этом численно
берется обратный интеграл вероятностей).
Режим
"Просмотр профилей классов и признаков". Система
"Эйдос" текущей версии 12.5 позволяет генерировать и выводить более
54 различных видов 2d & 3d графических форм, каждая из которых выводится
в форме, определяемой задаваемыми в диалоге параметрами.
Подсистема "Сервис". Реальная эксплуатация ни одной программной системы
невозможна либо без тщательного сопровождения эксплуатации и без наличия в
системе развитых средств обеспечения надежности эксплуатации. В системе
"Эйдос" для этого служит подсистема "Сервис" в которой:
–
автоматически ведется архивирование баз данных;
– создаются
отсутствующие базы данных и индексные массивы;
–
распечатываются в текстовые файлы служебные формы, являющиеся основой
содержательной информационной модели (базы абсолютных частот, условных
процентных распределений и информативностей).
В подсистему
"Сервис" входит также интеллектуальная дескрипторная
информационно-поисковая система, автоматически генерирующая нечеткие
дескрипторы и имеющая интерфейс нечетких запросов на любом естественном языке,
использующем кириллицу или латиницу (т.е. не только русском). Отчет по результатам
запроса содержит информационные
объекты базы данных системы, ранжированные в порядке уменьшения степени соответствия
запросу.
Система "Эйдос" (текущей версии 12.5)
включает базовую систему (система "Эйдос" в узком смысле слова), три
системы окружения, а также ряд программных интерфейсов с внешними источниками
данных:
– систему анализа и прогнозирования ситуация на
фондовом рынке "Эйдос-фонд", разработанную совместно с Б.Х.Шульман;
– систему комплексного психологического тестирования
"Эйдос-Y", созданную
совместно с С.Д.Некрасовым;
– систему типизации и идентификации социального
статуса респондентов по их астрономическим показателями на момент рождения
"Эйдос-
астра",
разработанную совместно с А.П.Труневым и В.Н.Шашиным.
Системы окружения представляют собой развитие программные
интерфейсы базовой системы "Эйдос" с внешними базами данных психологических
тестов, биржевыми базами данных и базами данных социологической информации
соответственно, а также выполняют ряд самостоятельных функций по предварительной
обработке информации, визуализации результатов анализа и т.д. Кроме того, в
саму базовую систему "Эйдос" включены программные интерфейсы,
обеспечивающие формализацию предметной области и импорт данных из внешних
источников данных различных стандартов (текстовых файлов и баз данных).
От экспертных
систем система "Эйдос" отличается тремя очень важными свойствами.
1. Первое
различие связано с источником знаний и способом их получения. Для ее обучения
системы «Эйдос» от экспертов требуется лишь само их решение о принадлежности
того или иного объекта или его состояния к определенному классу, а не
формулирование правил (продукций) или весовых коэффициентов, позволяющих прийти
к такому решению (система генерирует их сама, т.е. автоматически на основе
эмпирических данных). Дело в том, что часто эксперт не может или по различным
причинам не хочет вербализовать, тем более формализовать свои способы принятия
решений. Система "Эйдос" генерирует обобщенную таблицу решений
непосредственно на основе эмпирических данных (которые могут быть очень большой
размерности, зашумленными и фрагментированными).
2. Второе
различие касается типа логики, используемой при формализации знаний и способа
представлении знаний в базах знаний систем. Продукции в экспертных системах
основаны на логике Аристотеля и имеют два значения истинности: «Истина»,
«Ложь». Такие продукции могут быть выражены в виде предложений логического
следования (импликаций) типа: «Если объект обладает признаком A, то он
принадлежит группе B» и приводят к логическому клинчу (останову машины
логического вывода), если они противоречат друг другу. В системе «Эйдос» продукции
являются нечеткими и имеют расчетную (на основе эмпирических данных степень)
истинности и могут быть в выражены в виде правдоподобных рассуждений типа:
«Если объект обладает признаком A, то в этом факте содержится такое-то
количество информации о его принадлежности или непринадлежности к группе B».
Правдоподобные высказывания не могут полностью противоречить друг другу и на их
основе всегда возможно получить итоговое правдоподобное высказывание вида:
«Если объект обладает признаками {A1, A2, A3, An}, то в этой системе фактов
содержится такое-то количество информации о его принадлежности или непринадлежности
к группе B». В аппарате логического вывода системы «Эйдос» логический клинч
невозможен в принципе.
3. Третье
различие касается размерностей создаваемых моделей. Максимальное количество
классических продукций с двумя вариантами истинности: .T., .F. по литературным
данным (http://itmu.vsuet.ru/osobija/red
tavlenie_znan/htm/2_t.htm) для обычных
экспертных систем составляет не более 1000, а профессиональных – 10000. Система
Эйдос-Х++ позволяет моделировать поведение сложных объектов, включающих сотни
тысяч будущих состояний и сотни тысяч значений факторов и база знаний при этом
может включать более 10 миллиардов нечетких продукций с расчетной на основе
эмпирических данных степенью истинности, что в миллион или даже 10 миллионов (!) раз больше, чем у
экспертных систем. Время создания такой базы на современном персональном
компьютере с процессором I7 на обычном винчестере составляет около 30 минут и
она имеет размер около 240 Гб. Таким образом, ранее существовавшие ограничения
на размерность модели и размеры баз данных полностью преодолены в системе
Эйдос-Х++, в чем и состоит одна из причин ее разработки. В настоящее время
ограничение на размерность баз данных системе Эйдос-Х++ накладываются только
емкостью внешней памяти и вычислительной мощностью компьютера.
От систем
статистической обработки информации система "Эйдос" отличается прежде
всего своими целями, которые состоят в следующем: формирование обобщенных
образов исследуемых классов распознавания и признаков по данным обучающей
выборки (т.е. обучение); исключение из системы признаков тех из них, которые
оказались наименее ценными для решения задач системы; вывод информации по обобщенным образам классов
распознавания и признаков в удобной для восприятия и анализа текстовой и
графической форме (информационные или ранговые портреты); сравнение
распознаваемых формальных описаний объектов с обобщенными образами классов
распознавания (распознавание); сравнение обобщенных образов классов распознавания
и признаков друг с другом (кластерно-конструктивный анализ); расчет частотных
распределений классов распознавания и признаков, а также двумерных матриц
сопряженности на основе критерия c2 и коэффициентов
Пирсона, Чупрова и Крамера; результаты
кластерно-конструктивного и информационного анализа выводятся в форме
семантических сетей и когнитивных диаграмм. Система "Эйдос" в универсальной
форме автоматизирует базовые когнитивные операции системного анализа, т.е.
является инструментарием СК-анализа. Таким образом, система "Эйдос"
выполняет за исследователя-аналитика ту работу, которую при использовании
систем статистической обработки ему приходится выполнять вручную, что чаще
всего просто невозможно при реальных размерностях данных. Поэтому система
"Эйдос" и называется
универсальной когнитивной аналитической системой.
Система "Эйдос" обеспечивает генерацию и
запись в виде файлов более 64 видов 2d & 3d графических форм и 50 видов текстовых
форм.
При применении системы в самых различных предметных
областях обеспечивается достоверность распознавания обучающей выборки: на
уровне 90% (интегральная валидность), которая существенно повышается после Парето-оптимизации системы признаков
(т.е. после исключения признаков с низкой селективной силой), удаления из
модели артефактов, а также классов и признаков, по которым недостаточно данных,
разделения классов на типичные и нетипичные части. Система "Эйдос"
версии 12.5 обеспечивает синтез модели, включающей десятки тысяч классов и
признаков при неограниченном объеме обучающей выборки, причем признаки могут
быть не только качественные (да/нет), но и количественные, т.е. числовые. В
некоторых режимах анализа модели имеются ограничения на ее размерность, которые
на данном этапе преодолеваются путем снижения размерности модели. Реализована
возможность разработки супертестов, в том числе интеграции стандартных тестов в
свою среду, (при этом не играет роли известны ли методики интерпретации, т.е.
"ключи" этих тестов). В системе имеется научная графика,
обеспечивающая высокую степень наглядности, а также естественный словесный
интерфейс при обучении Системы и запросах на распознавание.
Исходные тексты системы "Эйдос" и систем
окружения "Эйдос-Y",
"Эйдос-фонд" и «Эйдос-астра» в формате "Текст-DOS" имеют
объем около 2.5 Мб; их распечатка 6-м шрифтом составляет около 800 страниц.
Универсальная
когнитивная аналитическая система "Эйдос"
представляет собой программную систему, и для ее
эксплуатации, как и для эксплуатации любой программной системы, необходима
определенная инфраструктура. Без инфраструктуры эксплуатации любая программная
система остается лишь файлом, записанным на винчестере. В зависимости от
масштабности решаемых задач управления и специфики предметной области данная
структура может быть как довольно малочисленной, так и более развитой. Однако в
любом случае ее основные функциональные и структурные характеристики остаются
примерно одними и теми же. Кратко рассмотрим эту инфраструктуру на примере
гипотетической организации, производящей определенные виды продукции.
Основная цель: обеспечивать информационную и аналитическую поддержку
деятельности организации, направленную на производство запланированного объема
продукции заданного качества, достижение высо-
кой эффективности управления и устойчивого
поступательного развития.
Данная основная
цель предполагает выполнение информационных и аналитических работ с различными
объектами деятельности, находящимися на различных структурных уровнях как самой
организации, так и ее окружения: персональный уровень; уровень коллективов
(подразделений); уровень организации в целом; окружающая среда
(непосредственное, региональное, международное окружение). Для достижения
основной цели для каждого класса объектов должны регулярно выполняться
следующие работы: оценка (идентификация) текущего состояния с накоплением
данных (мониторинг); прогнозирование развития (оперативное, тактическое и
стратегическое); выработка рекомендаций по управлению. Необходимо особо подчеркнуть, что основная цель может быть достигнута
только при условии соблюдения вполне определенной наукоемкой технологии, основы
которой изложены в данном исследовании.
Задачи, решаемые для достижения цели работы:
1.
Мониторинг: оценка и
идентификация текущего (фактического, актуального) состояния объекта
управления; накопление данных идентификации в базах данных в течение длительного
времени.
2. Анализ: выявление причинно-следственных зависимостей путем
анализа данных мониторинга.
3.
Прогнозирование: оперативное,
тактическое и стратегическое прогнозирование развития объекта управления и
окружающей среды путем использования закономерностей, выявленных на этапе
анализа данных мониторинга.
4.
Управление: анализ взаимодействия объекта управления с окружающей средой и
выработка рекомендаций по управлению.
Таким образом,
по мнению автора, управление является высшей, существующей на данный момент формой обработки
информации.
Для достижения
основной цели и решения задач управления необходимо выполнять работы по
следующим направлениям: регулярное получение исходной информации о состоянии
объекта управления; обработка исходной информации на компьютерах; анализ
обработанной информации, прогнозирование развития объекта управления, выработка
рекомендаций по оказанию управляющих воздействий на объект управления;
разработка и применение (или предоставление рекомендаций заказчикам) различных
методов оказания управляющих воздействий на объект управления.
Для этого
необходима определенная организационная структура: научно-методический отдел включает:
научно-методичес-кий сектор; сектор разработки программного обеспечения; сектор
внедрения и сопровождения программного обеспечения; сектор организационного и
юридического обеспечения; отдел мониторинга:
сектор исследования объекта управления; сектор по работе с независимыми
экспертами; сектор по взаимодействию с поставляющими информацию организациями;
сектор по анализу информации общего пользования; отдел обработки информации:
сектор ввода исходной информации (операторы); сектор сетевых технологий и
Internet; сектор внедрения, эксплуатации и сопровождения программных систем;
сектор технического обслуживания компьютерной техники; сектор ведения архивов
баз данных по проведенным исследованиям; аналитический отдел имеет структуру,
обеспечивающую компетентный профессиональный анализ результатов обработки
данных мониторинга по объектам, которые приняты для контроля и управления.
Для выполнения
работ по этим направлениям необходимо определенное обеспечение деятельности:
техническое, программное, информационное, организационное, юридическое и
кадровое. Детально подобная структура и виды обеспечения ее деятельности описаны
в работе [4].
Применение АСК-анализа обеспечивает выявление информационных
зависимостей между факторами различной природы и будущими состояниями объекта
управления, т.е. позволяет осуществить синтез содержательной информационной
модели, а фактически – осуществить синтез АСУ. Применение АСК-анализа в составе
АСУ обеспечивает ее эксплуатацию в режиме непрерывной адаптации модели (на
детерминистских этапах), а когда это необходимо (т.е. после прохождения точек
бифуркации) – и ее нового синтеза.
Ниже приведена технология системы "Эйдос"
как инструментария АСК-анализа:
Шаг 1–й: формализация
предметной области (БКОСА-1): разработка описательных и классификационных шкал
и градаций, необходимых для формализованного описания предметной области.
Описательные шкалы описывают факторы различной природы, влияющие на поведение
активных объектов управления (АОУ), а классификационные – все его будущие состояния,
в том числе целевые.
Шаг 2–й: формирование
обучающей выборки (БКОСА-2): информация о состоянии среды и объекта управления,
а также вариантах управляющих воздействий поступает на вход системы. Работа по
преобразованию этой информации в формализованный вид (т.е. кодирование) осуществляется
специалистами, обслуживающими систему с использованием описательных и классификационных
шкал. Вся эта информация представляется в виде специальных кодированных
бланков, используемых также для ввода информации в компьютер. В результате ее
формируется так называемая "обучающая выборка".
Шаг 3–й: обучение
(БКОСА-3): обучающая
выборка обрабатывается обучающим алгоритмом, на основе чего им формируются
решающие правила (обобщенные образы состояний АОУ, отражающие весь спектр будущих
возможных состояний объекта управления) и определяется цен
ность факторов для решения задач подсистем идентификации,
мониторинга, прогнозирования и выработки управляющих воздействий.
Шаг 4–й: оптимизация
(БКОСА-4): факторы, не имеющие особой прогностической ценности, корректным
способом удаляются
из системы. Данный процесс осуществляется с помощью итерационных алгоритмов,
при этом обеспечивается выполнение ряда ограничений, таких как результирующая
размерность пространства факторов, его информационная избыточность и т.п.
Шаг 5–й: верификация
модели (БКОСА-5): выполняется после каждой адаптации или пересинтеза модели. На
этом шаге обучающая выборка копируется в распознаваемую и осуществляется ее
автоматическая классификация (в режиме распознавания). Затем рассчитываются так
называемые внутренняя дифференциальная и интегральная валидности,
характеризующие качество решающих правил.
Шаг-6: принятие
решения об эксплуатации модели или ее пересинтезе. Если результаты верификации
модели удовлетворяют разработчиков рефлексивной АСУ активными объектами (РАСУ
АО), то она переводится из пилотного (экспериментального) режима, при котором
управляющие решения генерировались, но не исполнялись, в режим
экспериментальной эксплуатации, а затем и опытно–производственной эксплуатации,
когда они реально начинают использоваться для управления. Иначе, т.е. если же
модель признана недостаточно адекватной, то необходимо осуществить ее пересинтез,
начиная с шага 1. При этом используются следующие приемы: расширение набора
факторов, т.к. значимые факторы могли не войти в модель; увеличение объема
обучающей выборки, т.к. существенные примеры могли не войти в обучающую
выборку; исключение артефактов, т.к. в модель могли вкрасться существенно
искажающие ее не подтверждающиеся данные; пересмотр экспертных оценок и, если
необходимость этого возникает систематически, то и переформирование экспертного
совета, т.к. причиной этого могла быть некомпетентность экспертов; объединение
некоторых классы, т.к. по ним недостаточно данных; разделение некоторых классов,
т.к. по ним слишком высокая вариабельность объектов по признакам, и т.д.
Шаг 7-й:
идентификация и прогнозирование состояния АОУ (БКОСА-7).
Шаг 8-й: оценка
качества идентификации состояния АОУ. Если качество идентификации высокое, то
состояние АОУ рассматривается как типовое, а значит, причинно-следственные
взаимосвязи между факторами и будущими состояниями данного объекта управления
считаются адекватно отраженными в модели и известными (т.е. если качество
идентификации высокое, то считается, что объект относится к генеральной
совокупности, по отношению к которой обучающая выборка репрезентативна). Поэтому
в этом случае осуществляется переход на Шаг-9 (выработка управляющего
воздействия и последующий анализ). Иначе – считается, что на вход системы
идентификации попал объект, не относящийся к генеральной совокупности,
адекватно представленной обучающей выборкой. Поэтому в этом случае информация о
нем поступает на Шаг-13, начиная с которого запускается процедура пересинтеза
модели, что приводит к расширению генеральной совокупности, представленной
обучающей выборкой.
Шаг 9-й: выработка
решения об управляющем воздействии (БКОСА-9) путем решения обратной задачи
прогнозирования [7].
Шаг 10–й
типологический анализ классов и факторов (БКОСА-10): кластерно-конструктивный и
когнитивный анализ, семантические сети, когнитивные диаграммы состояний АОУ и
факторов [7].
Шаг 11-й:
многофакторное планирование и принятие решения о применении системы управляющих
факторов (БКОСА-11).
Шаг 12-й: оценка
адекватности принятого решения об управляющих воздействиях: если АОУ перешел в
заданное целевое состояние, то осуществляется переход на вход адаптации содержательной
информационной модели (Шаг-2): в подсистеме идентификации предусмотрен режим
дополнения распознаваемой выборки к обучающей, чтобы в последующем, когда
станут известны результаты управления, этой верифицированной (т.е. достоверной)
оценочной информацией дополнить обучающую выборку и переформировать решающие
правила (обучающая обратная связь). Иначе, т.е. если АОУ не перешел в заданное
целевое состояние, переход на вход пересинтеза модели (Шаг-1), при этом могут
быть изменены и описательные, и классификационные (оценочные) шкалы, что
позволяет качественно расширить сферу адекватного функционирования РАСУ АО.
Шаг 13–й
(неформализованный поиск нетипового решения об управляющем воздействии и
подготовка данных для пересинтеза модели, как в случае, если решения оказалось
удачным, так и в противном случае).
Таким образом, предложена
технология применения системы "Эйдос" как инструментария применения
АСК-анализа, основанного на системной теории информации, ориентированной на синтез
рефлексивных АСУ АО. В процессе эксплуатации системы "Эйдос" успешно
решаются все задачи АСК-анализа: формирование
обобщенных образов состояний АОУ на основе обучающей выборки (обучение);
идентификация состояний АОУ на основе его параметров (распознавание);
определение влияния входных параметров на перевод АОУ в различные будущие
состояния (обратная задача прогнозирования); прогнозирование поведения АОУ в
условиях полного отсутствия управляющих воздействий; прогнозирование поведения
АОУ при различных вариантах многофакторных управляющих воздействий.
Кроме того, выявленные в результате работы
рефлексивной АСУ при-
чинно-следственные
зависимости между факторами различной природы и будущими состояниями объекта
управления позволяют, при условии неизменности этих закономерностей в течение
достаточно длительного времени, построить АСУ с постоянной моделью
классического типа.