ГЛАВА 1. ИСТОРИЯ:
БАЗОВАЯ СИСТЕМА «ЭЙДОС»
И СИСТЕМЫ ОКРУЖЕНИЯ

 

1.1. Базовая система «Эйдос»

 

1.1.1. Кратко о системе «Эйдос»

 

Универсальная когнитивная аналитическая система «Эйдос», по-видимому, является одной из первых реально работающих отечественных универсальных систем искусственного интеллекта, широко применяемых и развивающихся и в настоящее время [108].

Математическая модель Универсальной когнитивной аналитической системы "Эйдос", а также методика численных расчетов (алгоритмы и структуры данных) и функциональная структура системы разработаны автором в 1979 году, когда он работал старшим инженером на вычислительном центре Краснодарского медицинского института[1] и занимался разработкой математических моделей и алгоритмов медицинских диагностических систем. Впервые математическая модель системы «Эйдос» прошла экспериментальную апробацию в ходе численного эксперимента в 1981 году. С 1981 по 1992 система "Эйдос" неоднократно реализовалась автором в предметно-зависимых приложениях на платформе Wang (на компьютерах Wang-2200C) в среде персональной технологической системы «Вега» разработки автора (1983 год), во многом функционально аналогичной MS Excel (включая деловую графику), но опережавшей его лет на 10. Акты внедрения ранних версий системы «Эйдос» (с 1987 года) приведены в приложении 2.

Для IBM-совместимых персональных компьютеров система "Эйдос" была реализована в универсальной постановке (не зависящей от предметной области) в 1992 году и с тех она пор совершенствуется постоянно, вплоть до настоящего времени. В 1993 году впервые была опубликована математическая модель системы «Эйдос». В 1994 году (т.е. за 2 года до создания системы Windows 95) на систему  "Эйдос" и связанные с ней разработки получены 3 свидетельства РосПатента: №№ 940217, 940328 и 940334, ставшие первыми в Краснодарском крае, а возможно и в России, патентами на системы искусственного интеллекта. Отметим, что именно в 1994 году в Российской Федерации впервые появилась возможность правовой защиты авторских прав на программы для ЭВМ. Позже были получены еще ряд свидетельств РосПатента[2].

Система «Эйдос» применялась для решения задач прогнозирования, поддержки принятия решений и научных исследований во многих предметных областях. Обзор применений системы «Эйдос» до 2002 года приведен в 7-й главе работы [7][3], где приведена и ссылка на акты внедрения. О применениях системы «Эйдос» с 2002 года по настоящее время можно судить по работам [3-190], публикациям в Научном журнале КубГАУ: http://ej.kubagro.ru/a/viewaut.asp?id=11 и материалам сайта автора: http://lc.kubagro.ru. Система "Эйдос" является высокоэффективным инструментом научных исследований в самых различных предметных областях, в которых требуется обобщение (многопараметрическая типизация), системная (многопараметрическая) идентификация, прогнозирование и принятие решений, сравнение, классификация, и была успешно применена в экономике, технических науках, педагогике, социологии, психологии, психофизиологии, биологии, медицине, агрономии, сельскохозяйственных науках (растениеводстве и плодоводстве), рекламных и маркетинговых исследованиях, геофизике, климатологии, мелиорации и других науках. Она была применена также при выполнении ряда кандидатских и докторских диссертационных работ по экономическим, техническим и психологическим наукам[4]:

- 3 докторов экономических наук;

- 2 доктора технических наук;

- 4 кандидата психологических наук;

- 1 кандидата технических наук;

- 1 кандидата медицинских наук.

С 1999 по 2002 год система «Эйдос» применялась в учебном процессе в Кубанском государственном технологическом университете (КубГТУ) при преподавании дисциплин: "Новые информационные технологии в учебном процессе", "Комплексные технологии в науке и образовании". С 2002 года и по настоящее время система «Эйдос» применяется в Кубанском государственном аграрном университете (КубГАУ) и Адыгейском государственном университете (АГУ) при преподавании дисциплины «Интеллектуальные информационные системы», а в КубГАУ также и при преподавании дисциплин: "Основы теории управления" и «Компьютерные технологии в строительной науке и образовании» (магистерский курс).

Разработанный автором автоматизированный системно-когнитивный анализ (АСК-анализ) и его программный инструментарий – Универсальная когнитивная аналитическая система "Эйдос", нашли свое широкое отражение в Internet[5].

 

1.1.2. Назначение и состав системы "Эйдос"

 

1.1.2.1. Цели и основные функции системы "Эйдос"

 

Универсальная когнитивная аналитическая система "Эйдос" (система «Эйдос») является отечественным лицензионным программным продуктом, созданным с использованием официально приобретенного лицензионного программного обеспечения. Система «Эйдос» включает базовую систему, ряд систем окружения и программные интерфейсы импорта данных из внешних баз данных различных стандартов.

По системе "Эйдос" и различным аспектам ее практического применения имеется более сотни публикаций автора с соавторами, в т.ч. 25 монографий и три учебных пособия с грифами УМО и министерства.

Система "Эйдос" является программным инструментарием, реализующим теоретическую концепцию, математическую модель и методику численных расчетов Системно-когнитивного анализа (СК-анализ) [7] и обеспечивает реализацию следующих основных функций:

1. Синтез и адаптация семантической информационной модели предметной области, включая активный объект управления и окружающую среду.

2. Идентификация и прогнозирование состояния активного объекта управления, а также разработка управляющих воздействий для его перевода в заданные целевые состояния.

3. Углубленный анализ семантической информационной модели предметной области.

Синтез содержательной информационной модели предметной области

Синтез модели в СК-анализе осуществляется с применением подсистем: "Словари", "Обучение", "Оптимизация", "Распознавание" и "Анализ". Он включает следующие этапы:

1) формализация (когнитивная структуризация предметной области);

2) формирование исследуемой выборки и управление ею;

3) синтез или адаптация модели;

4) оптимизация модели;

5) измерение адекватности модели (внутренней и внешней, интегральной и дифференциальной валидности), ее скорости сходимости и семантической устойчивости.

Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий

Данный вид работ осуществляется с помощью подсистем "Распознавание" и "Анализ". Эти подсистемы обеспечивают: ввод распознаваемой выборки; пакетное распознавание; вывод результатов распознавания и их оценку, в т.ч. с использованием данных по дифференциальной валидности модели.

Углубленный анализ содержательной информационной модели предметной области

Этот анализ выполняется в подсистеме "Типология", которая включает:

1. Информационный и семантический анализ классов и признаков.

2. Кластерно-конструктивный анализ классов распознавания и признаков, включая визуализацию результатов анализа в оригинальной графической форме когнитивной графики (семантические сети классов и признаков).

3. Когнитивный анализ классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина).

 

1.1.2.2. Обобщенная структура системы "Эйдос"

 

Система "Эйдос-12.5" включает семь подсистем, состоящих из режимов, подрежимов, функций и подфункций (включающих в свою очередь функциональное меню, пункты которого здесь не приводятся):

1. Формализация предметной области (ПО)

1.1. Классификационные шкалы и градации

1.2. Описательные шкалы (и градации)

1.3. Градации описательных шкал (признаки)

1.4. Иерархические уровни систем

1.4.1. Уровни классов

1.4.2. Уровни признаков

1.5. Программные интерфейсы для импорта данных

1.5.1. Импорт данных из TXT-фалов стандарта DOS-текст

1.5.2. Импорт данных из DBF-файлов стандарта проф. А.Н.Лебедева

1.5.3. Импорт из транспонированных DBF-файлов проф. А.Н.Лебедева

1.5.4. Генерация шкал и обучающей выборки RND-модели

1.5.5. Генерация шкал и обучающей выборки для исследования чисел

1.5.6. Транспонирование DBF-матриц исходных данных

1.5.7. Импорт данных из DBF-файлов стандарта Евгения Лебедева

1.5.8. Системно-когнитивный анализ стандартных графических шрифтов[6]

1.6. Почтовая служба по НСИ

1.6.1. Обмен по классам

1.6.2. Обмен по обобщенным признакам

1.6.3. Обмен по первичным признакам

1.7. Печать анкеты

2. Синтез СИМ

2.1. Ввод–корректировка обучающей выборки

2.2. Управление обучающей выборкой

2.2.1. Параметрическое задание объектов для обработки

2.2.2. Статистическая характеристика, ручной ремонт

2.2.3. Автоматический ремонт обучающей выборки

2.3. Синтез семантической информационной модели СИМ

2.3.1. Расчет матрицы абсолютных частот

2.3.2. Исключение артефактов (робастная процедура)

2.3.3. Расчет матрицы информативностей СИМ-1 и сделать ее текущей

2.3.4. Расчет условных процентных распределений СИМ-1 и СИМ-2

2.3.5. Автоматическое выполнение режимов 1–2–3–4

2.3.6. Зависимость достоверности СИМ от объема обучающей выборки, сходимость и устойчивость СИМ, поиск периодов эргодичности и точек бифуркации

2.3.7. Расчет матрицы информативностей СИМ-2 и сделать ее текущей

2.4. Почтовая служба по обучающей информации

2.5. Синтез СИМ и измерение ее адекватности

3. Оптимизация СИМ

3.1. Формирование ортонормированного базиса классов

3.2. Исключение признаков с низкой селективной силой

3.3. Удаление классов и признаков, по которым недостаточно данных

3.4. Разделение классов на типичную и нетипичную части

3.5. Генерация сочетанных признаков и перекодирование обучающей выборки

4. Распознавание

4.1. Ввод–корректировка распознаваемой выборки

4.2. Пакетное распознавание

4.3. Вывод результатов распознавания

4.3.1. Разрез: один объект – много классов

4.3.2. Разрез: один класс – много объектов

4.4. Почтовая служба по распознаваемой выборке

4.5. Построение когнитивных функций влияния

4.6. Докодирование сочетаний признаков в распознаваемой выборке

4.7. Назначения объектов на классы (задача о назначениях)[7]

4.7.1. Задание ограничений на ресурсы по классам

4.7.2. Ввод затрат на объекты

4.7.3. Назначение объектов на классы (LC-алгоритм)

4.7.4. Сравнение эффективности LC и RND алгоритмов

5. Типология

5.1. Типологический анализ классов распознавания

5.1.1. Информационные (ранговые) портреты (классов)

5.1.2. Кластерный и конструктивный анализ классов

5.1.2.1 Расчет матрицы сходства образов классов

5.1.2.2. Генерация кластеров и конструктов классов

5.1.2.3. Просмотр и печать кластеров и конструктов

5.1.2.4. Автоматическое выполнение режимов: 1,2,3

5.1.2.5. Вывод 2d семантических сетей классов

5.1.3. Когнитивные диаграммы классов

5.2. Типологический анализ первичных признаков

5.2.1. Информационные (ранговые) портреты признаков

5.2.2. Кластерный и конструктивный анализ признаков

5.2.2.1. Расчет матрицы сходства образов признаков

5.2.2.2. Генерация кластеров и конструктов признаков

5.2.2.3. Просмотр и печать кластеров и конструктов

5.2.2.4. Автоматическое выполнение режимов: 1,2,3

5.2.2.5. Вывод 2d семантических сетей признаков

5.2.3. Когнитивные диаграммы признаков

6. СК-анализ СИМ

6.1. Оценка достоверности заполнения объектов

6.2. Измерение адекватности семантической информационной модели

6.3. Измерение независимости классов и признаков

6.4. Просмотр профилей классов и признаков

6.5. Графическое отображение нелокальных нейронов

6.6. Отображение Паретто-подмножеств нейронной сети

6.7. Классические и интегральные когнитивные карты

6.8. Восстановление значений функций по признакам аргумента[8]

6.8.1. Восстановление значений и визуализация 1d-функций

6.8.2. Восстановление значений и визуализация 2d-функций

6.8.3. Преобразование 2d-матрицы в 1d-таблицу с признаками точек

6.8.4. Объединение многих БД: Inp_001.dbf и т.д., в Inp_data.dbf

6.8.5. Помощь по подсистеме (требования к исходным данным)

7. Сервис

7.1. Генерация (сброс) БД

7.1.1. Все базы данных

7.1.2. НСИ

7.1.2.1. Всех баз данных НСИ

7.1.2.2. БД классов

7.1.2.3. БД первичных признаков

7.1.2.4. БД обобщенных признаков

7.1.3. Обучающая выборка

7.1.4. Распознаваемая выборка

7.1.5. Базы данных статистики

7.2. Переиндексация всех баз данных

7.3. Печать БД абсолютных частот

7.4. Печать БД условных процентных распределений СИМ-1 и СИМ-2

7.5. Печать БД информативностей СИМ-1 и СИМ-2

7.6. Интеллектуальная дескрипторная информационно–поисковая система

7.7. Копирование основных баз данных СИМ

7.8. Сделать текущей матрицу информативностей СИМ-1

7.9. Сделать текущей матрицу информативностей СИМ-2

Структура и взаимодействие этих подсистем и режимов позволяют полностью реализовать все аспекты СК-анализа в удобной для пользователя форме. Обобщенной структуре соответствуют и структура управления и дерево диалога системы. Подробнее теоретическая концепция системы «Эйдос», ее подсистемы и режимы, реализуемые ей функции и операции, описаны в работах [3-190]. В данной монографии, в связи с ограниченностью ее объема, приводится лишь краткая характеристика некоторых из них.

 

1.1.3. Пользовательский интерфейс, технология разработки и эксплуатации приложений управления знаниями в системе "ЭЙДОС"

Не смотря на то, что данный раздел посвящен интерфейсу системы "Эйдос", видеограммы и экранные формы в нем не приводятся в связи с ограничениями на объем монографии, кроме того, они есть в работах [1-190]. В наименованиях разделов с описаниями подсистем и режимов системы "Эйдос" указаны коды реализуемых ими базовых когнитивных операций системного анализа (БКОСА) в соответствии с обобщенной схемой СК-анализа [7].

 

1.1.3.1. Начальный этап синтеза модели: когнитивная структуризация и формализация предметной области, подготовка исходных данных (подсистема "Словари") (БКОСА-1, БКОСА-2)

 

Подсистема "Словари" обеспечивает формализацию предметной области. Она реализует следующие режимы: классификационные шкалы и градации; описательные шкалы и градации; градации описательных шкал; иерархические уровни организации систем; автоматический ввод первичных признаков из текстовых файлов; ряд программных интерфейсов импорта данных из из внешних баз данных различных стандартов; почтовая служба по нормативно-справочной информации; печать анкеты.

 

Классификационные шкалы и градации (БКОСА-1.1)

Классификационные шкалы и градации предназначены для ввода справочника будущих состояний активного объекта управления – классов. Режим: "Классификационные шкалы и градации" обеспечивает ведение базы данных классификационных шкал и градаций классов: ввод; корректировку; удаление; распечатку (в текстовый файл); сортировку; поиск по базе данных.

 

Описательные шкалы и градации (БКОСА-1.2)

Описательные шкалы и градации предназначены для ввода справочников факторов, влияющих на поведение активного объекта управления – признаков. В этом режиме обеспечивается ввод, удаление, корректировка, копирование наименований описательных шкал и связанных с ними градаций. Характерной особенностью системы "Эйдос" является возможность использования неальтернативных градаций, которых может быть различное количество по различным шкалам (в широких пределах). Справочник позволяет работать непосредственно с градациями (с учетом связей со шкалами), видеть их общее количество, а также просматривать и распечатывать процентное распределение ответов респондентов по классам.

Уровни организации систем (уровни Вольфа Мерлина) являются независимым способом классификации классов и факторов, что позволяет легко создавать и анализировать различные их подмножества как сами по себе, так и в сопоставлении друг с другом. В.С.Мерлин предложил интегральную концепцию индивидуальности, в которой рассматривал взаимодействие и взаимообусловленность различных уровней свойств личности: от генетически предопределенных, до социально-обусловленных и отражающих сиюминутное состояние. В системе "Эйдос" предусмотрен аппарат, позволяющий классифицировать факторы таким образом, что становится возможным исследовать различные уровни их организации и взаимообусловленности. Уровни организации классов предназначены для классификации будущих состояний активного объекта управления, как целевых, так и нежелательных с точки зрения самого объекта управления и управляющей системы, а также различных вариантов сочетаний этих вариантов. Возможны и другие виды классификации.

Система "Эйдос" обеспечивает решение задач атрибуции анонимных и псевдонимных текстов (установления вероятного авторства), датировки текстов, определения их принадлежности к определенным традициям, школам или течениям мысли. При этом различные структуры, из которых состоят тексты, рассматриваются как их атрибуты. В системе "Эйдос" реализован специальный режим, обеспечивающий автоматическое выявление и ввод этих атрибутов текстов непосредственно из текстовых файлов.

Технология работы в системе "Эйдос" текущей версии не предусматривает одновременной работы многих пользователей с одними и теми же базами данных в режиме корректировки записей. Поэтому возможна эффективная организация распределенной работы по многомашинной технологии без использования ЛВС. Для обеспечения необходимой тождественности справочников на различных компьютерах служит режим "Почтовая служба по НСИ".

Классификационные шкалы и градации в экономических, социально-психологических и политологических исследованиях часто представляют собой опросники (анкеты). Для их распечатки в файл (в поддиректорию "TXT") служит режим: "Печать анкеты". В системе "Эйдос" все текстовые и графические входные и выходные формы автоматически сохраняются в виде файлов, удобных для использования в различных приложениях под Windows.

Ввод-корректировка обучающей информации (БКОСА-2.1)

Данная подсистема обеспечивает ввод и корректировку обучающей выборки, управление ею, синтез и адаптацию модели на основе данных обучающей выборки, экспорт и импорт данных с других компьютеров.

Для ввода-корректировки обучающей выборки служит соответствующий режим, имеющий двухоконный интерфейс, позволяющий ввести в обучающую выборку двухвекторные описания объектов. Левое окно служит для ввода классификационной характеристики объекта. В этом окне каждому объекту соответствует одна строка с прокруткой. В правом окне вводится описательная характеристика объекта на языке признаков. Каждому объекту соответствует окно с прокруткой. Переход между окнами осуществляется по нажатию клавиши "TAB". Количество объектов в обучающей выборке не ограничено. Имеется практический опыт проведения расчетов с объемами обучающей выборки до 70000 объектов, суммарным количеством градаций описательных шкал до 4000 и количеством классов до 3900. Реализована также возможность автоматического формирования объектов обучающей выборки путем кодирования текстовых файлов.

В системе реализован ряд программных интерфейсов, обеспечивающих автоматическое формирование классификационных и описательных шкал и градаций, а также обучающей выборки:

– импорт данных из файлов стандарта "Текст DOS";

– импорт данных из DBF-файлов, стандарта проф. А.Н.Лебедева;

– импорт данных из транспонированных DBF-файлов, стандарта профессора А.Н.Лебедева;

– генерация случайной модели;

– генерация учебной модели для исследования свойств натуральных чисел.

 

Управление составом обучающей информации (БКОСА-2.2)

Данный режим предназначен для управления обучающей выборкой путем параметрического задания подмножеств анкет для обработки, объединения классов, автоматического ремонта обучающей выборки ("ремонт или взвешивание данных"). Параметрическое выделение подмножества анкет для обработки может осуществляться логически и физически (рекомендуется 2-й вариант), это осуществляется путем сравнения с анкетой-маской. В ней задаются коды тех классов и признаков, которые обязательно должны присутствовать во всех анкетах обрабатываемого подмножества. Режим: "Статистическая характеристика обучающей выборки. Ручной ремонт" предназначен для выявления слабо представленных классов (по которым недостаточно данных) и объединения нескольких классов в один. При этом производится переформирование справочника классов и автоматическое перекодирование анкет обучающей выборки. В режиме "Автоматический ремонт обучающей выборки (ремонт или взвешивание данных)" реализуется БКОСА-2.2: задается частотное распределение объектов по категориям, характерное для генеральной совокупности (или другое), затем автоматически осуществляется формирование последовательных подмножеств анкет обучающей выборки (с увеличивающимся числом анкет), на каждом этапе максимально соответствующих заданному частотному распределению генеральной совокупности. При этом используется метод последовательных приближений по минимаксному критерию: максимизация корреляции и минимизация максимального отклонения. Система рекомендует оптимальное (по этим двум критериям) подмножество и позволяет исключить остальные анкеты из рассмотрения. При достижении минимакса можно говорить об обеспечении структурной репрезентативности [7].

 

1.1.3.2. Синтез модели: пакетное обучение системы распознавания (подсистема "Обучение") (БКОСА-3)

 

Данный режим обеспечивает: расчет матрицы абсолютных частот, поиск и исключение из дальнейшего анализа артефактов, расчет матрицы информативностей, расчет матрицы условных процентных распределений, пакетный режим автоматического выполнения вышеперечисленных 4-х режимов, а также исследовательский режим, обеспечивающий измерение скорости сходимости и семантической устойчивости сформированной содержательной информационной модели.

 

Расчет матрицы абсолютных частот (БКОСА-3.1.1)

В данном режиме осуществляется последовательное считывание всех анкет обучающей выборки и использование описаний объектов для формирования статистики встреч признаков в разрезе по классам. На экране в наглядной форме отображается стадия этого процесса, который может занимать значительное время при больших размерностях задачи и объеме обучающей выборки. Кроме того, на качественном уровне красным отображается заполнение матрицы абсолютных частот данными: классы соответствуют столбцам, а признаки – строкам. Поэтому значительная фрагментарность данных легко обнаруживается еще на этой стадии. Данный режим обеспечивает полную "развязку по данным" и независимость времени исполнения процессов синтеза модели и ее анализа от объема обучающей выборки. Кроме того, в данном режиме выявляются 4 типа формально-обнаружимых ошибок в исходных данных и по ним формируется файл отчета.

Исключение артефактов (робастная процедура) (БКОСА-3.1.2)

В данном режиме на основе исследования частотного распределения частот встреч признаков в матрице абсолютных частот, делаются выводы:

– об отсутствии статистики и невозможности обнаружения и исключения артефактов;

– о наличии статистики и возможности выявления артефактов (если частоты встреч признаков растут пропорционально объему обучающей выборки, то это нормально, артефактами считаются признаки, по которым эта закономерность нарушается).

На основе этих выводов рекомендуется частота, которая признается незначимой и характерной для артефактов и осуществляется переформирование баз данных с исключенными артефактами.

 

Расчет матриц информативностей (БКОСА-3.1.3, 3.2, 3.3)

В этом режиме непосредственно на основе матрицы абсолютных частот с применением системного обобщения формулы Харкевича, предложенного автором в рамках СТИ, рассчитывается матрица информативностей, определяются значимость признаков, степень сформированности обобщенных образов классов, а также обобщенный критерий сформированности модели Харкевича для всей матрицы информативностей в целом. На экране монитора наглядно отображается стадия выполнения процесса и структура заполнения матрицы информативностей значимыми данными (на качественном уровне). На основе матрицы абсолютных частот рассчитывается и матрица условных процентных распределений.

 

Автоматическое выполнение режимов 1-2-3-4. В данном пакетном режиме последовательно выполняются ранее перечисленные режимы обучения системы (кроме режима исключения артефактов).

 

Измерение сходимости и устойчивости модели

Для измерения сходимости и устойчивости модели СК-анализа задаются параметры, определяющие исследование скорости сходимости:

– порядок выборки анкет (физический, случайный, в порядке возрастания соответствия генеральной совокупности, в порядке убывания степени многообразия, вносимого анкетой в модель);

– количество и коды признаков, по которым исследуется сходимость модели;

– интервал сглаживания для расчета скользящей погрешности.

В данном режиме организован цикл по объектам обучающей выборки, в котором после учета каждой анкеты в матрице абсолютных частот перерассчитывается матрица информативностей и в отдельной базе данных запоминаются информативности для заданных признаков. Это позволяет измерять и графически отображать скорость сходимости и семантическую устойчивость модели. В работе [7] на примере прогнозирования фондового рынка, подробно рассматриваются вопросы сходимости и семантической устойчивости содержательной информационной модели.

Почтовая служба по обучающей информации обеспечивает экспорт и импорт баз данных обучающей выборки при решении задач в системе "Эйдос" по многомашинной технологии.

 

1.1.3.3. Оптимизация модели (подсистема "Оптимизация") (БКОСА-4)

 

В данной подсистеме реализовано несколько различных подходов к повышению адекватности модели: контролируемое существенное снижение размерности семантических пространств классов и атрибутов при несущественном уменьшении их объема без уменьшения адекватности модели; разделение классов на типичные и нетипичные части и друге, некоторые из которых кратко будут рассмотрены ниже.

 

Формирование ортонормированного базиса классов (БКОСА-4.2)

Формирование ортонормированного базиса классов реализуется с применением одного из трех итерационных алгоритмов оптимизации, относящиеся к методу последовательных приближений:

1) исключение из модели заданного количества наименее сформированных классов;

2) исключение заданного процента количества классов от оставшихся (адаптивный шаг);

3) исключение классов, вносящих заданный процент степени сформированности от оставшегося суммарного (адаптивный шаг).

Критерий остановки процесса последовательных приближений – срабатывание хотя бы одного из заданных ограничений:

а) достигнуто заданное минимальное количество классов в модели;

б) достигнута заданная полнота описания признака.

Прокрутка окна вправо позволяет просмотреть дополнительные характеристики, позволяющие оценить степень сформированности образов классов и ортонормированность пространства классов.

 

Исключение признаков с низкой селективной силой (БКОСА-4.1)

С этой целью реализовано три итерационных алгоритма оптимизации, относящиеся к методу последовательных приближений:

– путем исключения из модели заданного количества наименее значимых признаков;

– путем исключения заданного процента количества признаков от оставшихся (адаптивный шаг);

– путем исключения признаков, вносящих заданный процент значимости от оставшейся суммарной (адаптивный шаг).

Критерий остановки процесса исключения признаков с низкой селективной силой – срабатывание одного из заданных ограничений:

а) достигнуто заданное минимальное количество признаков в модели;

б) достигнуто заданное минимальное количество признаков на класс (полнота описания класса).

 

Удаление классов и признаков, по которым недостаточно данных

В данном режиме реализована возможность удаления из модели всех классов и признаков, по которым или вообще нет данных, или их недостаточно в соответствии с заданным критерием. Этот режим сходен с режимом выявления и исключения артефактов.

 

Разделение классов на типичную и нетипичные части

Если объекты, относящиеся к классу, обладают незначительной вариабельностью по признакам, то обобщенный образ класса получается четким и хорошо идентифицируемым, если же эта вариабельность высока, то он получается аморфным, расплывчатым и класс плохо идентифицируемым, в результате чего во втором случае объекты, в действительности принадлежащие к данному классу иногда не относятся системой к нему, т.е. рассматриваются как нетипичные. В данном режиме (_34) реализован эффективный итерационный алгоритм, в котором на основе этих нетипичных объектов создаются новые классы с тем же названием, что и исходный и с указанием номера итерации, на которой они созданы. В результате классы с высокой внутренней вариабельностью входящих в них объектов разбиваются на подклассы с низкой внутренней вариабельностью и достоверность модели быстро возрастает.

 

1.1.3.4. Верификация модели (оценка ее адекватности) (БКОСА-5)

 

Данный режим исполняется после синтеза модели. Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую, пакетного распознавания и последующего анализа в режиме "Измерение валидности системы распознавания" подсистемы "Анализ". Он показывает средневзвешенную погрешность идентификации (интегральная валидность) и погрешность идентификации в разрезе по классам. При этом объект считается отнесенным к классу, с которым у него наибольшее сходство. Необходимо отметить, что остальные классы, находящиеся по уровню сходства на второй и последующих позициях не учитываются. Это обусловлено тем, что их учет привел бы к завышению оценки валидности модели.

Классы, по которым дифференциальная валидность неприемлемо низка считаются не сформированными. Причинами этого может быть очень высокая вариабельность объектов, отнесенных к данным классам (тогда имеет смысл разделить их на несколько), а также недостаток достоверной классификационной и описательной информации по этим классам (некорректная работа экспертов).

 

1.1.3.5. Эксплуатация приложения в режиме адаптации и периодического синтеза модели (БКОСА-7, БКОСА-9, БКОСА-10)

 

Идентификация и прогнозирование (подсистема "Распознавание") (БКОСА-7)

Данная подсистема реализует режимы ввода и корректировки распознаваемой выборки; пакетного распознавания; вывода результатов и межмашинного обмена данными. Ввод-корректировка распознаваемых анкет осуществляется в двухоконном интерфейсе: в левом окне показаны заголовки идентифицируемых объектов, в которых отображаются их коды и условные наименования, а в правом окне – описания объектов на языке признаков. В левом окне каждому объекту соответствует строка, а в правом – окно с прокруткой. Переход между окнами происходит по нажатию клавиши "TAB". В данном режиме каждая анкета распознаваемой выборки последовательно идентифицируется с каждым классом. Вывод результатов распознавания (идентификации и прогнозирования) возможен в двух разрезах:

а) информация о сходстве каждого объекта со всеми классами;

б) информация о сходстве каждого класса со всеми объектами.

Система генерирует обобщающий отчет по итогам идентификации, в котором в каждой строке дана информация о классе, с которым распознаваемый объект имеет наивысший уровень сходства (в процентах). Качество результата идентификации – это эвристическая оценка качества, учитывающая максимальную величину сходства, различие между первым и вторым классами по уровню сходства и в (меньшей степени) общий вид распределения классов по уровням сходства с данным объектом. Каждой строке обобщающего отчета соответствует карточка результатов идентификации (прогнозирования), которая по сути дела представляет собой результат разложения вектора объекта в ряд по векторам классов. Эти карточки распечатываются в файл с полными наименованиями классов и содержат классы, с уровнем сходства выше заданного.

Почтовая служба по распознаваемым анкетам обеспечивает запись на дискету распознаваемой выборки и считывание распознаваемой выборки с дискеты с добавлением к имеющейся на текущем компьютере. Этот режим служит для объединения информации по идентифицируемым объектам, введенной на различных компьютерах.

Подсистема "Типология" обеспечивает типологический анализ классов и признаков.

Типологический анализ классов включает: информационные (ранговые) портреты; кластерно-конструктивный и когнитивный анализ классов.

 

Информационные портреты классов  (БКОСА-9.1)

Информационный портрет класса представляет собой список признаков в порядке убывания количества информации о принадлежности к данному классу. Такой список представляет собой результат решения обратной задачи идентификации (прогнозирования). Фильтрация (F6) позволяет выделить из информационного портрета класса диапазон признаков (по кодам или уровням Мерлина) и, таким образом, исследовать влияние заданных признаков на переход активного объекта управления в состояние, соответствующее данному классу.

Кластерный и конструктивный анализ классов обеспечивает: расчет матрицы сходства классов; генерацию кластеров и конструктов; просмотр и печать кластеров и конструктов; пакетный режим, обеспечивающий автоматическое выполнение первых трех режимов при установках параметров "по умолчанию"; визуализацию результатов кластерно-конструктивного анализа в форме семантических сетей и когнитивных диаграмм.

 

Расчет матрицы сходства эталонов классов (БКОСА-10.1.1)

В данном режиме непосредственно на основе оптимизированной матрицы информативностей рассчитывается матрица сходства классов. На экране в наглядной форме отображается информация о текущей стадии выполнения этого процесса.

 

Генерация кластеров и конструктов классов (БКОСА-10.1.2)

В данном режиме пользователем задаются параметры для генерации кластеров и конструктов классов, позволяющие исключить из форм центральную часть конструктов (оставить только полюса), а также сформировать кластеры и конструкты для заданных (кодами или уровнями Мерлина) подматриц. В данном режиме обеспечивается отображение отчета по конструктам и вывод его в виде текстового файла. Реализован режим быстрого поиска заданного конструкта и быстрый выход на него по заданному классу.

 

Автоматическое выполнение режимов 1-2-3

В данном пакетном режиме автоматически выполняются вышеперечисленные 3 режима с параметрами "по умолчанию". Выполнение пакетного режима целесообразно в самом начале проведения типологического анализа для общей оценки его результатов. Более детальные результаты получаются при выполнении отдельных режимов с конкретными значениями параметров.

 

Вывод 2d-семантических сетей классов (БКОСА-10.1.3)

В данном режиме пользователем в диалоге с системой "Эйдос" задаются коды от 3 до 12 классов (ограничение связано с тем, что больше классов не помещается на мониторе при используемом разрешении), а затем на основе данных матрицы сходства классов отображается ориентированный граф, в вершинах которого находятся классы, а ребра соответствуют знаку (красный – "+", синий – "-") и величине (толщина линии) сходства/различия между ними. Посередине каждой линии уровень сходства/различия соответствующих классов отображается в числовой форме (в процентах). Такие графы в данной работе называются 2d-семантическими сетями классов (2d означает "двухмерные").

 

Когнитивные диаграммы классов (БКОСА-10.3.1, 10.3.2)

В системе "Эйдос" реализован двухоконный интерфейс ввода задания на формирование когнитивных диаграмм и пример такой диаграммы. Переход между окнами осуществляется по клавише "ТАВ", выбор класса для когнитивной диаграммы – по нажатию клавиши "Enter". В верхней левой части верхнего окна отображаются коды выбранных классов. Генерация и вывод когнитивной диаграммы для заданных классов выполняется по нажатию клавиши F5. Отображаемые диаграммы всегда записываются в виде графических файлов в соответствующие поддиректории. Имеются также пакетные режимы генерации диаграмм: генерацию когнитивных диаграмм для полюсов конструктов (F6), генерация всех возможных когнитивных диаграмм (F7), а также генерация диаграмм Вольфа Мерлина (F8). При задании всех этих режимов имеется возможность задания большого количества параметров, определяющих вид диаграмм и содержание отображаемой на них информации.

Типологический анализ атрибутов обеспечивает: формирование и отображение семантических портретов атрибутов (признаков), а также кластерно-конструктивный и когнитивный анализ атрибутов.

 

Семантические портреты атрибутов (БКОСА-9.2)

В данном режиме обеспечивается формирование семантического портрета заданного признака и его отображение в текстовой и графической формах. Окно для просмотра текстового отчета имеет прокрутку вправо, что позволяет отобразить количественные характеристики. Графическая диаграмма выводится по нажатию клавиши F5, и может быть непосредственно распечатана или записана в виде графического файла в соответствующую поддиректорию.

Кластерный и конструктивный анализ атрибутов обеспечивает: расчет матрицы сходства признаков; генерация кластеров и конструктов признаков: просмотр и печать результатов кластерно-конструктивного анализа; автоматическое выполнение перечисленных режимов; отображение результатов кластерно-конструктивного анализа в форме семантических сетей и когнитивных диаграмм.

 

Расчет матрицы сходства атрибутов (БКОСА-10.2.1)

Стадия выполнения расчета матрицы сходства признаков наглядно отображается на мониторе.

 

Генерация кластеров и конструктов атрибутов (БКОСА-10.2.2)

В данном режиме имеется возможность задания ряда параметров, детально определяющих обрабатываемые данные и форму вывода результатов анализа и отображаются результаты кластерно-конструктивного анализа. Имеются также многочисленные возможности манипулирования данными (различные варианты поиска, сортировки и фильтрации).

Автоматическое выполнение режимов 1-2-3. Автоматически реализуются три вышеперечисленные режима.

 

Вывод 2d-семантических сетей атрибутов (БКОСА-10.2.3)

Результаты кластерно-конструктивного анализа признаков отображаются для заданных признаков в наглядной графической форме семантических сетей.

 

Когнитивные диаграммы атрибутов (БКОСА-10.4.1, 10.4.2)

Это новый вид когнитивных диаграмм, не встречающийся в литературе. Частным случаем этих диаграмм являются инвертированные диаграммы Вольфа Мерлина (терм. авт.). При их генерации имеется возможность задания ряда параметров, определяющих обрабатываемые данные и форму отображения результатов.

В подсистеме "Анализ" реализованы режимы:

– оценки анкет по шкале лживости;

– измерения внутренней интегральной и дифференциальной валидности модели;

– измерения независимости классов и признаков (стандартный анализ c2);

– генерации большого количества разнообразных 2d & 3d графических форм на основе данных матриц абсолютных частот, условных процентных распределений и информативностей (2d & 3d означает: "двухмерные и трехмерные");

– генерации и графического отображения нелокальных нейронов, нейронных сетей, классических и интегральных когнитивных карт.

Оценка достоверности заполнения анкет

В данном режиме исследуются корреляции между ответами в каждой анкете, эти корреляции сравниваются с выявленными на основе всей обучающей выборки и все анкеты ранжируются в порядке уменьшения типичности обнаруженных в них корреляций. Считается, что если корреляции в анкете соответствуют "среднестатистическим", которые принимаются за "норму", то анкета отражает обнаруженные макрозакономерности, если же нет, то возникает подозрение в том, что она заполнена некорректно.

В режиме "Измерение независимости объектов и признаков" реализован стандартный анализ c2, а также рассчитываются коэффициенты Пирсона, Чупрова и Крамера, популярные в экономических, социологических и политологических исследованиях. В системе задание на расчет матриц сопряженности вводится в специальный бланк, который служит также для отображения обобщающих результатов расчетов. На основе этого задания рассчитываются и записываются в форме текстовых файлов одномерные и двумерные матрицы сопряженности для заданных подматриц.

В отличие от матриц сопряженности, выводимых в известной системе SPSS, здесь они выводятся с текстовыми пояснениями на том языке, на котором сформированы классификационные и описательные шкалы, с констатацией того, обнаружена ли статистически-значимая связь на заданном уровне значимости. Необходимо также отметить, что в системе "Эйдос" не используются табулированные теоретические значения критерия c2 для различных степеней свободы, а необходимые теоретические значения непосредственно рассчитываются системой, причем со значительно большей точностью, чем они приведены в таблицах (при этом численно берется обратный интеграл вероятностей).

Режим "Просмотр профилей классов и признаков". Система "Эйдос" текущей версии 12.5 позволяет генерировать и выводить более 54 различных видов 2d & 3d графических форм, каждая из которых выводится в форме, определяемой задаваемыми в диалоге параметрами.

Подсистема "Сервис". Реальная эксплуатация ни одной программной системы невозможна либо без тщательного сопровождения эксплуатации и без наличия в системе развитых средств обеспечения надежности эксплуатации. В системе "Эйдос" для этого служит подсистема "Сервис"  в которой:

– автоматически ведется архивирование баз данных;

– создаются отсутствующие базы данных и индексные массивы;

– распечатываются в текстовые файлы служебные формы, являющиеся основой содержательной информационной модели (базы абсолютных частот, условных процентных распределений и информативностей).

В подсистему "Сервис" входит также интеллектуальная дескрипторная информационно-поисковая система, автоматически генерирующая нечеткие дескрипторы и имеющая интерфейс нечетких запросов на любом естественном языке, использующем кириллицу или латиницу (т.е. не только русском). Отчет по результатам запроса содержит информационные объекты базы данных системы, ранжированные в порядке уменьшения степени соответствия запросу.

 

1.1.4. Технические характеристики и обеспечение эксплуатации системы "ЭЙДОС" (версии 12.5)

1.1.4.1. Состав системы "Эйдос": базовая система, системы окружения и программные интерфейсы импорта данных

Система "Эйдос" (текущей версии 12.5) включает базовую систему (система "Эйдос" в узком смысле слова), три системы окружения, а также ряд программных интерфейсов с внешними источниками данных:

– систему анализа и прогнозирования ситуация на фондовом рынке "Эйдос-фонд", разработанную совместно с Б.Х.Шульман;

– систему комплексного психологического тестирования "Эйдос-Y", созданную совместно с С.Д.Некрасовым;

– систему типизации и идентификации социального статуса респондентов по их астрономическим показателями на момент рождения "Эйдос-астра", разработанную совместно с А.П.Труневым и В.Н.Шашиным.

Системы окружения представляют собой развитие программные интерфейсы базовой системы "Эйдос" с внешними базами данных психологических тестов, биржевыми базами данных и базами данных социологической информации соответственно, а также выполняют ряд самостоятельных функций по предварительной обработке информации, визуализации результатов анализа и т.д. Кроме того, в саму базовую систему "Эйдос" включены программные интерфейсы, обеспечивающие формализацию предметной области и импорт данных из внешних источников данных различных стандартов (текстовых файлов и баз данных).

 

1.1.4.2. Отличия системы "Эйдос" от аналогов: экспертных и статистических систем

 

От экспертных систем система "Эйдос" отличается тремя очень важными свойствами.

1. Первое различие связано с источником знаний и способом их получения. Для ее обучения системы «Эйдос» от экспертов требуется лишь само их решение о принадлежности того или иного объекта или его состояния к определенному классу, а не формулирование правил (продукций) или весовых коэффициентов, позволяющих прийти к такому решению (система генерирует их сама, т.е. автоматически на основе эмпирических данных). Дело в том, что часто эксперт не может или по различным причинам не хочет вербализовать, тем более формализовать свои способы принятия решений. Система "Эйдос" генерирует обобщенную таблицу решений непосредственно на основе эмпирических данных (которые могут быть очень большой размерности, зашумленными и фрагментированными).

2. Второе различие касается типа логики, используемой при формализации знаний и способа представлении знаний в базах знаний систем. Продукции в экспертных системах основаны на логике Аристотеля и имеют два значения истинности: «Истина», «Ложь». Такие продукции могут быть выражены в виде предложений логического следования (импликаций) типа: «Если объект обладает признаком A, то он принадлежит группе B» и приводят к логическому клинчу (останову машины логического вывода), если они противоречат друг другу. В системе «Эйдос» продукции являются нечеткими и имеют расчетную (на основе эмпирических данных степень) истинности и могут быть в выражены в виде правдоподобных рассуждений типа: «Если объект обладает признаком A, то в этом факте содержится такое-то количество информации о его принадлежности или непринадлежности к группе B». Правдоподобные высказывания не могут полностью противоречить друг другу и на их основе всегда возможно получить итоговое правдоподобное высказывание вида: «Если объект обладает признаками {A1, A2, A3, An}, то в этой системе фактов содержится такое-то количество информации о его принадлежности или непринадлежности к группе B». В аппарате логического вывода системы «Эйдос» логический клинч невозможен в принципе.

3. Третье различие касается размерностей создаваемых моделей. Максимальное количество классических продукций с двумя вариантами истинности: .T., .F. по литературным данным (http://itmu.vsuet.ru/Posobija/Predstavlenie_znan/htm/2_t.htm) для обычных экспертных систем составляет не более 1000, а профессиональных – 10000. Система Эйдос-Х++ позволяет моделировать поведение сложных объектов, включающих сотни тысяч будущих состояний и сотни тысяч значений факторов и база знаний при этом может включать более 10 миллиардов нечетких продукций с расчетной на основе эмпирических данных степенью истинности, что в миллион  или даже 10 миллионов (!) раз больше, чем у экспертных систем. Время создания такой базы на современном персональном компьютере с процессором I7 на обычном винчестере составляет около 30 минут и она имеет размер около 240 Гб. Таким образом, ранее существовавшие ограничения на размерность модели и размеры баз данных полностью преодолены в системе Эйдос-Х++, в чем и состоит одна из причин ее разработки. В настоящее время ограничение на размерность баз данных системе Эйдос-Х++ накладываются только емкостью внешней памяти и вычислительной мощностью компьютера.

От систем статистической обработки информации система "Эйдос" отличается прежде всего своими целями, которые состоят в следующем: формирование обобщенных образов исследуемых классов распознавания и признаков по данным обучающей выборки (т.е. обучение); исключение из системы признаков тех из них, которые оказались наименее ценными для решения задач системы;  вывод информации по обобщенным образам классов распознавания и признаков в удобной для восприятия и анализа текстовой и графической форме (информационные или ранговые портреты); сравнение распознаваемых формальных описаний объектов с обобщенными образами классов распознавания (распознавание); сравнение обобщенных образов классов распознавания и признаков друг с другом (кластерно-конструктивный анализ); расчет частотных распределений классов распознавания и признаков, а также двумерных матриц сопряженности на основе критерия c2 и коэффициентов Пирсона, Чупрова и Крамера;  результаты кластерно-конструктивного и информационного анализа выводятся в форме семантических сетей и когнитивных диаграмм. Система "Эйдос" в универсальной форме автоматизирует базовые когнитивные операции системного анализа, т.е. является инструментарием СК-анализа. Таким образом, система "Эйдос" выполняет за исследователя-аналитика ту работу, которую при использовании систем статистической обработки ему приходится выполнять вручную, что чаще всего просто невозможно при реальных размерностях данных. Поэтому система "Эйдос" и называется универсальной когнитивной аналитической системой.

 

1.1.4.3. Некоторые количественные характеристики системы "Эйдос"

 

Система "Эйдос" обеспечивает генерацию и запись в виде файлов более 64 видов 2d & 3d графических форм и 50 видов текстовых форм.

При применении системы в самых различных предметных областях обеспечивается достоверность распознавания обучающей выборки: на уровне 90% (интегральная валидность), которая существенно повышается после Парето-оптимизации системы признаков (т.е. после исключения признаков с низкой селективной силой), удаления из модели артефактов, а также классов и признаков, по которым недостаточно данных, разделения классов на типичные и нетипичные части. Система "Эйдос" версии 12.5 обеспечивает синтез модели, включающей десятки тысяч классов и признаков при неограниченном объеме обучающей выборки, причем признаки могут быть не только качественные (да/нет), но и количественные, т.е. числовые. В некоторых режимах анализа модели имеются ограничения на ее размерность, которые на данном этапе преодолеваются путем снижения размерности модели. Реализована возможность разработки супертестов, в том числе интеграции стандартных тестов в свою среду, (при этом не играет роли известны ли методики интерпретации, т.е. "ключи" этих тестов). В системе имеется научная графика, обеспечивающая высокую степень наглядности, а также естественный словесный интерфейс при обучении Системы и запросах на распознавание.

Исходные тексты системы "Эйдос" и систем окружения "Эйдос-Y", "Эйдос-фонд" и «Эйдос-астра» в формате "Текст-DOS" имеют объем около 2.5 Мб; их распечатка 6-м шрифтом составляет около 800 страниц.

 

1.1.4.4. Обеспечение эксплуатации системы "Эйдос"

 

Универсальная когнитивная аналитическая система "Эйдос" представляет собой программную систему, и для ее эксплуатации, как и для эксплуатации любой программной системы, необходима определенная инфраструктура. Без инфраструктуры эксплуатации любая программная система остается лишь файлом, записанным на винчестере. В зависимости от масштабности решаемых задач управления и специфики предметной области данная структура может быть как довольно малочисленной, так и более развитой. Однако в любом случае ее основные функциональные и структурные характеристики остаются примерно одними и теми же. Кратко рассмотрим эту инфраструктуру на примере гипотетической организации, производящей определенные виды продукции.

Основная цель: обеспечивать информационную и аналитическую поддержку деятельности организации, направленную на производство запланированного объема продукции заданного качества, достижение высокой эффективности управления и устойчивого поступательного развития.

Данная основная цель предполагает выполнение информационных и аналитических работ с различными объектами деятельности, находящимися на различных структурных уровнях как самой организации, так и ее окружения: персональный уровень; уровень коллективов (подразделений); уровень организации в целом; окружающая среда (непосредственное, региональное, международное окружение). Для достижения основной цели для каждого класса объектов должны регулярно выполняться следующие работы: оценка (идентификация) текущего состояния с накоплением данных (мониторинг); прогнозирование развития (оперативное, тактическое и стратегическое); выработка рекомендаций по управлению. Необходимо особо подчеркнуть, что основная цель может быть достигнута только при условии соблюдения вполне определенной наукоемкой технологии, основы которой изложены в данном исследовании.

Задачи, решаемые для достижения цели работы:

1. Мониторинг: оценка и идентификация текущего (фактического, актуального) состояния объекта управления; накопление данных идентификации в базах данных в течение длительного времени.

2. Анализ: выявление причинно-следственных зависимостей путем анализа данных мониторинга.

3. Прогнозирование: оперативное, тактическое и стратегическое прогнозирование развития объекта управления и окружающей среды путем использования закономерностей, выявленных на этапе анализа данных мониторинга.

4. Управление: анализ взаимодействия объекта управления с окружающей средой и выработка рекомендаций по управлению.

Таким образом, по мнению автора, управление является высшей, существующей на данный момент формой обработки информации.

Для достижения основной цели и решения задач управления необходимо выполнять работы по следующим направлениям: регулярное получение исходной информации о состоянии объекта управления; обработка исходной информации на компьютерах; анализ обработанной информации, прогнозирование развития объекта управления, выработка рекомендаций по оказанию управляющих воздействий на объект управления; разработка и применение (или предоставление рекомендаций заказчикам) различных методов оказания управляющих воздействий на объект управления.

Для этого необходима определенная организационная структура: научно-методический отдел включает: научно-методический сектор; сектор разработки программного обеспечения; сектор внедрения и сопровождения программного обеспечения; сектор организационного и юридического обеспечения; отдел мониторинга: сектор исследования объекта управления; сектор по работе с независимыми экспертами; сектор по взаимодействию с поставляющими информацию организациями; сектор по анализу информации общего пользования; отдел обработки информации: сектор ввода исходной информации (операторы); сектор сетевых технологий и Internet; сектор внедрения, эксплуатации и сопровождения программных систем; сектор технического обслуживания компьютерной техники; сектор ведения архивов баз данных по проведенным исследованиям; аналитический отдел имеет структуру, обеспечивающую компетентный профессиональный анализ результатов обработки данных мониторинга по объектам, которые приняты для контроля и управления.

Для выполнения работ по этим направлениям необходимо определенное обеспечение деятельности: техническое, программное, информационное, организационное, юридическое и кадровое. Детально подобная структура и виды обеспечения ее деятельности описаны в работе [4].

 

 

1.1.5. АСК-анализ, как технология синтеза и эксплуатации рефлексивных АСУ активными объектами

 

Применение АСК-анализа обеспечивает выявление информационных зависимостей между факторами различной природы и будущими состояниями объекта управления, т.е. позволяет осуществить синтез содержательной информационной модели, а фактически – осуществить синтез АСУ. Применение АСК-анализа в составе АСУ обеспечивает ее эксплуатацию в режиме непрерывной адаптации модели (на детерминистских этапах), а когда это необходимо (т.е. после прохождения точек бифуркации) – и ее нового синтеза.

Ниже приведена технология системы "Эйдос" как инструментария АСК-анализа:

Шаг 1–й: формализация предметной области (БКОСА-1): разработка описательных и классификационных шкал и градаций, необходимых для формализованного описания предметной области. Описательные шкалы описывают факторы различной природы, влияющие на поведение активных объектов управления (АОУ), а классификационные – все его будущие состояния, в том числе целевые.

Шаг 2–й: формирование обучающей выборки (БКОСА-2): информация о состоянии среды и объекта управления, а также вариантах управляющих воздействий поступает на вход системы. Работа по преобразованию этой информации в формализованный вид (т.е. кодирование) осуществляется специалистами, обслуживающими систему с использованием описательных и классификационных шкал. Вся эта информация представляется в виде специальных кодированных бланков, используемых также для ввода информации в компьютер. В результате ее формируется так называемая "обучающая выборка".

Шаг 3–й: обучение (БКОСА-3): обучающая выборка обрабатывается обучающим алгоритмом, на основе чего им формируются решающие правила (обобщенные образы состояний АОУ, отражающие весь спектр будущих возможных состояний объекта управления) и определяется ценность факторов для решения задач подсистем идентификации, мониторинга, прогнозирования и выработки управляющих воздействий.

Шаг 4–й: оптимизация (БКОСА-4): факторы, не имеющие особой прогностической ценности, корректным способом удаляются из системы. Данный процесс осуществляется с помощью итерационных алгоритмов, при этом обеспечивается выполнение ряда ограничений, таких как результирующая размерность пространства факторов, его информационная избыточность и т.п.

Шаг 5–й: верификация модели (БКОСА-5): выполняется после каждой адаптации или пересинтеза модели. На этом шаге обучающая выборка копируется в распознаваемую и осуществляется ее автоматическая классификация (в режиме распознавания). Затем рассчитываются так называемые внутренняя дифференциальная и интегральная валидности, характеризующие качество решающих правил.

Шаг-6: принятие решения об эксплуатации модели или ее пересинтезе. Если результаты верификации модели удовлетворяют разработчиков рефлексивной АСУ активными объектами (РАСУ АО), то она переводится из пилотного (экспериментального) режима, при котором управляющие решения генерировались, но не исполнялись, в режим экспериментальной эксплуатации, а затем и опытно–производственной эксплуатации, когда они реально начинают использоваться для управления. Иначе, т.е. если же модель признана недостаточно адекватной, то необходимо осуществить ее пересинтез, начиная с шага 1. При этом используются следующие приемы: расширение набора факторов, т.к. значимые факторы могли не войти в модель; увеличение объема обучающей выборки, т.к. существенные примеры могли не войти в обучающую выборку; исключение артефактов, т.к. в модель могли вкрасться существенно искажающие ее не подтверждающиеся данные; пересмотр экспертных оценок и, если необходимость этого возникает систематически, то и переформирование экспертного совета, т.к. причиной этого могла быть некомпетентность экспертов; объединение некоторых классы, т.к. по ним недостаточно данных; разделение некоторых классов, т.к. по ним слишком высокая вариабельность объектов по признакам, и т.д.

Шаг 7-й: идентификация и прогнозирование состояния АОУ (БКОСА-7).

Шаг 8-й: оценка качества идентификации состояния АОУ. Если качество идентификации высокое, то состояние АОУ рассматривается как типовое, а значит, причинно-следственные взаимосвязи между факторами и будущими состояниями данного объекта управления считаются адекватно отраженными в модели и известными (т.е. если качество идентификации высокое, то считается, что объект относится к генеральной совокупности, по отношению к которой обучающая выборка репрезентативна). Поэтому в этом случае осуществляется переход на Шаг-9 (выработка управляющего воздействия и последующий анализ). Иначе – считается, что на вход системы идентификации попал объект, не относящийся к генеральной совокупности, адекватно представленной обучающей выборкой. Поэтому в этом случае информация о нем поступает на Шаг-13, начиная с которого запускается процедура пересинтеза модели, что приводит к расширению генеральной совокупности, представленной обучающей выборкой.

Шаг 9-й: выработка решения об управляющем воздействии (БКОСА-9) путем решения обратной задачи прогнозирования [7].

Шаг 10–й типологический анализ классов и факторов (БКОСА-10): кластерно-конструктивный и когнитивный анализ, семантические сети, когнитивные диаграммы состояний АОУ и факторов [7].

Шаг 11-й: многофакторное планирование и принятие решения о применении системы управляющих факторов (БКОСА-11).

Шаг 12-й: оценка адекватности принятого решения об управляющих воздействиях: если АОУ перешел в заданное целевое состояние, то осуществляется переход на вход адаптации содержательной информационной модели (Шаг-2): в подсистеме идентификации предусмотрен режим дополнения распознаваемой выборки к обучающей, чтобы в последующем, когда станут известны результаты управления, этой верифицированной (т.е. достоверной) оценочной информацией дополнить обучающую выборку и переформировать решающие правила (обучающая обратная связь). Иначе, т.е. если АОУ не перешел в заданное целевое состояние, переход на вход пересинтеза модели (Шаг-1), при этом могут быть изменены и описательные, и классификационные (оценочные) шкалы, что позволяет качественно расширить сферу адекватного функционирования РАСУ АО.

Шаг 13–й (неформализованный поиск нетипового решения об управляющем воздействии и подготовка данных для пересинтеза модели, как в случае, если решения оказалось удачным, так и в противном случае).

Таким образом, предложена технология применения системы "Эйдос" как инструментария применения АСК-анализа, основанного на системной теории информации, ориентированной на синтез рефлексивных АСУ АО. В процессе эксплуатации системы "Эйдос" успешно решаются все задачи АСК-анализа:  формирование обобщенных образов состояний АОУ на основе обучающей выборки (обучение); идентификация состояний АОУ на основе его параметров (распознавание); определение влияния входных параметров на перевод АОУ в различные будущие состояния (обратная задача прогнозирования); прогнозирование поведения АОУ в условиях полного отсутствия управляющих воздействий; прогнозирование поведения АОУ при различных вариантах многофакторных управляющих воздействий.

Кроме того, выявленные в результате работы рефлексивной АСУ причинно-следственные зависимости между факторами различной природы и будущими состояниями объекта управления позволяют, при условии неизменности этих закономерностей в течение достаточно длительного времени, построить АСУ с постоянной моделью классического типа.

 

1.1.6. Перспективы развития системы «Эйдос»

 

Основную перспективу развития Универсальной когнитивной аналитической системы «Эйдос» автор видит в разработке многоязычной (прежде всего русской и английской) Internet версии (система «Эйдос-net»), работающей в локальной сети Host-компьютера (на кластере), к которой был бы обеспечен доступ с любого компьютера, находящегося в Internet.

Основные отличия системы «Эйдос-net» от локальной версии состоят в наличии диспетчера приложений и нескольких уровней авторизации пользователей. Предполагается также пересмотреть структуру диалога системы, а также снять ограничения на размерности обрабатываемых моделей, имеющиеся в текущей версии. Подробнее перспективы развития СК-анализа и системы «Эйдос» описаны в 7-й главе работы [7][9].

Диспетчер приложений обеспечивает создание или выбор текущего приложения в пределах компетенции пользователя, определяемого уровнем авторизации. Предполагается несколько уровней авторизации (таблица 1):

 

Таблица 1 – Уровни авторизации и права пользователей
системы «Эйдос-net»

Статус
пользователя

Права пользователя

Источник
полномочий

1

Администратор
приложения

Создание и удаление своих приложений и в них пересинтез моделей; решение задач прогнозирования и поддержки принятия решений; исследование СИМ

Модератор:
автор сайта – 
системы «Эйдос-net»

2

Специалист

Адаптация моделей, в которых он авторизован, решение в них задач прогнозирования и поддержки принятия решений

Модериратор:
администратор
приложения

3

Пользователь

Решение задач прогнозирования и поддержки принятия решений в приложениях, в которых он авторизован администратор приложения

Модериратор:
администратор
приложения

4

Ученик

Просмотр системы меню и публикаций по системе, возможность осваивать лабораторные работы

Немодерируемый
доступ

 

В настоящее время автор работает над реализацией этого проекта.

Но необходимо отметить, что и сегодня имеется техническая возможность:

одновременной интерактивной on-line демонстрации текущей «локальной» версии системы «Эйдос» на любом количестве компьютеров, подключенных к Internet;

– удаленной инсталляции системы «Эйдос» для дальнейшего использования на этих удаленных компьютерах;

– удаленного использования системы «Эйдос» на любых компьютерах, на которых она проинсталлирована.

Для обеспечения всех этих возможностей может быть использована, например, программа TeamViewer (http://www.teamviewer.com/). Эта программа, в отличие от RemoteAdmin (Radmin) и NetOP, обеспечивает доступ к удаленным компьютерам, в т.ч. и не имеющим внешних IP-адресов и находящимся за брандмауэром, прокси-сервером и другими аппаратными и программными экранами.

В режиме демонстрации на удаленных компьютерах отображается рабочий стол главного компьютера, с которого осуществляется демонстрация, и изображение с его монитора, но нет никакого другого доступа к этим удаленным компьютерам. При этом с главного компьютера есть возможность аудио- и видео-общения с аудиторией около удаленных компьютеров, т.е. можно комментировать презентацию, а также слышать вопросы слушателей и отвечать на них, т.е. автор может вести дистанционное преподавание с целью освоения системы «Эйдос», например, по лекционным и лабораторным курсам. Удаленную инсталляцию системы «Эйдос» для дальнейшего использования на удаленных компьютерах осуществляет автор. Удаленное использование системы «Эйдос» на любых компьютерах, на которых она проинсталлирована, осуществляют те, кому автором предоставлено такое право.

 

 

1.1.7. Выводы

 

1. Создан программный и методический инструментарий СК-анализа – Универсальная когнитивная аналитическая система "Эйдос", рядом Свидетельств РосПатента РФ.

2. Система "Эйдос" на базе формализуемой когнитивной концепции успешно реализует предложенную семантическую информационную модель и алгоритмы базовых когнитивных операций системного анализа, и, таким образом, является специальным программным инструментарием для синтеза и экспулатации приложений управления знаниями. Система "Эйдос" является эффективным инструментарием СК-анализа. В функциях и структуре системы "Эйдос" нашли воплощение фундаментальные закономерности познания, связанные с функциональной асимметрией мозга и знаковых систем [4].

3. Технология синтеза и эксплуатации приложений системы "Эйдос", видеограммы ее пользовательского интерфейса и технические характеристики (текущая версия системы "Эйдос-12.5" позволяет обрабатывать десятки тысяч будущих состояний активных объектов управления и градаций факторов).

4. Технология разработки приложения управления знаниями в системе "Эйдос" включает: когнитивную структуризацию и формализацию предметной области (подсистема "Словари"); синтез модели (подсистема "Обучение"); оптимизацию модели (подсистема "Оптимизация"); верификацию модели (оценка степени адекватности, скорости сходимости и семантической устойчивости модели).

5. Технология эксплуатации приложения системы "Эйдос" в режиме адаптации и синтеза модели включает: идентификацию и прогнозирование (подсистема "Распознавание"); кластерно-конструктивный, семантический и когнитивный анализ (подсистема "Типология"); анализ достоверности, валидности, независимости (подсистема "Анализ"); средства и инструменты обеспечения надежности эксплуатации (подсистема "Сервис").

5. Система "Эйдос" является большой системой. Листинг ее исходных текстов (вместе с системами окружения "Эйдос-фонд", "Эйдос-Y" и «Эйдомс-астра») 6-м шрифтом составляет около 800 страниц, в процессе работы система оперирует десятками баз данных (около 70).

6. Разработана инфраструктура применения системы "Эйдос", детализированы организационные, юридические, экономические, технические и другие аспекты информационной технологии применения данной системы для решения задач синтеза рефлексивных АСУ активными объектами и эксплуатации этих АСУ в режиме адаптации и периодического синтеза модели.

7. Разработана технология синтеза рефлексивных АСУ активными объектами и методики ее применения в конкретных предметных областях. Предложено рассматривать алгоритм СК-анализа, как алгоритм синтеза рефлексивных АСУ активными, а сам СК-анализ, как технологию синтеза рефлексивных АСУ активными объектами и их эксплуатации в режиме адаптации и периодического синтеза модели:

шаг 1–й: формализация предметной области (БКОСА-1);

шаг 2–й: формирование обучающей выборки (БКОСА-2);

шаг 3–й: обучение (БКОСА-3);

шаг 4–й: оптимизация (БКОСА-4);

шаг 5–й: верификация модели (БКОСА-5);

шаг 6-й: принятие решения об эксплуатации модели или ее пересинтезе;

шаг 7-й: идентификация и прогнозирование состояния АОУ (БКОСА-7);

шаг 8-й: оценка качества идентификации состояния АОУ;

шаг 9-й: выработка решения об управляющем воздействии (БКОСА-9);

шаг 10–й: типологический анализ классов и факторов (БКОСА-10);

шаг 11-й: многофакторное планирование и принятие решения о применении системы управляющих факторов (БКОСА-11);

шаг 12-й: оценка адекватности принятого решения об управляющих воздействиях;

шаг 13–й: (неформализованный поиск нетипового решения об управляющем воздействии и подготовка данных для пересинтеза модели, причем как в случае, если решение оказалось удачным, так и в противном случае).

Постановка и программная реализация системы «Эйдос» универсальна, т.е. не зависит от предметной области, потому она может быть эффективно применена в самых различных предметных областях.

 

1.2. Система окружения «Эйдос-фонд»

 

Данный раздел написан на основе материалов работы [7].

В 1993-1994 годах, автором совместно с Б.Х.Шульман (США) были проведены исследования Российского фондового рынка. При этом были применены предложенные технологии и специальный программный инструментарий АСК-анализа – базовая система "Эйдос" и специально созданная система окружения "Эйдос-фонд"  (рисунок 1).

 

Рисунок 1. Титульная видеограмма системы окружения "Эйдос-фонд"

 

Было разработано несколько вариантов приложений для различных сегментов фондового рынка и с различной детализацией прогнозов. В том числе впервые прогнозировался не только курс, но и сценарий его имзенения в течение дня. В дальнейшем данная разработка была усовершенствована (усилены графические возможности анализа данных), разработаны исследовательские режимы и др.

 

1.3. Система окружения «Эйдос-Ψ»

 

Описание системы окружения «Эйдос-Ψ» дается на основе работы [4].

Работы автора над созданием современных компьютерных Y-технологий, обеспечивающих управляемый перевод человека в оптимальные формы сознания, начались в 1979 году [7]. Эти работы были инициированы необходимостью решения ряда проблем, некоторые из которых освещаются ниже.

Первая группа проблем связана с необходимостью получения комплексной картины предметной области с помощью узкоориентированного, т.е. специализированного психометрического инструментария.

В настоящее время психологи-практики все чаще обращаются к комплексному психологическому тестированию. Основная причина этого очевидна: каждый из стандартных психологических тестов или опросников позволяют исследовать лишь какой-либо один из уровней или аспектов личности, или достаточно узкий их спектр, тогда как основной интерес представляет именно получение и исследование целостной картины, которая определяется характером взаимосвязей разноуровневых свойств личности.

Например, самоактуализационный тест (САТ) измеряет прежде всего социально-обусловленные качества респондентов, тогда как опросник 16 PF Р.Б.Кеттелла - конституционные психические качества, детерминируемые более фундаментальными и устойчивыми генотипическими факторами.

На определяющую роль изучения межуровневых взаимосвязей индивидуальных, психодинамических и социально-психологических свойств личности для интегрального исследования индивидуальности указывал В.С.Мерлин.

Вторая группа проблем, связана с тем, что практически все стандартные психодиагностические тесты, опросники и процедуры (далее: “тесты”) обладают целым рядом принципиальных недостатков, ограничивающих их корректное и методологически оправданное применение:

1.   Эти тесты разработаны и нормированы на выборке разработчика, а должны применяться на выборке пользователя.

2.   Они созданы для одних целей, а используются для других целей.

На первый взгляд кажется, что первая проблема решается адаптацией тестов, однако это не совсем так. Дело в том, что необходимо еще подтвердить специальным исследованием, что адаптированный скажем С.Петербургской психологической школой (фирма “Иматон” и др.) тест применим на Кубани, т.е. учитывает Южно-Российскую региональную специфику.

Автор считает, что адаптировать тесты необходимо на репрезентативной выборке, представляющей ту генеральную совокупность, на которой они будут применяться. Иначе даже “адаптированные” где-то и для кого-то тесты не будут учитывать региональной специфики, в которой работают конкретные пользователи, и практически ничем не будут отличаться в этом отношении от “неадаптированных”.

Но даже у тестов учитывающих региональную специфику (локализованных) из-за динамичности предметной области со временем уменьшается надежность и валидность. Поэтому необходима периодическая адаптация тестов к изменившимся условиям, а лучше - работа тестов в адаптивном режиме. На сегодняшний день по литературным данным известна лишь одна система, обеспечивающая не только автоматизированную разработку, но и эксплуатацию тестов в адаптивном режиме - это система  “ЭЙДОС” [7].

Известно, что работы по адаптации тестов являются весьма трудоемкими и наукоемкими, а также сложными в организационно-юридическом отношении. Поэтому в настоящее время в России научные центры, способные решать эти задачи, можно буквально пересчитать по пальцам одной руки. Очевидно, мощности этих центров не обеспечивают потребностей регионов в стандартизированном психометрическом инструментарии.

Из этих предпосылок часто делается вывод о том, что необходимо дать психологам технологию создания и адаптации тестов, чтобы они сами на местах могли решать эту проблему. Однако в настоящее время этот вывод представляется автору необоснованным, несмотря на то, что и он придерживался ранее этой точки зрения. Дело в том, что дать психологу подобный инструмент - это все равно, что дать рядовому бухгалтеру систему программирования Turbo C++ и предложить ему, чтобы он сам создал, а затем модернизировал такую систему бухучета, которая отражала бы специфику его предприятия. Однако рядовой бухгалтер не имеет для решения этой задачи ни сил, ни времени, ни соответствующей квалификации. Так же и рядовой психолог не сможет, да и не должен заниматься выработкой своего инструментария.

Но если предположить, что психологи все же займутся не своим прямым делом, а разработкой инструментария, и что у них это получится, то это будет означать одновременно конец какой-либо сопоставимости в их исследованиях, так как каждый будет пользоваться своим собственным инструментарием. По сути, мы сталкиваемся в этой ситуации с метрологической проблемой. И мы знаем, что существуют центры и лаборатории стандартизации и метрологии, которые занимаются поверкой и, если надо, настройкой измерительных приборов. Опыт метрологических служб является весьма ценным в нашем случае и им целесообразно воспользоваться.

Следовательно, весьма актуальным является создание региональных ведомственных и межведомственных психологических центров, которые могли бы решать как задачу оснащения практических психологов в своих регионах новыми, адаптированными и сопоставимыми психометрическими методиками, так и обеспечивать организацию и координацию регламентных сопоставимых исследований в масштабах своих регионов.

Проблема нецелевого применения тестов по мнению автора является даже еще более острой, чем проблема их неадекватности. Вызывает по меньшей мере удивление с какой легкостью “специалисты” некоторых частных фирм, изучив всего-лишь одно отдельно взятое психологическое свойство, например, “общительность”, выносят рекомендации о том, может ли данный кандидат быть, например, бухгалтером, сотрудником службы безопасности или инкассатором банка. Спрашивается, зачем банку нужен общительный бухгалтер? Но отсутствием элементарной методологической корректности применения тестов страдают не только коммерческие фирмы, живущие за счет рекламы, вводящей в заблуждение. В медицинской комиссии медотдела УВД с применением тестов Кеттелла и Люшера даются рекомендации о профессиональной пригодности или непригодности каждого конкретного кандидата для службы в ОВД. Но ведь данные тесты не предназначены для этих целей и их применение в данном случае с научно-методической точки зрения не более (и не менее) оправдано, чем, например, применение кофейной гущи.

Конечно ясно, что результаты тестирования с помощью этих тестов каким-то образом связаны с успешностью или неуспешностью службы на различных должностях в ОВД. Но ведь вопрос как раз и заключается в том, что эта взаимосвязь еще никем не исследовалась и фактически никому не известна. А ведь на пути к практическому применению этих знаний необходимо еще создать соответствующий инструментарий, опробировать его, сертифицировать и стандартизировать как пригодный для решения данных конкретных задач. Забегая вперед отметим, что инструментарий и методика для создания двухступенчатого теста на базе тестов Кеттела и Люшера (а также других) имеется: – это базовая когнитивная система “ЭЙДОС” ]7]  и система обработки данных комплексного психологического тестирования “ЭЙДОC-Y”.

Выводы:

Для проведения исследований интегральной индивидуальности на современном технологическом уровне необходимо применение соответствующих автоматизированных систем, реализующих адекватные данной задаче методологические концепции и математические модели. Задача создания и применения подобных систем является весьма актуальной.

Актуальной является задача создания в КЮИ МВД РФ научно-методического психологического Центра, способного решать как следующие задачи:

-      разработка новых сопоставимых психометрических методик специального назначения;

-      организация, координация, научно-методическое и инструментальное обеспечение регламентных сопоставимых психологических исследований в масштабах региона;

-      адаптация, локализация, сертификация и стандартизация уже имеющихся и практически использующихся психометрических методик.

Все уже практически применяемые в ОВД края психометрические методики должны пройти сертификацию и стандартизацию в Центре. Выводы и рекомендации, которые даются на основе применения не сертифицированных и не стандартизированных Центром методик должны быть признаны научно-методически не обоснованными и юридически ничтожными. В перспективе Центр мог бы выполнять функции регионального ведомственного психологического центра. Функции, структура и обеспечение деятельности подобного центра подробно развиты автором в работе [7].

Автоматизированная система комплексной обработки
данных психологического тестирования
"Эйдос-Y"

Для решения задач комплексной обработки данных психологического тестирования и получения как комплексных индивидуальных психологических портретов респондентов, так и их групп, автором совместно с С.Д.Некрасовым (Государственная аттестационная служба) была разработана система "Эйдос-Y".

Для решения задач комплексной обработки данных психологического тестирования и получения как комплексных индивидуальных психологических портретов респондентов, так и их групп, автором была разработана система “ЭЙДОC-Y”.

Система “ЭЙДОC-Y относится к окружению системы “ЭЙДОС” т.е. она с одной стороны представляет собой расширяемый супертест (аналогично MMPI), а с другой стороны является программным интерфейсом между реализованными в ней стандартными тестами и системой “ЭЙДОС”, обеспечивающей интеллектуальную обработку результатов тестирования.

Система “ЭЙДОC-Y обеспечивает:

1.  ввод и обработку первичных данных о респондентах;

2.  экспорт данных в универсальную когнитивную аналитическую систему “ЭЙДОС” для их содержательного углубленного анализа и для разработки двухступенчатых тестов и тестов прямого действия;

3.  объединение баз первичных данных, введенных на разных компьютерах.

Основные отличия (а, по мнению автора, и преимущества) системы “ЭЙДОС-Y” по сравнению с аналогами, состоят в следующем:

1.  Данная система предназначена не для опроса респондентов непосредственно за компьютером, а для ввода и обработки данных тестирования. Автор считает нецелесообразным применение компьютеров непосредственно для тестирования респондентов в наших условиях, т.к. для большинства респондентов использование компьютера само по себе является сильным стрессовым фактором, что искажает результаты тестирования. Кроме того, как показывает опыт, ввод данных опроса в систему  “ЭЙДОC-Y осуществляется практически на порядок быстрее, чем тестирование за компьютером, что обеспечивает соответствующую экономию машинного времени. Например, вместо использования 50 компьютеров для тестирования 50 респондентов в течение 1 часа, мы тестируем этих респондентов “за столом”, а потом на одном компьютере вводим данные для обработки в течение 5 часов, что не представляет организационно-технических сложностей.

2.  Системой сохраняются в базах данных не только результаты интерпретации ответов респондентов (стены, факторы и т.п.), но и сами первичные данные опроса. Это позволяет в дальнейшем использовать непосредственно первичные данные как для их анализа различными методами с помощью статистических систем, так и для разработки тестов прямого действия с помощью системы “ЭЙДОС”;

3.  Система обеспечивает автоматизированное применение ключей и автоматизированную интерпретацию результатов тестирования, как по каждому тесту отдельно, так и по всем тестам совместно в их взаимосвязи, причем виды изучаемых взаимосвязей очень гибко задаются самим исследователем;

4.  Система обеспечивает экспорт первичных данных и результатов их стандартной интерпретации в универсальную когнитивную аналитическую систему “ЭЙДОС”, что позволяет осуществить их совместный содержательный углубленный анализ, а также получить новые оптимальные двухступенчатые тесты и тесты прямого действия;

5.  Система позволяет получит не только психологическую характеристику отдельных индивидуумов, но и групп респондентов, относящихся к определенным градациям шкал, введенных самими исследователями.

В настоящее время система “ЭЙДОС-Y” обеспечивает комплексную (совместную) обработку данных по следующим опросным процедурам одновременно:

1.  Тест выявляющий уровень самоактуализации (САТ).

2.  Опросник 16 PF Р.Б.Кеттелла.

3.  Опросник по определению стиля управленческой деятельности.

4.  Анкета "Ориентация на развитие".

5.  Анкета "Опосредующие развитие факторы (стимулирующие и препятствующие)".

Принцип организации системы обеспечивает расширение перечня совместно используемых опросных процедур. Добавление новой опросной процедуры реализуется разработчиками системы и требует одного-двух человеко-дней.

Математические модели, реализуемые системой “ЭЙДОC-Y” являются упрощением и конкретизацией моделей системы “ЭЙДОС” для данного специального случая.

Настройка системы на способ совместной обработки результатов тестирования осуществляется следующим образом.

В режиме “Шкалы классификации респондентов” исследователь имеет возможность ввести наименования некоторого количества шкал и по каждой шкале указать определенное количество градаций с их наименованиями. Количество шкал и количество градаций по разным шкалам может быть различное (в отличии от многих других систем), но не более некоторого максимального количества, определяемого при генерации системы (в настоящее время до 99).

В режиме “Ведение справочника респондентов” исследователь может добавлять новых респондентов, вводить и корректировать их фамилию, имя и отчество (в остальных же режимах данный список респондентов лишь используется и не может быть скорректирован). Правее фамилий есть столбцы, соответствующие шкалам, введенным в справочник шкал. В каждом столбце исследователь задает код той градации соответствующей шкалы, к которой относится респондент. В данном режиме на экране отображаются и наименования шкал, и наименования градаций.

Таким образом в системе “ЭЙДОС-Y” каждый респондент характеризуется не только всей совокупностью его ответов на вопросы батареи тестов, как в большинстве статистических систем (например: SPSS, STATGRAPHICS, STATISTICA), но и принадлежностью к определенным группам, соответствующим градациям шкал, заданных самим пользователем. Решение о принадлежности респондента к тем или иным группам принимается исследователями на основе результатов тестирования или(и) экспертных оценок. Данная особенность системы сближает ее с интеллектуальной системой “ЭЙДОС” и позволяет организовать полноценный экспорт данных о респондентах в последнюю.

Надежность обработки информации в системе обеспечивается следующими мерами:

1.  все режимы ввода данных организованы таким образом, что исключается возможность ввода некорректных данных;

2.  система автоматически ведет архивы баз данных;

3.  автоматически переиндексирует все базы данных в случае отсутствия индексных массивов.

Выходные формы системы. Каждая опросная процедура, входящая в состав системы, выдает результаты в виде двух таблиц:

1.  в первой против фамилии каждого респондента содержатся данные интерпретации его ответов;

2.  во второй содержатся усредненные результаты интерпретации для каждой градации каждой шкалы.

Последнее и обеспечивает совместный анализ результатов тестирования респондентов с помощью опросников, реализованных в системе.

Тест САТ и анкета “Ориентация на развитие”, кроме того выдают частотные распределения стандартизированных баллов (стенов), разделенные на три зоны, такие, что вероятность попадания стена в каждую из них одинакова[10]. Система сама определяет границы этих зон, что обеспечивает оценку конкретных респондентов и их групп не только относительно “генеральной совокупности”, но и относительно самой группы респондентов.

Кроме того, система выдает по каждому респонденту итоговые данные по его тестированию с помощью всех тестов в виде одной сводной карты.

Все выходные формы записываются системой в виде текстовых файлов в поддиректорию TXT, что позволяет печатать их с использованием любого текстового редактора и на любом принтере, имеющемся у пользователя.

По опроснику 16 PF Р.Б.Кеттелла системой выдаются также в графическом виде стандартные профили респондентов и их групп (группы соответствуют градациям шкал) по факторам, причем профили групп выдаются в двух видах:

– одна группа на одной диаграмме;

– все группы одной шкалы на одной диаграмме (рисунок 2).

 

Рисунок 2. Примеры психологических профилей групп

 

Эти профили записываются системой в виде PCX-файлов в поддиректорию PCX, причем имена файлов соответствуют кодам респондентов, кодам шкал и групп. Эти графические данные легко могут быть вставлены в сводную карту респондента и распечатаны, например, с использованием популярного редактора Winword.

Необходимо отметить, что приведенные характеристики системы не являются окончательными, т.к. она непрерывно совершенствуется.

 

1.4. Система окружения «Эйдос-астра»

Актуальность исследования глобальных процессов, т.е. процессов на Земле в целом (глобальных геосистем), сегодня уже ни у кого не вызывает сомнения. Если раньше этот вопрос решался в основном в научной среде на уровне несколько отвлеченного академического обсуждения, то теперь, в уже наступившую эпоху глобальных катаклизмов природного и техногенного характера, этот вопрос «неожиданно» приобрел печальную конкретику, т.к. непосредственно коснулся многих миллионов или даже миллиардов людей.

Как известно из теории управления поведение любой системы определяется состоянием самой системы (внутренними факторами и ее предысторией) управляющими факторами, а также воздействием окружающей среды. Для глобальных геосистем: ноосферы (глобальных социальных и экономических процессов), биосферы, геосферы, магнитосферы, атмосферы и других, внешней средой, с которой эти системы входят в непосредственное взаимодействие, является ближайшее космическое окружение нашей планеты, т.е. различные космические тела, входящие в состав Солнечной системы.

В работах [14, 18, 57, 67, 70, 72, 86, 87, 90, 102, 104, 109, 110, 111, 116, 121, 124, 125, 126, 152, 166, 175, 199]  рассмотрены различные аспекты влияния космической среды на поведение ряда глобальных геосистем. При этом в основе этих исследований лежит методология естественных наук, т.к. они основаны на совместном изучении больших объемов детализированной фактографической информации о динамике состояния этих геосистем за длительные периоды времени, а с другой – астрономической информации о параметрах тел Солнечной системы.

Естественные науки основаны на измерениях и на интеллектуальном анализе результатов этих измерений. Само понятие «измерение» в истории науки эволюционировало вместе с самой наукой. Можно выделить следующие этапы эволюции понятия «измерение»:

– определение наличия некоторого качества у объекта измерения;

– получение одного числа, количественно характеризующего степень проявления некоторого качества объекта измерения;

– получение одного числа, количественно характеризующего степень проявления некоторого качества объекта измерения, а также получение погрешности определения этого числа, т.е. определение некоторого «доверительного интервала», в который «истинное значение числа» попадает с определенной заданной вероятностью;

– получение набора чисел с доверительными интервалами для каждого из них, т.е. получение статистического распределения и изучение зависимости его параметров от действующих на измеряемый объект факторов;

– получение эмпирических законов, функциональных зависимостей и когнитивных функциональных зависимостей.

Все научные экспериментальные установки, по сути, являются информационно-измерительными системами (ИИС), т.е. позволяют получить информацию об объекте исследования, т.е. его свойствах и состояниях. В любой информационно-измерительной системе информация от объекта исследования к системе обработки информации (входящей в состав ИИС) всегда передается по некоторому каналу передачи информации. В физических и астрономических исследованиях в качестве канала передачи информации чаще всего выступают электромагнитные волны различных диапазонов: свет, радиоволны и рентгеновское излучение.

Заметим, что на наш взгляд отсутствие знаний о каналах передачи взаимодействия или недостаточное их понимание не является фатальным препятствием на пути изучения свойств объектов с помощью этого взаимодействия. Это означает, что возможно получение адекватной информации об исследуемом объекте по слабо изученным каналам или каналам, природа которых вообще неизвестна. В процессах познания основное значение имеет информация, получаемая об объекте познания по каналам взаимодействия с ним, а не понимание природы этих каналов, которое не имеет принципиального значения на первых этапах познания. Этот подход будем называть информационным методом исследования. Он является аналогом «черного ящика» в кибернетике. Информационный метод  позволяет накапливать новую информацию об объектах познания, не зная способа взаимодействия с ними, а также использовать эту информацию на практике, что в последующем позволяет развить теоретически обоснованные представления о природе, как самих исследуемых объектов, так и каналов взаимодействия с ними.

В этой связи необходимо отметить, что эмпирический факт (установленный в результате измерения) является первичным по отношению к теории, т.е. для признания существования факта вообще нет необходимости в какой-либо объясняющей его теории, хотя есть горькая поговорка о том, что «если факт не вписывается в теорию, то тем хуже для факта». Дело же теории объяснять уже известные факты и предсказывать новые, еще не обнаруженные экспериментально.

Особенно ценным для развития теории является достоверное обнаружение новых фактов, которые этой теорией не объясняются, т.к. их теоретическое объяснение позволяет получить общую теорию, для которой предыдущая теория является частным случаем. Поэтому теоретики должны не отмахиваться от новых пока не объяснимых фактов или объявлять их несуществующими лишь на том основании, что они не вписываются в их теории, а наоборот, буквально охотится за подобными фактами.

Но что является эмпирическим фактом в свете изложенных представлений о развитии понятия измерения? Сегодня эмпирическим фактом можно считать обнаружение причинно-следственных и функциональных зависимостей в эмпирических данных, т.е. выявление новых знаний из данных [127], в частности выявление когнитивных функциональных зависимостей в эмпирических данных [125].

Понятно, что для достижения этой цели необходим адекватный инструмент и от функциональных возможностей этого инструмента самым непосредственным образом зависит как сама возможность выявления новых фактов и новых знаний из них, но также количество и качество этих фактов и знаний.

При этом вполне возможна ситуация, когда исследование с помощью современных автоматизированных интеллектуальных технологий давно всем известных и находящихся в общем доступе многолетних баз данных о фактических параметрах геосистем и тел Солнечной системы позволит открыть в них как новые факты, так и новые ранее неизвестные закономерности их взаимосвязи. Примерно так технологии XXI века позволяют еще раз переработать отвалы золотой руды на шахтах конца XIX – начала XX века и извлечь из них новые тонны золота, которые в свое время не смогли извлечь с помощью существовавших тогда примитивных технологий.

В качестве современной автоматизированной интеллектуальной технологии автор применил автоматизированный системно-когнитивный анализ (АСК-анализ) и его программный инструментарий – универсальную когнитивную аналитическую систему "Эйдос". Эту систему далее будем называть базовой системой «Эйдос». В состав этой системы входит подсистема _152 (в новой версии 2.3.2.2), содержащая ряд стандартных программных интерфейсов с внешними источниками данных различных стандартов: текстовых, баз данных (БД) и графических, расширяющих сферу ее применения. Некоторые из подобных интерфейсов при своем развитии превратились в системы окружения: "Эйдос-фонд", "Эйдос-Ψ" и "Эйдос-астра".

Задачей данного раздела является краткое описание системы «Эйдос-астра» и опыта ее применения. Текущая версия данной системы состоит из двух основных программных модулей, составляющих ядро системы, а также еще 25 взаимосвязанных программных модулей, представляющих собой подсистемы, включающие режимы, а также отдельных вспомогательных программных модулей (утилит) (см. диаграмму 1).

Диаграмма 1: базовая система «Эйдос» и системы окружения

 

Первоначально система Эйдос-астра была предназначена для исследований в области астросоциотипологии. Первые исследования в этом направлении проводились непосредственно с применением базовой системы «Эйдос». Было создано и изучено на достоверность много различных моделей. При этом оказалось, что одни модели показывают более высокую достоверность по одним классам распознавания, тогда как другие – по другим. Со временем стало ясным, что процесс создания и исследования различных частных моделей целесообразно автоматизировать, с тем, чтобы создать мультимодель, позволяющую объединить их достоинства частных моделей при этом преодолев их недостатки (принцип коллектива решающих правил[11]). Для этой цели и была создана система «Эйдос-астра», позволяющая автоматически генерировать различные системы частных моделей (мультимодели), исследовать их на достоверность в разрезе по классам и с учетом этой информации наиболее эффективно использовать их для идентификации и прогнозирования. Но со временем проблематика этих исследований расширилась и преобразовалась в целое новое научное направление, которое можно было бы назвать: «Применение технологий искусственного интеллекта для исследования влияния космической среды на поведение активных глобальных геосистем».

К подобным системам автор относит: ноосферу (включая глобальные социальные и экономические системы), биосферу, атмосферу, гидросферу, геосферу и магнитосферу. По ряду из этих глобальных систем были проведены исследования с применением системы «Эйдос-астра» и базовой системы «Эйдос»:

– ноосфера (включая глобальные социально-экономические системы): исследование динамики фондового рынка и детерминации социального статуса респондентов;

– геосфера: землетрясения, движение географического и магнитного плюсов Земли;

– динамика магнитосферы Земли.

Оказалось, что система «Эйдос-астра» может сама рассматриваться как универсальное интеллектуальное ядро, применимое для решения широкого класса прямых и обратных интеллектуальных задач многопараметрической типизации, системной идентификации, прогнозирования и поддержки принятия решений и научного исследования предметной области путем исследования ее семантической информационной модели в самых различных предметных областях. При этом характерной особенностью подобных задач является использование для исследований огромных по объемам внешних баз данных, содержащих информацию о десятках и сотнях тысяч и даже о миллионах событий. Эти базы данных размещены в Internet открытом бесплатном свободном доступе. Для преобразования этих баз данных в форму, удобную для исследования в системе «Эйдос-астра» и предварительной обработки данная система была расширена путем включения в ее состав ряда новых программных интерфейсов с внешними базами исходных данных.

Необходимо специально отметить, что система «Эйдос-астра» создавалась авторами как инструмент научных исследований. В качестве инструментального средства программирования использовался язык семейства Xbase++[12] (CLIPPER 5.01 + TOOLS II + BiGraph 3.01R1).

Технология моделирования социально-экономических и природных процессов на основе системы искусственного интеллекта «Эйдос-астра»

Система искусственного интеллекта «Эйдос-астра» была создана на основе системы «Эйдос». Первоначально эта система предназначалась для распознавания социальных категорий респондентов по астрономическим данным на момент рождения на основе теории сходства с использованием базы данных респондентов, содержащей более 26000 записей. Однако, после того, как были установлены общие закономерности распознавания социальных категорий и доказана основная теорема астросоциотипологии, возникла идея применить систему «Эйдос-астра» для моделирования экономических категорий, типа курсов валют. Было показано, что технология решения задач распознавания экономических категорий практически не отличается от технологии, развитой  для социальных категорий, ни по структуре используемых баз данных, ни по стадиям анализа.

Синтез каждой модели включает семь стадий, начиная с суммирования абсолютных частот признаков и, заканчивая, синтезом информационной модели СИМ-1 или СИМ-2 (тип информационной модели задается в диалоге) – рисунки 3, 4.

Рисунок 3. Скриншот подсистемы синтеза мультимодели
 (1-й подсистемы ядра системы «Эйдос-астра»)

 

Рисунок 4. Скриншот режима синтеза информационной модели

 

После того, как мультимодель создана, ее можно верифицировать, используя специальную программу распознавания – рисунок 5, в которой реализован алгоритм измерения внутренней дифференциальной валидности частных моделей и мультимодели в целом. В режиме распознавания можно задать в диалоге объем выборки, на которой производится измерение параметра сходства.  Для прогнозирования курсов валют используется режим 4 программы распознавания, в котором обрабатываются астрономические данные на каждый день и час прогноза – рисунки 6-7.

 

Рисунок 5. Скриншот подсистемы распознавания
(2-й подсистемы ядра системы «Эйдос-астра»)

 

Рисунок 6. Скриншот режима измерения достоверности
идентификации в разрезе по классам в частных моделях

 

Рисунок 7. Скриншот режима пакетного распознавания

 

В результате распознавания  формируется таблица категорий с указанием параметра сходства, которая используется для формирования итоговой таблицы достоверности прогноза. Для обработки этих данных используется специальный режим – рисунок 7. В этом режиме каждой дате и времени прогноза (например, 11 августа 18:00 на рисунке 8) сопоставляется набор категорий с указанием параметра сходства.   

 

Рисунок 8. Скриншот режима визуализации результатов
распознавания базовой системы «Эйдос»

 

Наконец, для стабилизации достоверности прогноза в системе «Эйдос-астра» реализованы пять алгоритмов голосования частных моделей описанные в работе [18]. Генерируя несколько моделей, можно обобщить их прогнозы, используя один из пяти алгоритмов, когда в итоговый прогноз берется:

1)      СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ, рассчитанная по всем частным моделям;

2)      СРЕДНЕЕ уровней сходства из всех прогнозов частных моделей;

3)      Уровень сходства из той частной модели, в которой он МАКСИМАЛЬНЫЙ;

4)      Уровень сходства из той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей;

5)      СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.

Система «Эйдос-астра» является мощным инструментом для исследования социально-экономических и природных процессов и систем в зависимости от астрономических параметров небесных тел Солнечной системы. Предложенные математические модели, алгоритмы и реализующие их программные средства (базовая система "Эйдос" и система окружения "Эйдос-астра"), а также технология и методика их применения обеспечили получение прикладных результатов не только в области астросоциотипологии, но и в области прогнозирования курсов валют, индекса S&P 500, магнитного поля Земли, сейсмических событий и климата по астрономическим данным с использованием технологий искусственного интеллекта.  В дальнейшем система окружения «Эйдос-астра» получила развитие, отраженное в работе [126]. Архитекутра системы «Эйдос-Х++» разрабатывается с учетом опыта разработки и экспулатации системы «Эйдос-астра» и позволяет реализовать все ее функции стандартным для новой системы образом, т.е. функционально система «Эйдос-Х++» полностью включает систему «Эйдос-астра», но ряд этих функций в настоящее время находится в процессе разработки.

 

 



[10] Вероятность является пределом, к котрому стремятся относительнеы частоты (частости) при неограниченном увеличении числа испытаний. Здесь мы термином «вероятность» пользуемся учитывая это обстоятельство