УДК 519:68

 

АВТОМАТИЗАЦИЯ КОГНИТИВНЫХ ОПЕРАЦИЙ

СИСТЕМНОГО АНАЛИЗА

Канд.техн.наук Е.В.Луценко

Технический университет КубГТУ

 

К системному анализу обращаются, когда возникает необходимость построения адекватной модели сложной многопараметрической системы (СМС). При этом на различных этапах системного анализа используются различные математические методы, позволяющие автоматизировать различные аспекты системного анализа. Автор предлагает рассматривать системный анализ как метод познания и, соответственно, предлагает математическую модель и реализующую ее программную систему, позволяющие автоматизировать когнитивные (от англ cognition – познание) операции системного анализа (КОСА).

Рассмотрим основные требования и критерии, которым должна удовлетворять математическая модель КОСА. Как правило СМС системы имеют природу, не позволяющую проводить с ними эксперименты. Вместе с тем одним из основных требований системного анализа является требование полноты и всесторонности рассмотрения объекта исследования. Поэтому главной проблемой на пути построения системной модели СМС является выявление и сбор максимально полной исходной информации для построения модели.

Для выявления максимального количества факторов, возможно играющих роль в модели СМС, на первом этапе системного анализа предлагается использовать "метод мозгового штурма", т.е. метод некритического, раскрепощенного выдвижения различных вариантов без анализа их оправданности. Конечно в модель СМС будут включены лишь наиболее существенные из этих факторов, а несущественные будут исключены из рассмотрения на последующих этапах анализа, но для того чтобы не упустить ни одного из существенных факторов сначала необходимо исследовать их максимальную систему и именно на ней определить степень важности каждого фактора.

При этом часто затруднительно подтвердить или опровергнуть статистические гипотезы о подчинении исходных данных нормальному распределению. Поэтому для построения модели СМС предлагается использовать непараметрические модели.

Учитывая, что модель СМС как правило включает тысячи и десятки тысяч факторов, представляется даже теоретически невозможным экспериментально исследовать динамику каждого из них при различных сочетаниях фиксированных значений остальных, как это требуется в многофакторном анализе. Автор предлагает исследовать поведение СМС, максимально учитывая все многообразие значений факторов, формирующееся за счет их естественной вариабельности. Так как естественная вариабельность не позволяет изучить все возможные сочетания факторов, то модель СМС должна корректно работать на неполных, фрагментарных и слабо структурированных данных.

При этом возникает вероятность того, что в обрабатываемые данные попадут и случайные выбросы, не отражающие закономерности исследуемой СМС, т.е. артефакты. Исключать эти артефакты предлагается с использованием робастных процедур, применение которых становится возможным при накоплении достаточной статистики.

Различные факторы, как правило, имеют различную качественную природу, поэтому сложно найти универсальную количественную форму, в которой они были бы сопоставимы. В литературе приводится несколько вариантов таких форм: "безразмерная" (недостаток - сложность интерпретации), "полезность", "денежная", т.е. выигрыш – проигрыш (но не все сводится к деньгам). Автор предлагает применить для обеспечения сопоставимости факторов различной природы их измерение в новой ранее не используемой для этой цели мере: семантической мере ценности информации по А.Харкевичу. Предлагается также численный метод для ее расчета на основе данных, полученных в ходе фактического исследования СМС.

По перечисленным причинам применение параметрических методов, таких как многофакторный анализ, является, как правило, просто практически невозможным для построения моделей СМС. Учитывая вышесказанное, автором предложена непараметрическая робастная математическая модель, основанная на семантической теории информации, обеспечивающая: анализ данных большой размерности: тысячи и десятки тысяч факторов; анализ неструктурированных и неполных исходных данных различной качественной природы, не подчиняющихся нормальному распределению, которые очень далеки по полноте и строгости от тех, которые требуются в факторном анализе; определение фактических свойств выбранных индикаторов, критериев и факторов; выбор из всей совокупности факторов сравнительно небольшого их числа, играющих определяющую роль (Парето – оптимизация); использование методов интеллектуального анализа данных временных рядов, позволяющих: выявить причинно-следственные закономерности в предметной области, определить периоды эргодичности, осуществлять многовариантное прогнозирование и выбор оптимального сочетания управляющих факторов с решением проблемы комбинаторного взрыва (обратная задача распознавания образов). Автором разработана и программная система, реализующая данную математическую модель: это автоматизированная когнитивная аналитическая система "Эйдос" [2], успешно апробировано на большом количестве примеров в различных областях.

Данная модель и программная система позволяют автоматизировать следующие базовые когнитивные операции системного анализа [1]: восприятие: интенсиональное (дискретное) представление чувственного образа конкретного объекта в форме совокупности признаков; присвоение формальных (знаковых) имен: экстенсиональное (континуальное) представление чувственного образа конкретного объекта в форме принадлежности к некоторым градациям определенных смысловых шкал; обобщение (синтез, индукция): формирование обобщенных образов различных категорий объектов на основе одновременного использования экстенсиональных и интенсиональных описаний конкретных объектов, которые используются в качестве примеров; анализ обобщенных образов (дедукция, Парето-оптимизация): выявление общего и особенного для каждого обобщенного образа; анализ признаков: выявление общего и особенного в смысловом содержании каждого признака; абстрагирование: определение для каждого признака его вклада в различие друг от друга обобщенных образов; контролируемое и корректное удаление незначимых признаков с сохранением всей существенной информации; классификация обобщенных образов: определение сходств и различий обобщенных образов друг с другом; объединение сходных образов в кластеры; формирование биполярных систем наиболее непохожих кластеров, т.е. конструктов образов, построение семантических сетей обобщенных образов; классификация признаков: определение сходств и различий признаков по их смыслу; объединение сходных по смыслу признаков в кластеры; формирование биполярных систем наиболее непохожих кластеров, т.е. конструктов признаков, построение семантических сетей признаков; содержательное сравнение обобщенных образов: определение признаков, по которым заданные два образа несопоставимы, которыми они сходны и которыми они отличаются друг от друга, построение когнитивных диаграмм, в т.ч. диаграмм В.С.Мерлина; содержательное сравнение признаков: определение элементов смысла, по которым заданные два признака несопоставимы, которыми они сходны и которыми они отличаются друг от друга, построение инвертированных когнитивных диаграмм; распознавание (идентификация) конкретных объектов: сравнение чувственного образа конкретного объекта со всеми обобщенными образами.

 

Литература

  1. Лаптев В.Н., Луценко Е.В. Изучение некоторых понятий гносеологии и психологии на примере когнитивной аналитической системы "ЭЙДОС" //Организация и методологические проблемы компьютеризации учебного процесса: Сб.науч.трудов.-Краснодар: КВВАУ,1998.-С. 53-59.
  2. Пат. № 940217. Универсальная автоматизированная система распознавания образов "ЭЙДОС" /Е.В. Луценко (Россия); Заяв. № 940103. Опубл. 11.05.94.-12с.