ГЛАВА 5. АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ
В ЭКОЛОГИИ И ЭКОНОМИКЕ

 

5.1. АСК-анализ влияния экологических факторов
на качество жизни населения региона

 

Без опоры на науку невозможно становление полноценного экологического сознания. Чтобы повысить обоснованность и вес выводов о влиянии экологии на качество жизни, необходимо количественно оценить силу и направление влияния на него разнородных экологических факторов. Однако, оказывается, что сделать это довольно проблематично по целому ряду причин. Во-первых, это отсутствие или малодоступность необходимых для подобных исследований исходных данных. Те же данные, которые все же удается найти, охватывают небольшие периоды наблюдений (малый лонгитюд), а их восполнение, в т.ч. путем проведения экспериментов, принципиально невозможно. В результате невозможно требовать от таких данных полных повторностей, что является необходимым условием корректного применения факторного анализа. Во-вторых,  экологические факторы описываются разнородными показателями, измеренными в различных типах измерительных шкал (номинальных, порядковых и числовых) и в различных единицах измерения. Математические методы сопоставимой обработки подобных данных, а также реализующий эти методы программный инструментарий, фактически отсутствуют.  В-третьих, подобные задачи относятся к задачам большой размерности, т.е. в них идет речь не о 5 или максимум 7 факторах, как в факторном анализе, а о сотнях и тысячах.  В четвертых исходные данные зашумлены и требуют устойчивых методов. В-пятых, экологические  факторы взаимосвязаны и требуют нелинейных непараметрических подходов. Для решения этих проблем предлагается применить новую инновационную интеллектуальную технологию: автоматизированный системно-когнитивный анализ и его программный инструментарий – систему «Эйдос». Приводится краткий численный пример оценки влияния экологических факторов на продолжительность жизни и причины смерти

 

«Системы искусственного интеллекта позволяют решать сложнейшие проблемы, которые не возникали, пока этих систем не было»

/Mahaguru I.T./

5.1.1. Формулировка проблемы

 

Все в принципе согласны с тем, что «хорошая экология – это хорошо, а плохая экология – это плохо».  Чтобы дать подобную оценку на качественном уровне нет необходимости в проведении каких-то специальных научных исследований, т.е. это не сложно. Соответственно и влияние подобных малосодержательных по существу выводов на экологическое сознание и на принятие решений руководителями различных уровней не недостаточно.

Чтобы повысить обоснованность подобных выводов и их вес в формировании экологического сознания необходимо количественно оценить силу и направление влияния разнородных экологических факторов, например, таких как уровень загрязнения окружающей среды (воздуха, вод и почв), на какие-то значимые интегральные показатели, непосредственно касающиеся основной массы населения, например на качество жизни населения региона [1-4].

Совершенно четко однозначно сформулируем основополагающую на наш взгляд мысль: «Экология важна не только сама по себе, но и потому, что она оказывает существенное влияние на то, что важно для нас: на наше физическое и психическое здоровье, качество жизни, рождаемость и смертность, физическая продолжительность жизни, а также продолжительность активной и творческой жизни и работоспособного состояния и многое-многое другое».

Чтобы исследовать влияние экологических факторов на все эти аспекты жизни недостаточно лишь экологических баз данных о степени загрязнения земли, воды, воздуха, пищи, строительных материалов, одежды, мебели, игрушек и т.п. и т.д. Необходимы также базы данных, отражающие наше физическое и психическое здоровье, качество жизни, рождаемость и смертность, продолжительность жизни, продолжительность активной и творческой жизни и работоспособного состояния. И все эти базы данных необходимо обрабатывать совместно в сопоставимой форме по одной методологии, технологии и методике и в одной реализующей их программной системе. Проблема состоит не в том, что такой методологии, технологии, методики программной системы нет, т.к. они есть, а в том, что они совершенно неизвестны специалистам в конкретных областях, для которых они предназначены, в частности совершенно неизвестны экологам.

 

5.1.2. Традиционные подходы к решению проблемы и их недостатки

 

Экологи до сих пор надеются на то, что их задачи позволит решить MS Excel и системы «Статистика» и SPSS. Но постепенно их иллюзии рассеиваются, и они начинают понимать, что возможности инструмента решения проблемы должны соответствовать сложности проблемы, и что для этого малопригодны математические методы, разработанные 100 лет назад и более, например факторный анализ.

Экологи с завидным упорством пытаются применять эти методы, однако оказывается, что корректно сделать это довольно проблематично по целому ряду вполне объективных, независимых от исследователей, реально имеющих место причин. Мы назовем лишь некоторые из них.

Во-первых, это отсутствие или малодоступность необходимых для подобных исследований исходных данных. Те же данные, которые все же удается найти, охватывают небольшие периоды наблюдений (малый лонгитюд), а их восполнение, в т.ч. путем проведения экспериментов, принципиально невозможно. В результате невозможно требовать от таких данных полных повторностей, что является необходимым условием корректно применения факторного анализа.

Во-вторых,  экологические факторы описываются разнородными показателями, измеренными в различных типах измерительных шкал (номинальных, порядковых и числовых) и в различных единицах измерения. Математические методы сопоставимой обработки подобных данных, а также реализующий эти методы программный инструментарий, фактически отсутствуют. 

В-третьих, подобные задачи относятся к задачам большой размерности, т.е. в них идет речь не о 5 или максимум 7 факторах, как в факторном анализе, а о сотнях и тысячах.  Обычно в руководствах по факторному анализу начинаются с сакраментальной фразы: «Выберем небольшое число наиболее важных факторов, которые будем исследовать». Но при этом авторы этих руководств благоразумно воздерживаются от рассмотрения методологических, методических и практических подходов к тому, как это сделать, т.к. они просто отсутствуют или малоизвестны, как и необходимый для этого программный инструментарий. На практике обычно все сводится не к исследованию объекта, который надо исследовать, а к исследованию данных, которые фактически есть и удовлетворяют этим жестким требованиям, но мягко говоря, не очень полно отражают исследуемый объект.

В-четвертых, факторный анализ является неустойчивым методом  в том смысле, что, даже небольшие вариации значений исходных данных приводят к сильному изменению результатов применения метода, т.е. требует, чтобы исходные данные были абсолютно точными. Ясно, что реальные исходные данные сильно зашумлены и не удовлетворяют этому требованию. Да и даже в принципе вряд ли можно всерьез говорить о каких-то гипотетических абсолютно точных данных, т.е. ясно, что это некая абстракция, которой в полной мере практически ничего в действительности не соответствует.

В-пятых, факторный анализ является линейным, параметрическим методом, т.е. требует выполнения нормального распределения и независимости исследуемых факторов. Дело в том, что нормальное распределение выполняется только при действии большого числа случайных и независимых друг от друга аддитивных факторов, а на практике они конечно не случайны и часто взаимозависимы, не аддитивны, зависят от каких-то третьих более фундаментальных факторов.

 

5.1.3. Предлагаемое решение проблемы с применением АСК-анализа и системы «Эйдос»

 

Для решения подобных задач предлагается применить новую инновационную интеллектуальную технологию: автоматизированный системно-когнитивный анализ (АСК-анализ) и его программный инструментарий – систему «Эйдос».

АСК-анализ имеет ряд особенностей, которые обусловили его выбор в качестве метода решения проблемы:

1.      Имеет теоретическое обоснование, основой которого является семантическая мера целесообразности информации А.Харкевича.

2.      Обеспечивает корректную сопоставимую количественную обработку разнородных по своей природе взаимосвязанных факторов, измеряемых в различных единицах измерения, высокую точность и независимость результатов расчетов от единиц измерения исходных данных.

3.      Обеспечивает построение многомерных моделей объекта моделирования непосредственно на основе неполных (фрагментированных) и зашумленных (искаженных) эмпирических данных о нем.

4.      Имеет развитую и доступную программную реализацию в виде универсальной когнитивной аналитической системы «Эйдос» (открытое программное обеспечение: http://lc.kubagro.ru/aidos/_Aidos-X.htm).

Об АСК-анализе написано довольно много. На момент написания данной статьи это 21 монография и учебное пособие [5-25] и сотни статей в изданиях, входящих в Перечень ВАК РФ [26]. На программный инструментарий АСК-анализа – интеллектуальную систему «Эйдос» и различные ее режимы и подсистемы получено 27 свидетельств РосПатента [27]. Краткое описание АСК-анализа дано в работе [28], в которой есть и основные необходимые ссылки.

По этим причинам нет необходимости в описании теоретических основ, математической модели, методики численных расчетов (т.е. алгоритмов и структур данных) и программного инструментария АСК-анализа и мы кратко остановимся лишь на двух ключевых моментах: метризации измерительных шкал и нелинейности моделей в АСК-анализе.

 

 

 

 

5.1.4. Суть метода АСК-анализа – преобразование исходных данных в информацию, а ее в знания путем метризации измерительных шкал

 

АСК-анализ представляет собой один из современных инновационных методов искусственно интеллекта, который имеет теоретическое обоснование и оснащен широко и успешно апробированным универсальным программным инструментарием, позволяющим решить эти вопросы не только как обычно на теоретическом концептуальном уровне, но и на практике [5, 29].

Модели знаний АСК-анализа основаны на нечеткой декларативной модели представления знаний, предложенной автором в 1979 году и являющейся гибридной моделью, сочетающей в себе преимущества фреймовой, нейросетевой и четкой продукционной моделей и обеспечивающей создание моделей очень больших размерностей до 10 млн. раз превышающих максимальные размерности моделей знаний экспертных систем с четкими продукциями:

– от фреймовой модели модель представления знания системы «Эйдос» отличается существенно упрощенной программной реализацией и более высоким быстродействием без потери функциональности;

– от нейросетевой тем, что обеспечивает хорошо обоснованную теоретически содержательную интерпретацию весовых коэффициентов на рецепторах и обучение методом прямого счета;

– от четкой продукционной модели – нечеткими продукциями, представленными в декларативной форме, что обеспечивает эффективное использование знаний без их многократной генерации для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемого объекта.

АСК-анализ является непараметрическим методом, устойчивым к шуму в исходных данных, позволяющий корректно обрабатывать неполные (фрагментированные) исходные данные, описывающие воздействие взаимозависимых факторов на нелинейный объект моделирования.

Суть метода АСК-анализа в том, что он позволяет рассчитать на основе исходных данных какое количество информации содержится в значениях факторов, обуславливающих переходы объекта моделирования в различные будущие состояния, причем как в желательные, так и в нежелательные [9][1].

Он состоит в целенаправленном последовательном повышении степени формализации исходных данных до уровня, который позволяет ввести исходные данные в компьютерную систему, а затем преобразовать исходные данные в информацию; информацию преобразовать в знания; использовать знания для решения задач прогнозирования, принятия решений и исследования предметной области.

Рассмотрим подробнее вопросы выявления, представления и использования знаний в АСК-анализе и системе «Эйдос».

Данные – это информация, записанная на каком-либо носителе или находящаяся в каналах связи и представленная на каком-то языке или в системе кодирования и рассматриваемая безотносительно к ее смысловому содержанию.

Исходные данные об объекте управления обычно представлены в форме баз данных, чаще всего временных рядов, т.е. данных, привязанных ко времени. В соответствии с методологией и технологией автоматизированного системно-когнитивного анализа (АСК-анализ) для управления и принятия решений использовать непосредственно исходные данные не представляется возможным. Точнее сделать это можно, но результат управления  при таком подходе оказывается мало чем отличающимся от случайного. Для реального же решения задачи управления необходимо предварительно преобразовать данные в информацию, а ее в знания о том, какие воздействия на объект моделирования к каким его изменениям приводят.

Информация есть осмысленные данные.

Смысл данных, в соответствии с концепцией смысла Шенка-Абельсона, состоит в том, что известны причинно-следственные зависимости между событиями, которые описываются этими данными. Таким образом, данные преобразуются в информацию в результате операции, которая называется «Анализ данных», которая состоит из двух этапов:

1. Выявление событий в данных (разработка классификационных и описательных шкал и градаций и преобразование с их использованием исходных данных в обучающую выборку, т.е. в базу событий – эвентологическую базу).

2. Выявление причинно-следственных зависимостей между событиями.

В случае систем управления событиями в данных являются совпадения определенных значений входных факторов и выходных параметров объекта управления, т.е. по сути, случаи перехода объекта управления в определенные будущие состояния под действием определенных сочетаний значений управляющих факторов. Качественные значения входных факторов и выходных параметров естественно формализовать в форме лингвистических переменных. Если же входные факторы и выходные параметры являются числовыми, то их значения измеряются с некоторой погрешностью и фактически представляют собой интервальные числовые значения, которые также могут быть представлены или формализованы в форме лингвистических переменных (типа: «малые», «средние», «большие» значения экономических показателей).

Какие же математические меры могут быть использованы для количественного измерения силы и направления причинно-следственных зависимостей?

Наиболее очевидным ответом на этот вопрос, который обычно первым всем приходит на ум, является: «Корреляция». Однако, в статистике это хорошо известно, что это совершенно не так.  Для преобразования исходных данных в информацию необходимо не только выявить события в этих данных, но и найти причинно-следственные связи между этими событиями. В АСК-анализе предлагается 7 количественных мер причинно-следственных связей, основной из которых является семантическая мера целесообразности информации по А.Харкевичу.

Знания – это информация,  полезная для достижения целей[2].

Значит для преобразования информации в знания необходимо:

1. Поставить цель (классифицировать будущие состояния моделируемого объекта на целевые и нежелательные).

2. Оценить полезность информации для достижения этой цели (знак и силу влияния).

Второй пункт, по сути, выполнен при преобразовании данных в информацию. Поэтому остается выполнить только первый пункт, т.к. классифицировать будущие состояния объекта управления как желательные (целевые) и нежелательные.

Знания могут быть представлены в различных формах, характеризующихся различной степенью формализации:

 – вообще неформализованные знания, т.е. знания в своей собственной форме, ноу-хау (мышление без вербализации есть медитация);

– знания, формализованные в естественном вербальном языке;

– знания, формализованные в виде различных методик, схем, алгоритмов, планов, таблиц и отношений между ними (базы данных);

– знания в форме технологий, организационных, производственных, социально-экономических и политических структур;

– знания, формализованные в виде математических моделей и методов представления знаний в автоматизированных интеллектуальных системах (логическая, фреймовая, сетевая, продукционная, нейросетевая, нечеткая и другие).

Таким образом, для решения сформулированной проблемы необходимо осознанно и целенаправленно последовательно повышать степень формализации исходных данных до уровня, который позволяет ввести исходные данные в интеллектуальную систему, а затем:

– преобразовать исходные данные в информацию;

– преобразовать информацию в знания;

– использовать знания для решения задач управления, принятия решений и исследования предметной области.

Соответственно, АСК-анализ имеет следующее этапы:

АСК-анализ имеет следующие этапы [5-25]:

– когнитивно-целевая структуризация предметной области;

– формализация предметной области (формирование классификационных и описательных шкал и градаций и обучающей выборки);

– синтез и верификация статистических и системно-когнитивных моделей;

– решение задач идентификации, прогнозирования, принятия решений и исследования предметной области в наиболее достоверных из созданных моделей.

Единственный неавтоматизированный в системе «Эйдос» этап – это первый, а остальные приведены на рисунках 1 и 2:

 

Рисунок 1 – Соотношение содержания понятий:
«Данные», «Информация», «Знания»

Рисунок 2 – Этапы последовательного повышения степени формализации модели от данных к информации, а от нее к знаниям

 

После выполнения когнитивной структуризации и формализации предметной области осуществляется синтез статистических моделей и моделей знаний, в которых все шкалы, в которых описаны исходные данные, преобразуются к одному типу: числовому, и к одним единицам измерения: единицам измерения информации, т.е. проводится метризация шкал. В настоящее время в системе «Эйдос» применяется 7 способов метризации шкал [29].

В АСК-анализе факторы формально описываются шкалами, а значения факторов – градациями шкал. Существует три основных группы факторов: физические, социально-экономические и психологические (субъективные) и в каждой из этих групп есть много различных видов факторов, т.е. есть много различных физических факторов, много социально-экономических и много психологических, но в АСК-анализе все они рассматриваются с одной единственной точки зрения: сколько информации содержится в их значениях о переходе объекта, на который они действуют, в определенное состояние, и при этом сила и направление влияния всех значений факторов на объект измеряется в одних общих для всех факторов единицах измерения: единицах количества информации.

Именно по этой причине вполне корректно складывать (в аддитивных интегральных критериях) силу и направление влияния всех действующих на объект значений факторов, независимо от их природы, и определять результат совместного влияния на объект системы значений факторов.

При этом в общем случае объект является нелинейным и факторы внутри него взаимодействуют друг с другом, т.е. для них не выполняется принцип суперпозиции. АСК-анализ позволяет создавать и применять нелинейные модели влияния взаимосвязанных факторов на сложные объекты управления, т.к. является непараметрическим методом  [30].

Кратко рассмотрим численный пример применения АСК-анализа и системы «Эйдос» для моделирования влияния экологических факторов на качество жизни населения региона, а именно на один из основных интегральных показателей качества жизни – ее продолжительность.

 

5.1.5. Краткий численный пример

5.1.5.1. Источники исходных данных

 

Для создания модели, отражающей влияние экологических факторов на продолжительность жизни в России, использовались данные Федеральной службы государственной статистики[3] по регионам России, с одной стороны по продолжительности жизни, а с другой стороны – по экологии:

– данные по продолжительности жизни при рождении по регионам России (ожидаемая) за 2013 год взята с сайта: http://www.statdata.ru/spg_reg_rf;

– данные по числу умерших по регионам России с указанием причин на странице: «Социальное положение и уровень жизни населения России»: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalog/doc_1138698314188

 Приложение к сборнику (информация по субъектам Российской Федерации), 2014г. (0,3 Мб)

http://www.gks.ru/free_doc/doc_2014/pril_soc-pol2014.rar

– данные по экологическим факторам по регионам России на странице: «Охрана окружающей среды в России»: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalog/doc_1139919459344

 Приложение к сборнику (информация в разрезе субъектов Российской Федерации), 2014г. (0,4 Мб)

http://www.gks.ru/free_doc/doc_2014/Pril-ohrana.rar

Все эти данные из различных источников были собраны в одном Excel-файле, приведенном в таблице 1:

 

 

Таблица 1 – Исходные данные по регионам России для модели влияния экологических факторов на продолжительность жизни и причины смерти

Для объединения этих данных в одной таблице были убраны строки по федеральным округам и произведена одинаковая сортировка по регионам России. Кроме того некоторые итоговые колонки, которых не было в исходных данных, получены расчетным путем.

Из таблицы 1 видно, что сами данные приведены в различных единицах измерения из-за чего их совместная сопоставимая обработка в одной модели представляет собой проблему. Эта проблема решается в АСК-анализе путем метризации шкал и представления всех данных в одних единицах измерения: единицах количества информации [29].

Отметим также, что файл исходных данных, представленный в таблице 1, соответствует требованиями универсального программного интерфейса системы «Эйдос» с внешними базами данных (рисунок 3):

Рисунок 3 – Экранная форма с требованиями к файлу исходных данных
(Help - универсального программного интерфейса системы «Эйдос»
с внешними базами данных)

 

5.1.5.2. Когнитивно-целевая структуризация
и формализация предметной области

 

Далее в соответствии с этапами АСК-анализа выполняем когнитивную структуризацию и формализацию предметной области.

В результате когнитивной структуризации мы решаем, что и на основе чего мы хотим узнать. В данном случае мы хотим выяснить какова сила и направление влияния экологических факторов на продолжительность жизни причины смерти по регионам России.

В таблице 1 соответствующие колонки с классификациоными шкалами выделены ярко-желтым и светло-желтым фоном, а с описательными шкалами – светло-зеленым и светло-голубым фоном.

В результате формализация предметной области база исходных данных, представленная в таблице 1, нормализуется, т.е. разрабатываются справочники классификационных и описательных шкал и градаций, с использованием которых исходные данные кодируются и создаются база событий (эвентологическая база данных) и обучающая выборка (рисунок 2).

Для автоматической формализации предметной области выполняем в системе «Эйдос» режим 2.3.2.2 с параметрами, указанными на рисунке 4.

После запуска этого режима за заднем фоне за всеми конами появится окно:

 

на котором нужно выбрать вариант «Сохранить» или «Не сохранять». Это окно появляется потому, что в Excel-файле есть несколько страниц и расчетные колонки.

После этого появляется окно внутреннего калькулятора (рисунок 5), на котором надо задать по 5 градаций и в классификационных, и описательных шкалах и градациях, затем «Пересчитать шкалы и градации» и затем «Выйти на создание модели». Именно 5 градаций на шкалах рекомендуется выбрать в связи с малым объемом выборки, чтобы все интервальные значения были представлены наблюдениями.

 

Рисунок 4 – Экранная форма универсального программного интерфейса
системы «Эйдос» с внешними базами данных)

Рисунок 5 – Экранная форма внутреннего калькулятора универсального программного интерфейса системы «Эйдос» с внешними базами данных)

 

Формализация предметной области происходит быстро (за 2 секунды). При том выполняются этапы, перечисленные на экранной форме отображения стадии исполнения, представленной на рисунке 6:

 

Рисунок 6 – Итоговая экранная форма отображения стадии
исполнения этапа формализации предметной области

 

5.1.5.3. Синтез и верификация модели

 

Этот этап АСК-анализа выполняется в режиме 3.5 системы «Эйдос» при следующих параметрах (рисунок 7):

Рисунок 7 – Экранная форма параметров синтеза и верификации модели

 

На рисунке 8 показана итоговая форма этого режима:

Рисунок 8 – Итоговая экранная форма отображения стадии
исполнения этапа синтеза и верификации модели

 

В результате созданы и верифицированы все модели, приведенные на рисунках 2 и 7. Видно, что этот процесс занял 1 минуту 38 секунд.

Из формы, представленной на рисунке 9, видно, что достоверность моделей знаний достаточно высока для данной предметной области, на основе чего можно говорить об определенной степени зависимости продолжительности жизни и причин смерти от экологической обстановки:

Рисунок 9 – Экранная форма с оценкой достоверности моделей с разными частными и интегральными критериями на основе предложенной автором метрики, сходной с F-критерием, но не предполагающей нормальность распределения, а лишь интегрально учитывающей верные и ошибочные результаты идентификации и не идентификации

 

Из экранной формы на рисунке 9 видно также, что модели знаний имеют примерно на 20% более высокую достоверность, чем статистические модели, которые работают по принципу положительного псевдопрогноза (рисунок 10):

Рисунок 10 – Экранная форма с описанием видов прогнозов с точки зрения оценки их достоверности на основе предложенной автором метрики, сходной с F-критерием

Ниже приведены фрагменты моделей Abs, Prc2 и Inf1 (рисунок 11):

 

 

Рисунок 11 – Фрагменты моделей Abs, Prc2 и Inf1

 

На основе модели Abs (матрица абсолютных частот) принимать решения не целесообразно из-за ее низкой достоверности (рисунок 9) и разного количества примеров по классам (обобщенным категориям).

В модели Prc2 (условные и безусловные процентные распределения) зависимость представленных в модели значений от числа примеров по классам снята, но достоверность у нее такая же низкая, как у Abs. Кроме того для принятия решений на основе той модели необходимо вручную сравнивать значения условных и безусловных вероятностей, что трудоемко и едва ли возможно при больших размерностях моделей.

Модель знаний Inf1, основанная на мере А.Харкевича, получена в результате автоматизированного сравнения значения условных и безусловных вероятностей, представленных в модели Prc1, сходной с Prc2, и имеет довольно высокую достоверность[4].

Поэтому в соответствии с технологией АСК-анализа преобразования данных в информацию, а ее в знания (рисунки 1 и 2) именно модель Inf1 будем использовать для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области, путем исследования ее модели.

 

5.1.5.4. Решение задач на основе созданной модели

 

Задачи идентификации и прогнозирования отличаются тем, что при идентификации действующие факторы и состояние объекта моделирования относятся к одному моменту времени, а при прогнозировании факторы относятся к настоящему, а состояние объекта, на который они действуют – к будущему. В остальном они практически не отличаются.

В системе «Эйдос» есть много экранных форм и Excel-отчетов, отображающих результаты идентификации и прогнозирования:

 

из которых на рисунке 14 приведены лишь первые две.

Для их получения в модели Inf1, в соответствии с рисунком 2, сделаем ее текущей (рисунок 12) и проведем в ней идентификацию и прогнозирование (рисунок 13):

 

Рисунок 12 – Итоговая экранная форма отображения стадии
исполнения придания модели Inf1 статуса текущей модели

 

Рисунок 13 – Итоговая экранная форма отображения стадии
пакетного распознавания (идентификации, прогнозирования) в модели Inf1

 

5.1.5.4.1. Идентификация и прогнозирование

Некоторые примеры экранных форм с результатами решения задачи идентификации и прогнозирования приведены на рисунке 14:

 

 

Рисунок 14 – Экранные формы с результатами
идентификации и прогнозирования

 

5.1.5.4.2. Принятие решений

 

Принятие решения – это задача, обратная задаче прогнозирования. Если при прогнозировании мы по значениям действующих факторов определяем будущее состояние объекта управления, то при принятии решений мы наоборот, по будущему состоянию (желательному, целевому, или наоборот нежелательному, а вообще говоря по любому исследуемому) определяем какие значения факторов его обуславливают, т.е. вызывают переход объекта управления в это состояние.

Отметим, что как только мы информацию, содержащуюся в моделях Inf1 – Inf7, начинаем использовать для принятия решений, для достижения целей, для управления, она сразу становится знаниями (см. раздел 4 и рисунки 1 и 2).

В системе «Эйдос» есть много различных режимов и выходных форм, содержащих знания для принятия решений. Приведем экранные формы, получающиеся в двух из них (4.2.1 и 4,4,10). Для сопоставимости с результатами, представленными на рисунке 14, выберем класс с кодом 3 для исследования его системы детерминации (рисунки  15 и 16):

Рисунок 15 – Экранная форма, отображающая систему детерминации класса

 

 

Рисунок 16 – Экранная форма, отображающая систему детерминации класса

 

На всех формах красным показаны значения факторов, способствующие достижению этого результата, а синим – препятствующие. Сила влияния (значимость) выражена в битах.

 

5.1.5.4.3. Исследование моделируемого объекта

Если модель объекта достаточно адекватна, то ее исследование корректно считать исследованием самого моделируемого объекта. В нашем случае это именно так.

Прежде всего, приведем Паретто-кривую значимости градаций описательных шкал, т.е. значений экологических факторов (рисунок 17).

 

Рисунок 17 – Паретто-кривая значимости значений экологических факторов

 

И нее хорошо видно, что в модели Inf4 около 50% суммарного влияния всех значений экологических факторов обусловлено всего 15% от их числа, а остальные 85% все вместе играют примерно такую же роль, как этих 15 наиболее сильно влияющих. По-видимому, на этих наиболее сильно влияющих значениях факторов и следует сосредоточить основное внимание при планировании и проведении экологических мероприятий.

В заключение приведем одну из когнитивных функций (рисунок 18), которая отражает, какое количество информации содержится в значениях аргумента о значениях функции [31].

В когнитивной функции количество информации в аргументе о значении функции отображено цветом. Аппроксимация сделана на основе предложенной автором модификации взвешенного метода наименьших квадратов путем применения в качестве весов наблюдений количества информации в аргументе о значении функции [32, 33, 34]. Ширина полосы аппроксимации обратно пропорциональна количеству информации.

Рисунок 18 – Количество информации о продолжительности жизни
(оба пола), в сведениях о доле (от всех выбросов) выбросов загрязняющих
веществ в атмосферу от стационарных источников

 

Видно, что чем больше в общем объеме выбросов доля выбросов загрязняющих веществ в атмосферу от стационарных источников, тем меньше продолжительность жизни (по обоим полам), т.е. зависимость между ними практически обратно пропорциональная. Этот факт можно содержательно объяснить особой опасностью для человека выбросов именно от стационарных источников по сравнению с другими. Отсюда следует научно-обоснованная рекомендация уделить особое внимание уменьшению именно этой категории выбросов. В соответствии с методологией Функционально-стоимостного анализа и «Директ-Костинг» это может быть наиболее эффективными затратами на экологию, от которых есть основания ожидать наиболее ощутимого эффекта (рентабельности) в улучшении здоровья населения.

Система «Эйдос» обеспечивает автоматизацию SWOT-анализа [35].

SWOT-анализ является широко известным и общепризнанным метод стратегического планирования. Однако это не мешает тому, что он подвергается критике, часто вполне справедливой, обоснованной и хорошо аргументированной. В результате критического рассмотрения SWOT-анализа выявлено довольно много его слабых сторон (недостатков), источником которых является необходимость привлечения экспертов, в частности для оценки силы и направления влияния факторов. Ясно, что эксперты это делают неформализуемым путем (интуитивно), на основе своего профессионального опыта и компетенции.  Но возможности экспертов имеют свои ограничения и часто по различным причинам они не могут и не хотят это сделать. Таким образом, возникает проблема проведения SWOT-анализа без привлечения экспертов. Эта проблема может решаться путем автоматизации функций экспертов, т.е. путем измерения силы и направления влияния факторов непосредственно на основе эмпирических данных. Подобная технология разработана давно, ей уже около 30 лет, но она малоизвестна – это интеллектуальная система «Эйдос». В статье на реальном численном примере подробно описывается возможность проведения количественного автоматизированного SWOT-анализа средствами АСК-анализа и интеллектуальной системы «Эйдос-Х++» без использования экспертных оценок непосредственно на основе эмпирических данных.  Предложено решение прямой и обратной задач SWOT-анализа. PEST-анализ рассматривается как SWOT-анализ, с более детализированной классификацией внешних факторов. Поэтому выводы, полученные в данном разделе на примере SWOT-анализа, можно распространить и на PEST-анализ [35].

Ниже приведены SWOT-матрица и SWOT-диаграмма влияния экологических факторов на достижение высокой продолжительности жизни (рисунок 19).

Когнитивная диаграмма значений экологических факторов отражает их сходство и различие по тем параметрам качества жизни населения региона, которые они обуславливают.

Необходимо отметить, что величина сходства и различия в когнитивных диаграммах получена в результате расчета матриц сходства на основе моделей знаний, а не в результате неформализуемых экспертных оценок на основе интуиции и профессиональной компетенции («на глазок»).

 

 

Рисунок 19 – SWOT-матрица и SWOT-диаграмма влияния экологических факторов
на достижение высокой продолжительности жизни

 

На рисунке 20 приведена когнитивная диаграмма классов, а на рисунке 21 – признаков.

Рисунок 20. Когнитивная диаграмма классов, соответствующих
параметрам качества жизни

 

Рисунок 20. Когнитивная диаграмма значений экологических факторов

Когнитивная диаграмма классов отражает их сходство и различие по системе обуславливающих их значений экологических факторов.

 

5.1.6. Выводы

В статье предложена и продемонстрирована на численном примере возможность исследования влияния экологических факторов на уровень качества жизни региона с применением АСК-анализа и системы «Эйдос».

Отметим, что в статье отражена лишь небольшая доля возможностей исследования моделей, предоставляемых системой «Эйдос».

Материалы данного раздела могут быть использованы при преподавании дисциплин: интеллектуальные системы; инженерия знаний и интеллектуальные системы; интеллектуальные технологии и представление знаний; представление знаний в интеллектуальных системах; основы интеллектуальных систем; введение в нейроматематику и методы нейронных сетей; основы искусственного интеллекта; интеллектуальные технологии в науке и образовании; управление знаниями; автоматизированный системно-когнитивный анализ и интеллектуальная система «Эйдос»; которые автор ведет в настоящее время[5], а также и в других дисциплинах, связанных с преобразованием данных в информацию, а ее в знания и применением этих знаний для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области (а это практически все дисциплины во всех областях науки).

Этим и другим применениям должно способствовать и то, что система «Эйдос» находится в полном открытом бесплатном доступе (с открытыми исходными текстами) на сайте автора по адресу: http://lc.kubagro.ru/aidos/_Aidos-X.htm.

Данный раздел посвящен краткому описанию возможностей исследования влияния экологических факторов на качество жизни, предоставляемых АСК-анализом и системой «Эйдос». Выше говорилось о том, что совершенно аналогично можно исследовать влияние экологии и на другие самые различные аспекты природы и общества, благо исходные данные достаточные для этого сегодня есть в открытом доступе. Но подробнее рассмотреть собственно экологические результаты в данной работе проблематично из-за ее ограниченного объема и это планируется сделать в последующих публикациях.

5.1.7. Предложения

Предлагается создать региональный центр автоматизированных системно-когнитивных исследований. Область деятельности такого центра может быть весьма широка и позволяет поставить на регулярную основу исследования и разработки подобные тем, которые проводились автором на протяжении многих лет [1-34][6].

 

5.2. Системно-когнитивные модели прогнозирования
развития многоотраслевой агропромышленной
корпорации

 

5.2.1. Когнитивно-целевая структуризация
и формализация предметной области

 

В данном разделе в соответствии с методологией Автоматизированного системно-когнитивного анализа (АСК-анализ) рассматривается реализация 1-го и 2-го этапов АСК-анализа: когнитивной структуризации и формализации предметной области.  На этапе когнитивной структуризации предметной области, исследователи решают, что рассматривать в качестве объекта моделирования, влияющих на него факторов и результатов их действия. В соответствии с результатами когнитивной структуризации подготавливаются база исходных данных для исследования (обучающая выборка или база прецедентов). На этапе формализации предметной области база исходных данных нормализуются, т.е. разрабатываются классификационные и описательные шкалы и градации, и с их использованием база исходных данных кодируется. В результате формируется база событий (эвентологическая база данных) и обучающая выборка. Этап когнитивной структуризации и подготовки исходных данных не формализован, а этап формализации предметной области полностью автоматизирован и выполняются непосредственно с применением универсальной когнитивной аналитической системы «Эйдос», которая является программным инструментарием АСК-анализа. Этапы когнитивной структуризации и формализации предметной области АСК-анализа являются первыми этапами преобразования данных в информацию, а ее в знания. Последующие этапы: синтез и верификация системно-когнитивной модели, решение задач идентификации, прогнозирования и принятия решений, а также исследования моделируемого объекта путем исследования его модели планируется рассмотреть в будущих работах

 

Автоматизированный системно-когнитивный анализ (АСК-анализ) предложен в 2002 году проф. Е.В.Луценко [1]. Это инновационный метод искусственного интеллекта, оснащенный общедоступным программным инструментарием, в качестве которого в настоящее время выступает универсальная когнитивная аналитическая система «Эйдос» [2]. Скачать и запустить систему «Эйдос» (самую новую на текущий момент версию) или обновление системы до текущей версии всегда можно здесь: http://lc.kubagro.ru/aidos/_Aidos-X.htm. Это наиболее полная на данный момент незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (около 50 Мб). Обновление имеет объем около 3 Мб. АСК-анализ – это непараметрический метод, позволяющий исследователь сложные нелинейные объекты управления на основе неполных, зашумленных данных о них большой размерности, измеренных в различных типах шкал и различных единицах измерения [3].

Эти особенности АСК-анализа обусловили его выбор в качестве метода создания системно-когнитивной модели прогнозирования развития многоотраслевой агропромышленной корпорации. Авторы имеют опыт решения подобных задач в АПК [4-19].

АСК-анализ обеспечивает преобразование исходных данных в информацию, а ее в знания [1], и включает следующие этапы:

1. Когнитивная структуризация предметной области.

2. Формализация предметной области.

3. Синтез и верификация системно-когнитивной модели.

4. Решение задач идентификации, прогнозирования и принятия решений.

5. Исследование моделируемого объекта путем исследования его системно-когнитивной модели.

Содержание понятий: «Данные», «Информация» и «Знания» и последовательность преобразования данных в информацию, а ее в знания в АСК-анализе и системе «Эйдос» рассмотрены в ряде работ по АСК-анализу[7].

Данные – это информация, записанная на каком-либо носителе или находящаяся в каналах связи и представленная на каком-то языке или в системе кодирования и рассматриваемая безотносительно к ее смысловому содержанию.

Исходные данные об объекте управления обычно представлены в форме баз данных, чаще всего временных рядов, т.е. данных, привязанных ко времени. В соответствии с методологией и технологией автоматизированного системно-когнитивного анализа (АСК-анализ), для управления и принятия решений использовать непосредственно исходные данные не представляется возможным. Точнее сделать это можно, но результат управления  при таком подходе оказывается мало чем отличающимся от случайного. Для реального же решения задачи управления необходимо предварительно преобразовать данные в информацию, а ее в знания о том, какие воздействия на корпорацию к каким ее изменениям обычно, как показывает опыт, приводят.

Информация есть осмысленные данные.

Смысл данных, в соответствии с концепцией смысла Шенка-Абельсона, состоит в том, что известны причинно-следственные зависимости между событиями, которые описываются этими данными. Таким образом, данные преобразуются в информацию в результате операции, которая называется «Анализ данных», которая состоит из двух этапов:

1. Выявление событий в данных (разработка классификационных и описательных шкал и градаций и преобразование с их использованием исходных данных в обучающую выборку, т.е. в базу событий – эвентологическую базу).

2. Выявление причинно-следственных зависимостей между событиями.

В случае систем управления событиями в данных являются совпадения определенных значений входных факторов и выходных параметров объекта управления, т.е. по сути, случаи перехода объекта управления в определенные будущие состояния под действием определенных сочетаний значений управляющих факторов. Качественные значения входных факторов и выходных параметров естественно формализовать в форме лингвистических переменных. Если же входные факторы и выходные параметры являются числовыми, то их значения измеряются с некоторой погрешностью и фактически представляют собой интервальные числовые значения, которые также могут быть представлены или формализованы в форме лингвистических переменных (типа: «малые», «средние», «большие» значения экономических показателей).

Какие же математические меры могут быть использованы для количественного измерения силы и направления причинно-следственных зависимостей?

Наиболее очевидным ответом на этот вопрос, который обычно первым всем приходит на ум, является: «Корреляция». Однако, в статистике это хорошо известно, что это совершенно не так.  Для преобразования исходных данных в информацию необходимо не только выявить события в этих данных, но и найти причинно-следственные связи между этими событиями. В АСК-анализе предлагается 7 количественных мер причинно-следственных связей, основной из которых является семантическая мера целесообразности информации по А.Харкевичу [3].

Знания – это информация,  полезная для достижения целей.

Значит для преобразования информации в знания необходимо:

1. Поставить цель (классифицировать будущие состояния моделируемого объекта на целевые и нежелательные).

2. Оценить полезность информации для достижения этой цели (знак и силу влияния).

Второй пункт, по сути, выполнен при преобразовании данных в информацию. Поэтому остается выполнить только первый пункт, т.к. классифицировать будущие состояния объекта управления как желательные (целевые) и нежелательные.

Знания могут быть представлены в различных формах, характеризующихся различной степенью формализации:

 – вообще неформализованные знания, т.е. знания в своей собственной форме, ноу-хау (мышление без вербализации есть медитация);

– знания, формализованные в естественном вербальном языке;

– знания, формализованные в виде различных методик, схем, алгоритмов, планов, таблиц и отношений между ними (базы данных);

– знания в форме технологий, организационных, производственных, социально-экономических и политических структур;

– знания, формализованные в виде математических моделей и методов представления знаний в автоматизированных интеллектуальных системах (логическая, фреймовая, сетевая, продукционная, нейросетевая, нечеткая и другие).

Таким образом, для решения сформулированной проблемы необходимо осознанно и целенаправленно последовательно повышать степень формализации исходных данных до уровня, который позволяет ввести исходные данные в интеллектуальную систему, а затем:

– преобразовать исходные данные в информацию;

– преобразовать информацию в знания;

– использовать знания для решения задач управления, принятия решений и исследования предметной области.

В данной работе в соответствии с методологией Автоматизированного системно-когнитивного анализа (АСК-анализ) рассматривается реализация 1-го и 2-го этапов АСК-анализа: когнитивной структуризации и формализации предметной области.  На этапе когнитивной структуризации предметной области исследователи решают, что рассматривать в качестве объекта моделирования, влияющих на него факторов и результатов их действия.

В данном случае в качестве объекта моделирования рассматривается многоотраслевая агропромышленная корпорация («Холдинг»), в качестве факторов, влияющих на ее развитие: Выручка от  реализации (Отгрузка), Себестоимость приобретения, Валовая прибыль, Коммерческие расходы, Чистая прибыль, текущие и за 4 последним квартала по предприятиям, входящим в холдинг, а в качестве прогнозируемых показателей – эти показатели по холдингу в целом в двух следующих кварталах.

В соответствии с результатами когнитивной структуризации подготавливаются база исходных данных для исследования (обучающая выборка или база прецедентов) (таблица 1):

Таблица 1 – Исходные данные (фрагмент)

Наименование шкалы

Тип данных

2000г., 1 кв.

2000г., 2 кв.

2000г., 3 кв.

2000г., 4 кв.

В 1-м кв.: ВС.ПО ХОЛД.: Выручка от  реализации

N

0,27383403

0,05769639

0,15437844

-0,20388887

В 1-м кв.: ВС.ПО ХОЛД.: Себестоимость приобретения

N

0,28029666

0,05654697

0,14149217

-0,20277262

В 1-м кв.: ВС.ПО ХОЛД.: Валовая прибыль

N

0,34808617

0,01529807

0,25395728

-0,26520805

В 1-м кв.: ВС.ПО ХОЛД.: Коммерческие расходы

N

0,17911279

0,01163287

0,19818931

-0,12430448

В 1-м кв.: ВС.ПО ХОЛД.: Чистая прибыль

N

0,69558329

0,02558452

0,3015067

-0,42765802

В 2-м кв.: ВС.ПО ХОЛД.: Выручка от  реализации

N

0,05769639

0,15437844

-0,20388887

0,26426991

В 2-м кв.: ВС.ПО ХОЛД.: Себестоимость приобретения

N

0,05654697

0,14149217

-0,20277262

0,27119177

В 2-м кв.: ВС.ПО ХОЛД.: Валовая прибыль

N

0,01529807

0,25395728

-0,26520805

0,31997283

В 2-м кв.: ВС.ПО ХОЛД.: Коммерческие расходы

N

0,01163287

0,19818931

-0,12430448

0,17289596

В 2-м кв.: ВС.ПО ХОЛД.: Чистая прибыль

N

0,02558452

0,3015067

-0,42765802

0,62070126

001.БАКАЛЕЯ ООО      : Выручка от  реализации (Отгрузка)

N

59872.904

68605.74

81330.38

90666.871

001.БАКАЛЕЯ ООО      : Себестоимость приобретения

N

54663.068

62013.394

73244.71

82504.499

001.БАКАЛЕЯ ООО      : Валовая прибыль

N

5162.304

6515.82

7962.462

8074.803

001.БАКАЛЕЯ ООО      : Коммерческие расходы:

N

4855.162

5177.562

5708.661

6243.681

001.БАКАЛЕЯ ООО      : Чистая прибыль

N

4.937

960.807

1867.996

1432.32

002.РОССИНГРИДГРУПП  : Выручка от  реализации

N

10875.6

12007.9

12784.1

13784

002.РОССИНГРИДГРУПП  : Себестоимость приобретения:

N

9642.754

10829.924

11628.944

12529.951

002.РОССИНГРИДГРУПП  : Валовая прибыль

N

1317.49

1289.439

1268.928

1375.051

002.РОССИНГРИДГРУПП  : Коммерческие расходы:

N

885.334

934.097

994.073

1055.042

002.РОССИНГРИДГРУПП  : Чистая прибыль

N

316.831

231.382

118.053

142.828

003.КОРМИЛИЦА        : Выручка от  реализации (Отгрузка)

N

74196.02

87070.587

84697.234

106818.561

003.КОРМИЛИЦА        : Себестоимость приобретения

N

64274.399

78033.995

75411.831

93112.188

003.КОРМИЛИЦА        : Валовая прибыль

N

9489.662

8742.812

8835.316

13144.883

003.КОРМИЛИЦА        : Коммерческие расходы:

N

4584.478

5146.744

5115.603

6287.31

003.КОРМИЛИЦА        : Чистая прибыль

N

3611.378

1945.21

2250.487

4964.347

004.КУБАНЬ АЛКО ООО  : Выручка от  реализации (Отгрузка)

N

9907.906

12479.705

17467.6

21390.205

004.КУБАНЬ АЛКО ООО  : Себестоимость приобретения

N

8502.326

10818.892

15205.326

18536.645

004.КУБАНЬ АЛКО ООО  : Валовая прибыль

N

1405.579

1660.813

2256.274

2845.56

004.КУБАНЬ АЛКО ООО  : Коммерческие расходы:

N

964.271

1177.139

1342.223

1542.788

004.КУБАНЬ АЛКО ООО  : Чистая прибыль

N

380.18

406.289

826.097

1210.297

005.КУБТОРГ ЗАО      : Выручка от  реализации (Отгрузка)

N

222588.061

261211.761

254091.703

320455.682

005.КУБТОРГ ЗАО      : Себестоимость приобретения

N

176831.595

214111.287

206767.531

254373.733

005.КУБТОРГ ЗАО      : Валовая прибыль

N

17596.183

22349.374

19233.869

28821.405

005.КУБТОРГ ЗАО      : Коммерческие расходы:

N

11946.08

13915.558

13673.261

17032.353

005.КУБТОРГ ЗАО      : Чистая прибыль

N

2349.761

3924.535

714.98

2356.409

006.МОСКВИЧКА ООО    : Выручка от  реализации

N

57378.5

75468.3

70557.5

109825.1

006.МОСКВИЧКА ООО    : Себестоимость приобретения:

N

52161.899

68321.089

63439.83

97980.652

006.МОСКВИЧКА ООО    : Валовая прибыль

N

5399.882

7363.734

7406.39

12510.962

006.МОСКВИЧКА ООО    : Коммерческие расходы:

N

3010.511

3939.762

3445.43

4247.655

006.МОСКВИЧКА ООО    : Чистая прибыль

N

2158.976

3174.71

3740.921

7811.79

 

Исходные данные, приведенные в таблице 1, охватывают период с 2000 по 2009 годы (10-летний лонгитюд), включают 340 строк (классификационных и описательных шкал) и подготовлены в соответствии с требованиями одного из программных интерфейсов системы «Эйдос» с внешними базами данных. Вместо описания этих требований приведем на рисунке 3 Help к этому режиму:

Рисунок 3 – Help программного интерфейса системы «Эйдос»,
используемого для формализации предметной области
на основе исходных данных из таблицы 1

 

На этапе формализации предметной области база исходных данных нормализуются, т.е. разрабатываются классификационные и описательные шкалы и градации и с их использованием база исходных данных кодируется. В результате формируется база событий (эвентологическая база данных) и обучающая выборка. Этап когнитивной структуризации и подготовки исходных данных не формализован, а этап формализации предметной области полностью автоматизирован и выполняются непосредственно с применением универсальной когнитивной аналитической системы «Эйдос», которая является программным инструментарием АСК-анализа. Этапы когнитивной структуризации и формализации предметной области АСК-анализа являются первыми этапами преобразования данных в информацию, а ее в знания.

На рисунке 4 приведено окно программного интерфейса 2.3.2.3 для задания параметров формализации предметной области:

Рисунок 4 – Окно программного интерфейса 2.3.2.3 для задания параметров формализации предметной области

 

В результате работы данного программного интерфейса созданы классификационные и описательные шкалы и градации и исходные данные, представленные в таблице 1, закодированы с их использованием, в результате чего создана обучающая выборка и база событий (эвентологическая база данных) (рисунки 5, 6, 7):

 

Рисунок 5 – Экранная форма просмотра и корректировки
классификационных шкал и градаций

 

Будущие состояния холдинга формально описываются в модели как градации классификационных шкал, т.е. классы.

Рисунок 6 – Экранная форма просмотра и корректировки
описательных шкал и градаций

 

Показатели работы предприятий холдинга в прошлый период формально описываются в модели как градации описательных шкал, т.е. факторы и их значения, влияющие на будущие состояния холдинга.

Рисунок 7. Экранная форма просмотра и корректировки
обучающей выборки (база событий)

 

Выводы.

В результате проведенной работы подготовлены все условия для выполнения последующих этапов АСК-анализа: синтез и верификация системно-когнитивной модели, решение задач идентификации, прогнозирования и принятия решений, а также исследования моделируемого объекта путем исследования его модели, которые планируется описать в будущих статьях.

 

5.2.2. Синтез и верификация модели

 

В данном разделе в соответствии с методологией Автоматизированного системно-когнитивного анализа (АСК-анализ) рассматривается реализация 3-го АСК-анализа: синтез и верификация модели прогнозирования развития многоотраслевой агропромышленной корпорации. На этом этапе осуществляется синтез и верификация 3 статистических и 7 системно-когнитивных моделей: ABS – матрица абсолютных частот, PRC1 и PRC2 – матрицы условных и безусловных процентных распределений, INF1 и INF2 –  частный критерий: количество знаний по А.Харкевичу, INF3 – частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами INF4 и INF5 – частный критерий: ROI - Return On Investment, INF6 и INF7 – частный критерий: разность условной и безусловной вероятностей (коэффициент взаимосвязи). Достоверности созданных моделей оценивались в соответствии с предложенной  метрикой, сходной с известным F-критерием, но не предполагающей выполнение нормального распределения, линейности объекта моделирования, независимости и аддитивности действующих на него факторов. Достоверность полученных моделей оказалось достаточно высокой для решения последующих задач идентификации, прогнозирования и принятия решений, а также исследования моделируемого объекта путем исследования его модели, которые планируется рассмотреть в будущих статьях

Автоматизированный системно-когнитивный анализ (АСК-анализ) предложен в 2002 году проф. Е.В.Луценко [1]. Это инновационный метод искусственного интеллекта, оснащенный общедоступным программным инструментарием, в качестве которого в настоящее время выступает универсальная когнитивная аналитическая система «Эйдос» [2]. Скачать и запустить систему «Эйдос» (самую новую на текущий момент версию) или обновление системы до текущей версии всегда можно здесь: http://lc.kubagro.ru/aidos/_Aidos-X.htm. Это наиболее полная на данный момент незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (около 50 Мб). Обновление имеет объем около 3 Мб. АСК-анализ – это непараметрический метод, позволяющий исследователь сложные нелинейные объекты управления на основе неполных, зашумленных данных о них большой размерности, измеренных в различных типах шкал и различных единицах измерения [3].

Эти особенности АСК-анализа обусловили его выбор в качестве метода создания системно-когнитивной модели прогнозирования развития многоотраслевой агропромышленной корпорации. АСК-анализ включает следующие этапы:

1. Когнитивная структуризация предметной области.

2. Формализация предметной области.

3. Синтез и верификация системно-когнитивной модели.

4. Решение задач идентификации, прогнозирования и принятия решений.

5. Исследование моделируемого объекта путем исследования его системно-когнитивной модели.

В работе [4] описана реализация первых дух этапов АСК-анализа при системно-когнитивные модели прогнозирования развития многоотраслевой агропромышленной корпорации. В данном разделе рассмотрим третий и четвертый этапы. Авторы имеют опыт решения подобных задач в АПК [5-20]. Для синтеза и верификации системно-когнитивной модели запустим с параметрами по умолчанию режим 3.5 системы «Эйдос» (рисунок 1):

Рисунок 1. Экранная форма задания параметров работы режима
синтеза и верификации моделей системы «Эйдос»

 

На рисунке 2 приведена экранная форма отображения стадии исполнения и прогнозирования времени окончания работы данного режима:

Рисунок 2. Экранная форма задания параметров работы режима
синтеза и верификации моделей системы «Эйдос»

 

В результате работы данного режима перечисленные модели сначала создаются, а потом проверяются на достоверность путем идентификации объектов обучающей выборки и подсчета количества ошибок первого и второго рода (ложной идентификации и неидентификации). На рисунке 3 приведена информация о достоверности созданных моделей в соответствии с предложенной  проф. Е.В. Луценко метрикой, сходной с известным F-критерием, но не предполагающей выполнение нормального распределения, линейности объекта моделирования, независимости и аддитивности действующих на него факторов:

Рисунок 3. Достоверность созданных моделей

 

На рисунке 4 приведена экранная форма Help данного режима, поясняющая смысл используемой метрики оценки достоверности:

Рисунок 4. Смысл используемой метрики оценки достоверности

 

Из рисунка 3 видно, что наиболее достоверной оказалась модель INF5. В соответствии со схемой преобразования данных в информацию, а ее в знания в АСК-анализе, зададим эту модель в качестве текущей (рисунок 7) и выполним пакетное распознавание в наиболее достоверной модели (рисунок 8):

 

 

Рисунок 7. Экранные формы режима задания модели в качестве текущей

 

Рисунок 7. Экранная форма режима пакетного распознавания

 

Выводы.

В результате проведенной работы подготовлены все условия для выполнения последующих этапов АСК-анализа: решение задач идентификации, прогнозирования и принятия решений, а также исследования моделируемого объекта путем исследования его модели, которые планируется описать в будущих статьях.

 

 

 



[1] Вопреки тому, как его поняли некоторые авторы

[2] Основные публикации автора по вопросам выявления, представления и использования знаний:

http://www.twirpx.com/file/793311/

– Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка – Абельсона / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №03(005). С. 65 – 86. – IDA [article ID]: 0050403004. – Режим доступа: http://ej.kubagro.ru/2004/03/pdf/04.pdf, 1,375 у.п.л.

– Луценко Е.В. Методологические аспекты выявления, представления и использования знаний в АСК-анализе и интеллектуальной системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2011. – №06(070). С. 233 – 280. – Шифр Информрегистра: 0421100012\0197, IDA [article ID]: 0701106018. – Режим доступа: http://ej.kubagro.ru/2011/06/pdf/18.pdf, 3 у.п.л.

[3] Огромная благодарность сотрудницам Росстата Новиковой Ирине Владимировне и Шашловой Наталье Викторовне за содействие в поиске необходимых исходных данных

[4] особенно если учесть высокую сложность предметной области, которую мы моделируем

[5] http://lc.kubagro.ru/My_training_schedule.doc

[6] http://ej.kubagro.ru/a/viewaut.asp?id=11

[7] Подборка публикаций по этим вопросам: http://www.twirpx.com/file/793311/