Преобразование эмпирических данных
в информацию включает (обобщенно) следующие этапы:
– когнитивная структуризация и формализация
предметной области;
– синтез и верификация системно-когнитивных
моделей.
Оно необходимо для решения задач
прогнозирования, принятия решений и исследования моделируемой предметной области
путем исследования ее модели, т.к. все эти задачи решаются на основе знаний, содержащихся
в системно-когнитивной модели, показавшей наивысшую достоверность.
На этапе когнитивной структуризации
определяется, что мы хотим прогнозировать, чем управлять и на основе чего собираемся
это делать.
В качестве классификационных шкал
нами были выбраны результирующие состояния объекта управления (13 показателей):
урожайность, ц/га; содержание белка, %; содержание клейковины, %; натура зерна,
г/л; стоимость зерна, руб./га; цена 1 ц зерна, руб.; окупаемость удобрений зерном
кг/кг; чистый доход, руб./га; уровень рентабельности, %; приращение энергии, ГДЖ/га;
коэффициент чистой эффективности; коэффициент соотношения полученной и затраченной
энергии; выход зерна в расчете на 1 ГДж затраченной энергии, кг (таблица 8).
Классификационным и описательным
шкалам присваиваются коды и наименования.
В качестве описательных шкал (факторов),
влияющих на переход объекта управления в результирующие состояния взяты 47 показателей,
такие как: предшественники (кукуруза на зерно, озимая пшеница, сахарная свекла,
горох, эспарцет); доза удобрений (без внесения удобрений , средняя доза РК, средняя
доза NK, средняя доза NP, минимальная доза NPK, средняя доза NPK, повышенная доза
NPK, высокая доза NPK); севооборот (зернопропашный, зернотравянопропашный); количество
осадков за год, мм; количество осадков на период осенней вегетации, мм; количество
осадков на период весенне-летней вегетации, мм; количество осадков на период от
колошения до созревания, мм; среднесуточная температура за год, °С; среднесуточная
температура на период осенней вегетации, °С; среднесуточная температура на период
весенне-летней вегетации, °С среднесуточная температура на период от колошения до
созревания, °С; содержание влаги в слое почвы 0-
Таблица 8 – Кодировка классификационных
шкал
Код |
Наименование классификационной шкалы |
1 |
Урожайность, ц/га |
2 |
Содержание белка, % |
3 |
Содержание клейковины,% |
4 |
Натура зерна, г/л |
5 |
Стоимость зерна, руб./га |
6 |
Чистый дох (убыток), руб./га |
7 |
Уровень рентабельности (убыточности), % |
8 |
Приращение энергии, гдж/га |
9 |
К-т чистой эффективности |
10 |
К-т отношения получ. И затрач. Энергии |
11 |
Выход зерна в расчете на 1 гдж затрач. Энергии,
кг |
12 |
Окупаемость удобрений зерном, кг/кг |
13 |
Цена зерна, руб./кг |
Ввод данных мониторинга в базу прецедентов
осуществлялся с помощью универсального программного интерфейса между внешними базами
данных системы «Эйдос-X++», который обеспечивает автоматическое формирование классификационных
и описательных шкал, а также обучающей выборки на основе Excel-файла.
Нами было принято решение использовать
четыре равных интервала. Система «Эйдос» автоматически находит минимальное и максимальное
числовые значения в каждом столбце классов или признаков, формирует числовые интервалы,
числовые значения заменяет интервальными (приложение 2, 3). Каждое текстовое или
интервальное значения считается градацией классификационной или описательной шкалы,
характеризующей объект.
Получены следующие результаты верификации
моделей знаний (таблица 9). Так, наиболее подходящая модель знаний – это модель
INF3, которая обладает высокой степенью достоверности, адекватно отражает исследуемую
предметную область, а, следовательно, ее можно использовать для прогнозирования
результатов и принятия управленческих решений по выбору технологий производства
зерна озимой пшеницы, обеспечивающей с высокой вероятностью желаемый результат.
Таблица 9 – Результаты верификации
моделей знаний
Тип модели |
Интегральный критерий |
Достоверность |
||
Идентификации |
Не иденти-фикации |
Средняя |
||
INF1, частный критерий: количество знаний по А.
Харкевичу, 1-й вариант |
Корреляция |
83,790 |
67,035 |
75,413 |
Свертка |
76,103 |
74,547 |
75,325 |
|
INF2, частный критерий: количество знаний по А.
Харкевичу, 2-й вариант |
Корреляция |
83,790 |
67,019 |
75,405 |
Свертка |
76,959 |
74,563 |
75,761 |
Продолжение таблицы 9
Тип модели |
Интегральный критерий |
Достоверность |
||
Идентификации |
Не иденти-фикации |
Средняя |
||
INF3, частный критерий: Хи-квадрат |
Корреляция |
83,530 |
67,702 |
75,616 |
Свертка |
83,530 |
67,702 |
75,616 |
|
INF4, частный критерий: ROI - Return On Investment |
Корреляция |
75,155 |
75,890 |
75,522 |
Свертка |
85,084 |
61,156 |
73,120 |
|
INF6, частный критерий: разность условной и безусловной
вероятностей |
Корреляция |
81,276 |
68,151 |
74,714 |
Свертка |
83,634 |
62,433 |
73,033 |
Результаты измерения адекватности семантической информационной
модели (INF3) отражены в приложении 4.
В системе «Эйдос-X++» реализовано несколько методов
оптимизации (улучшения адекватности) модели: исключение из модели статистически
мало представленных классов и факторов; исключение незначимых факторов; взвешивание
данных; итерационное разделение классов на типичную и нетипичную части; генерация
моделей больших размерностей с сочетанными признаками.
Проведенные численные эксперименты с применением
методов оптимизации показало, что их применение нецелесообразно, т.к. исходная модель
и так обладает хорошими характеристиками адекватности, а в этом случае применение
методов повышения адекватности не дает ощутимых результатов.
В нашей работе задача прогнозирования
сводится к тому, чтобы по планируемым к применению или уже применяемым технологиям
выращивания зерна озимой пшеницы спрогнозировать наиболее вероятные хозяйственные
и экономические результаты.
Кроме прогнозирования инструментарий
«Эйдос-Х++» обеспечивает оценку достоверности этого прогнозирования.
На рисунке 7 представлены девять
классов, с которыми данная конкретная ситуация наиболее сходна (красный цвет) или
наиболее различна (синий цвет). Классы, к которым объект действительно относится,
отмечены символом: «». Если по классу результаты
идентификации в данной модели недостоверны, т.е. уровень сходства отрицательный,
то не следует доверять такому результату.
Рисунок 9 – Экранная форма результатов прогнозирования
Информационный портрет класса отражает
систему его детерминации.
Генерация информационного портрета класса или задача
поддержки принятия решений представляет собой решение обратной задачи прогнозирования,
т.к. по заданному будущему состоянию объекта управления определяем систему факторов,
детерминирующих это состояние, т.е. вызывающих переход объекта управления в это
состояние.
В начале информационного портрета
класса расположены факторы, положительно влияющие на переход объекта управления
в заданное состояние, затем факторы, не оказывающие на это существенного влияния,
и далее – факторы, препятствующие переходу объекта управления в это состояние (в
порядке возрастания силы препятствования). Информационные портреты классов могут
быть отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход
объекта управления в данное состояние не всех отраженных в модели факторов, а только
тех, коды которых попадают в определенный диапазон (описательные шкалы).
Рисунок 10 – Информационный портрет класса:
12: «Содержание клейковины%,-4/4»
Из информационного портрета класса,
представленного на рисунке 10, видно, что высокое содержание клейковины, согласно
модели INF3, обеспечивает определенные температурный режим, содержание влаги в почве
и баланс питательных веществ. Так, наибольшую значимость имеют: среднесуточная температура
(9,8-10,7 Сº) и количество осадков (124-
При выращивании зерна озимой пшеницы
с высоким содержанием клейковины рекомендуется повышенные дозы удобрений полного
комплекса, в качестве предшественника использовать горох.
В то же время на содержание клейковины
не оказывает влияние содержание минерального азота в фазу колошения (3,1-3,8 мг/кг)
и в фазу выхода растений в трубку объемом 3,1-7,8 мг/кг, содержание влаги в почве
0-100 на период весенней вегетации, составляющая 177-
Рассмотрев информационные портреты,
определено, что для получения зерна озимой пшеницы высокой урожайности наибольшее
положительное влияние оказывают природные факторы: количество осадков; средняя температура,
содержание влаги в почве (значимость 29-15%). Также рекомендовано использовать предшественник
горох и эспарцет, вносить повышенные и высокие дозы полного комплекса удобрений,
но их сила влияния значительно ниже (13-5%), чем у природных факторах. Рост урожайности
обеспечивает содержание фосфатов, калия, азота в слое почвы 0-
На высокие экономические показатели
(чистый доход на
На рисунке 11 видно, что наибольший
коэффициент энергетической эффективности обеспечивает содержание влаги в слое почвы
от 0-100 на период полной спелости 120-
Рисунок 11 – Круговая диаграмма информационного
портрета класса 36: «Коэффициент чистой эффективности – 4/4».
В соответствии с концепцией смысла
системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона,
смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует.
Сначала в этом списке идут состояния объекта управления, на переход в которые данный
фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не
оказывает существенного влияния, и далее состояния – переходу в которые данный фактор
препятствует. Информационные портреты факторов могут быть отфильтрованы по диапазону
классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления
не во все возможные будущие состояния, а только в состояния, коды которых попадают
в определенный диапазон (классификационные шкалы).Семантический портрет факторов
отражен на рисунке 12.
Рисунок 12 – Информационный портрет признака:
«доза удобрений-неудобренный» в модели INF-3
Так, если при выращивании зерна
озимой пшеницы не применять удобрения, то с высокой значимостью урожайность будет
низкая (25-38 ц/га). Кроме того, производство зерна будет неэффективным (рисунок
12).
Использование в качестве предшественника
сахарной свеклы, согласно информационному портрету данного признака, с высокой значимостью
(19-15%) обеспечит получение низкой урожайности зерна, низкого качества с наименьшими
значениями экономических показателей и показателей энергетической эффективности.
Применение зернотравянопрашного
севооборота обеспечит получение достаточного большого чистого дохода на
Низкие производственные затраты,
значимость которого составила 16%, гарантирует получение сравнительно больших значений
коэффициента чистой энергетической эффективности (6,8-9), выхода зерна в расчете
на 1 ГДж затраченной энергии (269-
Круговая диаграмма (рисунок 13)
свидетельствует, что плохо увлажненная почва на период сева приводит к получению
зерна низкого качества и урожайности, и соответственно, чистого дохода и уровня
рентабельности.
Рисунок 13 – Круговая диаграмма информационного
портрета признака 17: «Содержание влаги в слое почвы 0-
Положительное влияние с высокой
значимостью на природно-экономическую систему оказывают: на период осенней вегетации
- хорошо увлажненная почва, невысокий температурный режим (2,5-7,3 С°), высокое
содержание минерального азота (24,3-30,4 мг/кг); на период весенней вегетации –
умеренное количество осадков (124-
По результатам проделанной работы,
с помощью системы «Эйдос», нами было определено, что наибольшее влияние, из рассмотренных
признаков, на природно-экономическую систему оказывают природные факторы. Для получения
лучших хозяйственных результатов рекомендовано повышенные дозы удобрений полного
комплекса, в качестве предшественника использовать горох и эспарцет.
Кластерно-конструктивный анализ
– это математический метод анализа данных, обеспечивающий: выявление классов, наиболее
сходных по системе их детерминации и объединение их в кластеры; выявление кластеров
классов, наиболее сильно отличающиеся по системе их детерминации и построение из
них полюсов конструктов классов, при этом остальные кластеры включаются в конструкты
в качестве промежуточных между полюсами; выявление факторов, наиболее сходных по
детерминируемыми классам и объединение их в кластеры; выявление кластеров факторов,
наиболее сильно отличающиеся по детерминируемым ими классам и построение из них
полюсов конструктов факторов, остальные кластеры включаются в конструкты в качестве
промежуточных между полюсами [3].
Состояния объекта управления, соответствующие
классам, включенным в один кластер, могут быть достигнуты одновременно, т.е. являются
совместимыми (коалиционными) по детерминирующим их факторам. Состояния объекта управления,
соответствующие классам, образующим полюса конструкта, не могут быть достигнуты
одновременно, т.е. являются противоположными по детерминирующим их факторам (антагонистическими).
Факторы, включенные в один кластер,
оказывают сходное влияние на поведение объекта управления и могут, при необходимости,
быть использованы для замены друг друга. Факторы, образующие полюса конструкта,
оказывают противоположное влияние на поведение объекта управления.
Кластерно-конструктивный анализ
классов позволяет сравнить их по сходству системы детерминации и отобразить эту
информацию в графической форме семантической сети классов.
В результате работы режимов кластерно-конструктивного
анализа системы «Эйдос-Х++» формируются матрицы сходства классов и значений факторов
и семантические сети.
Рисунок 14 – Семантическая сеть классов.
На рисунке 14 представлена семантическая
сеть, отображающая степень сходства классов по системе детерминирующих их значений
факторов, из которого видно, что низкая урожайность имеет высокую степень сходства
с низким значением чистой эффективности и низким уровнем рентабельности. В то
же время высокая урожайность имеет высокую степень различия с минимальным значением
коэффициента чистой эффективности.
Рисунок 15 свидетельствует о сходстве
(различии) по силе и направлению влияния факторов на поведение объекта управления
(природно-экономической системы).
Рисунок 15 – Семантическая сеть признаков
Так, предшественник горох имеет
высокую степень сходства с минимальными затратами на удобрения, высоким содержанием
влаги в почве.
Учитывая, что семантические сети классов и признаков
отображают только сходство и различие, но при этом структура каждой связи содержательно
не раскрывается.
Содержательное сравнение классов
и факторов осуществляется с помощью когнитивной диаграммы, которая показывает какие
значения и какой вклад вносят в сходство-различие классов и факторов.
Когнитивные диаграммы представляет
собой графическое изображение обобщенного коэффициента корреляции профилей классов
(или факторов), при этом каждая линия, вносящая вклад в сходство (различие) соответствует
одному слагаемому, ее цвет – знаку, а толщина – модулю этого слагаемого.
Рисунок 16 – Когнитивная диаграмма двух классов:
«Уровень рентабельности, % - 4/4»
и «Окупаемость удобрений зерном – 4/4»
Рассматривая когнитивную диаграмму
двух классов (Уровень рентабельности, %-4/4 и окупаемость удобрений зерном- 4/4)
на рисунке 16, видно, что основной вклад в сходство этих двух состояний вносит предшественник
эспарцет. Но на этом их сходство заканчивается.
Если сравнивать когнитивные диаграммы
максимальных значений урожайности и коэффициента чистой эффективности (рисунок 17),
при этом исключив природные факторы, то данные состояния сходны по предшественнику
горох.
Рисунок 17 – Когнитивная диаграмма двух классов:
«Урожайность, % - 4/4»
и «Коэффициент чистой эффективности – 4/4»
Когнитивная диаграмма (рисунок 18)
содержательно отображает в графической форме сходство и различия двух признаков.
Так, предшественники горох и эспарцет детерминируют получение высоких значений чистого
дохода на
Наиболее значимые коэффициенты корреляции
получены между урожайностью и чистым доходом на
Изучение системы детерминации состояний
моделируемого объекта возможно на основе построения нелокальных нейронов и интерпретируемых
нейронных сетей.
Рисунок 18 – Когнитивная диаграмма признаков:
«Предшественник горох» и «Предшественник эспарцет»
Нелокальный нейрон представляет
собой будущее состояние объекта управления с изображением наиболее сильно влияющих
на него факторов с указанием силы и направления (способствует-препятствует) их влияния
[3].
Некоторые нелокальные нейроны представлены
в таблице 10. Так, из модели нейрона: «содержание клейковины - 4/4 – (25,9; 30,4)»
видно, что для получения зерна с высоким содержанием клейковины большое влияние
оказывают природные факторы: незначительное количество осадков на период осенней
Таблица 10 – Модели нелокальных
нейронов
Наименование нейрона |
Модель нелокального нейрона |
Содержание клейковины, % - 4/4 – (25,9-30,4) |
|
Чистый доход, руб.га - 4/4 – (102,58; 146,81) |
|
Коэффициент отношения полученной и затраченной
энергии – 4/4 - (10,089; 12,404) |
|
вегетации (124-
Модель нелокального нейрона: «коэффициент
отношения полученной и затраченной энергии – 4/4» свидетельствует о том, что получение
максимального значения данного показателя возможно, если в качестве предшественника
использовать горох, при минимальных дозах удобрений NPK, хорошо увлажненном слое
почвы 0-
Нейронная сеть представляет собой
совокупность взаимосвязанных нейронов. В классических нейронных сетях связь между
нейронами осуществляется по входным и выходным сигналам, а в нелокальных нейронных
сетях – на основе общего информационного поля, реализуемого семантической информационной
моделью.
Система «Эйдос» обеспечивает визуализацию
любого подмножества многослойной нейронной сети с заданными или выбираемыми по заданным
критериям рецепторами и нейронами, связанными друг с другом связями любого уровня
опосредованности.
На рисунке 19 отражено Паретто-подмножество нелокальной
нейронной сети урожайности и содержания белка в зерне. Минимальная урожайность зерна
имеет высокую степень сходства с низким содержанием азота на начало весенней вегетации,
низкими производственным затратами, неудобренным вариантом.
Рисунок 19 – Паретто-подмножество нелокальной
нейронной сети
Когнитивные функции или функции влияния представляет
собой график зависимости вероятностей перехода объекта управления в будущие состояния
под влиянием различных значений некоторого фактора [1,2].
Если взять несколько информационных портретов факторов,
соответствующих градациям одной описательной шкалы, отфильтровать их по диапазону
градаций некоторой классификационной шкалы и взять из каждого информационного портрета
по одному состоянию, на переход в которое объекта управления данная градация фактора
оказывает наибольшее влияние, то мы и получим зависимость, отражающую вероятность
перехода объекта управления в будущие состояния под влиянием различных значений
некоторого фактора, т.е. функцию влияния. Функции влияния являются наиболее развитым
средством изучения причинно-следственных зависимостей в моделируемой предметной
области, предоставляемым системой «Эйдос». Необходимо отметить, что на вид функций
влияния математической моделью СК-анализа не накладывается никаких ограничений,
в частности, они могут быть и нелинейные.
Рассмотрим некоторые природные факторы,
оказывающие наибольшее влияние на природно-экономическую систему. Так, на
рисунке 20 видно, что для получения высокой урожайности на период сева
необходим хорошо увлажненный слой почвы 0-
Рисунок 20 -
Когнитивная функция влияния содержания влаги
в слое почвы 0-
По данным приложения 6 (рисунок 7-9) видно, что
для наибольшей энергетический эффективности, а именно, коэффициента чистой
энергетической эффективности требуется достаточно увлажненная почва на период
сева -17-
На основании анализа функций влияния,
приведенных в таблице 11 и рисунков 29/1-20/8 можно сделать общий вывод о том,
что увеличение доз удобрений положительно сказывается на повышении показателей
природно-экономической системы.
Таблица 11 – Классификация функций влияния двух
факторов
на два выходных параметра природно-экономической системы
Показатель
природно-экономической системы (класс) |
Функция влияния |
|
Предшественников |
Различных доз удобрений |
|
Урожайность,
ц/га |
|
|
Содержание
клейковины, % |
|
|
Чистый
доход на |
|
|
Коэффициент
чистой энергетической эффективности |
|
|
Рисунок 20/1 – Когнитивная функция влияния
предшественников на урожайность, ц/га
Рисунок 20/2 – Когнитивная функция влияния
различных доз удобрений на урожайность, ц/га
Рисунок 20/3 – Когнитивная функция влияния
предшественников на содержание клейковины, %
Рисунок 20/4 – Когнитивная функция влияния
различных доз удобрений на содержание клейковины, %
Рисунок 20/5 – Когнитивная функция влияния
предшественников на чистый доход на
Рисунок 20/6 – Когнитивная функция влияния
различных доз удобрений на чистый доход на
Рисунок 20/7 – Когнитивная функция влияния
предшественников на коэффициент чистой энергетической эффективности
Рисунок 20/8 – Когнитивная функция влияния
различных доз
удобрений на коэффициент чистой энергетической эффективности
Высокий уровень рентабельности (приложение 6,
рисунок 1-6) возможен при достаточно
низкой средней температуры на период весенне-летней вегетации (15,9-16,3
Сº), содержание влаги в слое почвы 0-
Так, наибольшее значение урожайности, содержания
клейковины, чистого дохода на
Этот вывод совпадает с экспертными оценками.
Однако его ценность состоит в том, что в отличие от экспертных оценок, он
является строгим количественным выводом, сделанным путем исследования
многоуровневой семантической информационной модели.
Исследование других когнитивных функций подтверждают
выводы касательно информационных портретов классов.
Классические когнитивные карты являются графической
формой представления фрагментов СИМ, объединяющей достоинства таких форм, как нейроны
и семантические сети факторов. Классическая когнитивная карта представляет собой
нейрон, соответствующий некоторому состоянию объекта управления с рецепторами, каждый
из которых соответствует фактору в определенной степени способствующему или препятствующему
переходу объекта в это состояние. Рецепторы соединены связями как с нейроном, так
и друг с другом. Связи рецепторов с нейроном отражают силу и направление влияния
факторов, а связи рецепторов друг с другом, отображаемые в форме семантической сети
факторов, – сходство и различие между рецепторами по характеру их влияния на объект
управления.
Таким образом, классическая когнитивная карта представляет
собой нейрон с семантической сетью факторов, изображенные на одной диаграмме.
Так, из рисунка 21 видно, что средняя доза NK,
минимальные производственные затраты и затраты на удобрения, минимальное
содержание фосфатов в фазу выхода растений в трубку способствуют переходу
объекта управления в состояние наибольшей окупаемости удобрений зерном, а препятствуют
ему – минимальное содержание азота на начало весенней вегетации, высокий
температурный режим в течение года.
Обобщенные когнитивные карты позволяют
объединить в одной графической форме семантические сети классов и факторов,
объединенных нейронной сетью. Если объединить несколько классических
когнитивных карт на одной диаграмме и изобразить на ней также связи между
нейронами в форме семантической сети классов, то получим обобщенную
(интегральную) когнитивную карту.
Рисунок 21 – Классическая когнитивная карта,
отражающая систему детерминации класса:
«Окупаемость удобрений зерном, кг/кг- 4/4»
Интегральная когнитивная карта представляет собой
систему из семантических сетей классов и значений факторов, при которой каждый класс
соединен как нелокальный нейрон линиями детерминации с системой детерминирующих
его значений факторов.
Рисунок 22 – Интегральная когнитивная карта № 20
На рисунке 22, согласно кодировки классов и признаков,
видно, что переход объекта управления в состояние соответствующее достаточно высоким
значениям уровня рентабельности, стоимости зерна, обуславливают предшественники
эспарцет и горох, минимальные затраты на удобрения. Препятствует данному состоянию
- зернопропашной севооборот.
Максимальному содержанию белка в зерна, который в
свою очередь имеет высокий уровень сходства с уровнем рентабельности от 58 до 102%,
способствует зернотравянопропашный севооборот и препятствует незначительные затраты
на удобрения. В то же время, согласно интегральной когнитивной карте № 46
(рисунок 23), переход в состояние высокого содержание белка в зерне
обуславливают: хорошо увлажненный (72-
Рисунок 23 - Интегральная когнитивная карта № 46
Таким образом, с помощью системы «Эйдос», нами было
определено, что для получения лучших хозяйственных и экономических результатов рекомендовано
повышенные дозы удобрений полного комплекса, в качестве предшественника использовать
горох и эспарцет, зернотравянопропашный севооборот, для энергетических результатов
- из предшественников рекомендуется горох, а также минимальная доза NPK.