ГЛАВА 7. ИНТЕЛЛЕКТУАЛЬНЫЕ МОДЕЛИ УПРАВЛЕНИЯ ПРОДУКТИВНОСТЬЮ СЕЛЬХОЗКУЛЬТУР И КАЧЕСТВОМ СЕЛЬХОЗПРОДУКЦИИ

 

7.1. Прогнозирование результатов выращивания
сельскохозяйственных культур
и поддержка
принятия решений по рациональному
выбору агротехнологий

 

Исследование проведено совместно с д.б.н., к.т.н., профессором О.А.Засухиной на базе Кубанского государственного аграрного университета в 1993-1996 годах [82, 83]. Методологической и инструментально-технологической основой данного исследования являлись системно-когнитивный анализ (СК-анализ) и система "Эйдос".

С помощью сформированной содержательной информационной модели прогнозировались результаты выращивания сельскохозяйственных культур и вырабатывались научно-обоснованных рекомендации по управлению урожайностью и качеством сельскохозяйственной продукции [9, 62, 82, 83].

Созданная модель включала:

– объект управления (сельскохозяйственную культуру: зерновые колосовые);

– классы (будущие состояния объекта управления, т.е. количественные и качественные результаты выращивания);

– факторы управляющей системы (агротехнологии, т.е. нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация севооборота и т.п.);

– факторы окружающей среды (вид почв, культуры–предшественники по предшествующим годам и др.).

Размерность модели составила: 35 прогнозируемых результатов выращивания, 188 градаций факторов, 217 прецедентов в обучающей выборке, 18594 факта.

На основе предложенной технологии СК-анализа в среде системы «Эйдос» разработано конкретное приложение, обеспечивающее управление продуктивностью (урожайностью) и качеством сельскохозяйственных культур путем выбора и применения оптимальной агротехнологии в зависимости от таких факторов, как:

– поставленная цель (максимальное количество или максимальное качество продукции);

– вид почв;

– метод вспашки;

– культура-предшественник;

– нормы высева;

– виды и нормы внесения удобрений;

– ротация севооборота;

а также ряда других параметров объекта управления и окружающей среды.

Этапы разработки приложения

1. Формулировка целей методики и в соответствии с ними разработка перечня прогнозируемых хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", рисунок 7.1):

 

Рисунок 7. 1. Будущие состояния объекта управления: количественные
и качественные результаты выращивания сельхозкультуры
(зерновые колосовые)

 

2. Разработка формализованного паспорта результатов выращивания сельхозкультур, позволяющего описать в пригодной для компьютерной обработки форме результаты выращивания конкретной сельхозкультуры на конкретном поле и по конкретной технологии.

Формализованный паспорт состоит из трех частей:

– первая включает целевые и нежелательные будущие состояния объекта управления;

– вторая содержит описательные шкалы и градации, описывающие не зависящие от воли человека факторы окружающей среды;

– третья – зависящие от человека, т.е. технологические факторы, которые можно рассматривать как средство достижения желаемых хозяйственных результатов (рисунок 7.2).

 

Рисунок 7. 2. Видеограмма с фрагментом справочника
описательных шкал (факторы)

 

3. Использование бумажного архива по выращиванию сельхозкультур для заполнения формализованных паспортов и ввода в программную инструментальную систему «Эйдос» в качестве примеров выращивания (обучающей выборки) (рисунок 7.3).

 

Рисунок 7. 3. Интерфейс ввода обучающей выборки

 

4. Выявление (на основе предъявленных реальных примеров выращивания сельхозкультур) взаимосвязей между применяемыми технологиями и полученными результатами и формирование информационных портретов по каждому возможному результату выращивания.

Информационный портрет хозяйственной ситуации представляет собой перечень технологических факторов с количественным указанием того, какое влияние оказывает каждый из них на осуществление данной ситуации (рисунок 7.4):

 

Рисунок 7. 4. Примеры информационных портретов результатов выращивания "высокое количество" и "высокое качество"

 

5. Каждый из технологических факторов на основе приведенных примеров характеризуется тем, какое влияние он оказывает на осуществление каждой (целевой или нежелательной) хозяйственной ситуации (рисунок 7.5):

 

Рисунок 7. 5. Семантический портрет признака:
"Предшественники – бобовые многолетние травы"

 

6. Сравнение различных хозяйственных ситуаций и формирование групп наиболее сходных из них (кластеров), а также определение кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом на экспериментальной базе данных был выявлен конструкт "качество–количество", означающий, что для получения высокого качества и большого количества необходимы совершенно противоположные и несовместимые (т.е. невозможные одновременно) почвы: предшественники и агротехнологические приемы (рисунок 7.6):

 

Рисунок 7. 6. Конструкт классов: "Качество – количество" и семантическая сеть классов по шкалам: "Качество – количество"

 

7. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти факторы предложено использовать для замены друг друга в случае необходимости (рисунок 7.7):

 

Рисунок 7. 7. Конструкт факторов: "Предшественники бобовые … – Ротация первая…" и семантической сети факторов: "Предшественники – Глубина обработки почвы"

 

8. Проверка способности созданного приложения правильно прогнозировать хозяйственные результаты на массиве уже введенных формализованных паспортов показала, что валидность оказалась недостаточно высокой для практического применения: на уровне  58%. Причиной этого являются артефакты, из-за которых некоторые хозяйственные ситуации оказались слабо детерминированными (рисунок 7.8). Удаление артефактов привело к повышению интегральной валидности до 80%, что достаточно для практического использования методики (рисунок 7.9)

 

Рисунок 7. 8. Интегральная и дифференциальная валидность методики до исключения артефактов

Рисунок 7. 9. Интегральная и дифференциальная валидность методики после исключения артефактов

 

Таким образом, решены две основные задачи:

1. Прогнозирование того, какие хозяйственные результаты наиболее вероятны (а какие практически невозможны) на данном виде почв и с данными предшественниками, а также при условии применения имеющихся в распоряжении агротехнологий (рисунок 7.10). Указана мера сходства прогнозируемой ситуации с каждым будущим состоянием.

 

Рисунок 7. 10. Пример карточки прогнозирования для конкретных условий выращивания

 

2. Разработка рекомендаций по выбору управляющих воздействий, т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии должны быть, чтобы можно было рассчитывать с определенной уверенностью на заданный хозяйственный результат. Для этого достаточно вывести информационный портрет заданного целевого состояния.

Система "Эйдос" позволяет оценивать степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не просто дает рекомендацию, но и количественно оценивает степень ее надежности. Кроме того, система дает характеристику влияния каждого технологического приема и рекомендации по замене желательных, но очень дорогих или не имеющихся в наличии технологических приемов, другими, более дешевыми и доступными, и, при этом, имеющими сходное влияние на хозяйственные результаты.

Таким образом, данная методика позволяет "просматривать" различные варианты технологии, прогнозировать последствия применения различных технологических приемов, и на этой основе вырабатывать научно обоснованные рекомендации по выбору возделываемой культуры и оптимальной для поставленных целей агротехнологии.

В данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные.

 

7.2. Постановка агрометеорологических задач
выбора микрозон и культур для выращивания

 

7.2.1. Актуальность исследования

 

Накоплен многолетний фактографический материал по выращиванию плодовых культур в разных условиях среды. Однако, этот материал находится в форме бумажных документов различных стандартов, что не позволяет обработать его с применением современных математических методов и компьютерных технологий и выявить причинно-следственные зависимости в системе генотип-среда. Интересы сельскохозяйственной науки и практики требуют активного использования этой информации для мониторинга, анализа, прогнозирования и поддержки управленческих решений по выращиванию плодовых культур и сортов.

 

7.2.2. Общие положения

 

В данном разделе формулируются частные и обеспечивающие задачи, необходимые для решения задачи прогнозирования количественных и качественных результатов выращивания заданной культуры в заданной точке. Это задачи выявления причинно-следственных закономерностей между метофакторами и результатами выращивания, прогнозирования периодов фенофаз по динамике метеопараметров, а также задачи триангуляции и пространственной интерполяции. Показана взаимосвязь между этими задачами в контексте раскрытия логики решения основной задачи.

 

7.2.3. Основная задача исследования
и этапы ее решения

 

Прогнозирование количественных и качественных результатов выращивания различных культур в заданных точках (микрозонах). На основе решения данной основной задачи для различных культур и точек выращивания могут быть решены следующие две подзадачи:

1. Определен потенциал выращивания заданной культуры в различных микрозонах.

2. Определен потенциал выращивания различных культур в заданной микрозоне.

Результаты решения 1-й подзадачи подаются в наглядной и удобной  для принятия решений форме геоинформационной визуализации в виде зональных географических карт, на которых зоны с одинаковым потенциалом для выращивания некоторой культуры закрашены одним условным цветом.

Решение основной задачи состоит из двух этапов.

На 1-м этапе выявляются причинно-следственные зависимости между метеоусловиями и результатами выращивания сельскохозяйственных культур.

На 2-м этапе используются знания выявленных причинно-следственных зависимостей для прогнозирования количественных и качественных результатов выращивания заданной культуры в конкретном пункте выращивания.

Будем считать, что биологический потенциал географической точки определяется многолетней динамикой метеопараметров в этой точке.

Отметим, что влияние почв и агротехнологий в данном исследовании не учитывается, но предлагаемые математические модели и реализующий их программный инструментарий пригодны и для этого (имеется положительный опыт в этом направлении).

Решение основной задачи базируется на гипотезе о том, что закономерности влияния динамики метеопараметров на переход культуры от одной фенофазы к другой и на количественные и качественные результаты ее выращивания определяются только генотипом данной культуры и не меняются от точки к точке и в течение времени для данной культуры. Если данная гипотеза верна, то закономерности влияния факторов среды на результаты выращивания данной культуры, выявленные на основе обработки эмпирических данных, полученных за определенный период времени в одних точках, применимы для прогнозирования результатов выращивания этой культуры и в других точках.

Известно (Драгавцев А.П.), что влияние одних и тех же метеопараметров на количественные и качественные результаты выращивания культуры зависит не только от самих значений этих метеопараметров, но в огромной степени – от фенофазы, в течение которой эти параметры действовали. Поэтому вся метеоинформация должна обрабатываться с привязкой к периодам фенофаз, характеризующим темп биологического времени для различных культур, а не просто – к физическому (календарному) времени.

В принципе многие закономерности влияния метеоусловий на результаты выращивания известны и описаны в специальной литературе, в том числе и авторами данного исследования. Однако для достижения цели исследования все эти задачи должны быть решены на новом качественном уровне, соответствующем современному уровню развития математических методов и информационных технологий, в частности в рамках одной инструментальной системы. Дело в том, что решение этих задач, реализованное в различных инструментальных системах, не обеспечивает возможности обмена информацией между ними, а значит, проведения реальных исследований и прогнозирования в промышленном режиме.

Рассмотрим подробнее, каким образом осуществляется декомпозиция основной задачи в определенную последовательность этапов, частных и обеспечивающих задач (рисунок 7.11).

 

Рисунок 7. 11. Декомпозиция основной задачи исследования в ряд частных и обеспечивающих задач

 

Этап 1-й: выявление причинно-следственных зависимостей между метеоусловиями и результатами выращивания сельскохозяйственных культур

Задача 1.1: На основе обработки эмпирической информации об условиях и результатах выращивании различных культур в конкретных микрозонах выявить причинно-следственные закономерности влияния метеопараметров, действующих в течение определенных фенотипических фаз развития, на количественные и качественные результаты выращивания.

Исходные данные:

– фактические периоды начала и окончания фенофаз;

– фактические посуточные значения метеопараметров.

Результат решения:

Для каждого значения каждого метеопараметра, действующего в период определенной фенофазы, установлены сила и направление его влияния на количественные и качественные результаты выращивания каждой конкретной культуры.

Однако в данном пункте выращивания может и не быть метеостанции для регистрации метеопараметров.

Поэтому задача 1.1 не может быть решена без решения задачи пространственной интерполяции: определение значений метеопараметров в заданной точке по их значениям в точках нахождения трех ближайших метеостанций путем взвешивания значений с учетом поправок на рельеф и расстояния. Данная задача, в свою очередь, предполагает предварительное решение задачи триангуляции: определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций. Последняя задача связана с необходимостью преобразования значений метеопараметров, известных для нерегулярной сетки (решетки), в узлах которой расположены метеостанции, в регулярную сетку потенциальных точек выращивания, которая более удобна для геоинформационной визуализации.

Для потенциальных точек выращивания, по которым необходимо прогнозировать количественные и качественные результаты, периоды начала и окончания различных фенофаз для различных культур, неизвестны. Поэтому возникает задача 1.2: на основе обработки эмпирической информации об условиях и динамике фенотипического развития различных культур в конкретных микрозонах выявить причинно-следственные зависимости влияния динамики метеопараметров на сроки начала и окончания фенофаз для этих культур.

Исходные данные:

– фактические периоды начала и окончания фенофаз;

– динамика метеопараметров.

Результат решения:

Математическая модель и методика численных расчетов, позволяющие с минимальной погрешностью определить сроки наступления и окончания фенофаз для различных культур как в фактических, так и предполагаемых точках их выращивания по известной динамике метеопараметров в этих точках.

Задача 1.2 так же, как и 1.1 включает в качестве вспомогательных задачи триангуляции и пространственной интерполяции.

Этап 2-й: использование знания выявленных причинно-следственных зависимостей для прогнозирования количественных и качественных результатов выращивания заданной культуры в конкретном пункте выращивания

Когда задачи 1-го этапа реализованы, то решение основной задачи сводится к выполнению следующих шагов:

1. Определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций (триангуляция).

2. Определение динамики метеопараметров в заданной точке путем взвешивания значений метеопараметров в трех ближайших метеостанциях с учетом расстояний и рельефа местности (пространственная интерполяция).

3. Прогнозирование наиболее вероятных сроков начала и окончания фенофаз для заданной культуры в заданной точке по известной динамике метеопараметров (задача 1.2).

4. Задача 2.1: Прогнозирование количественных и качественных результатов выращивания культуры по известным значениям метеопараметров, действующих в прогнозируемые периоды фенофаз (результат решения задачи 1.2), и известным закономерностям влияния метеопараметров на результаты выращивания (результат решения задачи 1.1).

Каждая из этих задач имеет свою формальную постановку, которую мы далее коротко рассмотрим.

 

7.2.4. Формальная постановка частных
и обеспечивающих задач

 

Задача 1.1

На основе обработки эмпирической информации об условиях и результатах выращивании различных культур в конкретных микрозонах выявить причинно-следственные закономерности влияния метеопараметров, действующих в течение определенных фенотипических фаз развития, на количественные и качественные результаты выращивания.

Исходные данные

– фактические периоды начала и окончания фенофаз;

– фактические посуточные значения метеопараметров.

Алгоритм решения

Применяются два основных метода решения данной задачи:

1. Метод оценки индексов среды и экологической пластичности сортов по продуктивности.

2. Метод автоматизированного системно-когнитивного анализа (АСК-анализ).

1-й метод подробно рассмотрен в литературе, поэтому освещать его нецелесообразно.

2-й метод основан на системной теории информации и автоматизации системного анализа путем его декомпозиции по базовым когнитивным операциям [82]. Суть это метода состоит в том, что:

– для формализации результатов выращивания используются две классификационные шкалы: шкала качества и шкала количества;

– для формализации действия метеофакторов применяются описательные шкалы, соответствующие сочетаниям: фенофаза ´ метеопараметр;

– для формализации опыта выращивания используется обучающая выборка, включающая в формальном виде описания всех случаев выращивания всех культур во всех микрозонах, по которым есть информация по первым двум группам шкал;

– на основе предыдущего осуществляется синтез семантической информационной модели (СИМ), отражающей силу и направление влияния всех значений метеофакторов, действующих во всех фенофазах, на количественные и качественные результаты выращивания сельскохозяйственных культур;

– СИМ проверяется на адекватность (верифицируется) и оптимизируется, из нее исключаются артефакты и незначимая исходная информация, а также градации классификационных и описательных шкал, по которым оказалось недостаточно данных;

– проводится системно-когнитивный анализ СИМ, включающий изучение системы детерминации будущих состояний объекта управления, сходства и различия будущих состояний по системе детерминации, сходства и различия факторов по их влиянию на объект управления, построение семантических сетей классов и факторов, когнитивных диаграмм, классических и интегральных когнитивных карт.

 

Результат решения

Для каждого значения каждого метеопараметра, действующего в период определенной фенофазы, установлены сила и направление его влияния на количественные и качественные результаты выращивания каждой конкретной культуры и строятся уравнения регрессии.

Задача 1.2

На основе обработки эмпирической информации об условиях и динамике фенотипического развития различных культур в конкретных микрозонах выявить причинно-следственные зависимости влияния динамики метеопараметров на сроки начала и окончания фенофаз для этих культур.

Исходные данные

– фактические периоды начала и окончания фенофаз;

– динамика метеопараметров.

Алгоритм решения

Считается, что на сроки наступления и окончания фенофаз в основном оказывают влияние накопительные значения средней температуры. Однако в специальной литературе нигде не конкретизируется математическая модель и методика численных расчетов, позволяющие действительно прогнозировать эти сроки, не сравниваются различные модели по погрешности прогнозирования (степени адекватности).

Поэтому возникает ряд вопросов, например:

– средние каких температур использовать: воздуха или почвы, минимальной, средней или максимальной;

– с какой календарной даты или фенофазы начинать накопление;

– какие конкретные значения сумматора соответствуют началу или окончанию тех или иных фаз у тех или иных культур.

По сути, эту математическую модель необходимо разработать и верифицировать самим, что входит в задачи данного исследования.

Результат решения

Математическая модель и методика численных расчетов, позволяющие с минимальной погрешностью определить сроки наступления и окончания фенофаз для различных культур как в фактических, так и предполагаемых точках их выращивания по известной динамике метеопараметров в этих точках.

Задача 2.1

Прогнозирование количественных и качественных результатов выращивания культуры по известным значениям метеопараметров, действующих в прогнозируемые периоды фенофаз (результат решения задачи 1.2) и известным закономерностям влияния метеопараметров на результаты выращивания (результат решения задачи 1.1).

Исходные данные

– фактические значения метеопараметров за ряд лет в данной точке.

Алгоритм решения

Для всех лет, по которым в базе метеоданных имеется информация о значениях метеопараметров, прогнозируются количественные и качественные результаты выращивания конкретной культуры, а затем за исследуемый период подсчитывается средняя вероятность получения различных результатов выращивания. Предполагается, что погода изменяется медленно, генотип еще медленней, и поэтому определенная таким образом вероятность имеет силу и на данный момент времени.

Результат решения

Вероятности различных количественных и качественных результатов выращивания различных культур в заданных точках. Например, вероятность получения высокого урожая абрикоса 1-го сорта в данной точке составляет 72 %.

Задача триангуляции

Определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций (триангуляция).

Исходные данные

Географические координаты метеостанций и точек выращивания. Для метеостанций сетка нерегулярная, а для точек выращивания, как правило, регулярная (квадратная с равным шагом ячейки).

Алгоритм решения

Существуют различные оптимальные по различным критериям и просто рациональные алгоритмы решения этой задачи, например алгоритм Делоне. Однако в данном случае их применение вряд ли оправданно, т. к. вычислительные ресурсы стандартного персонального компьютера вполне позволяют решить эту задачу простейшим в реализации "методом прямого перебора в течение вполне приемлемого реального времени", тем более эта задача может решаться редко, т. к. исходные данные меняются очень редко и незначительно.

Шаг 0: Вход.

Шаг 1: Организуется цикл по потенциальным точкам выращивания.

Шаг 2: Организуется цикл по метеостанциям.

Шаг 3: Географические координаты преобразуются в декартовы (что вполне корректно из-за очень небольших угловых расстояний между точкой выращивания и метеостанцией).

Шаг 4: Вычисляется расстояние по поверхности Земли между текущей точкой и метеостанцией.

Шаг 5: Результат вычисления расстояний заносится в первую базу данных.

Шаг 6: Все метеостанции рассмотрены?

Если нет – переход на шаг 3, иначе – на 7.

Шаг 7: Сортировка 1-й базы данных (расстояний от заданной точки до метеостанций) в порядке увеличения расстояния.

Шаг 8: Выбрать из базы данных три метеостанции с минимальными расстояниями до заданной точки выращивания и поместить эту информацию во 2-ю базу данных.

Шаг 9: Все точки выращивания просмотрены?

Если нет – переход на шаг 2, иначе – на 10.

Шаг 10. Выход.

Результат решения

База данных, в которой содержится информация о всех точках выращивания и трех ближайших к каждой точке метеостанциях.

Задача пространственной интерполяции

Определение динамики метеопараметров в заданной точке путем взвешивания значений метеопараметров в трех ближайших метеостанциях с учетом расстояний и рельефа местности (пространственная интерполяция). Эта задача называется также задачей "восстановления полей элементов в узлах нерегулярной сетки (триангуляция)".

Исходные данные:

– известны суточные значения ряда метеопараметров в точках расположения метеостанций;

– известны три ближайшие к любой заданной точке метеостанции.

Алгоритм решения

Восстановление полей элементов численными методами, получившее название объективного анализа, в настоящее время широко применяется в гидрометеорологии не только в научных исследованиях, но и в оперативной практике. Независимо от применяемых методов расчета, все известные схемы объективного анализа предусматривают предвычисление значений элемента в узлах регулярной сетки по данным окружающих пунктов наблюдений.

Из численных методов восстановления полей элементов наиболее широко известны метод оптимальной интерполяции, метод полиномиальной аппроксимации, метод последовательных приближений. Имеется ряд других методов, многие из которых представляют собой модификации перечисленных методов.

В отечественной гидрометеорологии наибольшее распространение получил метод оптимальной интерполяции. В кратком изложении суть метода сводится к следующему.

1. Описываем пункты наблюдений, используя для этого крупномасштабные карты: гипсометрическую, почвенную, ландшафтную. Снимаются географические координаты пункта, его декартовы координаты по условной сетке с шагом 10 км, высота над уровнем моря, экспозиция склона.

2. Описываем узлы регулярной сетки. С этой целью определяем для каждого узла все указанные выше характеристики, а также ближайшие оказывающие влияние метеостанции.

3. Вводим необходимую гидрометеорологическую информацию по станциям региона.

4. Используем комплекс программ, реализующих метод оптимальной интерполяции.

Метод реализован на IBM PC. Проведенные контрольные расчеты показали работоспособность созданных программ, а также адекватность полученных данных реальным условиям.

Результат решения

Значения всех метеопараметров на любые сутки прошедшего периода можно считать достоверно известными для любой географической точки, находящейся между метеостанциями.

 

7.2.5. Выводы

 

Сформулированные задачи, будучи реализованные в одной программной системе, обеспечивают решение основной задачи, поставленной в настоящем исследовании: прогнозирование количественных и качественных результатов выращивания различных культур в заданных точках (микрозонах). Необходимо отметить, что данная система позволяет реализовать не все перечисленные задачи и находится в постоянном совершенствовании и развитии.

 

7.3. Прогнозирование продуктивности
и качества культур на основе данных
метеопрогнозов

 

Исследование посвящено решению актуальных задач прогнозирования количественных и качественных результатов выращивания семечковых плодовых культур (на примере яблок), на основе выявления причинно-следственных зависимостей между метеофакторами и этими результатами.

В разделе 1: "Постановка задачи и выбор метода ее решения" обоснованы актуальность, объект и предмет, цель и задачи исследования, приведены источники исходных данных, дана характеристика исходных данных и обоснованы требования к методу решения поставленных задач, кратко описаны традиционные методы решения, и сделан основной вывод о недостаточности традиционных подходов и целесообразности применения новых методов для решения поставленных задач.

В разделе 2: "Когнитивная структуризация, формальная постановка задачи и синтез модели" обоснованы выбор метода и концепция решения задачи, дано краткое описание метода системно-когнитивного анализа (СК-анализ), раскрыты его теоретические предпосылки, описаны математическая модель, методика численных расчетов, специальный программный инструментарий СК-анализа (система "Эйдос"), проведены когнитивная структуризация предметной области, формальная постановка задачи и формирование обучающей выборки. В частности, разработаны классификационные и описательные шкалы и градации, а также электронная форма для представления исходных данных и применен программный интерфейс СК-анализа для преобразования исходных данных из формы по датам в стандартную форму по фенофазам, осуществлен импорт исходных данных из стандартной формы по фенофазам в базы данных системы "Эйдос", а затем и синтез семантической информационной модели, ее оптимизация и проверка на адекватность. По результатам второй главы сделан главный вывод о том, что сформированная модель имеет достаточно высокую адекватность для того, чтобы ее исследование считать исследованием самого объекта.

В разделе 3: "Исследование семантический информационной модели" решены следующие задачи:

1. Прогнозирование результатов выращивания заданной культуры в заданной точке.

2. Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта.

3. Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне.

4. Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов.

Показано, что для решения перечисленных задач предварительно необходимо решить задачу определения периодов фенофаз для заданного сорта в данной зоне и микрозоне выращивания и задачу определения значений метеопараметров в заданной точке по их значениям в трех ближайших метеостанциях, что не является предметом данной работы. В третьей главе сделан вывод о том, что предложенный подход позволяет успешно решить поставленные задачи и достичь цели работы.

В разделе 4: "Эффективность применения полученного решения, его ограничения и перспективы развития" кратко описаны возможности применения предложенной технологии в проектных и производственных организациях, а также в образовательных учреждениях. Показаны ограничения разработанной технологии и перспективы ее развития. Сделан вывод об эффективности предложенной технологии и целесообразности ее применения и дальнейшего развития.

В выводах кратко перечислены полученные результаты, констатировано достижение цели работы, сформулирована научная новизна и практическая значимость проведенного исследования.

 

7.3.1. Постановка задачи и выбор метода
ее решения

 

7.3.1.1. Актуальность, объект и предмет,
цель и задачи исследования

 

Актуальность темы работы определяется возможностью применения ее результатов на практике в ряде организаций различных направлений деятельности: проектных; производственных; образовательных.

В проектных организациях методы надежного прогнозирования количественных и качественных результатов выращивания яблок могли бы стать основой для принятия ряда ответственных решений, связанных с проектированием новых садов.

С этим связано решение двух задач:

1. Решение о размещении сада (обоснованный выбор зоны и подзоны выращивания конкретных сортов и культур).

2. Выбор сортов для выращивания (обоснованный выбор сортов и культур для выращивания в конкретной зоне и подзоне).

В настоящее время эти решения принимаются по данным эмпирических испытаний в отдельных точках, чаще всего привязанных к крупным плодовым хозяйствам без возможности проводить испытание всего набора культур и без учета и анализа адаптивного и природно-ресурсного потенциала конкретного пункта выращивания. Подобный подход приводит к тому, что культуры выращиваются не там, где для этого есть природные условия, а там, где имеется необходимая инфраструктура (населенные пункты). В результате, например, ни один сортоучасток в Краснодарском крае не дает урожай абрикосов больше 4-х раз в 10 лет. Аналогично обстоит дело и с выбором культур для выращивания на полях, а также с выбором агротехнологий для их выращивания.

В производственных организациях методы надежного прогнозирования количественных и качественных результатов выращивания яблок могли бы стать основой для принятия ряда ответственных решений, связанных с заблаговременным выбором способа использования произведенной продукции (продажа, хранение, переработка), и, этим самым, созданием благоприятных условий для осуществления выбранного способа:

– определением цен и оформление партнерских отношений по фьючерсным и лизинговым сделкам;

– подготовкой материально-технической базы хранения и переработки.

В учебном процессе методы надежного прогнозирования количественных и качественных результатов выращивания яблок могут быть использованы для разработки полноценной лабораторной работы по дисциплине: "Интеллектуальные информационные системы", изучаемой на 5-м курсе специальности 351400 – Прикладная информатика.

Актуальность данной работы определяется также ее научной новизной. В настоящее время подобные исследования и разработки проводились под руководством заслуженного деятеля науки РФ, доктора сельскохозяйственных наук профессора И.А.Драгавцевой по косточковым плодовым культурам: персик и абрикос, и по семечковым, в частности яблокам, насколько известно по литературным данным, подобная работа проводится впервые.

Таким образом, объектом исследования является изучение влияния факторов различной природы на количественные и качественные результаты выращивания сельхозкультур.

Предмет исследования состоит в изучении влияния климатических факторов на урожайность и качество яблок пяти сортов: "Джонатан", "Ред Делишес", "Ренет Симеренко", "Ренет Шампанское", "Старкрымсон".

Цель исследования: выявление причинно-следственных зависимостей между климатическими факторами с одной стороны, и урожайностью и качеством различных сортов яблок с другой стороны, и, на основе этого, разработка соответствующей методики прогнозирования.

Цель достигается путем поэтапного решения следующих задач:

1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных.

2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы).

3. Разработка электронной формы для представления исходных данных.

4. Преобразование исходных данных в электронную форму.

5. Контроль достоверности исходных данных и исправление ошибок.

6. Использование программного интерфейса для преобразования исходных данных из формы по датам в стандартную форму по фенофазам.

7. Использование программного интерфейса для преобразования исходных данных из стандартной формы по фенофазам в базы данных,  используемые в инструментарии системно-когнитивного анализа (СК-анализ) – когнитивной аналитической системе "Эйдос" (система "Эйдос").

8. Синтез семантической информационной модели (СИМ).

9. Оптимизация СИМ.

10. Измерение адекватности СИМ.

11. Решение задачи №1: "Прогнозирование результатов выращивания заданной культуры в заданной точке".

12. Решение задачи №2: "Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта".

13. Решение задачи №3: "Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне".

14. Решение задачи №4: "Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов".

15. Разработка принципов оценки экономической эффективности разработанных технологий при их применении:

– в проектных организациях;

– в производственных организациях;

– в образовательных учреждениях.

16. Исследование ограничений разработанной технологии и перспектив ее развития.

 

7.3.1.2. Источники исходных данных

 

Основой для выполнения данной работы являются данные, предоставленные ЗАО Агрофирмой "Сад – Гигант" (353565, Россия, Краснодарский края, г. Славянск-на-Кубани, ул. Школьная, 615), которая является крупнейшим хозяйством России и мира в своей отрасли (http://sadgigant.ru).

Свою историю агрофирма "Сад-Гигант" отсчитывает с 1929 года, и, на протяжении 70-ти лет, хозяйство крупнейшим производителем фруктов в стране (рисунок 7.12).

 

Рисунок 7. 12. Агрофирма "Сад – Гигант", центральный офис

 

Более 15 лет возглавляет агрофирму "Сад-Гигант" Кладь Александр Анатольевич – известный ученый, профессор, доктор сельскохозяйственных наук в области садоводства, заслуженный работник сельского хозяйства России, прогрессивный руководитель, депутат краевого законодательного собрания.

Сегодня агрофирма - одно из ведущих хозяйств в России по производству плодовой продукции.

И можно с уверенностью сказать, что АФ "Сад- Гигант" крепко стоит на ногах, не пользуется заемными средствами, своевременно оплачивает налоги в бюджеты всех уровней, взносы во внебюджетные фонды и заработную плату своим работникам.

"Сад-Гигант" - это 3500 гектаров земельных угодий, из которых 2000 занято плодовыми насаждениями, где только плодоносящих яблонь около сорока сортов.

"Сад-Гигант" - это более 30 тысяч тонн свежих фруктов ежегодно.

На базе агрофирмы работает госсортоучасток, где ведется изучение и совершенствование сортимента плодовых культур. Здесь на площади 50 гектаров в конкурсном испытании заложено около 400 сортоопытов по пяти культурам: яблоня, груша, слива, алыча, черешня. Ежегодно коллекцию пополняет до 20 новых сортов и гибридов плодовых культур. На основе испытаний определяются перспективные сорта плодовых культур для промышленной основы в условиях нашего хозяйства. Так, за последний год, выделены по качеству, урожайности и рекомендованы следующие сорта: яблоня - "Алые паруса", "Флорина"; черешня - "Ярославна", "Роксалана", "Опус", "Эпос"; слива - "Блек Стар"; алыча - "Глобус".

Интенсивные технологии выращивания садов, новые перспективные сорта, хранение их в фруктохранилищах с регулируемой газовой атмосферой, товарная обработка плодов на голландской линии в фирменную гофротару - все это позволяет продукции агрофирмы в новых рыночных условиях быть конкурентоспособной.

В фирме организован и ведется систематический сбор и учет данных, необходимых для осуществления основной деятельности предприятия (плановых мероприятий по подкормке, обработке и уходу за культурами), а также для планирования и прогнозирования будущих результатов деятельности (качества и количества урожая).

Ответственными за этот учет являются:

– метеорологический центр;

– плановый отдел;

– лаборатория;

– отдел маркетинга.

Для выполнения данной работы использовались таблицы основных метеоданных за каждый день с 01.01.1993 по 31.12.2002 года, полученные в метеорологический центре, по следующим показателям:

– температуре воздуха;

– почвы;

– относительная и абсолютная влажность;

– осадки;

– атмосферное давление;

– облачность;

– скорость и азимут ветра;

– атмосферные явления.

Плановый отдел предоставил информацию по количеству и качеству выращенной продукции тон/гектар пяти сортов яблок за десять лет.

В лаборатории отобраны данные по времени начала и окончания фенологических фаз состояния и роста культур с момента набухания почки до завершения листопада.              

 

7.3.1.3. Характеристика исходных данных
и обоснование требований к методу
решения поставленных задач

 

Исходные данные представлены нами в форме Excel-таблицы, включающей показатели различных типов данных:

– "дата" – 27;

– "текст" – 1;

– "число" – 22;

– "список" – 1.

Эта таблица состоит из 51 столбца (показателя) и 18260 строк, т.е. имеет довольно большую размерность и имеет размер около 7 мегабайт.

Строки содержат суточные метеоданные, наблюдаемые при выращивании 5 сортов яблок в течение 10 лет.

4 числовых показателя содержат количественные и качественные результаты выращивания (урожайность всего и в разрезе по сортам качества) каждого из 5 сортов, что составляет 99 классов.

18 числовых и 1 списочный показатель содержат метеоданные и информацию о 18 типах метеоявлений по каждой фенотипической фазе развития растений, которых всего 13.

Соответственно, эти показатели при преобразовании даже в шкалы отношений образуют 559 шкал, что дает 2795 градаций уже при 5 интервалах, а при увеличении числа интервалов количество градаций еще больше возрастает.

Следовательно, используемый математический метод должен обеспечивать выявление причинно-следственных зависимостей между метеофакторами (причины), и количественными и качественными результатами выращивания (следствия) на основе совместной обработки разнотипных данных больших размерностей.

 

7.3.1.4. Традиционные методы решения

 

Традиционные статистические модели:

– имеют жесткие ограничения по количеству исследуемых факторов, как правило, не более 10, тогда как в исследуемой модели факторов 559 шкал суммарно с 2795 градациями;

– требуют информации о результатах действия всех сочетаний исследуемых факторов («повторности»), что в исследуемой предметной области практически невыполнимо даже при нескольких факторах.

Необходимо особо подчеркнуть, что восполнить отсутствующие данные из опыта не представляется возможным, т.к. объект исследования принципиально не допускает повторение условий прошедших периодов с заданными сочетаниями факторов, которые не зависят от воли человека. Восполнение данных путем интерполяции также некорректно, т.к. в каждой строке и столбце корреляционной матрицы имеется более одного пропуска.

Кроме того, статистические модели очень сложно содержательно интерпретировать, для чего требуются большой труд квалифицированных аналитиков.

Таким образом, можно сделать вывод, что для моделирования такого сложного и малоисследованного объекта, каким является искусственная экосистема яблочного сада, применение традиционных математических моделей является проблематичным.

 

7.3.1.5. Выводы

 

Традиционные методы обработки имеющихся исходных данных не обеспечивают решение поставленных задач и необходимо использование нового подхода, обеспечивающего выявление причинно-следственных зависимостей между метеофакторами (причины), и количественными и качественными результатами выращивания (следствия) на основе совместной обработки разнотипных данных больших размерностей.

 

7.3.2. Когнитивная структуризация, формальная
постановка задачи и синтез модели

 

7.3.2.1. Обоснование выбора метода
и концепция решения задачи

 

По-видимому, решение поставленных задач может быть получено путем применения системно-когнитивного анализа (СК-анализ) [82], – нового перспективного математического метода системного анализа, основанного на теории информации, системном анализе и когнитивном моделировании.

Метод является непараметрическим, позволяет сопоставимо обрабатывать тысячи градаций факторов и будущих состояний объекта управления при неполных (фрагментированных), зашумленных данных различной природы.

Для метода СК-анализа разработаны и методика численных расчетов, и соответствующий программный инструментарий, а также технология и методика их применения. Они прошли успешную апробацию при решении ряда задач в различных предметных областях [82].

Наличие инструментария СК-анализа позволяет не только осуществить синтез СИМ, но и периодически поводить адаптацию и синтез новых версий семантической информационной модели, обеспечивая тем самым отслеживание динамики предметной области и сохраняя высокую адекватность модели в изменяющихся условиях.

В работе [82] приведен перечень этапов системно-когнитивного анализа, которые необходимо выполнить, чтобы осуществить синтез модели и исследование модели объекта управления:

1. Когнитивная структуризация, а затем и формализация предметной области.

2. Ввод данных мониторинга в базу прецедентов за период, в течение которого имеется необходимая информация в электронной форме.

3. Синтез семантической информационной модели (СИМ).

4. Оптимизация СИМ.

5. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).

6. Анализ СИМ.

7. Решение задач идентификации состояний объекта управления, прогнозирование и поддержка принятия управленческих решений по управлению с применением СИМ.

В СК-анализе нечисловым величинам тем же методом, что и числовым, приписываются сопоставимые в пространстве и времени, а также между собой, количественные значения, позволяющие обрабатывать их как числовые:

– на первых двух этапах СК-анализа числовые величины сводятся к интервальным оценкам, как и информация об объектах нечисловой природы (фактах, событиях) (этот этап реализуется и в методах интервальной статистики);

– на третьем этапе СК-анализа всем этим величинам по единой методике, основанной на системном обобщении семантической теории информации А.Харкевича, сопоставляются количественные величины, с которыми в дальнейшем и производятся все операции моделирования (этот этап является уникальным для СК-анализа).

 

7.3.2.2. Когнитивная структуризация предметной
области, формальная постановка задачи
и формирование обучающей выборки

 

Рассмотрим подробнее пути реализации первого этапа СК-анализа. На этом этапе:

– конкретно определяются факторы и будущие состояния объекта управления;

– измеряется область изменения числовых значений факторов и интервалы (диапазоны), а также макропараметров, определяющих состояния объекта управления;

– конструируются классификационные и описательные шкалы и градации и их кодирование;

– исходные данные кодируются в системе классификационных и описательных шкал и градаций, и формируется обучающая выборка (база прецедентов, содержащая в формализованный опыт управления перерабатывающим комплексом региона за ряд лет).

Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных
Когнитивная структуризация предметной области

Под когнитивной структуризацией понимается определение будущих состояний системы, т.е. ее желательных (целевых) и нежелательных будущих состояний, а также системы факторов, детерминирующих эти будущие состояния.

В общем случае, как факторы могут рассматриваться и факторы окружающей среды, и технологические факторы, и параметры объекта исследования на низких уровнях ее иерархической структурно-функциональной организации. В данном исследовании как факторы рассматриваются климатические факторы и явления.

Предлагаем для исследования в модели следующие состояния объекта исследования (классы) (таблица 7.1) и детерминирующие их факторы (признаки) (таблица 7.2).

 

Таблица 7. 1 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ (КЛАССЫ) (ФРАГМЕНТ)

Наименование

Наименование

1

Джонатан (всего)

11

Джонатан (2-й сорт)

2

Ред Делишес (всего)

12

Ред Делишес (2-й сорт)

3

Ренет Симеренко (всего)

13

Ренет Симеренко (2-й сорт)

4

Ренет Шампанское (всего)

14

Ренет Шампанское (2-й сорт)

5

Старкрымсон (всего)

15

Старкрымсон (2-й сорт)

6

Джонатан (1-й сорт)

16

Джонатан (3-й сорт)

7

Ред Делишес (1-й сорт)

17

Ред Делишес (3-й сорт)

8

Ренет Симеренко (1-й сорт)

18

Ренет Симеренко (3-й сорт)

9

Ренет Шампанское (1-й сорт)

19

Ренет Шампанское (3-й сорт)

10

Старкрымсон (1-й сорт)

20

Старкрымсон (3-й сорт)

 

Имеется в виду урожайность с 1га по всем сортам яблок "всего" и "в том числе" по трем сортам качества.

 

Таблица 7. 2 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ (ФАКТОРЫ) (ФРАГМЕНТ)

Условное

наименование

Условное

наименование

Условное

наименование

Условное

наименование

1

01TVOZDSR

44

02TVOZDSR

87

03TVOZDSR

130

04TVOZDSR

2

01TVOZDMAX

45

02TVOZDMAX

88

03TVOZDMAX

131

04TVOZDMAX

3

01TVOZDMIN

46

02TVOZDMIN

89

03TVOZDMIN

132

04TVOZDMIN

4

01TPOCHSR

47

02TPOCHSR

90

03TPOCHSR

133

04TPOCHSR

5

01TPOCHMAX

48

02TPOCHMAX

91

03TPOCHMAX

134

04TPOCHMAX

6

01TPOCHMIN

49

02TPOCHMIN

92

03TPOCHMIN

135

04TPOCHMIN

7

01VLOTNSR

50

02VLOTNSR

93

03VLOTNSR

136

04VLOTNSR

8

01VLOTNMIN

51

02VLOTNMIN

94

03VLOTNMIN

137

04VLOTNMIN

9

01VLABS

52

02VLABS

95

03VLABS

138

04VLABS

10

01OSAD_DAY

53

02OSAD_DAY

96

03OSAD_DAY

139

04OSAD_DAY

11

01OSAD_NIG

54

02OSAD_NIG

97

03OSAD_NIG

140

04OSAD_NIG

12

01OSAD_SUT

55

02OSAD_SUT

98

03OSAD_SUT

141

04OSAD_SUT

13

01DAVL_STA

56

02DAVL_STA

99

03DAVL_STA

142

04DAVL_STA

14

01DAVL_SEA

57

02DAVL_SEA

100

03DAVL_SEA

143

04DAVL_SEA

15

01OBL_VSEG

58

02OBL_VSEG

101

03OBL_VSEG

144

04OBL_VSEG

16

01OBL_DOWN

59

02OBL_DOWN

102

03OBL_DOWN

145

04OBL_DOWN

17

01VETER_AZ

60

02VETER_AZ

103

03VETER_AZ

146

04VETER_AZ

18

01VETER_SK

61

02VETER_SK

104

03VETER_SK

147

04VETER_SK

19

01ATM_00

62

02ATM_00

105

03ATM_00

148

04ATM_00

20

01ATM_01

63

02ATM_01

106

03ATM_01

149

04ATM_01

21

01ATM_02

64

02ATM_02

107

03ATM_02

150

04ATM_02

22

01ATM_03

65

02ATM_03

108

03ATM_03

151

04ATM_03

23

01ATM_04

66

02ATM_04

109

03ATM_04

152

04ATM_04

24

01ATM_05

67

02ATM_05

110

03ATM_05

153

04ATM_05

25

01ATM_06

68

02ATM_06

111

03ATM_06

154

04ATM_06

26

01ATM_07

69

02ATM_07

112

03ATM_07

155

04ATM_07

27

01ATM_08

70

02ATM_08

113

03ATM_08

156

04ATM_08

28

01ATM_09

71

02ATM_09

114

03ATM_09

157

04ATM_09

29

01ATM_10

72

02ATM_10

115

03ATM_10

158

04ATM_10

30

01ATM_11

73

02ATM_11

116

03ATM_11

159

04ATM_11

31

01ATM_12

74

02ATM_12

117

03ATM_12

160

04ATM_12

32

01ATM_13

75

02ATM_13

118

03ATM_13

161

04ATM_13

33

01ATM_14

76

02ATM_14

119

03ATM_14

162

04ATM_14

34

01ATM_15

77

02ATM_15

120

03ATM_15

163

04ATM_15

35

01ATM_16

78

02ATM_16

121

03ATM_16

164

04ATM_16

36

01ATM_17

79

02ATM_17

122

03ATM_17

165

04ATM_17

37

01ATM_18

80

02ATM_18

123

03ATM_18

166

04ATM_18

38

01ATM_19

81

02ATM_19

124

03ATM_19

167

04ATM_19

39

01ATM_20

82

02ATM_20

125

03ATM_20

168

04ATM_20

40

01ATM_21

83

02ATM_21

126

03ATM_21

169

04ATM_21

41

01ATM_22

84

02ATM_22

127

03ATM_22

170

04ATM_22

42

01ATM_23

85

02ATM_23

128

03ATM_23

171

04ATM_23

43

01ATM_24

86

02ATM_24

129

03ATM_24

172

04ATM_24

 

В таблице 7.2 приведены наименования 172-х шкал для 4-х фаз. Аналогичны наименования  и остальных шкал для всех 13 фаз (всего 559 шкал).

 

Таблица 7. 3 – РАСШИФРОВКА УСЛОВНЫХ НАИМЕНОВАНИЙ

Условное

наименование

Расшифровка

1

01TVOZDSR

Температура воздуха средняя (°С)

2

01TVOZDMAX

Температура воздуха максимальная (°С)

3

01TVOZDMIN

Температура воздуха минимальная (°С)

4

01TPOCHSR

Температура почвы средняя (°С)

5

01TPOCHMAX

Температура почвы максимальная (°С)

6

01TPOCHMIN

Температура почвы минимальная (°С)

7

01VLOTNSR

Влажность относительная средняя

8

01VLOTNMIN

Влажность относительная минимальная

9

01VLABS

Влажность абсолютная

10

01OSAD_DAY

Количество осадков днем

11

01OSAD_NIG

Количество осадков за ночь

12

01OSAD_SUT

Количество осадков за сутки

13

01DAVL_STA

Атмосферное давление на уровне метеостанции

14

01DAVL_SEA

Атмосферное давление на уровне моря

15

01OBL_VSEG

Облачность всего

16

01OBL_DOWN

Облачность низкая

17

01VETER_AZ

Ветер азимут (способ кодирования в таблица 8)

18

01VETER_SK

Ветер скорость

19

01ATM_00

Штиль

20

01ATM_01

Дождь

21

01ATM_02

Ливневый дождь

22

01ATM_03

Морось

23

01ATM_04

Снег

24

01ATM_05

Ливневый снег

25

01ATM_06

Снежная крупа

26

01ATM_07

Снежные зерна

27

01ATM_08

Ледяная крупа

28

01ATM_09

Ледяной дождь

29

01ATM_10

Град

30

01ATM_11

Мокрый снег

31

01ATM_12

Ливневый мокрый снег

32

01ATM_13

Роса

33

01ATM_14

Иней

34

01ATM_15

Гололед

35

01ATM_16

Зернистая изморось

36

01ATM_17

Кристаллическая изморось

37

01ATM_18

Гололедица

38

01ATM_19

Туман

39

01ATM_20

Просвечивающийся туман

40

01ATM_21

Дымка

41

01ATM_22

Гроза

42

01ATM_23

Зарница

42

01ATM_24

Шквал

 

Двузначный номер в начале условного наименования в таблицах 7.2, 7.3 и далее означает номер фазы и изменяется от 1 до 13.

В таблице 7.4 приведен способ кодирования азимута ветра.

 

Таблица 7. 4 – СПОСОБ КОДИРОВАНИЯ АЗИМУТА ВЕТРА

Код

Расшифровка

0

Северный

45

Северо-западный

90

Западный

135

Юго-западный

180

Южный

225

Юго-восточный

270

Восточный.

315

Северо-восточный

Формализация предметной области

Формализация предметной области осуществляется на основе ее когнитивной структуризации, проведенной в предыдущем разделе.

Формализация предметной области – это конструирование классификационных (таблица 7.5) и описательных шкал и градаций (таблицы 7.6 и 7.7), как правило, порядкового типа с использованием интервальных оценок, в системе которых предметная область описывается в форме, пригодной для обработки на компьютере с использованием математических моделей [82].

В соответствии с методом СК-анализа каждый числовой фактор, независимо от его смысла и единиц измерения, рассматривается как переменная числовая величина, принимающая определенное множество значений. Подобные величины формализуются путем сведения к интервальным значениям, т.е. путем введения некоторого количества диапазонов, охватывающих все множество значений фактора, и установления фактов попадания конкретного значения величины в определенный диапазон.

Для каждого фактора устанавливаются свои границы диапазонов, исходя из их количества и множества значений величины фактора.

Количество диапазонов может быть различным для разных факторов, но на практике удобнее выбирать их одинаковым. Каковы же соображения, из которых исходят при выборе количества диапазонов? Чем больше диапазонов, тем точнее интервальные оценки. Однако это так только тогда, когда, по крайней мере, для большинства диапазонов наблюдаются факты попадания значений факторов в них. Очевидно, для этого необходимо достаточно большое количество данных. Если же их нет, то многие диапазоны могут оказаться пустыми и модель приближается к детерминистскому типу. Тогда имеет смысл уменьшить их количество и тем самым укрупнить их.

Из этих рассуждений следует вывод о том, что при большом количестве данных оправданно увеличивать количество диапазонов и имеется возможность повысить точность исследования. Когда же данных недостаточно, приходится укрупнять диапазоны, что приводит к некоторой потере точности выводов, но делает их более обоснованными статистически. По-видимому, это утверждение можно считать одной из форм теоремы Котельникова об отсчетах.

СК-анализ предусматривает также возможность использования вторичных показателей, являющихся различными функциями первичных показателей. Но этот подход требует данных большего объема и за больший период времени и, поэтому, в данном исследовании применяться не будет.

Основываясь на этих соображениях нами, прежде всего, было определено количество диапазонов, количество которых было выбрано равным 5.

Затем были определены границы каждого диапазона. Для этого:

– для каждого фактора были определены минимальное и максимальное значения;

– весь интервал значений был разделен на пять равных частей (это означает, что фактически используется не порядковая шкала, как это выглядит на первый взгляд, а шкала отношений).

Исходя из этого были сконстурированы классифкационные и описательные шкалы и градации (таблицы 51 – 53).

 

Таблица 7. 5 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ (КЛАССЫ)

Код

Наименование

Код

Наименование

1

Джонатан (всего)    - урожай: 10.00

51

Ред Делишес (1-й сорт) - урожай: 18.00

2

Джонатан (всего)    - урожай: 11.00

52

Ред Делишес (1-й сорт) - урожай: 23.00

3

Джонатан (всего)    - урожай: 12.00

53

Ред Делишес (1-й сорт) - урожай: 25.00

4

Джонатан (всего)    - урожай: 13.00

54

Ред Делишес (1-й сорт) - урожай: 9.00

5

Джонатан (всего)    - урожай: 14.00

55

Ренет Симеренко (1-й сорт) - урожай: 11.00

6

Джонатан (всего)    - урожай: 15.00

56

Ренет Симеренко (1-й сорт) - урожай: 14.00

7

Джонатан (всего)    - урожай: 5.00

57

Ренет Симеренко (1-й сорт) - урожай: 15.00

8

Ред Делишес (всего)    - урожай: 10.00

58

Ренет Симеренко (1-й сорт) - урожай: 18.00

9

Ред Делишес (всего)    - урожай: 14.00

59

Ренет Симеренко (1-й сорт) - урожай: 19.00

10

Ред Делишес (всего)    - урожай: 15.00

60

Ренет Симеренко (1-й сорт) - урожай: 26.00

11

Ред Делишес (всего)    - урожай: 16.00

61

Ренет Симеренко (1-й сорт) - урожай: 3.00

12

Ред Делишес (всего)    - урожай: 18.00

62

Ренет Шампанское (1-й сорт) - урожай: 13.00

13

Ред Делишес (всего)    - урожай: 19.00

63

Ренет Шампанское (1-й сорт) - урожай: 15.00

14

Ред Делишес (всего)    - урожай: 24.00

64

Ренет Шампанское (1-й сорт) - урожай: 16.00

15

Ред Делишес (всего)    - урожай: 27.00

65

Ренет Шампанское (1-й сорт) - урожай: 19.00

16

Ренет Симеренко (всего)    - урожай: 12.00

66

Ренет Шампанское (1-й сорт) - урожай: 20.00

17

Ренет Симеренко (всего)    - урожай: 15.00

67

Ренет Шампанское (1-й сорт) - урожай: 24.00

18

Ренет Симеренко (всего)    - урожай: 16.00

68

Ренет Шампанское (1-й сорт) - урожай: 8.00

19

Ренет Симеренко (всего)    - урожай: 17.00

69

Старкрымсон (1-й сорт) - урожай: 11.00

20

Ренет Симеренко (всего)    - урожай: 20.00

70

Старкрымсон (1-й сорт) - урожай: 13.00

21

Ренет Симеренко (всего)    - урожай: 22.00

71

Старкрымсон (1-й сорт) - урожай: 14.00

22

Ренет Симеренко (всего)    - урожай: 28.00

72

Старкрымсон (1-й сорт) - урожай: 17.00

23

Ренет Симеренко (всего)    - урожай: 3.00

73

Старкрымсон (1-й сорт) - урожай: 7.00

24

Ренет Симеренко (всего)    - урожай: 4.00

74

Старкрымсон (1-й сорт) - урожай: 8.00

25

Ренет Шампанское (всего)    - урожай: 10.00

75

Джонатан (2-й сорт) - урожай: 0.00

26

Ренет Шампанское (всего)    - урожай: 14.00

76

Джонатан (2-й сорт) - урожай: 1.00

27

Ренет Шампанское (всего)    - урожай: 15.00

77

Джонатан (2-й сорт) - урожай: 15.00

28

Ренет Шампанское (всего)    - урожай: 17.00

78

Джонатан (2-й сорт) - урожай: 2.00

29

Ренет Шампанское (всего)    - урожай: 21.00

79

Ред Делишес (2-й сорт) - урожай: 1.00

30

Ренет Шампанское (всего)    - урожай: 22.00

80

Ред Делишес (2-й сорт) - урожай: 2.00

31

Ренет Шампанское (всего)    - урожай: 23.00

81

Ренет Симеренко (2-й сорт) - урожай: 0.00

32

Ренет Шампанское (всего)    - урожай: 25.00

82

Ренет Симеренко (2-й сорт) - урожай: 1.00

33

Ренет Шампанское (всего)    - урожай: 27.00

83

Ренет Симеренко (2-й сорт) - урожай: 2.00

34

Старкрымсон (всего)    - урожай: 10.00

84

Ренет Шампанское (2-й сорт) - урожай: 1.00

35

Старкрымсон (всего)    - урожай: 12.00

85

Ренет Шампанское (2-й сорт) - урожай: 2.00

36

Старкрымсон (всего)    - урожай: 15.00

86

Ренет Шампанское (2-й сорт) - урожай: 3.00

37

Старкрымсон (всего)    - урожай: 16.00

87

Старкрымсон (2-й сорт) - урожай: 1.00

38

Старкрымсон (всего)    - урожай: 18.00

88

Старкрымсон (2-й сорт) - урожай: 2.00

39

Старкрымсон (всего)    - урожай: 20.00

89

Старкрымсон (2-й сорт) - урожай: 3.00

40

Старкрымсон (всего)    - урожай: 9.00

90

Джонатан (3-й сорт) - урожай: 0.00

41

Джонатан (1-й сорт) - урожай: 12.00

91

Джонатан (3-й сорт) - урожай: 1.00

42

Джонатан (1-й сорт) - урожай: 13.00

92

Ред Делишес (3-й сорт) - урожай: 0.00

43

Джонатан (1-й сорт) - урожай: 14.00

93

Ред Делишес (3-й сорт) - урожай: 1.00

44

Джонатан (1-й сорт) - урожай: 3.00

94

Ренет Симеренко (3-й сорт) - урожай: 0.00

45

Джонатан (1-й сорт) - урожай: 7.00

95

Ренет Симеренко (3-й сорт) - урожай: 1.00

46

Джонатан (1-й сорт) - урожай: 9.00

96

Ренет Шампанское (3-й сорт) - урожай: 0.00

47

Ред Делишес (1-й сорт) - урожай: 13.00

97

Ренет Шампанское (3-й сорт) - урожай: 1.00

48

Ред Делишес (1-й сорт) - урожай: 14.00

98

Старкрымсон (3-й сорт) - урожай: 0.00

49

Ред Делишес (1-й сорт) - урожай: 15.00

99

Старкрымсон (3-й сорт) - урожай: 1.00

50

Ред Делишес (1-й сорт) - урожай: 17.00

 

 

 

Таблица 7. 6 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И КОДЫ ГРАДАЦИЙ (ЗНАЧЕНИЯ ФАКТОРОВ) (ФРАГМЕНТ)

Код

Условное

наименование

1

2