Данная задача взята из книги Д.Мичи и Р.Джонстона "Компьютер – творец" (c.205-208), в которой она приводится в качестве примера задачи, решаемой методами искусственного интеллекта. Авторами этой задачи являются Рышард Михальски и Джеймс Ларсон.
Суть этой задачи сводится к тому, чтобы выработать правила, обеспечивающие идентификацию железнодорожных составов и прогнозирование направления их следования на основе их формализованных или вербальных описаний.
Выбор данной задачи не накладывает ограничений на выводы, полученные в результате ее исследования. Это обусловлено тем, что она имеет ряд характерных особенностей, наблюдающихся в подобных задачах в самых различных предметных областях. Поэтому ее с полным основанием можно рассматривать как типовую для широкого класса задач идентификации и прогнозирования.
Эти особенности состоят в следующем:
1. Рассматривается ряд объектов, имеющих сложную многоуровневую структуру признаков.
2. Для каждого из этих объектов известно, к каким обобщенным категориям (классам) он относится.
3. Необходимо сформировать модель, обеспечивающую как идентификацию объектов, так и определение их принадлежности к обобщенным классам.
Если признаки и классы относятся к одному времени, то имеет место задача идентификации (распознавания). Если же признаки (факторы, причины) относятся к прошлому, а классы, характеризующие состояния объектов, – к будущему, то это задача прогнозирования. Математически эти задачи не отличаются.
Существуют различные подходы к решению данной задачи, отличающиеся способами формализации предметной области, объектов обучающей выборки и синтеза математической модели.
В данной работе мы исследуется два основных подхода:
1. "Классический", основанный на изучении объектов предметной области экспертами (когнитивный анализ), выделении признаков объектов и формировании описательных шкал и градаций, которым соответствуют уникальные коды.
2. "Лингвистический", в котором вербальные описания объектов предметной области на естественном языке используются для автоматизированной формализации предметной области, формирования обучающей выборки и синтеза модели.
Кратко рассмотрим реализацию обоих этих подходов в интеллектуальной технологии "Эйдос" [64]. Исходные данные к задаче представлены в графической форме (рисунок 93).
|
Рисунок 93. Примеры поездов, идущих на запад и на восток |
Железнодорожный состав является сложным объектом, имеющим несколько иерархических уровней и допускающим, соответственно, несколько уровней описания. Некоторые из этих уровней приведены в таблице 42.
Можно, например, описывать составы с использованием шкал только 2-го или только 3-го уровней. Возможны и смешанные варианты.
1-й вариант соответствует представлению о том, что на запад или восток идут не составы, а отдельные вагоны (отличающиеся типом и грузом), а состав идет туда же, куда и большинство вагонов.
2-й вариант предполагает, что составы как бы не состоят из различных вагонов с различными грузами, а свойства вагонов и грузов являются свойствами непосредственно состава.
Таблица 42 – УРОВНИ ОПИСАНИЯ ЖЕЛЕЗНОДОРОЖНЫХ СОСТАВОВ
№ |
Уровень описания |
Шкала |
Градация |
1. |
На уровне направления
движения состава |
Направление движения
состава |
Запад |
Восток |
|||
2. |
На уровне поезда |
Количество вагонов в составе |
2 |
3 |
|||
4 |
|||
Типы вагонов |
Закодировать все варианты |
||
Порядок вагонов в составе:
код 1-го вагона, код 2-го вагона и т.д. |
|
||
3. |
На уровне признаков вагонов и грузов |
Форма вагона |
V-образная |
Прямоугольная |
|||
Ромбовидная |
|||
U-образная |
|||
Эллипсоидная |
|||
Длина вагона |
Короткий |
||
Длинный |
|||
Количество осей |
2 |
||
3 |
|||
Вид стенок вагона |
Одинарные |
||
Двойные |
|||
Вид крыши |
Отсутствует |
||
Гофрированная |
|||
Двухскатная |
|||
Прямая (эллипсоидная) |
|||
Вид и количество |
1 большой круг |
||
2 маленьких круга |
|||
3 маленьких круга |
|||
1 квадрат |
|||
3 квадрата |
|||
1 короткий прямоугольник |
|||
2 коротких прямоугольника |
|||
1 длинный прямоугольник |
|||
1 треугольник |
|||
1 перевернутый треугольник |
|||
1 ромб |
|||
1 шестиугольник |
|||
Груз отсутствует |
Необходимо отметить, что сравнительно небольшое количество признаков вагонов обеспечивает огромное количество различных типов вагонов с различными сочетаниями этих признаков, из которых реально в приведенных составах встречается лишь незначительная часть. Очевидно, существует еще большее число вариантов сочетаний различных типов вагонов с видами грузов, порядков следования вагонов и грузов друг за другом и т.п. Из этого следуют по крайней мере два основных вывода:
1. Составить исчерпывающий справочник для описания состава на 2-м уровне, в котором бы указывались все варианты сочетаний различных типов вагонов с различными грузами, на практике довольно трудоемко и вряд ли целесообразно (из-за его огромной размерности).
2. Реально встречающиеся в составах сочетания типов вагонов и видов грузов практически все будут являться уникальными, что обеспечит однозначную идентификацию составов, если их описывать только на 2-м уровне. Это превращает задачу в тривиальную. Поэтому будем рассматривать описание составов на 3-м уровне с элементами 2-го.
Вербальные
описания железнодорожных составов практически на естественном языке являются их
лингвистическими моделями, которые могут обрабатываться в системе
"Эйдос". При этом в справочники
будут заноситься, причем автоматически, только реально встретившиеся признаки
составов.
Рассмотрим классический и лингвистический подходы на примере решения задач 1 и 2.
1. Формализовать задачу, создав классификационные и описательные шкалы (с использованием таблицы 42) и обучающую выборку на основе рисунка 93.
2. Осуществить синтез и верификацию модели.
3. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портреты классов").
4. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
5. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.
1. Создать стандартизированные (с использованием исходных данных, приведенных на рисунке 93) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB в виде: ####-zap.txt и ####-vos.txt.
2. Сгенерировать классификационные и описательные шкалы в режиме: "Автоввод первичных признаков и TXT-файлов", "Признаки – слова".
3. Сгенерировать обучающую выборку с использованием режима: "Ввод – корректировка обучающей выборки", "F7 InpTXT", "F6 Ввод из всех файлов". Дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток".
4. Осуществить синтез и верификацию семантической информационной модели.
5. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портеры классов").
6. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
7. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Отобразить в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.
Для этих целей используем таблицу 43 и рисунок 93. В результате получим таблицы 43 и 44.
Таблица
43 – КЛАССИФИКАЦИОННЫЕ
И ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
КЛАССЫ |
ПРИЗНАКИ |
Таблица 44 – ОБУЧАЮЩАЯ ВЫБОРКА
№ |
Наименование состава |
Коды классов |
Коды признаков |
|||||||||||
1 |
Состав-1 |
1 |
3 |
3 |
5 |
5 |
5 |
5 |
9 |
9 |
10 |
10 |
11 |
11 |
11 |
12 |
13 |
13 |
13 |
13 |
15 |
15 |
15 |
17 |
19 |
||||
29 |
27 |
23 |
|
|
|
|
|
|
|
|
||||
2 |
Состав-2 |
1 |
4 |
2 |
5 |
4 |
7 |
9 |
9 |
9 |
2 |
2 |
2 |
13 |
13 |
13 |
15 |
15 |
18 |
20 |
24 |
27 |
|
|
|
||||
3 |
Состав-3 |
1 |
5 |
2 |
5 |
6 |
5 |
10 |
9 |
9 |
12 |
11 |
11 |
13 |
13 |
13 |
18 |
18 |
15 |
28 |
27 |
19 |
|
|
|
||||
4 |
Состав-4 |
1 |
6 |
3 |
5 |
8 |
5 |
4 |
9 |
9 |
9 |
9 |
13 |
13 |
13 |
14 |
15 |
15 |
15 |
18 |
22 |
29 |
27 |
27 |
11 |
||||
11 |
11 |
11 |
|
|
|
|
|
|
|
|
||||
5 |
Состав-5 |
1 |
7 |
2 |
5 |
5 |
5 |
9 |
9 |
10 |
11 |
11 |
12 |
13 |
13 |
14 |
18 |
18 |
15 |
19 |
26 |
27 |
|
|
|
||||
6 |
Состав-6 |
2 |
8 |
1 |
5 |
5 |
9 |
10 |
11 |
11 |
13 |
13 |
15 |
18 |
27 |
21 |
|
|
|
|
|
|
|
|
|
||||
7 |
Состав-7 |
2 |
9 |
2 |
5 |
5 |
7 |
10 |
9 |
9 |
11 |
11 |
11 |
13 |
13 |
14 |
16 |
15 |
15 |
31 |
27 |
19 |
|
|
|
||||
8 |
Состав-8 |
2 |
10 |
1 |
7 |
5 |
9 |
10 |
11 |
12 |
19 |
26 |
15 |
18 |
13 |
13 |
|
|
|
|
|
|
|
|
|
||||
9 |
Состав-9 |
2 |
11 |
3 |
4 |
4 |
5 |
5 |
9 |
9 |
9 |
10 |
11 |
11 |
11 |
11 |
13 |
13 |
13 |
13 |
15 |
15 |
15 |
16 |
19 |
||||
24 |
26 |
19 |
|
|
|
|
|
|
|
|
||||
10 |
Состав-10 |
2 |
12 |
1 |
5 |
7 |
9 |
10 |
11 |
11 |
13 |
13 |
15 |
15 |
25 |
24 |
|
|
|
|
|
|
|
|
|
Создать стандартизированные (с использованием рисунка 1) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB с именами вида: ####-zap.txt и ####-vos.txt, где #### – номер анкеты (состава): 0001, 0002 и т.д., а остальные символы – произвольные, но выбираются таким образом, чтобы они отражали содержание анкеты.
0001-VOS.TXT Кол-во_вагонов=4 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_прямоугольная длина_вагона_короткий длина_вагона_короткий длина_вагона_длинный длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=3 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_двухскатная груз_1_большой_круг груз_1_шестиугольник груз_1_треугольник груз_3_квадрата |
0002-VOS.TXT Кол-во_вагонов=3 форма_вагона_прямоугольная форма_вагона_V-образная форма_вагона_U-образная длина_вагона_короткий длина_вагона_короткий длина_вагона_короткий N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_прямая груз_2_маленьких_круга груз_1_короткий_прямоугольник груз_1_треугольник |
0003-VOS.TXT Кол-во_вагонов=3 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_ромбовидная длина_вагона_длинный длина_вагона_короткий длина_вагона_короткий N_осей_вагона=3 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_прямая крыша_вагона_прямая груз_1_большой_круг груз_1_треугольник груз_1_перевернутый_треугольник |
0004-VOS.TXT Кол-во_вагонов=4 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_эллипсоидная форма_вагона_V-образная длина_вагона_короткий длина_вагона_короткий длина_вагона_короткий длина_вагона_короткий N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_двойные крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_прямая груз_1_квадрат груз_1_треугольник груз_1_треугольник груз_1_ромб |
0005-VOS.TXT Кол-во_вагонов=3 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_прямоугольная длина_вагона_короткий длина_вагона_короткий длина_вагона_длинный N_осей_вагона=3 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_двойные крыша_вагона_отсутствует крыша_вагона_прямая крыша_вагона_прямая груз_1_большой_круг груз_1_треугольник груз_1_длинный_прямоугольник |
0006-ZAP.TXT Кол-во_вагонов=2 форма_вагона_прямоугольная форма_вагона_прямоугольная длина_вагона_короткий длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_прямая груз_3_маленьких_круга груз_1_треугольник |
0007-ZAP.TXT Кол-во_вагонов=3 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_U-образная длина_вагона_короткий длина_вагона_короткий длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_двойные крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_гофрированная груза_нет груз_1_большой_круг груз_1_треугольник |
0008-ZAP.TXT Кол-во_вагонов=2 форма_вагона_прямоугольная форма_вагона_U-образная длина_вагона_короткий длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=3 стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_прямая груз_1_большой_круг груз_1_длинный_прямоугольник |
0009-ZAP.TXT Кол-во_вагонов=4 форма_вагона_прямоугольная форма_вагона_прямоугольная форма_вагона_V-образная форма_вагона_V-образная длина_вагона_короткий длина_вагона_короткий длина_вагона_короткий длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_отсутствует крыша_вагона_гофрированная груз_1_большой_круг груз_1_большой_круг груз_1_длинный_прямоугольник груз_1_короткий_прямоугольник |
0010-ZAP.TXT Кол-во_вагонов=2 форма_вагона_прямоугольная форма_вагона_U-образная длина_вагона_короткий длина_вагона_длинный N_осей_вагона=2 N_осей_вагона=2 стенки_вагона_одинарные стенки_вагона_одинарные крыша_вагона_отсутствует крыша_вагона_отсутствует груз_1_короткий_прямоугольник груз_2_коротких_прямоугольника |
Для этого используем режим: "F1 Словари – Автоввод первичных признаков и TXT-файлов – F3 Признаки – слова".
Классы во втором задании те же самые, что и в первом. Признаки выглядят несколько иначе, т.к. формируются автоматически из текстовых описаний составов, но по смыслу они также совпадают (таблица 45).
Таблица
45 – КЛАССИФИКАЦИОННЫЕ И ОПИСАТЕЛЬНЫЕ
ШКАЛЫ И ГРАДАЦИИ
КЛАССЫ ===================================== |
Код | Н а и м е н о в а н и е | |класса| класса распознавания | |===================================| | 1 | Состав следует на ВОСТОК | | 2 | Состав следует на ЗАПАД | | 3 | Состав-01 | | 4 | Состав-02 | | 5 | Состав-03 | | 6 | Состав-04 | | 7 | Состав-05 | | 8 | Состав-06 | | 9 | Состав-07 | | 10 | Состав-08 | | 11 | Состав-09 | | 12 | Состав-10 | ===================================== |
ПРИЗНАКИ ======================================= | 1|N_осей_вагона=2 | | 2|N_осей_вагона=3 | | 3|Кол-во_вагонов=2 | | 4|Кол-во_вагонов=3 | | 5|Кол-во_вагонов=4 | | 6|груз_1_большой_круг | | 7|груз_1_длинный_прямоугольник | | 8|груз_1_квадрат | | 9|груз_1_короткий_прямоугольник | | 10|груз_1_перевернутый_треугольник | | 11|груз_1_ромб | | 12|груз_1_треугольник | | 13|груз_1_шестиугольник | | 14|груз_2_коротких_прямоугольника | | 15|груз_2_маленьких_круга | | 16|груз_3_квадрата | | 17|груз_3_маленьких_круга | | 18|груза_нет | | 19|длина_вагона_длинный | | 20|длина_вагона_короткий | | 21|крыша_вагона_гофрированная | | 22|крыша_вагона_двухскатная | | 23|крыша_вагона_отсутствует | | 24|крыша_вагона_прямая | | 25|стенки_вагона_двойные | | 26|стенки_вагона_одинарные | | 27|форма_вагона_U-образная | | 28|форма_вагона_V-образная | | 29|форма_вагона_прямоугольная | | 30|форма_вагона_ромбовидная | | 31|форма_вагона_эллипсоидная | ======================================= |
Используем режим: "F2 Обучение – Ввод – корректировка обучающей выборки – F7 InpTXT – F6 Ввод из всех файлов". Затем необходимо дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток". Обучающая выборка будет иметь вид, приведенный в таблице 46.
Таблица 46 – ОБУЧАЮЩАЯ ВЫБОРКА
|
Этапы синтеза модели, ее оптимизации, проверки адекватности (которая в данном случае равна 100 %) и анализа подробно описаны в работах [64, 92]. Поэтому в данной работе мы приведем лишь их результаты.
Основная матрица семантической информационной модели приведена в таблице 47.
Таблица 47 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ
Атр |
Коды классов |
Сум. |
Ср. |
Отк. |
|||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
||||
1 |
-0,03 |
0,03 |
-0,08 |
0,09 |
-0,16 |
0,09 |
-0,16 |
0,07 |
0,09 |
-0,35 |
0,09 |
0,07 |
-0,23 |
-0,02 |
0,14 |
2 |
0,17 |
-0,34 |
0,39 |
|
0,55 |
|
0,55 |
|
|
0,78 |
|
|
2,11 |
0,18 |
0,32 |
3 |
|
0,5 |
|
|
|
|
|
0,96 |
|
0,96 |
|
0,96 |
3,37 |
0,28 |
0,43 |
4 |
0,17 |
-0,34 |
|
0,55 |
0,55 |
|
0,55 |
|
0,55 |
|
|
|
2,05 |
0,17 |
0,30 |
5 |
0,1 |
-0,16 |
0,56 |
|
|
0,56 |
|
|
|
|
0,56 |
|
1,62 |
0,14 |
0,26 |
6 |
-0,16 |
0,16 |
0,05 |
|
0,22 |
|
0,22 |
|
0,22 |
0,44 |
0,47 |
|
1,60 |
0,13 |
0,19 |
7 |
-0,32 |
0,26 |
|
|
|
|
0,73 |
|
|
0,96 |
0,56 |
|
2,18 |
0,18 |
0,37 |
8 |
0,35 |
|
|
|
|
1,22 |
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
9 |
-0,32 |
0,26 |
|
0,73 |
|
|
|
|
|
|
0,56 |
0,96 |
2,18 |
0,18 |
0,37 |
10 |
0,35 |
|
|
|
1,39 |
|
|
|
|
|
|
|
1,74 |
0,14 |
0,40 |
11 |
0,35 |
|
|
|
0 |
1,22 |
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
12 |
0,17 |
-0,34 |
-0,03 |
0,13 |
0,13 |
0,39 |
0,13 |
0,36 |
0,13 |
|
|
|
1,09 |
0,09 |
0,19 |
13 |
0,35 |
|
1,22 |
|
|
|
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
14 |
|
0,5 |
|
|
|
|
|
|
|
|
|
1,62 |
2,12 |
0,18 |
0,48 |
15 |
0,35 |
|
|
1,39 |
|
|
|
|
|
|
|
|
1,74 |
0,14 |
0,40 |
16 |
0,35 |
|
1,22 |
|
|
|
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
17 |
|
0,5 |
|
|
|
|
|
1,62 |
|
|
|
|
2,12 |
0,18 |
0,48 |
18 |
|
0,5 |
|
|
|
|
|
0 |
1,39 |
|
|
|
1,89 |
0,16 |
0,41 |
19 |
-0,14 |
0,15 |
0,32 |
|
0,06 |
|
0,06 |
0,29 |
0,06 |
0,29 |
-0,1 |
0,29 |
1,29 |
0,11 |
0,16 |
20 |
0,06 |
-0,08 |
-0,2 |
0,22 |
-0,03 |
0,22 |
-0,03 |
-0,22 |
-0,03 |
-0,22 |
0,05 |
-0,22 |
-0,48 |
-0,04 |
0,16 |
21 |
|
0,5 |
|
|
|
|
|
|
0,97 |
|
0,81 |
|
2,28 |
0,19 |
0,36 |
22 |
0,35 |
|
1,22 |
|
|
|
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
23 |
-0,04 |
0,05 |
0,11 |
0,03 |
-0,39 |
0,11 |
-0,39 |
-0,16 |
0,03 |
-0,16 |
0,11 |
0,26 |
-0,43 |
-0,04 |
0,20 |
24 |
0,17 |
-0,34 |
|
0,13 |
0,55 |
-0,03 |
0,55 |
0,36 |
|
0,36 |
|
|
1,77 |
0,15 |
0,27 |
25 |
0,1 |
-0,16 |
|
|
|
0,56 |
0,73 |
|
0,73 |
|
|
|
1,95 |
0,16 |
0,31 |
26 |
-0,01 |
0,01 |
0,07 |
0,06 |
0,06 |
-0,1 |
-0,18 |
0,05 |
-0,18 |
0,05 |
0,07 |
0,05 |
-0,05 |
0,00 |
0,10 |
27 |
-0,49 |
0,33 |
|
0,55 |
|
|
|
|
0,55 |
0,78 |
|
0,78 |
2,51 |
0,21 |
0,39 |
28 |
-0,07 |
0,08 |
|
0,55 |
|
0,39 |
|
|
|
|
0,81 |
0 |
1,76 |
0,15 |
0,28 |
29 |
0,04 |
-0,05 |
0,25 |
-0,42 |
|
-0,17 |
0,24 |
0,23 |
|
-0,19 |
-0,17 |
-0,19 |
-0,42 |
-0,03 |
0,21 |
30 |
0,35 |
|
|
|
1,39 |
|
|
|
|
|
|
|
1,74 |
0,14 |
0,40 |
31 |
0,35 |
|
|
|
|
1,22 |
|
|
|
|
|
|
1,57 |
0,13 |
0,36 |
Сум. |
2,53 |
2,01 |
5,12 |
4,02 |
4,34 |
5,70 |
3,01 |
3,56 |
4,51 |
3,71 |
3,82 |
4,58 |
46,91 |
|
|
Ср. |
0,08 |
0,06 |
0,17 |
0,13 |
0,14 |
0,18 |
0,10 |
0,12 |
0,15 |
0,12 |
0,12 |
0,15 |
|
0,13 |
|
Отк. |
0,22 |
0,25 |
0,38 |
0,32 |
0,38 |
0,39 |
0,26 |
0,35 |
0,34 |
0,33 |
0,26 |
0,39 |
|
|
0,33 |
В подсистеме: "Типология", "Информационные портеры классов" системы "Эйдос" получаем следующие информационные портреты классов (таблицы 48 и 49).
ТАБЛИЦА 48 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА
РАСПОЗНАВАНИЯ: |
08-11-04 18:48:42 Фильтр: All, Positive г.Краснодар =============================================================== | N |Код | Н а и м е н о в а н и я |Инфор-|Инфор-|Суммар | |п/п|приз| п р и з н а к о в |мат-ть|мат-ть|инф-ть | | |нака| | Бит. | %
| %% | |=============================================================| | 1
8 груз_1_квадрат................. 0.347 9.67
9.7 | | 2
10 груз_1_перевернутый_треугольник 0.347 9.67
19.3 | | 3
11 груз_1_ромб.................... 0.347 9.67
29.0 | | 4
13 груз_1_шестиугольник........... 0.347 9.67
38.7 | | 5
15 груз_2_маленьких_круга......... 0.347 9.67
48.4 | | 6
16 груз_3_квадрата................ 0.347 9.67
58.0 | | 7
22 крыша_вагона_двухскатная....... 0.347 9.67
67.7 | | 8
30 форма_вагона_ромбовидная....... 0.347 9.67
77.4 | | 9
31 форма_вагона_эллипсоидная...... 0.347 9.67
87.0 | | 10 2 N_осей_вагона=3................
0.173 4.82 91.8 | | 11 4 Кол-во_вагонов=3............... 0.173 4.82
96.7 | | 12 12 груз_1_треугольник.............
0.173 4.82 101.5 | | 13 24 крыша_вагона_прямая............
0.173 4.82 106.3 | | 14 5 Кол-во_вагонов=4...............
0.102 2.84 109.2 | | 15 25 стенки_вагона_двойные.......... 0.102 2.84
112.0 | | 16 20 длина_вагона_короткий..........
0.057 1.59 113.6 | | 17 29 форма_вагона_прямоугольная.....
0.038 1.07 114.7 | |~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~| | 18 26 стенки_вагона_одинарные........-0.008 -0.23
114.9 | | 19 1
N_осей_вагона=2................-0.027
-0.75 115.6 | | 20 23
крыша_вагона_отсутствует.......-0.041
-1.14 116.8 | | 21 28
форма_вагона_V-образная........-0.072
-2.00 118.8 | | 22 19 длина_вагона_длинный...........-0.143 -3.99
122.8 | | 23 6
груз_1_большой_круг............-0.165
-4.60 127.4 | | 24 7
груз_1_длинный_прямоугольник...-0.316
-8.83 136.2 | | 25 9
груз_1_короткий_прямоугольник..-0.316
-8.83 145.0 | | 26 27 форма_вагона_U-образная........-0.490
-13.67 158.7 | =============================================================== Универсальная
когнитивная аналитическая система
НПП *ЭЙДОС* |
ТАБЛИЦА 49 – ВЛИЯНИЕ ПРИЗНАКОВ |
ИНФОРМАЦИОННЫЙ ПОРТРЕТ
КЛАССА РАСПОЗНАВАНИЯ: Код: 2
Наименование: Состав следует на ЗАПАД 08-11-04 18:49:04 Фильтр: All, Positive г.Краснодар =============================================================== | N |Код | Н а и м е н о в а н и я |Инфор-|Инфор-|Суммар | |п/п|приз| п р и з н а к о в |мат-ть|мат-ть|инф-ть | | |нака| | Бит. | %
| %% | |=============================================================| | 1 3 Кол-во_вагонов=2.............. 0.500
13.94 13.9 | | 2
14 груз_2_коротких_прямоугольника
0.500 13.94 27.9 | | 3
17 груз_3_маленьких_круга........
0.500 13.94 41.8 | | 4
18 груза_нет.....................
0.500 13.94 55.8 | | 5 21
крыша_вагона_гофрированная....
0.500 13.94 69.7 | | 6
27 форма_вагона_U-образная.......
0.326 9.10 78.8 | | 7
7 груз_1_длинный_прямоугольник..
0.255 7.12 85.9 | | 8
9 груз_1_короткий_прямоугольник.
0.255 7.12 93.0 | | 9 6 груз_1_большой_круг........... 0.162
4.52 97.6 | | 10 19 длина_вагона_длинный.......... 0.145
4.05 101.6 | | 11 28 форма_вагона_V-образная....... 0.082
2.27 103.9 | | 12 23 крыша_вагона_отсутствует...... 0.049
1.36 105.2 | | 13 1
N_осей_вагона=2...............
0.033 0.93 106.2 | | 14 26 стенки_вагона_одинарные....... 0.010
0.29 106.5 | |~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~| | 15 29 форма_вагона_прямоугольная....
-0.053 -1.48 107.9 | | 16 20 длина_вагона_короткий.........
-0.083 -2.30 110.2 | | 17 5 Кол-во_вагонов=4..............
-0.163 -4.55 114.8 | | 18 25 стенки_вагона_двойные.........
-0.163 -4.55 119.3 | | 19 2 N_осей_вагона=3...............
-0.337 -9.40 128.7 | | 20 4
Кол-во_вагонов=3.............. -0.337
-9.40 138.1 | | 21 12 груз_1_треугольник............
-0.337 -9.40 147.5 | | 22 24 крыша_вагона_прямая...........
-0.337 -9.40 156.9 | =============================================================== Универсальная когнитивная аналитическая система НПП *ЭЙДОС* |
В подсистеме "Оптимизация" режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава (таблица 50).
Таблица 50 – ПРИЗНАКИ В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ |
08-11-04 18:49:35 г.Краснодар ================================================================ | N° |
Код | Н а и м е н о в а н и е |Ценн.|Сумма| Сумма | |п/п
|п.пр.| п р и з н а к о в | Бит | Бит | %
| ================================================================ | 1|
14 |груз_2_коротких_прямоугольника.|0.476|0.476| 4.888| | 2|
17 |груз_3_маленьких_круга.........|0.476|0.953| 9.776| | 3|
3 |Кол-во_вагонов=2...............|0.431|1.384| 14.201| | 4|
18 |груза_нет......................|0.414|1.798| 18.448| | 5|
10 |груз_1_перевернутый_треугольник|0.405|2.202| 22.599| | 6|
15 |груз_2_маленьких_круга.........|0.405|2.607| 26.750| | 7|
30 |форма_вагона_ромбовидная.......|0.405|3.011| 30.901| | 8|
27 |форма_вагона_U-образная........|0.388|3.399| 34.885| | 9|
7 |груз_1_длинный_прямоугольник...|0.372|3.772| 38.705| | 10|
9 |груз_1_короткий_прямоугольник..|0.372|4.144| 42.526| | 11|
8 |груз_1_квадрат.................|0.358|4.502| 46.203| | 12|
11 |груз_1_ромб....................|0.358|4.861| 49.881| | 13|
13 |груз_1_шестиугольник...........|0.358|5.219| 53.559| | 14|
16 |груз_3_квадрата................|0.358|5.577| 57.236| | 15|
22 |крыша_вагона_двухскатная.......|0.358|5.936| 60.914| | 16|
31 |форма_вагона_эллипсоидная......|0.358|6.294| 64.591| | 17|
21 |крыша_вагона_гофрированная.....|0.358|6.652| 68.266| | 18|
2 |N_осей_вагона=3................|0.323|6.975| 71.577| | 19|
25 |стенки_вагона_двойные..........|0.315|7.290| 74.807| | 20|
4 |Кол-во_вагонов=3...............|0.304|7.594| 77.927| | 21|
28 |форма_вагона_V-образная........|0.280|7.873| 80.797| | 22|
24 |крыша_вагона_прямая............|0.266|8.139| 83.523| | 23|
5 |Кол-во_вагонов=4...............|0.263|8.402| 86.224| | 24|
29 |форма_вагона_прямоугольная.....|0.206|8.608| 88.340| | 25|
23 |крыша_вагона_отсутствует.......|0.201|8.809| 90.403| | 26|
12 |груз_1_треугольник.............|0.191|9.000| 92.358| | 27|
6 |груз_1_большой_круг............|0.190|9.190| 94.307| | 28|
19 |длина_вагона_длинный...........|0.160|9.350| 95.954| | 29|
20 |длина_вагона_короткий..........|0.158|9.508| 97.573| | 30|
1 |N_осей_вагона=2................|0.141|9.649| 99.015| | 31|
26 |стенки_вагона_одинарные........|0.096|9.745|100.000| ================================================================ Универсальная когнитивная аналитическая система НПП *ЭЙДОС* |
Накопительная диаграмма селективной силы (Парето-диаграмма) приведена на рисунке 94.
|
Рисунок
94. Парето-диаграмма ценности
признаков для решения задач |
Сравним составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). В подсистеме "Типология" режиме "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов" выводим конструкт: "Идущие на запад" и "Идущие на восток" (рисунки 95 и 96).
|
Рисунок 95. Подсистема "Типология", режим "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов" |
|
Рисунок 96. Конструкт: "Идущие на запад" и "Идущие на восток" |
Из рисунка 4 видно, что:
– составы 4-й, 1-й и 3-й являются типичными для "Идущих на восток", а 5-й и, особенно 2-й, – нетипичными;
– составы 10-й, 9-й и 8-й являются типичными для "Идущих на запад", а 7-й и, особенно 6-й, – нетипичными.
Выведем в графической форме семантические
сети составов.
Семантические сети классов отображают результаты кластерно-конструктивного анализа в графической форме. Для этого используется режим: "Вывод 2d-семантических сетей классов" (рисунок 95). Результат приведен на рисунке 97.
|
Рисунок 97. Семантическая сеть классов |
Построим классические когнитивные карты для составов, идущих на запад и на восток". В Системе "Эйдос" классическая когнитивная карта строится из двух графических диаграмм:
1. Неклассического нейрона (подсистема "Анализ", режим "Графическое отображение нелокальных нейронов" (рисунок 98)).
2. Семантической сети признаков (подсистема "Типология", режим "Кластерный и конструктивный анализ признаков – вывод 2d-семантических сетей признаков" (рисунок 99)).
|
|
Рисунок
98. Задание режима |
Рисунок
99. Задание режима |
Результаты, т.е. когнитивные карты для составов, идущих на восток и запад, приведены на рисунках 100 и 101.
|
|
|
|
Рисунок
100. Когнитивная карта |
Рисунок
101. Когнитивная карта |
Из этих рисунков видно, что классическая когнитивная карта может быть изображена в форме конуса, но для наглядности изображения большого объема информации его вершина и боковая поверхность показаны в форме нейрона, а основание – в форме семантической сети.
Таким образом, вербальные описания объектов реальности на естественном языке с полным основанием могут рассматриваются как их иерархические лингвистические модели. Предложены методика и автоматизированная технология, основанные на универсальной когнитивной аналитической системе "Эйдос", которые обеспечивают:
– автоматизированную формализацию предметной области на основе вербального описания ее объектов;
– автоматизированное формирование описательных шкал и градаций;
– автоматизированную генерацию обучающей выборки;
– синтез семантической информационной модели, ее оптимизацию, проверку адекватности и анализ.
Предлагаемые технологии обеспечивают значительную экономию труда и времени по сравнению с традиционным подходом.
Необходимо отметить также, что в системе "Эйдос" реализована полнофункциональная интеллектуальная информационно-поисковая система, обеспечивающая работу по приведенной в работе технологии с объектами, описанными на естественном языке.
1. Что такое классификационные и описательные шкалы и градации?
2. Какие существуют виды шкал?
3. Как шкалы связаны с конструктами и с познанием?
4. Чем обусловлена возможность текстового описания объектов обучающей и распознаваемой выборки на естественном языке?
1. Мичи Д., Джонстон Р. Компьютер – творец. – М.: Мир, 1987. –251 с.
2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). – Краснодар: КЮИ МВД РФ, 1996. – 280 с.
Задачами данной лабораторной работы являются:
1. Продемонстрировать студентам возможность выявления причинно-следственных связей между признаками внешнего вида (описательные шкалы и градации), и их полом, успеваемостью, тем, откуда они родом, обучением в той или иной группе (классификационные шкалы и градации).
2. Сформировать у студентов навыки формализации предметной области, подготовки и ввода обучающей выборки, синтеза информационной семантической модели и проверки ее адекватности, анализа модели (информационные портреты, кластерно-конструктивный анализ, семантические сети и когнитивные диаграммы, графическое отображение векторов классов и признаков).
1. Формализовать задачу:
– создать классификационные и описательные шкалы;
– собрать исходную фактографическую информацию и ввести в систему обучающую выборку.
2. Осуществить синтез и верификацию модели.
3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
4. Провести анализ модели, дав ответы на следующие вопросы:
– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
– как сказывается пол на посещаемости?
– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?
– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;
Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.
Один из вариантов классификационных шкал и градаций представлен в таблице 51, а описательных – в таблице 52:
Таблица 51 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И
ГРАДАЦИИ |
|
|
С точки зрения методики организации занятия возможны различные варианты сбора и ввода информации обучающей выборки. Опыт проведения занятий по данной лабораторной работе показал, что с точки зрения экономии времени и обеспечения качества и единого вида обучающей выборки наиболее рациональным является вариант, приведенный ниже.
1. На доске чертится таблица вида 53. Это делается с таким расчетом, чтобы каждому присутствующему студенту группы соответствовала строка.
Таблица 53 – ШАБЛОН ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код |
Наименование |
Классы |
Признаки |
|||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 50 и 52) описать каждому самого себя и занести эту информацию в таблицу 53 на доске. При необходимости количество строк и столбцов в этой таблице можно увеличить.
В результате на доске появляется таблица вида 54. Видно, что по ряду студентов нет описательной информации, а классификационная – минимальна. Это связано с тем, что они отсутствовали на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки. У этих студентов данная работа не была зачтена. При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы:
Object.txt и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 50 и 51.
Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000 и Windowsxp)
3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки".
Таблица 54 – ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА
ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код |
Наименование |
Классы |
Признаки |
|||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
||
1 |
Бабенко ПИ-51 |
1 |
4 |
10 |
12 |
13 |
15 |
1 |
5 |
10 |
18 |
27 |
31 |
|
|
|
|
|
2 |
Воробьева ПИ-51 |
2 |
5 |
10 |
12 |
13 |
16 |
3 |
7 |
12 |
13 |
18 |
20 |
25 |
26 |
27 |
32 |
|
3 |
Гура ПИ-51 |
1 |
13 |
17 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
Гловнев ПИ-51 |
1 |
13 |
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
Дыбова ПИ-51 |
2 |
13 |
19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
Жеребятьев ПИ51 |
1 |
5 |
8 |
12 |
13 |
20 |
2 |
8 |
10 |
18 |
21 |
27 |
30 |
|
|
|
|
7 |
Заяц ПИ-51 |
2 |
4 |
10 |
12 |
13 |
21 |
3 |
6 |
12 |
15 |
18 |
21 |
26 |
27 |
31 |
|
|
8 |
Иванова ПИ-51 |
2 |
3 |
7 |
12 |
13 |
22 |
2 |
5 |
12 |
13 |
14 |
15 |
18 |
21 |
26 |
32 |
|
9 |
Котенко ПИ-51 |
2 |
4 |
7 |
12 |
13 |
23 |
1 |
6 |
11 |
13 |
15 |
18 |
21 |
26 |
27 |
32 |
|
10 |
Кузина О. ПИ-51 |
2 |
3 |
8 |
12 |
13 |
24 |
1 |
7 |
11 |
14 |
18 |
22 |
26 |
27 |
32 |
|
|
11 |
Кузина Я. ПИ-51 |
2 |
3 |
8 |
12 |
13 |
25 |
1 |
7 |
14 |
17 |
22 |
32 |
|
|
|
|
|
12 |
Лях ПИ-51 |
1 |
3 |
8 |
12 |
13 |
26 |
1 |
5 |
9 |
13 |
17 |
18 |
20 |
24 |
26 |
27 |
31 |
13 |
Мясников ПИ-51 |
1 |
3 |
9 |
12 |
13 |
27 |
1 |
5 |
10 |
13 |
16 |
18 |
20 |
24 |
27 |
32 |
0 |
14 |
Нагапетян ПИ-51 |
1 |
4 |
9 |
12 |
13 |
28 |
1 |
6 |
11 |
15 |
18 |
21 |
24 |
26 |
27 |
30 |
0 |
15 |
Полонская ПИ-51 |
2 |
13 |
29 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
Трунина ПИ-51 |
2 |
13 |
30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
17 |
Черкашина ПИ-51 |
2 |
4 |
10 |
12 |
13 |
31 |
3 |
6 |
11 |
13 |
18 |
21 |
24 |
26 |
27 |
30 |
|
18 |
Чепурченко ПИ51 |
1 |
13 |
32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19 |
Чушкин ПИ-51 |
1 |
13 |
33 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
Шульгин ПИ-51 |
1 |
5 |
8 |
12 |
13 |
34 |
1 |
5 |
9 |
17 |
20 |
26 |
30 |
|
|
|
|
21 |
Арушунян ПИ-52 |
1 |
14 |
35 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
Быченок ПИ-52 |
1 |
14 |
36 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
Веревкина ПИ-52 |
2 |
3 |
9 |
12 |
14 |
37 |
1 |
8 |
9 |
15 |
18 |
21 |
28 |
33 |
|
|
|
24 |
Григорьева ПИ52 |
2 |
4 |
8 |
12 |
14 |
38 |
2 |
5 |
9 |
13 |
18 |
22 |
28 |
33 |
|
|
|
25 |
Давыдич ПИ-52 |
2 |
14 |
39 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
26 |
Дронова ПИ-52 |
2 |
14 |
40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
27 |
Еременко ПИ-52 |
2 |
4 |
8 |
12 |
14 |
41 |
2 |
5 |
12 |
9 |
13 |
15 |
18 |
21 |
26 |
27 |
31 |
28 |
Жмурко ПИ-52 |
1 |
14 |
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
29 |
Иванова ПИ-52 |
2 |
3 |
9 |
12 |
14 |
43 |
2 |
4 |
10 |
14 |
15 |
17 |
18 |
20 |
28 |
33 |
|
30 |
Костенко ПИ-52 |
2 |
14 |
44 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
31 |
Крейс ПИ-52 |
2 |
4 |
8 |
12 |
14 |
45 |
1 |
5 |
9 |
15 |
19 |
21 |
28 |
32 |
|
|
|
32 |
Куркина ПИ-52 |
2 |
3 |
8 |
12 |
14 |
46 |
3 |
6 |
11 |
13 |
15 |
18 |
19 |
22 |
26 |
27 |
32 |
33 |
Люлик ПИ-52 |
2 |
5 |
8 |
12 |
14 |
47 |
2 |
7 |
12 |
15 |
18 |
22 |
24 |
26 |
32 |
|
|
34 |
Максимов ПИ-52 |
1 |
14 |
48 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
Мануйлов ПИ-52 |
1 |
3 |
7 |
12 |
14 |
49 |
1 |
5 |
9 |
14 |
18 |
20 |
24 |
25 |
26 |
27 |
30 |
36 |
Нарижний ПИ-52 |
1 |
3 |
7 |
12 |
14 |
50 |
1 |
5 |
9 |
14 |
18 |
20 |
24 |
25 |
26 |
27 |
31 |
37 |
Ольховская ПИ52 |
2 |
14 |
51 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
38 |
Паршакова ПИ-52 |
2 |
6 |
8 |
12 |
14 |
52 |
2 |
6 |
11 |
13 |
19 |
22 |
26 |
32 |
|
|
|
39 |
Силенко ПИ-52 |
1 |
3 |
7 |
12 |
14 |
53 |
1 |
6 |
12 |
13 |
18 |
20 |
28 |
32 |
|
|
|
40 |
Соколова ПИ-52 |
2 |
4 |
8 |
12 |
14 |
54 |
1 |
5 |
12 |
17 |
18 |
22 |
24 |
26 |
27 |
32 |
|
41 |
Турбин ПИ-52 |
1 |
14 |
55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
42 |
Цисарь ПИ-52 |
2 |
5 |
9 |
12 |
14 |
56 |
2 |
7 |
11 |
13 |
18 |
22 |
27 |
33 |
|
|
|
Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.
Для этого студентам необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД".
2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [64] корреляция".
3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".
В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 102:
|
Рисунок 102. Экранная форма "Селективная сила признаков" |
Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.
Более подробно эта информация представлена в таблице 55:
Таблица 55 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)
В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)
10-10-04 16:15:55
г.Краснодар
=========================================================================================
|N°|Код |Код | Наименование
| Наименование
|Интегр.|Сумм.инт|Сумм.ин|
| |К.шк|град| классификационной
шкалы | градации |инф-ть
|инф. Бит| в % |
=========================================================================================
| 1| 5 | 19
|ОДЕЖДА:.................. Юбка...................| 0.470|
0.470| 4.147|
| 2| 3 | 10 |ЦВЕТ
ГЛАЗ:............... Голубые................|
0.467| 0.938| 8.271|
| 3| 8 | 30
|ПОСЕЩАЕМОСТЬ:............ Плохая.................| 0.456|
1.393| 12.290|
| 4| 8 | 33
|ПОСЕЩАЕМОСТЬ:............ Очень хорошая..........| 0.438|
1.831| 16.150|
| 5| 2 | 8 |ЦВЕТ ВОЛОС:.............. Очень
светлые..........| 0.437| 2.268| 20.002|
| 6| 1 | 3 |ДЛИНА ВОЛОС:............. Длинные................| 0.429|
2.697| 23.788|
| 7| 2 | 7 |ЦВЕТ ВОЛОС:..............
Крашеные...............| 0.421| 3.118| 27.502|
| 8| 1 | 2 |ДЛИНА ВОЛОС:.............
Средние................| 0.418| 3.536| 31.192|
| 9| 7 | 28
|ДОСТАТОК:................ Ничего нет.............| 0.413|
3.949| 34.836|
|10| 5 | 17
|ОДЕЖДА:.................. Пиджак.................| 0.408|
4.357| 38.432|
|11| 7 | 25
|ДОСТАТОК:................ Есть автомобиль........| 0.408|
4.765| 42.027|
|12| 4 | 16 |НАЛИЧИЕ УКРАШЕНИЙ:.......
Браслет................| 0.404| 5.169| 45.590|
|13| 8 | 31
|ПОСЕЩАЕМОСТЬ:............ Средняя................| 0.400|
5.569| 49.122|
|14| 6 | 22 |МАКИЯЖ, МАНИКЮР,
ПЕДИКЮР: Заметный...............|
0.399| 5.968| 52.638|
|15| 3 | 11 |ЦВЕТ
ГЛАЗ:............... Карие..................|
0.398| 6.365| 56.147|
|16| 2 | 4 |ЦВЕТ ВОЛОС:.............. Очень
темные...........| 0.391| 6.757| 59.599|
|17| 2 | 6 |ЦВЕТ ВОЛОС:..............
Каштановые.............| 0.389| 7.146| 63.032|
|18| 4 | 14 |НАЛИЧИЕ
УКРАШЕНИЙ:....... Перстень...............|
0.381| 7.527| 66.395|
|19| 3 | 12 |ЦВЕТ
ГЛАЗ:............... Зеленые................|
0.367| 7.894| 69.629|
|20| 6 | 20 |МАКИЯЖ, МАНИКЮР,
ПЕДИКЮР: Отсутствует............| 0.361| 8.255| 72.817|
|21| 3 | 9 |ЦВЕТ ГЛАЗ:...............
Серые..................| 0.356| 8.611| 75.958|
|22| 6 | 21 |МАКИЯЖ, МАНИКЮР,
ПЕДИКЮР: Незаметный.............|
0.352| 8.963| 79.062|
|23| 4 | 15 |НАЛИЧИЕ
УКРАШЕНИЙ:....... Серьги.................|
0.337| 9.300| 82.035|
|24| 8 | 32
|ПОСЕЩАЕМОСТЬ:............ Хорошая................| 0.324|
9.625| 84.897|
|25| 2 | 5 |ЦВЕТ ВОЛОС:..............
Русые..................| 0.322| 9.947| 87.739|
|26| 7 | 24
|ДОСТАТОК:................ Есть своя квартира.....| 0.318|
10.265| 90.545|
|27| 1 | 1 |ДЛИНА ВОЛОС:.............
Короткие...............| 0.293| 10.558| 93.130|
|28| 4 | 13 |НАЛИЧИЕ
УКРАШЕНИЙ:....... Цепочка................|
0.264| 10.822| 95.458|
|29| 7 | 26 |ДОСТАТОК:................
Есть компьютер.........| 0.218| 11.041| 97.384|
|30| 7 | 27
|ДОСТАТОК:................ Есть мобильный телефон.| 0.194|
11.235| 99.097|
|31| 5 | 18
|ОДЕЖДА:.................. Брюки или джинсы.......| 0.102|
11.337|100.000|
|32| 6 | 23 |МАКИЯЖ, МАНИКЮР,
ПЕДИКЮР: Вызывающий.............|
0.000| 11.337|100.000|
|33| 8 | 29
|ПОСЕЩАЕМОСТЬ:............ Очень плохая...........| 0.000|
11.337|100.000|
=========================================================================================
Универсальная когнитивная аналитическая система НПП *ЭЙДОС*
Соответствующую логистическую кривую (накопительную селективной силы) можно получит в графической форме нажав на клавишу "F8 График".
Анализ модели позволяет дать обоснованные ответы, например, на следующие вопросы:
1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
2. Как сказывается пол на посещаемости?
3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?
4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?
Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.
Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков – Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость – это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 – 10. В результате получим экранную форму, приведенную на рисунке 103:
|
Рисунок 103. Информационный портрет признака: 30 "Посещаемость плохая", фильтр по успеваемости. |
Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 104.
|
Рисунок 104. Информационный портрет признака: 32 "Посещаемость хорошая", фильтр по успеваемости. |
Из этих рисунков видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей – высокая, как и можно было ожидать. НО теперь этот вывод получен непосредственно на основе анализа эмпирических данных и является количественным.
Эту же информацию можно получить и другим способом.
В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе. Выход из настройки по клавише Esc. После этого в экранных формах в виде трехмерных графиков последовательно отображаются информативности выбранной подматрицы, которые имеется возможность записать в форме PCX-файлов, пропустить или распечатать. Некоторые из этих форм представлены на рисунках 105 – 106.
|
|
|
|
Рисунок 105. Некоторые варианты отображения подматрицы: |
Из анализа этих трехмерных графиков видно, что очень хорошая успеваемость слабо зависит от посещаемости, а низкая – сильно. На основании этого можно сформулировать гипотезу, что хорошая посещаемость может гарантировать от низкой успеваемости, но сама по себе не гарантирует высокой, для достижения которой, видимо, играют важную роль также другие факторы, например, уровень достатка. Чтобы проверить эту гипотезу в подсистеме F6 "Анализ" запустим режим "Просмотр профилей классов и признаков" и поставим курсор на класс: код 7 "Успеваемость – 5 более 75%", а затем нажмем F4 "Профили 2d", F1 "Класс распознавания" и зададим диапазон признаков, градаций описательных шкал: 24-33 (шкалы: "Достаток" и "Посещаемость"). В результате получим графическую форму, представленная на рисунке 106:
|
Рисунок 106. Профиль влияния описательных
шкал: "Достаток" |
Из этой формы видно, что хорошая посещаемость (код 32) положительно влияет на высокую успеваемость примерно также, как наличие квартиры (код 24) и компьютера (код 26), но все эти факторы вместе взятые уступают влиянию одного фактора: "Есть автомобиль" (код 25).
В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания – Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость – это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти признаки, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 29 – 33. В результате получим экранную форму, приведенную на рисунке 107.
|
Рисунок 107. Информационный портрет класса: 1 "ПОЛ - мужской", фильтр по посещаемости. |
Аналогично получим информационный портрет класса: код 2, "ПОЛ – женский". Результат представлен на рисунке 108.
|
Рисунок 108. Информационный портрет класса: код 2 "ПОЛ – женский", фильтр по посещаемости. |
Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек – очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем.
Ответ на первые три вопроса дает анализ, который можно провести в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:
– количество уровней кластеризации – 1;
– порог модуля сходства – 0;
– диапазон кодов классов: 1-14;
– исключаем кластеры с одним классом;
– не исключаем кластеры с тождественным набором классов.
Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок 109), а также получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 56):
|
Рисунок 109. Конструкт: "Пол" |
Таблица
56 – КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ
РАСПОЗНАВАНИЯ |
|
Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме F5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах:
– количество уровней кластеризации – 1;
– порог модуля сходства – 0;
– диапазон кодов классов: 1-33;
– исключаем кластеры с одним признаком;
– не исключаем кластеры с тождественным набором признаков.
Результаты кластерно-конструктивного анализа признаков можно получить в виде TXT-файла с именем Klas_prp.txt в поддиректории TXT (таблица 57):
Таблица 57 – КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ" |
|
Чтобы ответить на этот вопрос необходимо провести в подсистеме: F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:
– количество уровней кластеризации – 1;
– порог модуля сходства – 0;
– диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов);
– исключаем кластеры с одним классом;
– не исключаем кластеры с тождественным набором классов.
Результаты кластерно-конструктивного анализа классов можно получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 58):
Таблица 58 – КОНСТРУКТ: "УЧЕБНАЯ
ГРУППА"
15-10-04 10:53:27 Фильтр кодов: 13-56
========================================
| Код | Наименование | Сход-
|
|класса| класса распознавания | ство % |
|=======================================
| 13 | ГРУППА
ПИ-51.........| 100.00|
| 27 | Мясников
ПИ-51.......| 43.60|
| 31 | Черкашина
ПИ-51......| 40.11|
| 28 | Нагапетян
ПИ-51......| 27.38|
| 15 | Бабенко
ПИ-51........| 24.17|
| 21 | Заяц
ПИ-51...........| 21.70|
| 20 | Жеребятьев
ПИ-51.....| 16.21|
| 23 | Котенко
ПИ-51........| 13.90|
| 34 | Шульгин
ПИ-51........| 3.78|
| 46 | Куркина
ПИ-52........| 0.98|
==========================================
| 16 | Воробьева
ПИ-51......| -0.35|
| 53 | Силенко
ПИ-52........| -1.79|
| 43 | Иванова
ПИ-52........| -3.81|
| 26 | Лях
ПИ-51............| -3.83|
| 24 | Кузина О.
ПИ-51......| -4.22|
| 25 | Кузина Я.
ПИ-51......| -5.27|
| 37 | Веревкина
ПИ-52......| -13.84|
| 54 | Соколова
ПИ-52.......| -14.71|
| 49 | Мануйлов
ПИ-52.......| -16.14|
| 45 | Крейс
ПИ-52..........| -17.43|
| 56 | Цисарь
ПИ-52.........| -23.11|
| 22 | Иванова
ПИ-51........| -23.42|
| 50 | Нарижний
ПИ-52.......| -24.32|
| 52 | Паршакова ПИ-52......| -26.13|
| 41 | Еременко
ПИ-52.......| -30.56|
| 47 | Люлик
ПИ-52..........| -36.87|
| 38 | Григорьева
ПИ-52.....| -52.30|
| 14 | ГРУППА
ПИ-52.........| -64.51|
==========================================
Из таблицы 58 видно, что:
– студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51;
– студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52;
– студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков).
Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 13.
Семантические сети классов отображаются на экране и записываются в форме PCX-файла в поддиректории: PCX/Klas-obj в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 110 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы).
Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: PCX/NeuroNet. На рисунке 111 приведен нелокальный нейрон: "Успеваемость: очень хорошая".
Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков – Кластерный и конструктивный анализ – Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде PCX-файла в поддиректории: PCX/Klas-att.
На рисунке 112 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке 111 нейроне (показаны только те связи между признаками, которые оказались больше 30%):
|
Рисунок 110. Семантическая сеть классов |
|
Рисунок 111. Нелокальный нейрон: "Успеваемость: очень хорошая" |
|
Рисунок 112. Семантическая сеть признаков, оказавшихся наиболее значимыми в нелокальном нейроне: "Успеваемость: очень хорошая" |
Если дополнить графическое изображение нейрона на рисунке 111 связями между признаками, показанными в семантической сети на рисунке 112, то получим классическую когнитивную карту. Студентам это предлагается сделать самостоятельно в 7-м режиме 6-й подсистемы, также как и получить когнитивные карты для других уровней успеваемости.
1. Что понимается под формализацией задачи.
2. Как создать классификационные и описательные шкалы в системе "Эйдос"?
3. Как собрать исходную фактографическую информацию и ввести в систему обучающую выборку?
4. Как осуществить синтез и верификацию модели?
5. Как оценить ценность признаков для прогнозирования и выделить признаки, наиболее существенные для решения поставленной задачи?
6. Как провести анализ модели, чтобы ответить на следующие вопросы:
– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
– как сказывается пол на посещаемости?
– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?
– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;
7. Как отобразить результаты анализа в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Известно, что подчерк каждого человека зависит от его темперамента и других генетически обусловленных, конституционных качеств личности, обладающих высокой стабильностью (некоторые из этих качеств могут быть измерены с применением 16PF-опросника Кеттела), а также от текущего психического и физического состояния человека.
Учебные достижения по различным дисциплинам также зависят от конституционных качеств. Поэтому вполне корректно поставить задачу прогнозирования учебных достижений студентов на основе изучения особенностей их подчерка.
1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.
1.2. В качестве описательных шкал и градаций использовать характеристики подчерка.
1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования (для себя).
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).
Пример формирования классификационных шкалы и градаций приведен в таблице 59.
Таблица 59 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ
Код |
Наименование класса |
Код |
Наименование класса |
1 |
ПОЛ
- мужской |
29 |
Полонская
ПИ-51 |
2 |
ПОЛ
- женский |
30 |
Трунина
ПИ-51 |
3 |
ОТКУДА
РОДОМ - город-краевой центр |
31 |
Черкашина
ПИ-51 |
4 |
ОТКУДА
РОДОМ - город-районный центр |
32 |
Чепурченко
ПИ-51 |
5 |
ОТКУДА
РОДОМ - поселок городского типа |
33 |
Чушкин
ПИ-51 |
6 |
ОТКУДА
РОДОМ - село |
34 |
Шульгин
ПИ-51 |
7 |
УСПЕВАЕМОСТЬ
- "5" более 75% |
35 |
Арушанян
ПИ-52 |
8 |
УСПЕВАЕМОСТЬ
- "5" более 50% но меньше 75% |
36 |
Быченок
ПИ-52 |
9 |
УСПЕВАЕМОСТЬ
- "5" более 25% но меньше 50% |
37 |
Веревкина
ПИ-52 |
10 |
УСПЕВАЕМОСТЬ
- "5" менее 25% |
38 |
Григорьева
ПИ-52 |
11 |
ФОРМА
ОБУЧЕНИЯ - бюджетная |
39 |
Давыдич
ПИ-52 |
12 |
ФОРМА
ОБУЧЕНИЯ - платная |
40 |
Дронова
ПИ-52 |
13 |
ГРУППА
ПИ-51 |
41 |
Еременко
ПИ-52 |
14 |
ГРУППА
ПИ-52 |
42 |
Жмурко
ПИ-52 |
15 |
Бабенко
ПИ-51 |
43 |
Иванова
ПИ-52 |
16 |
Воробьева
ПИ-51 |
44 |
Костенко
ПИ-52 |
17 |
Гура
ПИ-51 |
45 |
Крейс
ПИ-52 |
18 |
Головнев
ПИ-51 |
46 |
Куркина
ПИ-52 |
19 |
Дыбова
ПИ-51 |
47 |
Люлик
ПИ-52 |
20 |
Жеребятьев
ПИ-51 |
48 |
Максимов
ПИ-52 |
21 |
Заяц
ПИ-51 |
49 |
Мануйлов
ПИ-52 |
22 |
Иванова
ПИ-51 |
50 |
Нарижний
ПИ-52 |
23 |
Котенко
ПИ-51 |
51 |
Ольховская
ПИ-52 |
24 |
Кузина
О. ПИ-51 |
52 |
Паршакова
ПИ-52 |
25 |
Кузина
Я. ПИ-51 |
53 |
Силенко
ПИ-52 |
26 |
Лях
ПИ-51 |
54 |
Соколова
ПИ-52 |
27 |
Мясников
ПИ-51 |
55 |
Турбин
ПИ-52 |
28 |
Нагапетян
ПИ-51 |
56 |
Цисарь
ПИ-52 |
Существует много различных систем выявления признаков подчерка. Мы в учебных целях воспользуемся одной из самых простых из них, используемой на сайте: Альянс-медиа "Деловые тесты":
http://www.businesstest.ru/test.asp?test_id=155&topic_id=3
В таблице 60 эта система приведена в виде, преобразованном для удобства использования в системе "Эйдос".
Таблица 60 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
СПРАВОЧНИК
НАИМЕНОВАНИЙ ШКАЛ И ГРАДАЦИЙ ПРИЗНАКОВ
06-09-04 10:39:45
г.Краснодар
==========================================================================
| N |
Код | Наименование
|
|========================================================================|
| |[
1]|РАЗМЕР БУКВ:
|
| 1| 1 |Очень
мелкие................................................|
| 2|
2 |Мелкие......................................................|
| 3|
3 |Средние.....................................................|
| 4|
4 |Крупные.....................................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
2]|НАКЛОН БУКВ:
|
| 5|
5 |Влево.......................................................|
| 6|
6 |Легкий влево................................................|
| 7|
7 |Вправо......................................................|
| 8|
8 |Резкий вправо...............................................|
| 9|
9 |Прямое написание............................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
3]|ФОРМА БУКВ:
|
| 10|
10 |Округлые....................................................|
| 11|
11 |Бесформенные................................................|
| 12|
12 |Угловатые...................................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
4]|НАПРАВЛЕНИЕ ПОЧЕРКА: |
| 13|
13 |Строчки "ползут"
вверх......................................|
| 14|
14 |Строчки прямые..............................................|
| 15|
15 |Строчки "сползают" вниз.....................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
5]|ИНТЕНСИВНОСТЬ ПОЧЕРКА И СИЛА НАЖИМА: |
| 16|
16 |Легкая......................................................|
| 17|
17 |Средняя.....................................................|
| 18|
18 |Сильная.....................................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
6]|ХАРАКТЕР НАПИСАНИЯ СЛОВ: |
| 19|
19 |Склонность к соединению букв................................|
| 20|
20 |Склонность к отделению букв друг от друга...................|
| 21|
21 |Смешанный стиль.............................................|
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
| |[
7]|ОБЩАЯ ОЦЕНКА ПОЧЕРКА: |
| 22|
22 |Почерк старательный, буквы аккуратные.......................|
| 23|
23 |Почерк неровный, одни слова видны, другие читаются с трудом.|
| 24|
24 |Буквы написаны кое-как, почерк неразборчивый и небрежный....|
==========================================================================
Универсальная
когнитивная аналитическая система НПП *ЭЙДОС*
Чтобы собрать информацию для обучающей выборки, студенты на доске рисуют и заполняют таблицу, аналогичную таблице 61. Каждый заполняет строку по себе, и все учащиеся переписывают таблицу целиком к себе в тетрадь. Затем, когда таблица в тетради заполнена – она заносится в систему "Эйдос" в 1-м режиме 2-й подсистемы.
Таблица 61 – ОБУЧАЮЩАЯ ВЫБОРКА
Код |
Наименование |
Коды
классов |
Коды
признаков |
|||||||||||
2 |
Воробьева
ПИ-51 |
2 |
5 |
10 |
12 |
13 |
16 |
4 |
7 |
10 |
14 |
17 |
21 |
23 |
3 |
Гура
ПИ-51 |
1 |
13 |
17 |
0 |
0 |
0 |
3 |
7 |
11 |
15 |
17 |
21 |
24 |
5 |
Дыбова
ПИ-51 |
2 |
13 |
19 |
0 |
0 |
0 |
|
|
|
|
|
|
|
6 |
Жеребятьев
ПИ51 |
1 |
5 |
8 |
12 |
13 |
20 |
|
|
|
|
|
|
|
8 |
Иванова
ПИ-51 |
2 |
3 |
7 |
12 |
13 |
22 |
3 |
6 |
7 |
12 |
14 |
17 |
19 |
9 |
Котенко
ПИ-51 |
2 |
4 |
7 |
12 |
13 |
23 |
3 |
7 |
10 |
14 |
17 |
21 |
23 |
10 |
Кузина
О. ПИ-51 |
2 |
3 |
8 |
12 |
13 |
24 |
3 |
7 |
12 |
14 |
17 |
21 |
22 |
11 |
Кузина
Я. ПИ-51 |
2 |
3 |
8 |
12 |
13 |
25 |
3 |
7 |
11 |
14 |
17 |
21 |
22 |
12 |
Лях
ПИ-51 |
1 |
3 |
8 |
12 |
13 |
26 |
2 |
6 |
11 |
14 |
16 |
20 |
24 |
13 |
Мясников
ПИ-51 |
1 |
3 |
9 |
12 |
13 |
27 |
3 |
7 |
10 |
14 |
17 |
21 |
22 |
14 |
Нагапетян
ПИ-51 |
1 |
4 |
9 |
12 |
13 |
28 |
3 |
8 |
12 |
13 |
18 |
19 |
23 |
15 |
Полонская
ПИ-51 |
2 |
13 |
29 |
0 |
0 |
0 |
|
|
|
|
|
|
|
16 |
Трунина
ПИ-51 |
2 |
13 |
30 |
0 |
0 |
0 |
3 |
7 |
12 |
13 |
18 |
19 |
23 |
17 |
Черкашина
ПИ-51 |
2 |
4 |
10 |
12 |
13 |
31 |
3 |
7 |
12 |
14 |
17 |
19 |
23 |
18 |
Чепурченко
ПИ51 |
1 |
13 |
32 |
0 |
0 |
0 |
3 |
8 |
12 |
13 |
16 |
19 |
23 |
19 |
Чушкин
ПИ-51 |
1 |
13 |
33 |
0 |
0 |
0 |
3 |
6 |
11 |
14 |
17 |
20 |
23 |
20 |
Шульгин
ПИ-51 |
1 |
5 |
8 |
12 |
13 |
34 |
|
|
|
|
|
|
|
21 |
Арушунян
ПИ-52 |
1 |
14 |
35 |
0 |
0 |
0 |
|
|
|
|
|
|
|
22 |
Быченок
ПИ-52 |
1 |
14 |
36 |
0 |
0 |
0 |
|
|
|
|
|
|
|
23 |
Веревкина
ПИ-52 |
2 |
3 |
9 |
12 |
14 |
37 |
|
|
|
|
|
|
|
24 |
Григорьева
ПИ52 |
2 |
4 |
8 |
12 |
14 |
38 |
|
|
|
|
|
|
|
25 |
Давыдич
ПИ-52 |
2 |
14 |
39 |
0 |
0 |
0 |
|
|
|
|
|
|
|
26 |
Дронова
ПИ-52 |
2 |
14 |
40 |
0 |
0 |
0 |
3 |
7 |
11 |
14 |
17 |
20 |
23 |
27 |
Еременко
ПИ-52 |
2 |
4 |
8 |
12 |
14 |
41 |
|
|
|
|
|
|
|
28 |
Жмурко
ПИ-52 |
1 |
14 |
42 |
0 |
0 |
0 |
3 |
7 |
10 |
14 |
17 |
21 |
23 |
29 |
Иванова
ПИ-52 |
2 |
3 |
9 |
12 |
14 |
43 |
|
|
|
|
|
|
|
30 |
Костенко
ПИ-52 |
2 |
14 |
44 |
0 |
0 |
0 |
|
|
|
|
|
|
|
31 |
Крейс
ПИ-52 |
2 |
4 |
8 |
12 |
14 |
45 |
|
|
|
|
|
|
|
32 |
Куркина
ПИ-52 |
2 |
3 |
8 |
12 |
14 |
46 |
|
|
|
|
|
|
|
33 |
Люлик
ПИ-52 |
2 |
5 |
8 |
12 |
14 |
47 |
|
|
|
|
|
|
|
34 |
Максимов
ПИ-52 |
1 |
14 |
48 |
0 |
0 |
0 |
|
|
|
|
|
|
|
35 |
Мануйлов
ПИ-52 |
1 |
3 |
7 |
12 |
14 |
49 |
|
|
|
|
|
|
|
36 |
Нарижний
ПИ-52 |
1 |
3 |
7 |
12 |
14 |
50 |
|
|
|
|
|
|
|
37 |
Ольховская
ПИ52 |
2 |
14 |
51 |
0 |
0 |
0 |
|
|
|
|
|
|
|
38 |
Паршакова
ПИ-52 |
2 |
6 |
8 |
12 |
14 |
52 |
|
|
|
|
|
|
|
39 |
Силенко
ПИ-52 |
1 |
3 |
7 |
12 |
14 |
53 |
3 |
5 |
11 |
14 |
17 |
21 |
23 |
40 |
Соколова
ПИ-52 |
2 |
4 |
8 |
12 |
14 |
54 |
|
|
|
|
|
|
|
41 |
Турбин
ПИ-52 |
1 |
14 |
55 |
0 |
0 |
0 |
3 |
7 |
11 |
14 |
17 |
21 |
23 |
42 |
Цисарь
ПИ-52 |
2 |
5 |
9 |
12 |
14 |
56 |
3 |
9 |
10 |
14 |
17 |
21 |
23 |
43 |
Бабенко
ПИ-51 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
7 |
11 |
14 |
17 |
21 |
24 |
Так как по ряду студентов данных нет, то пример выполнения заданий 2 и 3 не приводится и они выполняются студентами самостоятельно.
1. Какие работы выполняются на этапе формализации задачи?
2. Как в системе "Эйдос" ввести классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки?
3. Как в системе "Эйдос" ввести описательные шкал и градации, использовав характеристики подчерка?
4. Каким образом подготовить и ввести в систему "Эйдос" обучающую выборку?
5. Как осуществить синтез и верификацию (измерение адекватности) семантической информационной модели в системе "Эйдос"?
6. Что включает системно-когнитивный анализ модели?
7. Как решаются задачи идентификации и прогнозирования в системе "Эйдос"?
8. В каких подсистемах и режимах системы "Эйдос" генерируются информационные портреты классов и факторов и отображаются в графической форме двухмерных и трехмерных профилей классов и факторов)?
9. Каким образом в системе "Эйдос" провести кластерно-конструктивный анализ классов и факторов и отобразить его в форме семантических сетей классов и факторов?
10. Как в системе "Эйдос" осуществить содержательное сравнение классов и факторов и отобразить результаты в форме когнитивных диаграмм классов и факторов?
11. Как в системе "Эйдос" построить нелокальные нейроны и интерпретируемые нейронные сети?
12. Как в системе "Эйдос" построить классические когнитивные модели и отобразить их в форме когнитивных карт?
13. Как в системе "Эйдос" построить интегральные когнитивные модели и отобразить в форме интегральных когнитивных карт?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Данная лабораторная работа основана на данных, полученных в Кубанском государственном технологическом университете (КубГТУ) при преподавании дисциплин кафедры Информатики: "Новые информационные технологии в учебном процессе" и "Комплексные технологии в науке и образовании" для специальности: 020300 – Социология (Социально-гуманитарный факультет), в 2002 году (акт внедрения имеется).
При проведении в 2001 году одного из первых в г. Краснодаре экспериментов по централизованному компьютерному тестированию для поступлении в вуз его организаторы предложили заполнить всем тестирующимся дополнительную социологическую анкету. Если бы удалось собрать данные с помощью этой анкеты по ряду регионов России и обработать их совместно с результатами тестирования по предметной обученности по ряду предметов, то в принципе оказалось бы возможным найти зависимости между характеристиками социального статуса абитуриента и его учебными достижениями. Безусловно, такие результаты представляли бы огромный научный интерес. Однако провести это дополнительное тестирование не удалось по ряду причин, среди которых основными, по-видимому, явились следующие:
– это тестирование не было бы анонимным;
– в анкету были включены некоторые вопросы, имеющие спорный характер;
– работа по организации проведению этого дополнительного тестирования потребовало бы от абитуриентов и организаторов проведения тестирования ранее незапланированных затрат времени и других усилий.
Но то, что в свое время не удалось сделать в масштабе России, вполне возможно осуществить в рамках одной лабораторной работы, в которой и предлагается использовать "ту самую социологическую анкету".
1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.
1.2. В качестве описательных шкал и градаций использовать предлагаемую анкету.
1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования (для себя).
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).
Мы для выполнения этого задания используем данные, полученные в КубГТУ в 2002 году (таблица 62).
Таблица 62 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ
Код |
Наименование класса |
1 |
УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.)
- высокая |
2 |
УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.)
- средняя |
3 |
УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.)
- низкая |
4 |
УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) -
высокая |
5 |
УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) -
средняя |
6 |
УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) -
низкая |
7 |
УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) -
высокая |
8 |
УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) -
средняя |
9 |
УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) -
низкая |
10 |
УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) -
высокая |
11 |
УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) -
средняя |
12 |
УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) - низкая |
13 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - высокая |
14 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - средняя |
15 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - низкая |
16 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - высокая |
17 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - средняя |
18 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - низкая |
19 |
УСП.ПО ДИСЦ.ГСД-03 (культурология) -
высокая |
20 |
УСП.ПО ДИСЦ.ГСД-03 (культурология) -
средняя |
21 |
УСП.ПО ДИСЦ.ГСД-03 (культурология) -
низкая |
22 |
УСП.ПО ДИСЦ.ГСД-04 (история) - высокая |
23 |
УСП.ПО ДИСЦ.ГСД-04 (история) - средняя |
Продолжение таблицы 62
Код |
Наименование класса |
24 |
УСП.ПО ДИСЦ.ГСД-04 (история) - низкая |
25 |
УСП.ПО ДИСЦ.ГСД-05 (физ.культура) -
высокая |
26 |
УСП.ПО ДИСЦ.ГСД-05 (физ.культура) -
средняя |
27 |
УСП.ПО ДИСЦ.ГСД-05 (физ.культура) - низкая |
28 |
УСП.ПО ДИСЦ.ГСД-06 (право) - высокая |
29 |
УСП.ПО ДИСЦ.ГСД-06 (право) - средняя |
30 |
УСП.ПО ДИСЦ.ГСД-06 (право) - низкая |
31 |
УСП.ПО ДИСЦ.ГСД-07 (экономика) - высокая |
32 |
УСП.ПО ДИСЦ.ГСД-07 (экономика) - средняя |
33 |
УСП.ПО ДИСЦ.ГСД-07 (экономика) - низкая |
34 |
УСП.ПО ДИСЦ.ГСД-09 (политология) - высокая |
35 |
УСП.ПО ДИСЦ.ГСД-09 (политология) - средняя |
36 |
УСП.ПО ДИСЦ.ГСД-09 (политология) - низкая |
37 |
УСП.ПО ДИСЦ.ГСД-10 (психология и
педагогика) - высокая |
38 |
УСП.ПО ДИСЦ.ГСД-10 (психология и
педагогика) - средняя |
39 |
УСП.ПО ДИСЦ.ГСД-10 (психология и
педагогика) - низкая |
40 |
УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по
выбору) - высокая |
41 |
УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по
выбору) - средняя |
42 |
УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по
выбору) - низкая |
43 |
УСП.ПО ДИСЦ.ЕН-01 (математика и
информатика) - высокая |
44 |
УСП.ПО ДИСЦ.ЕН-01 (математика и
информатика) - средняя |
45 |
УСП.ПО ДИСЦ.ЕН-01 (маетматика и
информатика) - низкая |
46 |
УСП.ПО ДИСЦ.ЕН-02
(конц.совр.естествознания) - высокая |
47 |
УСП.ПО ДИСЦ.ЕН-02
(конц.совр.естествознания) - средняя |
48 |
УСП.ПО ДИСЦ.ЕН-02
(конц.совр.естествознания) - низкая |
49 |
УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору)
- высокая |
50 |
УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору)
- средняя |
51 |
УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору)
- низкая |
52 |
УСП.ПО ДИСЦ.ОПД-01 (история социологии) -
высокая |
53 |
УСП.ПО ДИСЦ.ОПД-01 (история социологии) -
средняя |
54 |
УСП.ПО ДИСЦ.ОПД-01 (история социологии) -
низкая |
55 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
высокая |
56 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
средняя |
57 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
низкая |
58 |
УСП.ПО ДИСЦ.ОПД-03 (мет.и
техн.социолог.иссл.) - высокая |
59 |
УСП.ПО ДИСЦ.ОПД-03 (мет.и
техн.социолог.иссл.) - средняя |
60 |
УСП.ПО ДИСЦ.ОПД-03 (мет.и
техн.социолог.иссл.) - низкая |
61 |
УСП.ПО ДИСЦ.ОПД-04 (демография) - высокая |
62 |
УСП.ПО ДИСЦ.ОПД-04 (демография) - средняя |
63 |
УСП.ПО ДИСЦ.ОПД-04 (демография) - низкая |
64 |
УСП.ПО ДИСЦ.ОПД-05 (социальная статистика)
- высокая |
65 |
УСП.ПО ДИСЦ.ОПД-05 (социальная статистика)
- средняя |
66 |
УСП.ПО ДИСЦ.ОПД-05 (социальная статистика)
- низкая |
67 |
УСП.ПО ДИСЦ.ОПД-06 (социальная
антропология) - высокая |
68 |
УСП.ПО ДИСЦ.ОПД-06 (социальная
антропология) - средняя |
69 |
УСП.ПО ДИСЦ.ОПД-06 (социальная
антропология) - низкая |
70 |
УСП.ПО ДИСЦ.ОПД-07 (социальная психология)
- высокая |
71 |
УСП.ПО ДИСЦ.ОПД-07 (социальная психология)
- средняя |
Продолжение таблицы 62
Код |
Наименование класса |
72 |
УСП.ПО ДИСЦ.ОПД-07 (социальная психология)
– низкая |
73 |
УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.)
- высокая |
74 |
УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.)
- средняя |
75 |
УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.)
- низкая |
76 |
УСП.ПО ДИСЦ.ОПД-09 (социология
организаций) - высокая |
77 |
УСП.ПО ДИСЦ.ОПД-09 (социология
организаций) - средняя |
78 |
УСП.ПО ДИСЦ.ОПД-09 (социология
организаций) - низкая |
79 |
УСП.ПО ДИСЦ.ОПД-10 (социология
коммуникаций) - высокая |
80 |
УСП.ПО ДИСЦ.ОПД-10 (социология
коммуникаций) - средняя |
81 |
УСП.ПО ДИСЦ.ОПД-10 (социология
коммуникаций) - низкая |
82 |
УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) -
высокая |
83 |
УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) -
средняя |
84 |
УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) -
низкая |
85 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
высокая |
86 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
средняя |
87 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
низкая |
88 |
УСП.ПО ДИСЦ.ОПД-13 (социология религий) -
высокая |
89 |
УСП.ПО ДИСЦ.ОПД-13 (социология религий) -
средняя |
90 |
УСП.ПО ДИСЦ.ОПД-13 (социология религий) -
низкая |
91 |
УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по
выбору) - высокая |
92 |
УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по
выбору) - средняя |
93 |
УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по
выбору) - низкая |
94 |
УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и
проект.) - высокая |
95 |
УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и
проект.) - средняя |
96 |
УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и
проект.) - низкая |
97 |
УСП.ПО ДИСЦ.СД-02 (соц.проблемы
изуч.общ.мнения) - высокая |
98 |
УСП.ПО ДИСЦ.СД-02 (соц.проблемы
изуч.общ.мнения) - средняя |
99 |
УСП.ПО ДИСЦ.СД-02 (соц.проблемы
изуч.общ.мнения) - низкая |
100 |
УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) -
высокая |
101 |
УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) -
средняя |
102 |
УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) -
низкая |
103 |
УСП.ПО ДИСЦ.СД-04 (социология семьи) -
высокая |
104 |
УСП.ПО ДИСЦ.СД-04 (социология семьи) -
средняя |
105 |
УСП.ПО ДИСЦ.СД-04 (социология семьи) -
низкая |
106 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
высокая |
107 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
средняя |
108 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
низкая |
109 |
УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору)
- высокая |
110 |
УСП.ПО ДИСЦ.СД-06 (дисц.и кусры по выбору)
- средняя |
111 |
УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору)
- низкая |
112 |
Группа-1 |
113 |
Группа-2 |
Анкета организаторов тестирования преобразована к виду, удобному для обработки в системе "Эйдос" (таблица 63).
Таблица 63 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
Код
|
Наименования
шкал и градаций признаков
|
[ 1] |
ВАШ
ВОЗРАСТ: |
1 |
17 |
2 |
18 |
3 |
19 |
4 |
20 |
5 |
21 |
6 |
22 |
7 |
23 |
8 |
24 |
9 |
25
или более |
[ 2] |
ВЫ
РОДИЛИСЬ В РОССИИ? |
10 |
Да |
11 |
Нет |
[ 3] |
ЕСЛИ
ВЫ РОДИЛИСЬ НЕ В РОССИИ, ТО ВО СКОЛЬКО ЛЕТ ВЫ СЮДА ПРИЕХАЛИ? |
12 |
До
7 лет |
13 |
От
7 до 17 лет |
14 |
Больше
17 лет |
[ 4] |
КОЛИЧЕСТВО
ЖИЛЫХ КОМНАТ У ВАС ДОМА: |
15 |
1 |
16 |
2 |
17 |
3 |
18 |
4 |
19 |
5
или более |
[ 5] |
СКОЛЬКО
ВСЕГО ЧЕЛОВЕК ЖИВУТ У ВАС ДОМА? |
20 |
1 |
21 |
2 |
22 |
3 |
23 |
4 |
24 |
5 |
25 |
6 |
26 |
7 и
более |
[ 6] |
ДОХОД
НА ЧЛЕНА СЕМЬИ (В МЕСЯЦ): |
27 |
Низкий |
28 |
Средний |
29 |
Высокий |
[ 7] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО РУССКОМУ ЯЗЫКУ: |
30 |
Отличные |
31 |
Хорошие |
32 |
Средние |
33 |
Низкие |
[ 8] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО АЛГЕБРЕ: |
34 |
Отличные |
35 |
Хорошие |
36 |
Средние |
37 |
Низкие |
[ 9] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ГЕОМЕТРИИ: |
38 |
Отличные |
39 |
Хорошие |
40 |
Средние |
41 |
Низкие |
[ 10] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ФИЗИКЕ: |
42 |
Отличные |
43 |
Хорошие |
44 |
Средние |
45 |
Низкие |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
[ 11] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ХИМИИ: |
46 |
Отличные |
47 |
Хорошие |
48 |
Средние |
49 |
Низкие |
[ 12] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНФОРМАТИКЕ: |
50 |
Отличные |
51 |
Хорошие |
52 |
Средние |
[ 13] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО БИОЛОГИИ: |
54 |
Отличные |
55 |
Хорошие |
56 |
Средние |
57 |
Низкие |
[ 14] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИСТОРИИ: |
58 |
Отличные |
59 |
Хорошие |
60 |
Средние |
61 |
Низкие |
[ 15] |
КАК
ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНОСТРАННОМУ ЯЗЫКУ |
62 |
Отличные |
63 |
Хорошие |
64 |
Средние |
65 |
Низкие |
[ 16] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО РУССКОМУ ЯЗЫКУ: |
66 |
Уроки
в школе |
67 |
Со
знакомыми |
68 |
С
репетитором |
69 |
Факультатив
в школе |
70 |
Курсы
при ВУЗе |
71 |
Заочно
при ВУЗе |
[ 17] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО АЛГЕБРЕ: |
72 |
Уроки
в школе |
73 |
Со
знакомыми |
74 |
С
репетитором |
75 |
Факультатив
в школе |
76 |
Курсы
при ВУЗе |
77 |
Заочно
при ВУЗе |
[ 18] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ГЕОМЕТРИИ: |
78 |
Уроки
в школе |
79 |
Со
знакомыми |
80 |
С
репетитором |
81 |
Факультатив
в школе |
82 |
Курсы
при ВУЗе |
83 |
Заочно
при ВУЗе |
[ 19] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ФИЗИКЕ: |
84 |
Уроки
в школе |
85 |
Со
знакомыми |
86 |
С
репетитором |
87 |
Факультатив
в школе |
88 |
Курсы
при ВУЗе |
89 |
Заочно
при ВУЗе |
[ 20] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ХИМИИ: |
90 |
Уроки
в школе |
91 |
Со
знакомыми |
92 |
С
репетитором |
93 |
Факультатив
в школе |
94 |
Курсы
при ВУЗе |
95 |
Заочно
при ВУЗе |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
[ 21] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНФОРМАТИКЕ: |
96 |
Уроки
в школе |
97 |
Со
знакомыми |
98 |
С
репетитором |
99 |
Факультатив
в школе |
100 |
Курсы
при ВУЗе |
101 |
Заочно
при ВУЗе |
[ 22] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО БИОЛОГИИ: |
102 |
Уроки
в школе |
103 |
Со
знакомыми |
104 |
С
репетитором |
105 |
Факультатив
в школе |
106 |
Курсы
при ВУЗе |
107 |
Заочно
при ВУЗе |
[ 23] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИСТОРИИ: |
108 |
Уроки
в школе |
109 |
Со
знакомыми |
110 |
С
репетитором |
111 |
Факультатив
в школе |
112 |
Курсы
при ВУЗе |
113 |
Заочно
при ВУЗе |
[ 24] |
КАК
ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНОСТРАННОМУ ЯЗЫКУ |
114 |
Уроки
в школе |
115 |
Со
знакомыми |
116 |
С
репетитором |
117 |
Факультатив
в школе |
118 |
Курсы
при ВУЗе |
119 |
Заочно
при ВУЗе |
[ 25] |
СКОЛЬКО
ВРЕМЕНИ СУММАРНО УХОДИТ У ВАС НА ВЫПОЛНЕНИЕ ДОМАШНИХ ЗАДАНИЙ? |
120 |
До
15 минут |
121 |
Около
30 минут |
122 |
1 -
2 часа |
123 |
Более
2-х часов |
[ 26] |
УКАЖИТЕ
УРОВЕНЬ ОБРАЗОВАНИЯ ОТЦА: |
124 |
Неполное
среднее |
125 |
Среднее |
126 |
Среднее
техническое |
127 |
Незаконченное
высшее |
128 |
Высшее |
129 |
Кандидат
наук |
130 |
Доктор
наук |
[ 27] |
УКАЖИТЕ
УРОВЕНЬ ОБРАЗОВАНИЯ МАТЕРИ: |
131 |
Неполное
среднее |
132 |
Среднее |
133 |
Среднее
техническое |
134 |
Незаконченное
высшее |
135 |
Высшее |
136 |
Кандидат
наук |
137 |
Доктор
наук |
[ 28] |
УКАЖИТЕ
НАЦИОНАЛЬНОСТЬ ОТЦА: |
138 |
Русский |
139 |
Украинец |
140 |
Белорус |
141 |
Татарин |
142 |
Мордвин |
143 |
Удмурт |
144 |
Мари |
145 |
Башкир |
146 |
Чуваш |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
147 |
Еврей |
148 |
Калмык |
149 |
Бурят |
150 |
Коми |
151 |
Грузин |
152 |
Армянин |
153 |
Азербайджанец |
154 |
Другая |
[ 29] |
УКАЖИТЕ
НАЦИОНАЛЬНОСТЬ МАТЕРИ: |
155 |
Русский |
156 |
Украинец |
157 |
Белорус |
158 |
Татарин |
159 |
Мордвин |
160 |
Удмурт |
161 |
Мари |
162 |
Башкир |
163 |
Чуваш |
164 |
Еврей |
165 |
Калмык |
166 |
Бурят |
167 |
Коми |
168 |
Грузин |
169 |
Армянин |
170 |
Азербайджанец |
171 |
Другая |
[ 30] |
ВЫ
ПОСТОЯННО ЖИВЕТЕ В ДАННОМ МЕСТЕ ИЛИ ПЕРЕЕХАЛИ СЮДА ИЗ ДРУГОЙ МЕСТНОСТИ? |
172 |
Родился
и живу здесь постоянно |
173 |
Приехал
сюда из другого города России |
174 |
Приехал
из сельской местности России |
175 |
Приехал
из бывших республик СССР |
[ 31] |
ВЫ
ПРОЖИВАЕТЕ:
|
176 |
Москве |
177 |
Санкт-Петербурге |
178 |
В
областном (краевом) центре или столице республики |
179 |
В
крупном городе |
180 |
В
среднем городе |
181 |
В
малом городе |
182 |
В
поселке, деревне, селе, хуторе и т.п. |
[ 32] |
КАК
ЧАСТО ВЫ ДОМА РАЗГОВАРИВАЕТЕ НА РУССКОМ ЯЗЫКЕ? |
183 |
Всегда |
184 |
Почти
всегда |
185 |
Иногда |
186 |
Очень
редко |
187 |
Никогда |
[ 33] |
ВМЕСТЕ
С ВАМИ ПОСТОЯННО ПРОЖИВАЮТ: |
188 |
Мать |
189 |
Отец |
190 |
Отчим/мачеха |
191 |
Братья/сестры |
192 |
Бабушки/дедушки |
193 |
Другие
родственники |
[ 34] |
КОЛИЧЕСТВО
ДЕТЕЙ В СЕМЬЕ, ВКЛЮЧАЯ ВАС: |
194 |
Один |
195 |
Двое |
196 |
Трое |
197 |
Четверо
или более |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
[ 35] |
ИМЕЕТ
ЛИ ВАША СЕМЬЯ: |
198 |
Видеомагнитофон |
199 |
Видеокамеру |
200 |
Несколько
цветных телевизоров |
201 |
Компьютер |
202 |
Отечественную
автомашину |
203 |
Несколько
отечественных автомашин или иномарку |
[ 36] |
ЕСЛИ
ВЫ ИМЕЕТЕ КОМПЬЮТЕР ДОМА, ТО КАК ВЫ ЕГО ИСПОЛЬЗУЕТЕ? |
204 |
Для
игр |
205 |
Для
изучения учебных предметов (например, иностранных языков) |
206 |
Для
обмена информацией с помощью модема, в т.ч. в Internet |
207 |
Для
оплачиваемой работы |
[ 37] |
СКОЛЬКО
ПРИМЕРНО КНИГ У ВАС В СЕМЬЕ (НЕ СЧИТАЯ УЧЕБНИКОВ И УЧЕБНЫХ ПОСОБИЙ)? |
208 |
Менее
50 |
209 |
Около
100 |
210 |
Несколько
сотен |
211 |
Более
тысячи |
[ 38] |
ВАШЕ
ОТНОШЕНИЕ К ПЕРИОДИЧЕСКОЙ ПЕЧАТИ: |
212 |
Выписываем
на дом |
213 |
Покупаем
ежедневно |
214 |
Покупаем
еженедельно |
215 |
Почти
не читаем |
[ 39] |
ЖИЛИЩНЫЕ
УСЛОВИЯ ВАШЕЙ СЕМЬИ: |
216 |
Комната
в коммунальной квартире |
217 |
1-комнатная
квартира |
218 |
2-комнатная
квартира |
219 |
Квартира
из 3-х или более комнат |
220 |
Обычный
дом в сельской местности |
221 |
Дом
повышенной комфортности (особняк) |
[ 40] |
ПРИ
СОСТАВЛЕНИИ ПЛАНОВ НА БУДУЩЕЕ ЧЬЕ МНЕНИЕ ВЫ УЧИТЫВАЕТЕ В ПЕРВУЮ ОЧЕРЕДЬ
(ВЫБЕРИТЕ ТОЛЬКО ОДИН ОТВЕТ): |
222 |
Родителей |
223 |
Учителей |
224 |
Сверстников
(друзей) |
225 |
Средств
массовой информации |
226 |
Свое
собственное |
[ 41] |
ГДЕ
ВЫ ОБЫЧНО ПРОВОДИТЕ ЕЖЕГОДНЫЙ ОТПУСК (КАНИКУЛЫ): |
227 |
Дома |
228 |
На
собственной даче |
229 |
В
другом городе или на даче у родственников или знакомых |
230 |
В
туристическом походе |
231 |
На
Черном море в России |
232 |
В
бывших республиках СССР |
233 |
За
рубежом |
234 |
Другое |
[ 42] |
ВЫ
ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС: |
235 |
Общеобразовательный |
236 |
Профилированный
на ВУЗ |
237 |
Гимназический
или лицейский |
238 |
другой
(экономический, юридический и др.) |
[ 43] |
ВЫ
ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС С УГЛУБЛЕННЫМ ИЗУЧЕНИЕМ: |
239 |
Математики |
240 |
Физики |
241 |
Биологии |
242 |
Химии |
243 |
Географии |
244 |
Информатики |
245 |
Истории,
обществоведения |
246 |
Русского
языка, литературы |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
247 |
Иностранных
языков |
[ 44] |
ВЫБЕРИТЕ
ПРЕДМЕТЫ, КОТОРЫЕ ВАМ НРАВЯТСЯ: |
248 |
Русский
язык |
249 |
Математика |
250 |
Физика |
251 |
Химия |
252 |
Информатика |
253 |
Биология |
254 |
История |
255 |
Иностранный
язык |
256 |
География |
[ 45] |
ЧЕМ
ВАМ НРАВИТСЯ ШКОЛА, КОТОРУЮ ВЫ ЗАКОНЧИЛИ? |
257 |
Хорошие
отношения со сверстниками |
258 |
Хорошие
учителя |
259 |
Хорошая
подготовка к поступлению в ВУЗ |
260 |
Расположена
рядом с домом |
261 |
Ничем
не нравится |
262 |
Другое |
[ 46] |
ОБЛАСТЬ
ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ ОТЦА: |
263 |
Промышленность
(тяжелая) |
264 |
Промышленность
(легкая) |
265 |
Строительство |
266 |
Сельское
хозяйство |
267 |
Транспорт |
268 |
Коммерция,
торговля, сфера бытового обслуживания |
269 |
Экономика |
270 |
Частный
бизнес, предпринимательство |
271 |
Государственная
служба |
272 |
Служба
в силовых структурах |
273 |
Выборные
органы власти |
274 |
Образование |
275 |
Здравоохранение,
медицина |
276 |
Культура,
искусство |
277 |
Наука |
278 |
Юриспруденция |
279 |
Спорт |
280 |
Религия |
281 |
Другое |
[ 47] |
ОБЛАСТЬ
ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ МАТЕРИ: |
282 |
Промышленность
(тяжелая) |
283 |
Промышленность
(легкая) |
284 |
Строительство |
285 |
Сельское
хозяйство |
286 |
Транспорт |
287 |
Коммерция,
торговля, сфера бытового обслуживания |
288 |
Экономика |
289 |
Частный
бизнес, предпринимательство |
290 |
Государственная
служба |
291 |
Служба
в силовых структурах |
292 |
Выборные
органы власти |
293 |
Образование |
294 |
Здравоохранение,
медицина |
295 |
Культура,
искусство |
296 |
Наука |
297 |
Юриспруденция |
298 |
Спорт |
299 |
Религия |
300 |
Другое |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
[ 48] |
ОБЛАСТЬ
ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ, НАИБОЛЕЕ ПРИВЛЕКАЮЩАЯ МЕНЯ |
301 |
Промышленность
(тяжелая) |
302 |
Промышленность
(легкая) |
303 |
Строительство |
304 |
Сельское
хозяйство |
305 |
Транспорт |
306 |
Коммерция,
торговля, сфера бытового обслуживания |
307 |
Экономика |
308 |
Частный
бизнес, предпринимательство |
309 |
Государственная
служба |
310 |
Служба
в силовых структурах |
311 |
Выборные
органы власти |
312 |
Образование |
313 |
Здравоохранение,
медицина |
314 |
Культура,
искусство |
315 |
Наука |
316 |
Юриспруденция |
317 |
Спорт |
318 |
Религия |
319 |
Другое |
[ 49] |
УКАЖИТЕ
ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ПРАКТИЧЕСКИ НЕ ИСПОЛЬЗУЕТЕ: |
320 |
Просмотр
видео и кинофильмов |
321 |
Чтение
художественной литературы |
322 |
Спорт,
туризм |
323 |
Дискотеки
и т.п. |
324 |
Общение
с родителями |
325 |
Общение
с любимым человеком |
326 |
Работа
на дому |
327 |
Оплачиваемая
работа |
328 |
Дополнительное
образование |
329 |
Техническое
творчество |
330 |
Занятия
искусством |
331 |
Коллекционирование |
332 |
Посещение
музеев и выставок |
333 |
Посещение
оперы и балета |
334 |
Посещение
драматических театров |
335 |
Посещение
концертов классической музыки |
336 |
Посещение
концертов попмузыки |
337 |
Слушание
радио |
338 |
Слушание
аудио-музыки |
339 |
Просмотр
теленовостей |
340 |
Просмотр
развлекательных TV-программ |
341 |
Просмотр
спортивных TV-программ |
342 |
Просмотр
мультфильмов |
343 |
Просмотр
телесериалов |
344 |
Просмотр
познавательных передач |
345 |
Просмотр
религиозных программ |
346 |
Посещение
религиозных центров |
[ 50] |
УКАЖИТЕ
ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ: |
347 |
Просмотр
видео и кинофильмов |
348 |
Чтение
художественной литературы |
349 |
Спорт,
туризм |
350 |
Дискотеки
и т.п. |
351 |
Общение
с родителями |
352 |
Общение
с любимым человеком |
353 |
Работа
на дому |
354 |
Оплачиваемая
работа |
355 |
Дополнительное
образование |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
356 |
Техническое
творчество |
357 |
Занятия
искусством |
358 |
Коллекционирование |
359 |
Посещение
музеев и выставок |
360 |
Посещение
оперы и балета |
361 |
Посещение
драматических театров |
362 |
Посещение
концертов классической музыки |
363 |
Посещение
концертов попмузыки |
364 |
Слушание
радио |
365 |
Слушание
аудио-музыки |
366 |
Просмотр
теленовостей |
367 |
Просмотр
развлекательных TV-программ |
368 |
Просмотр
спортивных TV-программ |
369 |
Просмотр
мультфильмов |
370 |
Просмотр
телесериалов |
371 |
Просмотр
познавательных передач |
372 |
Просмотр
религиозных программ |
373 |
Посещение
религиозных центров |
[ 51] |
УКАЖИТЕ
ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ЧАСТО ИСПОЛЬЗУЕТЕ: |
374 |
Просмотр
видео и кинофильмов |
375 |
Чтение
художественной литературы |
376 |
Спорт,
туризм |
377 |
Дискотеки
и т.п. |
378 |
Общение
с родителями |
379 |
Общение
с любимым человеком |
380 |
Работа
на дому |
381 |
Оплачиваемая
работа |
382 |
Дополнительное
образование |
383 |
Техническое
творчество |
384 |
Занятия
искусством |
385 |
Коллекционирование |
386 |
Посещение
музеев и выставок |
387 |
Посещение
оперы и балета |
388 |
Посещение
драматических театров |
389 |
Посещение
концертов классической музыки |
390 |
Посещение
концертов попмузыки |
391 |
Слушание
радио |
392 |
Слушание
аудио-музыки |
393 |
Просмотр
теленовостей |
394 |
Просмотр
развлекательных TV-программ |
395 |
Просмотр
спортивных TV-программ |
396 |
Просмотр
мультфильмов |
397 |
Просмотр
телесериалов |
398 |
Просмотр
познавательных передач |
399 |
Просмотр
религиозных программ |
400 |
Посещение
религиозных центров |
[ 52] |
УКАЖИТЕ
ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПРАКТИЧЕСКИ ВСЕГДА: |
401 |
Просмотр
видео и кинофильмов |
402 |
Чтение
художественной литературы |
403 |
Спорт,
туризм |
404 |
Дискотеки
и т.п. |
405 |
Общение
с родителями |
406 |
Общение
с любимым человеком |
407 |
Работа
на дому |
408 |
Оплачиваемая
работа |
409 |
Дополнительное
образование |
410 |
Техническое
творчество |
411 |
Занятия
искусством |
412 |
Коллекционирование |
413 |
Посещение
музеев и выставок |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
414 |
Посещение
оперы и балета |
415 |
Посещение
драматических театров |
416 |
Посещение
концертов классической музыки |
417 |
Посещение
концертов попмузыки |
418 |
Слушание
радио |
419 |
Слушание
аудио-музыки |
420 |
Просмотр
теленовостей |
421 |
Просмотр
развлекательных TV-программ |
422 |
Просмотр
спортивных TV-программ |
423 |
Просмотр
мультфильмов |
424 |
Просмотр
телесериалов |
425 |
Просмотр
познавательных передач |
426 |
Просмотр
религиозных программ |
427 |
Посещение
религиозных центров |
[ 53] |
УКАЖИТЕ
СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС МАЛУЮ ЦЕННОСТЬ: |
428 |
Общение
с друзьями |
429 |
Общение
с родителями |
430 |
Наличие
вещей, имеющих продуктивную работу и учебу |
431 |
Наличие
престижных вещей |
432 |
Наличие
вещей, обеспечивающих комфортные условия жизни |
433 |
Возможность
влияния на ход важных событий в семье |
434 |
Материальная
независимость |
435 |
Свобода
высказываться и публиковаться |
436 |
Свобода
религии |
437 |
Удовольствия,
развлечения |
438 |
Работа
и учеба как творчество |
439 |
Работа
на благо общества |
440 |
Работа
как средство заработка |
441 |
Счастливая
семья |
442 |
Любовь |
443 |
Красота
человека |
444 |
Природа |
445 |
Культура,
искусство |
[ 54] |
УКАЖИТЕ
СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС НЕКОТОРУЮ ЦЕННОСТЬ: |
446 |
Общение
с друзьями |
447 |
Общение
с родителями |
448 |
Наличие
вещей, имеющих продуктивную работу и учебу |
449 |
Наличие
престижных вещей |
450 |
Наличие
вещей, обеспечивающих комфортные условия жизни |
451 |
Возможность
влияния на ход важных событий в семье |
452 |
Материальная
независимость |
453 |
Свобода
высказываться и публиковаться |
454 |
Свобода
религии |
455 |
Удовольствия,
развлечения |
456 |
Работа
и учеба как творчество |
457 |
Работа
на благо общества |
458 |
Работа
как средство заработка |
459 |
Счастливая
семья |
460 |
Любовь |
461 |
Красота
человека |
462 |
Природа |
463 |
Культура,
искусство |
[ 55] |
УКАЖИТЕ
СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС БОЛЬШУЮ ЦЕННОСТЬ: |
464 |
Общение
с друзьями |
465 |
Общение
с родителями |
466 |
Наличие
вещей, имеющих продуктивную работу и учебу |
467 |
Наличие
престижных вещей |
468 |
Наличие
вещей, обеспечивающих комфортные условия жизни |
469 |
Возможность
влияния на ход важных событий в семье |
Продолжение таблицы 63
Код
|
Наименования
шкал и градаций признаков
|
470 |
Материальная
независимость |
471 |
Свобода
высказываться и публиковаться |
472 |
Свобода
религии |
473 |
Удовольствия,
развлечения |
474 |
Работа
и учеба как творчество |
475 |
Работа
на благо общества |
476 |
Работа
как средство заработка |
477 |
Счастливая
семья |
478 |
Любовь |
479 |
Красота
человека |
480 |
Природа |
481 |
Культура,
искусство |
Для этих целей каждый учащийся заполняет данными о себе "Карточку респондента", имеющую вид, представленный на таблице 64:
Таблица 64 – КАРТОЧКА РЕСПОНДЕНТА № _____
Учебная группа: |
|
||||||
Фамилия, имя, отчество: |
|
||||||
Коды классов, к которым он принадлежит: |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коды признаков, которыми он характеризуется: |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При необходимости строки с кодами добавляются. На каждой карточке имеется номер студента по списку группы, который затем используется как номер анкеты в обучающей выборке. Необходимо сначала ввести пустые анкеты обучающей выборки по списку группы, а затем заполнить их, используя карточки. Учащиеся передают друг другу карточки передавать по компьютерному классу. В графе "Наим.физ.источника" указываются полностью: фамилия, и сокращенно: имя и отчество студента. Аналогично поступаем с карточками студентов 2-й группы, за исключением того, что для определения номера анкеты в обучающей выборке к списочному номеру студента 2-й группы прибавляется номер последнего студента 1-й группы.
Синтез и верификация модели осуществляется в соответствующих подсистемах системы "Эйдос". Результаты верификации представлены в таблице 65.
Таблица 65 – РЕЗУЛЬТАТЫ ВЕРИФИКАЦИИ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ
№ |
Код |
Наименование класса |
Ко-во лог. анк. |
% верной идентификации |
ВЫСОКАЯ адекватность модели |
||||
1 |
87 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
низкая |
1 |
100,00 |
2 |
106 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
высокая |
27 |
88,89 |
3 |
46 |
УСП.ПО ДИСЦ.ЕН-02
(конц.совр.естествознания) - высокая |
35 |
88,57 |
4 |
55 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
высокая |
26 |
88,46 |
5 |
45 |
УСП.ПО ДИСЦ.ЕН-01 (математика и информатика)
- низкая |
8 |
87,50 |
6 |
85 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
высокая |
24 |
87,50 |
7 |
13 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - высокая |
23 |
86,96 |
8 |
28 |
УСП.ПО ДИСЦ.ГСД-06 (право) - высокая |
35 |
85,71 |
9 |
37 |
УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика)
- высокая |
26 |
84,62 |
10 |
14 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - средняя |
6 |
83,33 |
11 |
16 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - высокая |
24 |
83,33 |
12 |
18 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - низкая |
6 |
83,33 |
СРЕДНЯЯ адекватность модели |
||||
13 |
24 |
УСП.ПО ДИСЦ.ГСД-04 (история) - низкая |
9 |
77,78 |
14 |
22 |
УСП.ПО ДИСЦ.ГСД-04 (история) - высокая |
17 |
76,47 |
15 |
17 |
УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - средняя |
12 |
75,00 |
16 |
56 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
средняя |
8 |
75,00 |
17 |
57 |
УСП.ПО ДИСЦ.ОПД-02 (общая социология) -
низкая |
8 |
75,00 |
18 |
43 |
УСП.ПО ДИСЦ.ЕН-01 (математика и информатика)
- высокая |
15 |
73,33 |
19 |
29 |
УСП.ПО ДИСЦ.ГСД-06 (право) - средняя |
7 |
71,43 |
20 |
47 |
УСП.ПО ДИСЦ.ЕН-02
(конц.совр.естествознания) - средняя |
7 |
71,43 |
НИЗКАЯ адекватность модели |
||||
21 |
113 |
Группа-2 |
23 |
69,57 |
22 |
23 |
УСП.ПО ДИСЦ.ГСД-04 (история) - средняя |
16 |
68,75 |
23 |
44 |
УСП.ПО ДИСЦ.ЕН-01 (математика и информатика)
- средняя |
19 |
68,42 |
24 |
39 |
УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика)
- низкая |
3 |
66,67 |
25 |
112 |
Группа-1 |
19 |
63,16 |
26 |
15 |
УСП.ПО ДИСЦ.ГСД-01 (философия) - низкая |
13 |
61,54 |
ОЧЕНЬ НИЗКАЯ адекватность модели |
||||
27 |
107 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
средняя |
11 |
54,55 |
28 |
38 |
УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика)
- средняя |
13 |
53,85 |
29 |
86 |
УСП.ПО ДИСЦ.ОПД-12 (социальная экология) -
средняя |
17 |
52,94 |
30 |
108 |
УСП.ПО ДИСЦ.СД-05 (социология культуры) -
низкая |
4 |
50,00 |
Из таблицы 65 видно, что:
– из 113 классов сформированными оказались лишь 30, т.к. по остальным в обучающей выборке просто не было данных;
– если исключить из модели не сформированные классы, а также классы с дифференциальной валидностью (% верной идентификации) меньше 70% (строки с 21 по 30), то получившаяся в результате модель по 20 классам модель будет иметь среднюю адекватность не ниже 70%. Для автоматизации этой операции в системе "Эйдос" в подсистеме измерения адекватности имеется специальный режим. Необходимо отметить, что этот прием аналогичен исключению из рассмотрения результатов обработки с низким доверительным интервалом, что широко используется в дискриминантом анализе.
Эти операции выполняются в 4-й подсистеме системы "Эйдос". Результаты выводятся в двух разрезах:
– индивидуальная универсальная характеристика конкретного респондента (рисунок 113);
– выборка респондентов, имеющих наивысшие сходство с заданным классом (рисунок 114).
Анализ карточек прогноза успеваемости показывает, что вариабельность внутри группы успевающих студентов гораздо выше, чем в группе неуспевающих. В результате в среднем уровень сходства конкретных респондентов с обобщенными образами классов, соответствующих высоким уровням успеваемости, гораздо ниже, чем с классами, соответствующими низким уровням успеваемости.
Это дает основание предложить гипотезу, что высокая успеваемость детерминируется менее жестко, чем низкая, т.е. существуют конкретные факторы, фактически предопределяющие низкую успеваемость, тогда как для высокой успеваемости можно говорить лишь о системе факторов, способствующих высокой успеваемости.
Конечно, чтобы подобные выводы имели достаточную научную достоверность необходима значительно большая статистика, чем использованная в данном учебном примере. Например, если бы подобное исследование было проведено хотя бы в масштабах КубГАУ (более 17000 студентов), то тогда уже с достаточной уверенностью можно было бы говорить о реально обнаруженных закономерностях.
|
Рисунок
113. Прогноз успеваемости по различным
предметам |
|
Рисунок
114. Список респондентов в порядке
убывания сходства |
Формы, подобные представленной на рисунке 113, могут интересовать потенциальных работодателей, а также приемную комиссию вуза в качестве дополнительной информации для принятия решения.
Определим, как влияют "ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ" на успеваемость по философии. Для этого в 1-м режиме 5-й подсистемы системы "Эйдос" получим информационный портрет класса с кодом 13: УСП.ПО ДИСЦ.ГСД-01 (философия) – высокая и нажав клавишу F6 зададим фильтр по диапазону градаций названной шкалы с кодом 50: {347, 373}. В результате получим информационный портрет данного класса, представленный в таблице 66.
Таблица 66 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА, КОД: 13 |
|
Профиль класса в разрезе по диапазону факторов можно получить в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 115).
|
Рисунок
115. Профиль влияния образовательного
уровня отца |
Из этого рисунка видно, что на отличную успеваемость студента по философии наиболее положительно сказывается если его отец – доктор наук.
В этой связи позволим себе
немного повеселить читателей следующей
историей. Профессор спрашивает абитуриента на вступительном экзамене:
– из каких соображений Вы
выбрали для поступления именно наш вуз и именно эту специальность?
– не задавай глупых
вопросов, папа!
отвечает
абитуриент.
Оставшуюся часть задания
студентам предлагается выполнить самостоятельно.
В 5-й подсистеме системы "Эйдос" получены следующие семантические сети классов, отражающие степень их сходства по детерминирующим их факторам (рисунок 116), и факторов, отражающие, их сходство и различие по влиянию на уровень учебных достижений учащихся (рисунок 117).
|
Рисунок 116. Пример семантической сети классов |
|
Рисунок 117. Пример семантической сети факторов |
Для этого в 3-й функции 1-го режиме 5-й подсистемы системы "Эйдос" зададим коды классов 13 и 15 (высокая и низкая успеваемость по философии) и фильтр по факторам для обоих портретов от 347 до 373 (влияние образовательного уровня отца). В результате получим когнитивную диаграмму, представленную на рисунке 118.
|
Рисунок 118. Когнитивная диаграмма, показывающая результаты содержательного сравнения двух классов по системам их детерминации |
Проинтерпретировать данную когнитивную диаграмму студенты должны самостоятельно.
Это задание предлагается выполнить самостоятельно. При этом использовать 6-й режим 6-й подсистемы системы "Эйдос".
В 7-м режиме 6-й подсистемы системы "Эйдос" при задании кода класса 13 и диапазона кодов факторов 1 – 11 генерируется следующая классическая когнитивная карта (рисунок 119).
|
Рисунок 119. Пример классической когнитивной карты |
В 7-м режиме 6-й подсистемы системы "Эйдос" при задании диапазона кода классов {13, 15} и диапазона кодов факторов {1, 11} генерируется следующая классическая когнитивная карта (рисунок 120), которая, по сути, является суперпозицией нескольких классических когнитивных карт.
Из этого рисунка видно, что факторы с кодами 3, 5, 11 сходны по влиянию на учебные достижения по философии:
– они все препятствуют достижению результата с кодом 13;
– они все способствуют достижению результата с кодом 15;
– результаты с кодами 13 и 15 детерминируются несовместимыми системами факторов и одновременно недостижимы, на что указывает антикорреляция между ними в семантической сети классов;
– фактор 3 способствует результату 14 и препятствует результату 13, а фактор 2, наоборот, препятствует 14 и способствует 13, и факторы 2 и 3 имеют различное влияние на поведение объекта управления, на что указывает антикорреляция между ними в семантической сети факторов.
Насколько известно, система "Эйдос" на данный момент является единственной системой, обеспечивающей автоматический синтез непосредственно на основе эмпирических данных и отображение в графической форме классических и интегральных когнитивных карт (интегральные когнитивные карты впервые предложены автором).
|
Рисунок 120. Пример интегральной когнитивной карты |
1. Какие работы выполняются на этапе формализации задачи?
2. Как в системе "Эйдос" ввести классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки?
3. Как в системе "Эйдос" ввести описательные шкал и градации, использовав характеристики подчерка?
4. Каким образом подготовить и ввести в систему "Эйдос" обучающую выборку?
5. Как осуществить синтез и верификацию (измерение адекватности) семантической информационной модели в системе "Эйдос"?
6. Что включает системно-когнитивный анализ модели?
7. Как решаются задачи идентификации и прогнозирования в системе "Эйдос"?
8. В каких подсистемах и режимах системы "Эйдос" генерируются информационные портреты классов и факторов и отображаются в графической форме двухмерных и трехмерных профилей классов и факторов)?
9. Каким образом в системе "Эйдос" провести кластерно-конструктивный анализ классов и факторов и отобразить его в форме семантических сетей классов и факторов?
10. Как в системе "Эйдос" осуществить содержательное сравнение классов и факторов и отобразить результаты в форме когнитивных диаграмм классов и факторов?
11. Как в системе "Эйдос" построить нелокальные нейроны и интерпретируемые нейронные сети?
12. Как в системе "Эйдос" построить классические когнитивные модели и отобразить их в форме когнитивных карт?
13. Как в системе "Эйдос" построить интегральные когнитивные модели и отобразить в форме интегральных когнитивных карт?
14. Кто такой "респондент"?
15. Что понимается под "социальным статусом" респондента?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Первую лабораторную работу рассмотрим более подробно, чтобы студенты могли ознакомиться с базовой системой "Эйдос", на которой основан курс лекций и лабораторных работ.
В данной работе исследуется возможность идентификации слов по входящим в них буквам. При этом слова рассматриваются как классы распознавания, а буквы – как признаки. Подробно описана технология синтеза и анализа модели с применением инструментария СК-анализа – системы "Эйдос", приведены видеограммы, табличные и графические выходные формы, причем впервые – классическая и интегральная когнитивные карты, генерируемые в версии 12.5. Продемонстрировано на численных примерах, что при идентификации слов главную роль играет информация о входящих в них буквах, а последовательность букв и их сочетаний не играет особой роли. Продемонстрирована устойчивость модели от неполноты и зашумленности информации.
Язык является мощным средством моделирования реальности. Иерархическая структура языка, включающего в частности такие структуры, как символы, слова, предложения и тексты, является ярким примером иерархической структуры обработки информации, обеспечивающей адекватное отражение структуры реальности. Описание некоторых объектов на естественном языке является их моделированием и позволяет решать задачи идентификации, прогнозирования, сравнения и классификации этих объектов. Автоматизированный синтез моделей объектов, описанных на естественном языке, представляет большой интерес для теории и практики систем искусственного интеллекта.
Эффективность языка, как системы моделирования, удивительна: 32 буквы русского алфавита позволяют составить более 40 тысяч слов русского языка, из которых может быть образовано огромное количество осмысленных предложений.
Каждый символ содержит некоторое количество информации о словах, предложениях и текстах, в которые он входит, каждое слово – о предложениях и текстах, и каждое предложение – о текстах. Однако в буквах содержится больше информации о словах, в словах – о предложениях, в предложениях – о текстах. Поэтому на основе анализа букв целесообразно идентифицировать лишь слова, а на основе слов – предложения, на основе предложений – тексты.
В
данной работе исследуется возможность идентификации слов по входящим в них
буквам. При этом слова рассматриваются как классы распознавания, а буквы – как
признаки.
Эта задача проста и наглядна. Поэтому она рекомендуется в качестве первой лабораторной работы для освоения инструментария системно-когнитивного анализа – универсальной когнитивной аналитической системы "Эйдос" [64, 92].
Подобные задачи имеют большое практическое значение и решаются в ряде систем, например, в редакторе Word – при проверке орфографии и подборе рекомендуемых слов для замены, в системе FineReader – для поиска слов с неверно распознанными символами и др.
1. Создать файл в стандарте DOS-текст с концами строк, записать его в поддиректорию DOB.
2. Сгенерировать классификационные и описательные шкалы и градации, а также обучающую выборку.
3. Осуществить синтез и верификацию модели.
4. Провести анализ устойчивости модели к неполноте информации и наличию шума.
5. Проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого.
6. Оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв.
7. Выполнить кластерно-конструктивный анализ слов и букв, вывести информационные и семантические портреты слов и букв, построить их профили.
8. Вывести в графической форме семантические сети и когнитивные диаграммы слов и букв, а также классическую и интегральную когнитивные карты.
Текстовый файл создается в редакторе Word или MultiEdit. Если он создан в Word, то при сохранении выбирается режим: "Файл – Сохранить как – Тип файла: Текст DOS с разбиением на строки". Имя файла произвольное, но удовлетворяющее требованиям DOS. Этот файл каждый студент создает самостоятельно из двух – трех абзацев текста. Например, это может быть краткая биография студента или текст может быть взят из какого-либо файла, имеющегося на компьютере. Могут использоваться и русский, и латинский алфавиты, а также цифры. Регистр роли не играет.
Пример текста
файла:
Молоко око срок окорок огород В. Г. Белинский
высоко и по достоинству оценил гениальное творение
нашего национального поэта. Великий критик писал:
"Пусть идет время и приводит с собой новые
потребности, пусть растет русское общество и обгоняет
"Онегина": как бы далеко оно ни ушло, всегда будет
оно любить эту поэму, всегда будет останавливать на
ней исполненный любви и благодарности взор...".
Слова из этого файла будут использованы системой для выполнения следующего этапа работы.
Генерация классификационных и описательных шкал и градаций осуществляется в соответствующих режимах системы "Эйдос": "Автоввод первичных признаков и TXT-файлов", "F5 Признаки – Буквы". (рисунки 121 и 122):
|
Рисунок 121. Выбор режима "Импорт данных
из TXT-файлов |
|
Рисунок 122. Выбор режима "Признаки – F5 Буквы" |
В результате будут автоматически сгенерированы классификационные и описательные шкалы и градации, а также обучающая выборка (приведена полностью) (таблицы 67, 68, 69).
Таблица 67 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ (СЛОВА)
Код |
Слово |
Код |
Слово |
Код |
Слово |
1 |
БЕЛИНСКИЙ |
16 |
ЛЮБВИ |
31 |
ОЦЕНИЛ |
2 |
БЛАГОДАРНОСТИ |
17 |
ЛЮБИТЬ |
32 |
ПИСАЛ |
3 |
БУДЕТ |
18 |
МОЛОКО |
33 |
ПОТРЕБНОСТИ |
4 |
ВЕЛИКИЙ |
19 |
НАЦИОНАЛЬНОГО |
34 |
ПОЭМУ |
5 |
ВЗОР |
20 |
НАШЕГО |
35 |
ПОЭТА |
6 |
ВРЕМЯ |
21 |
НЕЙ |
36 |
ПРИВОДИТ |
7 |
ВСЕГДА |
22 |
НОВЫЕ |
37 |
ПУСТЬ |
8 |
ВЫСОКО |
23 |
ОБГОНЯЕТ |
38 |
РАСТЕТ |
9 |
ГЕНИАЛЬНОЕ |
24 |
ОБЩЕСТВО |
39 |
РУССКОЕ |
10 |
ДАЛЕКО |
25 |
ОГОРОД |
40 |
СОБОЙ |
11 |
ДОСТОИНСТВУ |
26 |
ОКО |
41 |
СРОК |
12 |
ИДЕТ |
27 |
ОКОРОК |
42 |
ТВОРЕНИЕ |
13 |
ИСПОЛНЕННЫЙ |
28 |
ОНЕГИНА |
43 |
УШЛО |
14 |
КАК |
29 |
ОНО |
44 |
ЭТУ |
15 |
КРИТИК |
30 |
ОСТАНАВЛИВАТЬ |
|
|
Таблица 68 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (БУКВЫ)
Код |
Буква |
Код |
Буква |
Код |
Буква |
Код |
Буква |
1 |
0 |
18 |
H |
35 |
Y |
52 |
П |
2 |
1 |
19 |
I |
36 |
Z |
53 |
Р |
3 |
2 |
20 |
J |
37 |
А |
54 |
С |
4 |
3 |
21 |
K |
38 |
Б |
55 |
Т |
5 |
4 |
22 |
L |
39 |
В |
56 |
У |
6 |
5 |
23 |
M |
40 |
Г |
57 |
Ф |
7 |
6 |
24 |
N |
41 |
Д |
58 |
Х |
8 |
7 |
25 |
O |
42 |
Е |
59 |
Ц |
9 |
8 |
26 |
P |
43 |
Ж |
60 |
Ч |
10 |
9 |
27 |
Q |
44 |
З |
61 |
Ш |
11 |
A |
28 |
R |
45 |
И |
62 |
Щ |
12 |
B |
29 |
S |
46 |
Й |
63 |
Ъ |
13 |
C |
30 |
T |
47 |
К |
64 |
Ы |
14 |
D |
31 |
U |
48 |
Л |
65 |
Ь |
15 |
E |
32 |
V |
49 |
М |
66 |
Э |
16 |
F |
33 |
W |
50 |
Н |
67 |
Ю |
17 |
G |
34 |
X |
51 |
О |
68 |
Я |
Таблица 69 – ОБУЧАЮЩАЯ ВЫБОРКА
№ |
Класс |
Коды
признаков |
|||||||||||||
1 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
54 |
47 |
45 |
46 |
77 |
|
|
|
|
2 |
БЛАГОДАРНОСТИ |
38 |
48 |
37 |
40 |
51 |
41 |
37 |
53 |
50 |
51 |
54 |
55 |
45 |
81 |
3 |
БУДЕТ |
38 |
56 |
41 |
42 |
55 |
73 |
|
|
|
|
|
|
|
|
4 |
ВЕЛИКИЙ |
39 |
42 |
48 |
45 |
47 |
45 |
46 |
75 |
|
|
|
|
|
|
5 |
ВЗОР |
39 |
44 |
51 |
53 |
72 |
|
|
|
|
|
|
|
|
|
6 |
ВРЕМЯ |
39 |
53 |
42 |
49 |
68 |
73 |
|
|
|
|
|
|
|
|
7 |
ВСЕГДА |
39 |
54 |
42 |
40 |
41 |
37 |
74 |
|
|
|
|
|
|
|
8 |
ВЫСОКО |
39 |
64 |
54 |
51 |
47 |
51 |
74 |
|
|
|
|
|
|
|
9 |
ГЕНИАЛЬНОЕ |
40 |
42 |
50 |
45 |
37 |
48 |
65 |
50 |
51 |
42 |
78 |
|
|
|
10 |
ДАЛЕКО |
41 |
37 |
48 |
42 |
47 |
51 |
74 |
|
|
|
|
|
|
|
11 |
ДОСТОИНСТВУ |
41 |
51 |
54 |
55 |
51 |
45 |
50 |
54 |
55 |
39 |
56 |
79 |
|
|
12 |
ИДЕТ |
45 |
41 |
42 |
55 |
72 |
|
|
|
|
|
|
|
|
|
13 |
ИСПОЛНЕННЫЙ |
45 |
54 |
52 |
51 |
48 |
50 |
42 |
50 |
50 |
64 |
46 |
79 |
|
|
14 |
КАК |
47 |
37 |
47 |
71 |
|
|
|
|
|
|
|
|
|
|
15 |
КРИТИК |
47 |
53 |
45 |
55 |
45 |
47 |
74 |
|
|
|
|
|
|
|
16 |
ЛЮБВИ |
48 |
67 |
38 |
39 |
45 |
73 |
|
|
|
|
|
|
|
|
17 |
ЛЮБИТЬ |
48 |
67 |
38 |
45 |
55 |
65 |
74 |
|
|
|
|
|
|
|
18 |
МОЛОКО |
49 |
51 |
48 |
51 |
47 |
51 |
74 |
|
|
|
|
|
|
|
19 |
НАЦИОНАЛЬНОГО |
50 |
37 |
59 |
45 |
51 |
50 |
37 |
48 |
65 |
50 |
51 |
40 |
51 |
81 |
20 |
НАШЕГО |
50 |
37 |
61 |
42 |
40 |
51 |
74 |
|
|
|
|
|
|
|
21 |
НЕЙ |
50 |
42 |
46 |
71 |
|
|
|
|
|
|
|
|
|
|
22 |
НОВЫЕ |
50 |
51 |
39 |
64 |
42 |
73 |
|
|
|
|
|
|
|
|
23 |
ОБГОНЯЕТ |
51 |
38 |
40 |
51 |
50 |
68 |
42 |
55 |
76 |
|
|
|
|
|
24 |
ОБЩЕСТВО |
51 |
38 |
62 |
42 |
54 |
55 |
39 |
51 |
76 |
|
|
|
|
|
25 |
ОГОРОД |
51 |
40 |
51 |
53 |
51 |
41 |
74 |
|
|
|
|
|
|
|
26 |
ОКО |
51 |
47 |
51 |
71 |
|
|
|
|
|
|
|
|
|
|
27 |
ОКОРОК |
51 |
47 |
51 |
53 |
51 |
47 |
74 |
|
|
|
|
|
|
|
28 |
ОНЕГИНА |
51 |
50 |
42 |
40 |
45 |
50 |
37 |
75 |
|
|
|
|
|
|
29 |
ОНО |
51 |
50 |
51 |
71 |
|
|
|
|
|
|
|
|
|
|
30 |
ОСТАНАВЛИВАТЬ |
51 |
54 |
55 |
37 |
50 |
37 |
39 |
48 |
45 |
39 |
37 |
55 |
65 |
81 |
31 |
ОЦЕНИЛ |
51 |
59 |
42 |
50 |
45 |
48 |
74 |
|
|
|
|
|
|
|
32 |
ПИСАЛ |
52 |
45 |
54 |
37 |
48 |
73 |
|
|
|
|
|
|
|
|
33 |
ПОТРЕБНОСТИ |
52 |
51 |
55 |
53 |
42 |
38 |
50 |
51 |
54 |
55 |
45 |
79 |
|
|
34 |
ПОЭМУ |
52 |
51 |
66 |
49 |
56 |
73 |
|
|
|
|
|
|
|
|
35 |
ПОЭТА |
52 |
51 |
66 |
55 |
37 |
73 |
|
|
|
|
|
|
|
|
36 |
ПРИВОДИТ |
52 |
53 |
45 |
39 |
51 |
41 |
45 |
55 |
76 |
|
|
|
|
|
37 |
ПУСТЬ |
52 |
56 |
54 |
55 |
65 |
73 |
|
|
|
|
|
|
|
|
38 |
РАСТЕТ |
53 |
37 |
54 |
55 |
42 |
55 |
74 |
|
|
|
|
|
|
|
39 |
РУССКОЕ |
53 |
56 |
54 |
54 |
47 |
51 |
42 |
75 |
|
|
|
|
|
|
40 |
СОБОЙ |
54 |
51 |
38 |
51 |
46 |
73 |
|
|
|
|
|
|
|
|
41 |
СРОК |
54 |
53 |
51 |
47 |
72 |
|
|
|
|
|
|
|
|
|
42 |
ТВОРЕНИЕ |
55 |
39 |
51 |
53 |
42 |
50 |
45 |
42 |
76 |
|
|
|
|
|
43 |
УШЛО |
56 |
61 |
48 |
51 |
72 |
|
|
|
|
|
|
|
|
|
44 |
ЭТУ |
66 |
55 |
56 |
71 |
|
|
|
|
|
|
|
|
|
|
Синтез модели осуществляется на основе обучающей выборки (таблица 69) в соответствующем режиме (рисунок 123) после формирования классификационных и описательных шкал и градаций и обучающей выборки.
|
Рисунок 123. Режим "Синтез семантической
информационной модели" |
В результате синтеза семантической информационной модели рассчитываются две ее основные матрицы: матрица абсолютных частот (таблица 70) и матрица информативностей (таблица 71).
В матрице частот отражается суммарное количество встреч каждого признака у объектов каждого класса по данным обучающей выборки. Каждый элемент матрицы информативностей показывает, какое количество информации о переходе объекта управления в состояние, соответствующее классу, мы получаем, если узнаем, что действует некоторый признак.
Таблица 70 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ (ФРАГМЕНТ)
Коды |
Коды классов (слов) |
||||||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
37 |
|
2 |
|
|
|
|
1 |
|
1 |
1 |
|
|
|
1 |
|
|
|
|
2 |
38 |
1 |
1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
|
|
39 |
|
|
|
1 |
1 |
1 |
1 |
1 |
|
|
1 |
|
|
|
|
1 |
|
|
|
40 |
|
1 |
|
|
|
|
1 |
|
1 |
|
|
|
|
|
|
|
|
|
1 |
41 |
|
1 |
1 |
|
|
|
1 |
|
|
1 |
1 |
1 |
|
|
|
|
|
|
|
42 |
1 |
|
1 |
1 |
|
1 |
1 |
|
2 |
1 |
|
1 |
1 |
|
|
|
|
|
|
43 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44 |
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45 |
2 |
1 |
|
2 |
|
|
|
|
1 |
|
1 |
1 |
1 |
|
2 |
1 |
1 |
|
1 |
46 |
1 |
|
|
1 |
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
47 |
1 |
|
|
1 |
|
|
|
1 |
|
1 |
|
|
|
2 |
2 |
|
|
1 |
|
48 |
1 |
1 |
|
1 |
|
|
|
|
1 |
1 |
|
|
1 |
|
|
1 |
1 |
1 |
1 |
49 |
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
50 |
1 |
1 |
|
|
|
|
|
|
2 |
|
1 |
|
3 |
|
|
|
|
|
3 |
51 |
|
2 |
|
|
1 |
|
|
2 |
1 |
1 |
2 |
|
1 |
|
|
|
|
3 |
3 |
52 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
53 |
|
1 |
|
|
1 |
1 |
|
|
|
|
|
|
|
|
1 |
|
|
|
|
54 |
1 |
1 |
|
|
|
|
1 |
1 |
|
|
2 |
|
1 |
|
|
|
|
|
|
55 |
|
1 |
1 |
|
|
|
|
|
|
|
2 |
1 |
|
|
1 |
|
1 |
|
|
56 |
|
|
1 |
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
Таблица 71 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ (ФРАГМЕНТ)
Коды |
Коды классов (слов) |
||||||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
37 |
|
1,0 |
|
|
|
|
1,1 |
|
0,6 |
1,1 |
|
|
|
1,7 |
|
|
|
|
1,0 |
38 |
1,2 |
0,9 |
1,8 |
|
|
|
|
|
|
|
|
|
|
|
|
1,8 |
1,6 |
|
|
39 |
|
|
|
1,1 |
1,6 |
1,4 |
1,3 |
1,3 |
|
|
0,7 |
|
|
|
|
1,4 |
|
|
|
40 |
|
1,0 |
|
|
|
|
1,7 |
|
1,2 |
|
|
|
|
|
|
|
|
|
1,0 |
41 |
|
1,0 |
1,9 |
|
|
|
1,7 |
|
|
1,7 |
1,1 |
2,1 |
|
|
|
|
|
|
|
42 |
0,4 |
|
0,9 |
0,6 |
|
0,9 |
0,7 |
|
0,9 |
0,7 |
|
1,1 |
0,2 |
|
|
|
|
|
|
43 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44 |
|
|
|
|
4,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45 |
1,0 |
|
|
1,3 |
|
|
|
|
0,3 |
|
0,2 |
1,1 |
0,2 |
|
1,4 |
0,9 |
0,7 |
|
|
46 |
1,8 |
|
|
2,0 |
|
|
|
|
|
|
|
|
1,6 |
|
|
|
|
|
|
47 |
0,8 |
|
|
1,0 |
|
|
|
1,2 |
|
1,2 |
|
|
|
2,5 |
1,9 |
|
|
1,2 |
|
48 |
0,8 |
0,4 |
|
1,0 |
|
|
|
|
0,7 |
1,2 |
|
|
0,6 |
|
|
1,4 |
1,2 |
1,2 |
0,4 |
49 |
|
|
|
|
|
2,8 |
|
|
|
|
|
|
|
|
|
|
|
2,7 |
|
50 |
0,4 |
|
|
|
|
|
|
|
0,9 |
|
0,2 |
|
1,2 |
|
|
|
|
|
1,1 |
51 |
|
|
|
|
0,4 |
|
|
0,7 |
-0,5 |
|
0,1 |
|
-0,6 |
|
|
|
|
1,1 |
0,3 |
52 |
|
|
|
|
|
|
|
|
|
|
|
|
1,3 |
|
|
|
|
|
|
53 |
|
0,6 |
|
|
1,7 |
1,5 |
|
|
|
|
|
|
|
|
1,3 |
|
|
|
|
54 |
0,6 |
0,2 |
|
|
|
|
1,0 |
1,0 |
|
|
1,1 |
|
0,4 |
|
|
|
|
|
|
55 |
|
0,1 |
1,0 |
|
|
|
|
|
|
|
0,9 |
1,2 |
|
|
0,8 |
|
0,8 |
|
|
56 |
|
|
2,0 |
|
|
|
|
|
|
|
1,3 |
|
|
|
|
|
|
|
|
Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую (рисунок 124), распознавания (рисунок 125, 126) и измерения дифференциальной и интегральной валидности (рисунок 127):
|
Рисунок 124. Режим "Ввод-корректировка
обучающей выборки" |
|
Рисунок 125. Выбор режима "Пакетное
распознавание" |
|
Рисунок 126. Выполнение режима "Пакетное
распознавание" |
|
Рисунок 127. Выбор режима "Измерение
адекватности модели" |
|
Рисунок 128. Режим "Измерение
адекватности модели" |
Видим, что модель
адекватна, т.к. интегральная валидность составляет 100%. Это означает, что при идентификации слов на основе знания
входящих в них букв системой не было допущено ни одной ошибки, причем необходимо специально отметить, что при
этом в модели не учитывались
последовательность букв и их сочетаний.
В примере, исследуемом в данной лабораторной работе, неполнота информации – это пропуск букв, а наличие шума – замена верных букв неверными.
Подготовим распознаваемую выборку, состоящую из идентифицируемых слов с отсутствующими буквами.
Для этого выполним следующую последовательность шагов:
Шаг 1. Сбросим распознаваемую выборку в режиме "F7 Сервис – Генерация (сброс) баз данных – Распознаваемые анкеты" (рисунок 129):
|
Рисунок 129. Режим "Сброс распознаваемой
выборки" |
Шаг 2. Скопируем, например, первую анкету из обучающей выборки в распознаваемую, используя возможности режима "F2 Обучение – Ввод-корректировка обучающей выборки" (рисунок 124);
Шаг 3. Выберем режим "F4 Распознавание – Ввод-корректировка распознаваемой выборки" (рисунок 130):
|
Рисунок 130. Выбор режима
"Ввод-корректировка распознаваемой |
Выбор режима осуществляется нажатием клавиши Enter.
Шаг 4. Перейдем в правое окно, в котором задаются коды признаков, нажав клавишу "TAB".
Шаг 5. Удаляем последний код признака и дублируем анкету, нажав клавишу "F5 Дублирование анкеты".
Повторяем шаги 4 и 5 до тех пор, пока в описании слова останется одна буква. В результате получится видеограмма, представленная на рисунке 131.
Студенты при выполнении этого этапа работы могут взять несколько анкет на выбор. При этом набор анкет должен отличаться у разных студентов.
Обучающая выборка в этом случае будет иметь вид, представленный на таблице 72:
Таблица 72 – ВАРИАНТЫ КОДИРОВАНИЯ ОБЪЕКТА ОБУЧАЮЩЕЙ ВЫБОРКИ, ОТЛИЧАЮЩИЕСЯ СТЕПЕНЬЮ НЕПОЛНОТЫ ИНФОРМАЦИИ
№ |
Класс |
Коды
признаков |
|||||||||||||
1 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
54 |
47 |
45 |
46 |
|
|
|
|
|
2 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
54 |
47 |
45 |
|
|
|
|
|
|
3 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
54 |
47 |
|
|
|
|
|
|
|
4 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
54 |
|
|
|
|
|
|
|
|
5 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
50 |
|
|
|
|
|
|
|
|
|
6 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
45 |
|
|
|
|
|
|
|
|
|
|
7 |
БЕЛИНСКИЙ |
38 |
42 |
48 |
|
|
|
|
|
|
|
|
|
|
|
8 |
БЕЛИНСКИЙ |
38 |
42 |
|
|
|
|
|
|
|
|
|
|
|
|
9 |
БЕЛИНСКИЙ |
38 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Жирным шрифтом выделены символы, коды которых есть в анкете.
|
Рисунок 131. Выполнение режима
"Ввод-корректировка |
Шаг 6. Выполним пакетное распознавание, выбрав и выполнив режим "F4 Распознавание – Пакетное распознавание", как показано на рисунках 125 и 126.
Шаг 7. Затем выберем и выполним режим "F4 Распознавание – Вывод результатов распознавания" (рисунок 132):
|
Рисунок 132. Выбор режима "Вывод
результатов распознавания" |
Шаг 8. Войдя в этот режим получим видеограмму, представленную на рисунке 133:
|
Рисунок 133. Обобщенная форма по результатам
выполнения режима |
Шаг 9. Нажав клавишу "F1 Карта идентификации объекта с классами" получим более подробные результаты идентификации, представленные в карточках распознавания на рисунке 134:
|
|
|
|
|
Рисунок 134. Идентификация в условиях
неполноты информации |
Из обобщенных и детальных выходных форм по результатам распознавания слова по его неполному описанию видно, что модель обладает очень высокой устойчивостью к неполноте информации в описании идентифицируемых объектов.
Шум можно рассматривать как сочетание неполноты информации (т.к. некоторые значащие символы исчезают из описаний объектов), и дезинформации (т.к. в описание включаются ложные символы).
Поэтому замену символов в словах на символы, которые не встречаются по обучающей выборке можно считать неполнотой информации. Этот случай мы рассматривать не будем, т.к. по сути уже рассмотрели его в предыдущем пункте.
Рассмотрим пример, в котором одно слово заменой букв преобразуется в другое слово, например, слово "критик" преобразуется в слово "окорок". Каждой замене будет соответствовать одна анкета распознаваемой выборки (таблица 73):
Таблица 73 – ВАРИАНТЫ КОДИРОВАНИЯ ОБЪЕКТА ОБУЧАЮЩЕЙ ВЫБОРКИ, ОТЛИЧАЮЩИЕСЯ УРОВНЕМ ШУМА
№ |
Класс |
Коды
признаков |
|||||||||||||
1 |
КРИТИК |
47 |
53 |
45 |
55 |
45 |
47 |
|
|
|
|
|
|
|
|
2 |
КРОТИК |
47 |
53 |
51 |
55 |
45 |
47 |
|
|
|
|
|
|
|
|
3 |
КРОТОК |
47 |
53 |
51 |
55 |
51 |
47 |
|
|
|
|
|
|
|
|
4 |
ОКОРОК |
47 |
53 |
51 |
51 |
51 |
47 |
|
|
|
|
|
|
|
|
Результаты идентификации представлены на рисунке 135:
|
|
|
|
Рисунок 135. Результаты идентификации в
условиях шума |
Видим, что модель обладает определенной устойчивостью и к шуму.
С этой целью в текстовый файл специально включены такие слова, как: "око", "окорок", "молоко".
Результаты их идентификации приведены на рисунке 136:
|
|
|
Рисунок 136. Карточка результатов
распознавания системы "Эйдос" |
Как
видим, идентификация классов, один из которых является подмножеством других,
осуществляется правильно. Это является важным достоинством семантической
информационной модели системы "Эйдос", т.к. представляет собой
проблему для многих типов нейронных сетей. Достаточно отметить, что возможность
решения подобных задач считается одним из основных достоинств развитой модели
нейронной сети, реализованной в неокогнитроне Фукушимы.
Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок 137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.
|
Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления |
|
Рисунок 138. Парето-диаграмма ценности букв для идентификации слов |
Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.
Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ
№ |
Код |
Буква |
Ценность (бит) |
Ценность (бит) |
Ценность (%) |
1 |
66 |
Э |
0,76988 |
0,76988 |
4,841 |
2 |
56 |
У |
0,74529 |
1,51517 |
9,526 |
3 |
49 |
М |
0,71090 |
2,22607 |
13,996 |
4 |
46 |
Й |
0,69728 |
2,92335 |
18,380 |
5 |
61 |
Ш |
0,68748 |
3,61083 |
22,703 |
6 |
47 |
К |
0,68569 |
4,29652 |
27,014 |
7 |
67 |
Ю |
0,66376 |
4,96028 |
31,187 |
8 |
52 |
П |
0,66014 |
5,62042 |
35,338 |
9 |
64 |
Ы |
0,65157 |
6,27199 |
39,434 |
10 |
41 |
Д |
0,64023 |
6,91222 |
43,460 |
11 |
68 |
Я |
0,63612 |
7,54834 |
47,459 |
12 |
44 |
З |
0,62131 |
8,16965 |
51,366 |
13 |
65 |
Ь |
0,59697 |
8,76662 |
55,119 |
14 |
38 |
Б |
0,59622 |
9,36284 |
58,868 |
15 |
53 |
Р |
0,58610 |
9,94894 |
62,553 |
16 |
59 |
Ц |
0,57201 |
10,52095 |
66,149 |
17 |
40 |
Г |
0,56958 |
11,09053 |
69,730 |
18 |
39 |
В |
0,55490 |
11,64543 |
73,219 |
19 |
62 |
Щ |
0,52045 |
12,16588 |
76,492 |
20 |
37 |
А |
0,51477 |
12,68065 |
79,728 |
21 |
48 |
Л |
0,50010 |
13,18075 |
82,872 |
22 |
54 |
С |
0,47977 |
13,66052 |
85,889 |
23 |
55 |
Т |
0,47498 |
14,13550 |
88,875 |
24 |
51 |
О |
0,46548 |
14,60098 |
91,802 |
25 |
50 |
Н |
0,45089 |
15,05187 |
94,637 |
26 |
45 |
И |
0,43046 |
15,48233 |
97,343 |
27 |
42 |
Е |
0,42253 |
15,90486 |
100,000 |
Кластерно-конструктивный анализ выполняется в 5-й подсистеме "Типология" (рисунок 139). Сначала на основе матрицы информативностей рассчитывается матрица сходства классов (таблица 75), а затем на основе нее формируется таблица кластеров и конструктов классов (таблица 76).
|
Рисунок 139. Запуск режима кластерно-конструктивного анализа классов (слов) |
Таблица 75 – ФРАГМЕНТ МАТРИЦЫ СХОДСТВА КЛАССОВ (СЛОВ)
Код |
Коды классов |
|||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
1 |
100,0 |
20,0 |
19,0 |
78,1 |
-6,6 |
-5,5 |
1,3 |
9,7 |
12,9 |
22,2 |
5,3 |
13,3 |
2 |
20,0 |
100,0 |
43,1 |
-1,4 |
4,3 |
1,5 |
68,2 |
-4,6 |
32,4 |
54,0 |
23,9 |
31,5 |
3 |
19,0 |
43,1 |
100,0 |
-2,4 |
-5,5 |
-1,6 |
29,5 |
-6,7 |
2,2 |
36,3 |
65,5 |
57,8 |
4 |
78,1 |
-1,4 |
-2,4 |
100,0 |
7,2 |
7,9 |
11,7 |
19,5 |
12,9 |
29,3 |
5,6 |
18,3 |
5 |
-6,6 |
4,3 |
-5,5 |
7,2 |
100,0 |
17,2 |
8,3 |
10,2 |
-7,2 |
-5,5 |
4,9 |
-4,9 |
6 |
-5,5 |
1,5 |
-1,6 |
7,9 |
17,2 |
100,0 |
9,6 |
5,1 |
0,0 |
-1,4 |
1,4 |
1,7 |
7 |
1,3 |
68,2 |
29,5 |
11,7 |
8,3 |
9,6 |
100,0 |
18,0 |
35,1 |
49,5 |
47,9 |
44,5 |
8 |
9,7 |
-4,6 |
-6,7 |
19,5 |
10,2 |
5,1 |
18,0 |
100,0 |
-10,6 |
9,6 |
19,6 |
-6,0 |
9 |
12,9 |
32,4 |
2,2 |
12,9 |
-7,2 |
0,0 |
35,1 |
-10,6 |
100,0 |
23,3 |
-5,8 |
11,7 |
10 |
22,2 |
54,0 |
36,3 |
29,3 |
-5,5 |
-1,4 |
49,5 |
9,6 |
23,3 |
100,0 |
25,3 |
53,4 |
11 |
5,3 |
23,9 |
65,5 |
5,6 |
4,9 |
1,4 |
47,9 |
19,6 |
-5,8 |
25,3 |
100,0 |
51,4 |
12 |
13,3 |
31,5 |
57,8 |
18,3 |
-4,9 |
1,7 |
44,5 |
-6,0 |
11,7 |
53,4 |
51,4 |
100,0 |
13 |
42,0 |
-2,2 |
-5,7 |
36,4 |
-7,0 |
-5,8 |
-2,4 |
46,5 |
16,9 |
2,4 |
0,5 |
-2,3 |
14 |
19,8 |
23,2 |
-4,6 |
24,4 |
-3,5 |
-4,4 |
14,7 |
25,7 |
7,8 |
55,9 |
-5,1 |
-4,1 |
15 |
32,9 |
8,4 |
2,5 |
39,0 |
13,0 |
9,4 |
-7,2 |
18,2 |
-1,5 |
23,9 |
9,2 |
28,2 |
16 |
30,3 |
18,2 |
15,4 |
26,5 |
6,9 |
3,9 |
6,5 |
6,7 |
4,0 |
7,7 |
4,3 |
2,8 |
17 |
24,1 |
15,2 |
18,0 |
9,3 |
-5,6 |
-7,0 |
-8,2 |
-6,9 |
35,3 |
5,0 |
1,2 |
9,0 |
18 |
14,6 |
0,1 |
-6,1 |
18,9 |
-1,6 |
43,7 |
-6,8 |
14,5 |
-2,5 |
26,9 |
-5,1 |
-5,5 |
19 |
-0,6 |
24,6 |
-7,8 |
-3,6 |
-5,0 |
-7,4 |
19,5 |
-4,9 |
57,2 |
10,9 |
-5,7 |
-7,0 |
20 |
-2,3 |
29,7 |
-1,1 |
-2,9 |
-4,9 |
-2,2 |
33,7 |
-5,8 |
36,1 |
10,5 |
-5,7 |
2,3 |
21 |
61,5 |
-6,4 |
5,7 |
59,9 |
-4,1 |
3,0 |
4,1 |
-5,0 |
24,2 |
6,3 |
-3,1 |
11,8 |
22 |
0,1 |
-7,4 |
1,2 |
14,9 |
10,8 |
12,4 |
17,4 |
80,2 |
12,3 |
1,6 |
8,2 |
5,5 |
23 |
13,3 |
30,3 |
21,5 |
-4,9 |
-4,3 |
51,6 |
19,3 |
-4,0 |
20,5 |
-3,2 |
0,5 |
6,2 |
24 |
13,9 |
10,1 |
18,6 |
4,7 |
4,8 |
3,7 |
12,0 |
11,3 |
-4,4 |
-3,2 |
15,7 |
5,2 |
Таблица 76 – КОНСТРУКТ СЛОВ: "КРИТИК – ВСЕГДА"
№ |
Код |
Слово |
Уровень |
№ |
Код |
Слово |
Уровень |
1 |
15 |
КРИТИК |
100,00 |
23 |
2 |
БЛАГОДАРНОСТИ |
8,37 |
2 |
27 |
ОКОРОК |
71,79 |
24 |
28 |
ОНЕГИНА |
7,32 |
3 |
41 |
СРОК |
65,59 |
25 |
31 |
ОЦЕНИЛ |
5,70 |
4 |
14 |
КАК |
52,61 |
26 |
44 |
ЭТУ |
5,67 |
5 |
26 |
ОКО |
51,07 |
27 |
16 |
ЛЮБВИ |
5,34 |
6 |
42 |
ТВОРЕНИЕ |
40,52 |
28 |
30 |
ОСТАНАВЛИВАТЬ |
3,81 |
7 |
39 |
РУССКОЕ |
40,23 |
29 |
35 |
ПОЭТА |
2,59 |
8 |
36 |
ПРИВОДИТ |
39,13 |
30 |
3 |
БУДЕТ |
2,53 |
9 |
4 |
ВЕЛИКИЙ |
38,98 |
31 |
37 |
ПУСТЬ |
1,54 |
10 |
38 |
РАСТЕТ |
37,88 |
32 |
23 |
ОБГОНЯЕТ |
-1,37 |
11 |
1 |
БЕЛИНСКИЙ |
32,92 |
33 |
9 |
ГЕНИАЛЬНОЕ |
-1,50 |
12 |
33 |
ПОТРЕБНОСТИ |
29,38 |
34 |
24 |
ОБЩЕСТВО |
-1,55 |
13 |
12 |
ИДЕТ |
28,16 |
35 |
13 |
ИСПОЛНЕННЫЙ |
-3,75 |
14 |
10 |
ДАЛЕКО |
23,87 |
36 |
29 |
ОНО |
-4,20 |
15 |
18 |
МОЛОКО |
19,13 |
37 |
21 |
НЕЙ |
-4,87 |
16 |
8 |
ВЫСОКО |
18,23 |
38 |
43 |
УШЛО |
-5,20 |
17 |
25 |
ОГОРОД |
16,45 |
39 |
22 |
НОВЫЕ |
-5,51 |
18 |
5 |
ВЗОР |
12,98 |
40 |
40 |
СОБОЙ |
-5,64 |
19 |
6 |
ВРЕМЯ |
9,39 |
41 |
20 |
НАШЕГО |
-5,81 |
20 |
32 |
ПИСАЛ |
9,36 |
42 |
34 |
ПОЭМУ |
-6,07 |
21 |
11 |
ДОСТОИНСТВУ |
9,19 |
43 |
19 |
НАЦИОНАЛЬНОГО |
-7,01 |
22 |
17 |
ЛЮБИТЬ |
8,54 |
44 |
7 |
ВСЕГДА |
-7,17 |
Аналогично в режиме кластерно-конструктивного анализа признаков (рисунок 140) получаем матрицу сходства букв и конструкты букв (таблицы 77 и 78).
|
Рисунок 140. Запуск режима
кластерно-конструктивного анализа |
Таблица 77 – ФРАГМЕНТ МАТРИЦЫ СХОДСТВА ПРИЗНАКОВ (БУКВ)
Код |
Коды букв |
|||||||||||
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
|
37 |
100,0 |
-22,5 |
-11,1 |
33,7 |
5,4 |
-1,6 |
0,0 |
-9,0 |
-15,9 |
-20,6 |
5,1 |
6,5 |
38 |
-22,5 |
100,0 |
-2,1 |
-3,6 |
3,3 |
-6,5 |
0,0 |
-7,5 |
9,4 |
18,5 |
-20,9 |
13,9 |
39 |
-11,1 |
-2,1 |
100,0 |
-11,3 |
1,2 |
10,7 |
0,0 |
36,7 |
7,5 |
-7,3 |
-15,9 |
-6,5 |
40 |
33,7 |
-3,6 |
-11,3 |
100,0 |
22,9 |
15,2 |
0,0 |
-7,0 |
-15,4 |
-16,0 |
-24,7 |
-14,5 |
41 |
5,4 |
3,3 |
1,2 |
22,9 |
100,0 |
21,7 |
0,0 |
-7,0 |
8,5 |
-16,0 |
-13,8 |
-10,4 |
42 |
-1,6 |
-6,5 |
10,7 |
15,2 |
21,7 |
100,0 |
0,0 |
-12,0 |
6,1 |
20,8 |
-23,3 |
-11,4 |
43 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
44 |
-9,0 |
-7,5 |
36,7 |
-7,0 |
-7,0 |
-12,0 |
0,0 |
100,0 |
-9,1 |
-5,3 |
-8,2 |
-9,4 |
45 |
-15,9 |
9,4 |
7,5 |
-15,4 |
8,5 |
6,1 |
0,0 |
-9,1 |
100,0 |
15,3 |
5,4 |
35,3 |
46 |
-20,6 |
18,5 |
-7,3 |
-16,0 |
-16,0 |
20,8 |
0,0 |
-5,3 |
15,3 |
100,0 |
-1,8 |
8,1 |
47 |
5,1 |
-20,9 |
-15,9 |
-24,7 |
-13,8 |
-23,3 |
0,0 |
-8,2 |
5,4 |
-1,8 |
100,0 |
-2,8 |
48 |
6,5 |
13,9 |
-6,5 |
-14,5 |
-10,4 |
-11,4 |
0,0 |
-9,4 |
35,3 |
8,1 |
-2,8 |
100,0 |
49 |
-15,9 |
-13,3 |
7,9 |
-12,4 |
-12,4 |
-1,0 |
0,0 |
-4,1 |
-16,1 |
-9,5 |
0,5 |
3,9 |
50 |
0,9 |
-17,8 |
-16,8 |
29,0 |
-25,0 |
35,9 |
0,0 |
-8,8 |
-5,8 |
28,7 |
-29,0 |
-4,8 |
51 |
-31,8 |
2,6 |
-15,6 |
-0,9 |
-6,2 |
-36,3 |
0,0 |
7,6 |
-32,1 |
-6,3 |
30,3 |
-14,0 |
52 |
9,1 |
-13,2 |
-15,5 |
-19,5 |
-7,0 |
-30,2 |
0,0 |
-6,5 |
8,0 |
-4,7 |
-22,9 |
-1,6 |
53 |
-19,2 |
-20,2 |
15,7 |
-6,9 |
0,5 |
-4,8 |
0,0 |
36,4 |
-0,6 |
-20,4 |
19,8 |
-34,1 |
54 |
1,8 |
5,0 |
-0,5 |
-12,2 |
-4,6 |
-14,4 |
0,0 |
-9,6 |
-14,8 |
9,2 |
4,4 |
-14,3 |
55 |
-1,9 |
13,6 |
-12,1 |
-23,1 |
18,7 |
2,1 |
0,0 |
-10,3 |
10,2 |
-23,5 |
-25,1 |
-28,2 |
56 |
-25,1 |
-2,0 |
-20,5 |
-19,6 |
6,3 |
-12,3 |
0,0 |
-6,5 |
-23,8 |
-14,9 |
-14,9 |
-4,3 |
57 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
58 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
59 |
5,1 |
-10,6 |
-12,8 |
6,2 |
-9,9 |
4,9 |
0,0 |
-3,3 |
8,7 |
-7,6 |
-11,6 |
24,3 |
60 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
0,0 |
Таблица 78 – КОНСТРУКТ БУКВ: "А – О"
№ |
Код буквы |
Буква |
Уровень
сходства |
№ |
Код буквы |
Буква |
Уровень
сходства |
1 |
37 |
А |
100,00 |
13 |
42 |
Е |
-1,57 |
2 |
40 |
Г |
33,67 |
14 |
55 |
Т |
-1,90 |
3 |
65 |
Ь |
11,94 |
15 |
44 |
З |
-8,98 |
4 |
52 |
П |
9,08 |
16 |
62 |
Щ |
-8,98 |
5 |
61 |
Ш |
8,37 |
17 |
39 |
В |
-11,08 |
6 |
48 |
Л |
6,54 |
18 |
68 |
Я |
-12,81 |
7 |
41 |
Д |
5,41 |
19 |
67 |
Ю |
-12,84 |
8 |
47 |
К |
5,13 |
20 |
64 |
Ы |
-15,79 |
9 |
59 |
Ц |
5,13 |
21 |
45 |
И |
-15,90 |
10 |
66 |
Э |
4,66 |
22 |
49 |
М |
-15,92 |
11 |
54 |
С |
1,79 |
23 |
53 |
Р |
-19,19 |
12 |
50 |
Н |
0,90 |
24 |
46 |
Й |
-20,58 |
|
|
|
|
25 |
38 |
Б |
-22,52 |
|
|
|
|
26 |
56 |
У |
-25,09 |
|
|
|
|
27 |
51 |
О |
-31,79 |
Информационные портреты классов (слов) представляют собой списки признаков (букв), проранжированных в порядке убывания количества информации, содержащихся в них о принадлежности к данным классам.
Выход на режим генерации информационных портретов классов показан на рисунке 140. На рисунке 141 приведена круговая диаграмма информационного портрета класса (слова) "Достоинству". Обращает внимание, что в 4-х буквах из 8: "У", "Д", "С", "Т" содержится более 80% информации о принадлежности к данному слову.
|
Рисунок 141. Информационный портрет слова "Достоинству" |
Профиль класса представляет собой гистограмму, в которой показан вклад каждого признака в общее количество информации, содержащееся в образе данного класса.
Профили классов и признаков отображаются в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 142). Для примера на рисунке 143 показан профиль того же слова "Достоинству".
|
Рисунок 142. Выход на режим вывода профилей классов и признаков |
|
Рисунок 143. Профиль слова "Достоинству" |
Выход на режим генерации семантических портретов признаков (букв) показан на рисунке 140. Один таких портретов, а именно портрет буквы "Й", приведен на рисунке 144, а ее профиль – на рисунке 145.
|
Рисунок 144. Информационный портрет буквы "Й" |
|
Рисунок 145. Профиль буквы "Й" |
Эти возможности реализуются в режимах, выход на которые показан на рисунке 140. Семантическая сеть классов отображает в графической форме результаты кластерно-конструктивного анализа слов (рисунок 146), а признаков – букв (рисунок 147). Красный цвет линии связи в семантических сетях означает сходство, а синяя – различие, толщина линии соответствует степени выраженности этого свойства. Детальную структуру любой линии связи на семантических сетях можно исследовать на когнитивных диаграммах классов (рисунок 148) и признаков (рисунок 149). Классическая когнитивная карта для слова "Останавливать" приведена на рисунке 150. Классическая когнитивная карта представляет собой графическую диаграмму, объединяющую изображение нейрона и семантической сети его рецепторов. Классическая когнитивная карта представляет собой подмножество "Интегральной когнитивной карты", в которой объединены семантический сети нейронов и рецепторов и фрагмент нейронной сети, соединяющей рецепторы с нейронами. Режим системы "Эйдос" "Классические и интегральные когнитивные карты" позволяет при соответствующих параметрах, задаваемых в диалоге, генерировать и выводить в графической форме как интегральные, так и классические когнитивные карты, а также инвертированные когнитивные карты, представляющие собой семантическую сеть нейронов, соединенных фрагментов нейронной сети с одним рецептором.
|
Рисунок 146. Семантическая сеть классов (слов) |
|
Рисунок 147. Семантическая сеть признаков (букв) |
|
Рисунок 148. Детальная структура сходства слов "Молоко" и "Око" |
|
Рисунок 149. Детальная структура сходства букв "Е" и "Н" |
|
Рисунок 150. Классическая когнитивная карта
для слова |
|
Рисунок 151. Пример интегральной когнитивной
карты, |
На основе вышеизложенного можно сделать вывод о том, что для надежной и достоверной идентификации слов (по крайней мере при сравнительно небольшом их количестве) вполне достаточно информации о входящих в них буквах, и для этого нет особой необходимости привлекать дополнительную информацию о последовательности букв и их сочетаний. Продемонстрирована устойчивость модели от неполноты и зашумленности информации. Приведено более 30 графических форм, генерируемых системой "Эйдос", в т.ч. новые формы – классическая и интегральная когнитивные карты.
1. Каким образом провести анализ устойчивости модели к неполноте информации и наличию шума?
2. Каким образом можно проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого?
3. Как оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
Данная лабораторная работа является продолжением предыдущей, поэтому внимательно прочитайте теорию по предыдущей лабораторной работе. В этой работе исследуется возможность атрибуции текстов с применением технологии и инструментария системно-когнитивного анализа. Приведен подробный численный пример реализации всех этапов СК-анализа при атрибуции текстов, т.е. когнитивной структуризации и формализации предметной области; формирования обучающей выборки; синтеза семантической информационной модели; ее оптимизации и измерения адекватности; адаптации и пересинтеза; а также типологического и кластерно-конструктивного анализа.
Под атрибуцией анонимных и
псевдонимных текстов понимается установление их вероятного авторства
([1-5] рекомендуемой литературы).
Анонимные тексты – это тексты вообще без подписи автора, а псевдонимные – подписанные не фамилией автора, а псевдонимом.
Задача идентификации текстов на основе анализа предложений является тривиальной из-за практически абсолютной уникальности предложений. Поэтому больший интерес представляет задача идентификация текстов на основе анализа слов, т.е. задача атрибуции текстов, имеющая очень большое научное и практическое значение. К этой задаче сводится определение вероятного авторства текстов в случае, когда автор не указан (анонимный текст) или указан его псевдоним (псевдонимный текст), а также датировка текста.
Но самое главное, что к задаче атрибуции текстов сводятся задачи идентификации, прогнозирования, сравнения и классификации объектов, описанных на естественном языке (причем не важно, на каком именно).
С ней связаны также задачи автоматического выделения дескрипторов и задачи нечеткого поиска и идентификации.
Все эти задачи имеют практическое значение для специалистов по прикладной информатики в экономике и юриспруденции, которых готовит Кубанский государственный аграрный университет.
Одному из вариантов рения этих задач с применением интеллектуальной технологии "Эйдос" и посвящена данная лабораторная работа.
Следуя логике Системно-когнитивного анализа выполнить следующие работы.
1. Осуществить когнитивную структуризацию предметной области.
2. Выполнить формализацию предметной области.
3. Сформировать обучающую выборку.
4. Осуществить синтез семантической информационной модели.
5. Оптимизировать семантическую информационную модель.
6. Проверить семантическую информационную модель на адекватность, измерить внутреннюю и внешнюю, дифференциальную и интегральную валидность.
7. Выполнить адаптацию модели и измерить, как изменилась ее адекватность.
8. Осуществить пересинтез модели и измерить, как изменилась ее адекватность.
9. Вывести информационные портреты текстов и дать их интерпретацию.
10. Выполнить кластерно-конструктивный анализ модели.
Под когнитивной структуризацией в СК-анализе понимается определение причин и следствий, факторов и состояний объекта управления, исходной информации и того, на что она влияет.
В данной лабораторной работе необходимо решить задачу идентификации текстов по входящим в них словам. Следовательно, необходимо будет сформировать обобщенные образы текстов, соответствующих определенной тематике или автору (будем считать, что сочинение принадлежит тому писателю, творчеству которого оно посвящено). Для этого в качестве объектов обучающей выборки использоваться фрагменты текстов школьных сочинений, взятые из Internet, а в качестве признаков текстов будут использоваться входящие в них слова.
Каждое сочинение разобьем случайным образом на примерно равные по размеру небольшие фрагменты, которые используем в качестве объектов обучающей выборки.
Под формализацией предметной области понимается разработка классификационных и описательных шкал и градаций и ввод их в программную систему "Эйдос", являющуюся инструментарием СК-анализа.
2.1. Формирование классификационных
шкал и градаций
В подсистеме "Классификационные шкалы и градации" введем классы, соответствующие следующим писателям: Ф.М. Достоевский; Н.В. Гоголь; А.С. Грибоедов; М.Ю. Лермонтов; А.С. Пушкин; Л.Н. Толстой; И.С. Тургенев (рисунок 152).
|
Рисунок 152. Ввод классов |
2.1. Формирование описательных
шкал и градаций
Для этого исходные файлы для формирования объекты обучающей выборки должны быть средствами Word представлены в виде текстовых файлов, стандарта "Текст DOS" (без разбиения на строки).
Затем каждый из этих файлов разбивается на столько файлов, сколько в нем строк, причем имена этих файлов должны иметь вид: ####SUBSTR(File_name,4).TXT, где #### – сквозной номер файлов, соответствующий будущему номеру анкеты обучающей выборки, SUBSTR(File_name,4) – первые 4 символа имени исходного файла.
Полученные файлы должны быть помещены в поддиректорию DOB системы "Эйдос", а исходные – удалены из нее.
Это осуществляется одним из трех способов:
1. Вручную.
2. С использованием специальной программы, текст которой приводится ниже (язык программирования xBase).
3. В режиме:
"Словари – Программные интерфейсы для импорта данных – Импорт данных из
TXT-файлов стандарта "Текст DOS", формируем описательные шкалы и
градации (рисунок 153), причем в качестве признаков выбираем слова.
Исходный
текст программы записи TXT-файлов с данными по строкам
**************************************************************************
**********
Разбиение текстовых файлов DOS на нумерованные файлы по строкам
********** Луценко
Е.В., 03/31/04 04:24pm
**************************************************************************
scr_start=SAVESCREEN(0,0,24,79)
SHOWTIME(0,58,.T.,"rb/n")
FOR j=0 TO
24
@j,0 SAY SPACE(80) COLOR "n/n"
NEXT
**********
Удаление TXT-файлов, имена которых начинаются на 0
FILEDELETE("0*.TXT")
*****
РЕКОГНОСЦИРОВКА
Count =
ADIR("*.TXT")
&& Кол-во TXT-файлов
IF Count = 0
Mess = "В текущей директории TXT-файлов
не обнаружено !!!"
@15,40-LEN(Mess)/2 SAY Mess COLOR
"gr+/n"
INKEY(0)
RESTSCREEN(0,0,24,79,scr_start)
SHOWTIME()
QUIT
ENDIF
PRIVATE
Name[Count],Size[Count] &&
Имена и размеры файлов
Count =
ADIR("*.txt",Name,Size)
SortData(Name,Size,LEN(Name),1) && Сортировка файлов по алфавиту
CrLf =
CHR(13)+CHR(10) && Конец
строки (абзаца) (CrLf)
*** Загрузка
TXT-файлов
Num_pp =
0 &&
Номера выходных файлов
FOR f = 1 TO
Count && Начало
цикла по TXT-файлам
****** Загрузка файла
Buffer = FILESTR(Name[f],.T.)
Buffer = CHARONE(" ",Buffer) && Удаление повторяющихся пробелов
Buffer = Buffer + CrLf
Len = AT(CrLf,Buffer)
DO WHILE Len > 0 .AND. LASTKEY()
<> 27 && Цикл по
строкам
Len = AT(CrLf,Buffer)
IF Len > 0
****** Запись фрагмента файла
Str_pr =
ALLTRIM(SUBSTR(Buffer,1,Len-1))
Fn_out =
STRTRAN(STR(++Num_pp,4),"
","0")+SUBSTR(Name[f],1,4)+".TXT"
STRFILE(Str_pr,Fn_out)
****** Исключение из буфера
записанной строки
Buffer = ALLTRIM(SUBSTR(Buffer,Len+1))
ENDIF
ENDDO
NEXT
*** Удаление
исходных TXT-файлов
FOR f=1 TO
Count
FILEDELETE(Name[f])
NEXT
RESTSCREEN(0,0,24,79,scr_start)
SHOWTIME()
QUIT
|
Рисунок 153. Выход на режим генерации
справочников |
На рисунке 154 приведена экранная форма, отображающая ход процесса генерации описательных шкал и градаций и TXT-файлов, содержащих примеры текстов с разбиением по строкам.
|
Рисунок 154. Генерация описательных шкал и
градаций |
В результате получаем классификационные и описательные шкалы и градации, приведенные в таблицах 79 и 80.
Таблица 79 – КЛАССИФИКАЦИОННЫЕ
ШКАЛЫ И ГРАДАЦИИ
Код |
Наименование |
1 |
Достоевский |
2 |
Гоголь |
3 |
Грибоедов |
4 |
Лермонтов |
5 |
Пушкин |
6 |
Толстой |
7 |
Тургенев |
Таблица 80 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (фрагмент)
Код |
Наименование |
Код |
Наименование |
Код |
Наименование |
1 |
! |
41 |
Бедные |
81 |
Все |
2 |
( |
42 |
Без |
82 |
Вспомним |
3 |
(основной |
43 |
Бездушных |
83 |
Встреча |
4 |
) |
44 |
Безумным |
84 |
Всюду |
5 |
, |
45 |
Безумных |
85 |
Вы |
6 |
- |
46 |
Безухов |
86 |
Вызывают |
7 |
. |
47 |
Безухову |
87 |
Высокие |
8 |
1812 |
48 |
Белинский |
88 |
Высокопарные |
9 |
20- |
49 |
Бессильной |
89 |
Г |
10 |
30-е |
50 |
Бог |
90 |
Герой |
11 |
30-х |
51 |
Боже |
91 |
Главная |
12 |
60-х |
52 |
Болконский |
92 |
Глухость |
13 |
: |
53 |
Болконскому |
93 |
Говоря |
14 |
; |
54 |
Бордо |
94 |
Гоголь |
15 |
? |
55 |
Борис |
95 |
Гоголя |
16 |
Bcтает |
56 |
Бориса |
96 |
Годунов |
17 |
XIX |
57 |
Бородинским |
97 |
Горе |
18 |
А |
58 |
Бородинского |
98 |
Гости |
19 |
Автор |
59 |
Буянов |
99 |
Грибоедов |
20 |
Авторский |
60 |
Была |
100 |
Грибоедова |
21 |
Агрессивная |
61 |
В |
101 |
Гулливера |
22 |
Адама |
62 |
Ведь |
102 |
Да |
23 |
Александр |
63 |
Везде |
103 |
Даже |
24 |
Александра |
64 |
Век |
104 |
Дворянин-аристократ |
25 |
Алексевна |
65 |
Великий |
105 |
Действительно |
26 |
Алексеевна |
66 |
Великолепная |
106 |
Дельвигу |
27 |
Аммоса |
67 |
Вернулся |
107 |
Денисова |
28 |
Андреевич |
68 |
Взволнованный |
108 |
Дидло |
29 |
Андрей |
69 |
Взгляды |
109 |
Для |
30 |
Андрею |
70 |
Власы |
110 |
Дмитриевна |
31 |
Анной |
71 |
Вместе |
111 |
Добролюбова |
32 |
Архивам |
72 |
Внешней |
112 |
Достоевского |
33 |
Афанасьевича |
73 |
Внешние |
113 |
Драматична |
34 |
Ах |
74 |
Воды |
114 |
Друбецкого |
35 |
Базаров |
75 |
Возникает |
115 |
Другое |
36 |
Базарова |
76 |
Война |
116 |
Думы |
37 |
Базаровым |
77 |
Вообще |
117 |
Дуни |
38 |
Балы |
78 |
Вопрос |
118 |
Дуня |
39 |
Бегущим |
79 |
Вот |
119 |
Душа |
40 |
Бедность |
80 |
Время |
120 |
Евгений |
Приводится лишь фрагмент описательных шкал и градаций, т.к. размерность справочника составляет 3522 градации (т.е. слова).
Обучающая выборка представляет собой фрагменты текстов различных авторов, используемые в качестве примеров для формирования семантической информационной модели. На основе анализа этих примеров выявляются взаимосвязи между теми или иными словами и принадлежностью текстов разным авторам.
Для генерации обучающей выборки используется 1-й режим 2-й подсистемы, функция F7InpTXT – F6Ввод из всех файлов. При этом в качестве признаков, также как при формировании описательных шкал и градаций, выбираются слова (рисунок 155).
|
Рисунок 155. Генерация обучающей выборки из TXT-файлов |
В результате формируется обучающая выборка, состоящая из 151 примера фрагментов текстов различных авторов. Остается лишь проставить в каждом примере (анкете) код писателя, о котором данный текст, т.е. код класса (в левом окне).
Синтез модели осуществляется во 2-й подсистеме, 4-м режиме, 5-й функции (рисунок 156).
|
Рисунок 156. Запуск режима: |
Стадия процесса синтеза отображается в ряде экранных форм, одна из которых приводится на рисунке 157.
|
Рисунок 157. Экранная форма, отображающая одну из стадий процесса синтеза семантической информационной модели |
Оптимизация модели представляет собой исключение из нее малозначащих признаков без потери адекватности модели. Эта операция осуществляется во 2-м режиме 3-й подсистемы (рисунок 158).
|
Рисунок 158. Выход на режимы оптимизации модели |
При том имеется возможность вывести график ценности признаков "нарастающим итогом", т.е. Паретто-диаграмму признаков (рисунок 159).
|
Рисунок 159. Паретто-диаграмма признаков |
Видно, что в системе признаков нет имеющих очень малую или нулевую ценность. Это связано с тем, что все слова являются практически уникальными для фрагментов текстов, т.е. встречаются во всех текстах в основном от 1 до 5 раз (рисунок 160).
|
Рисунок 160. Частотное распределение частот признаков |
Под внутренней валидностью понимается способность модели верно идентифицировать объекты, входящие в обучающую выборку.
Для измерения адекватности модели необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую (во 1-м режиме 2-й подсистемы нажав клавишу F5).
2. Выполнить пакетное распознавание (во 2-м режиме 4-й подсистемы, задав 1-й критерий сходства) (рисунок 161).
3. Измерить адекватность модели (во 2-м режиме 6-й подсистемы) (рисунки 162 и 163).
|
Рисунок 161. Выход на режим пакетного распознавания |
|
Рисунок 162. Выход на режим измерения адекватности модели |
|
Рисунок 163. Экранная форма управления измерением адекватности модели и отображения результатов |
Эта форма может прокучиваться вправо-влево. В верхней части формы приведены показатели интегральной валидности (средневзвешенные по всей обучающей выборке), а в самой таблице – дифференциальной валидности, т.е. в разрезе по классам.
Кроме того, результаты измерения адекватности модели выводятся в форме файлов с именами ValidSys.txt (рисунок 164) и ValAnkSt.txt (рисунок 165) стандарта "TXT-текст DOS" в поддиректории TXT. Первый файл имеет вид:
|
Рисунок 164. Выходная форма ValidSys.txt с
результатами измерения |
Рассмотрим, что означают графы этой выходной формы.
"Всего логических анкет" – это количество анкет (примеров текстов) в обучающей выборке, на основе которых формировался образ данного класса.
"Идентифицировано верно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся.
"Идентифицировано ошибочно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации).
"Неидентифицировано верно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся.
"Неидентифицировано ошибочно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации).
В правой части формы приведены те же показатели, но в процентом выражении:
– для анкет, идентифицированных верно и неидентифицированных ошибочно за 100% принимается количество логических анкет обучающей выборки по данному классу;
– для анкет, идентифицированных ошибочно и неидентифицированных верно за 100% принимается суммарное количество логических анкет обучающей выборки за вычетом логических анкет по данному классу.
|
Рисунок 165. Фрагмент выходной формы ValAnkSt.txt с результатами измерения адекватности модели и отображения результатов |
В данной форме приведены коды анкет обучающей выборки, которые были учтены в каждой графе предыдущей формы по каждому классу.
Под внешней валидностью понимается способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.
Для измерения внешней валидности необходимо выполнить следующие действия:
1. В режиме измерения адекватности модели запустить режим измерения внешней валидности (нажав F8 Измерение внешней валидности) (рисунок 166).
2. Выбрать один из режимов удаления объектов обучающей выборки, приведенный на экранной форме (рисунок 167).
|
Рисунок 166. Режим переноса анкет обучающей
выборки |
Результат выполнения всех указанных на рисунке 166 действий приведен на рисунке 167.
|
Рисунок 167. Выходная форма с результатами
измерения |
При этом исходная выборка была разделена на две:
– в обучающей выборке остались только нечетные анкеты;
– в распознаваемую выборку были включены только четные анкеты;
– при распознавании был использован 2-й интегральный критерий: сумма количества информации.
Анализ отчета по внешней валидности, приведенного на рисунке 167, позволяет сделать вывод о высокой степени адекватности семантической информационной модели. Это значит, что взаимосвязи между словами, использованными в текстах, и принадлежностью этих текстов различным авторам, выявленные по примерам обучающей выборки, оказались имеющими силу и для других фрагментов текстов, приведенных в распознаваемой выборке. Это означает, что они относятся к генеральной совокупности, по отношению к которой обучающая выборка репрезентативна.
Под адаптацией модели понимается ее количественная модификация, осуществляемая путем включения в обучающую выборку дополнительных примеров реализации объектов, относящихся к тем же самым классам и описанным в той же системе признаков.
На первом этапе, для изучения адаптивности модели осуществим ее синтез на основе обучающей выборки, состоящей из нечетных анкет, которая использовалась в примере для измерения внешней валидности. Но в отличие от этого примера эту же выборку используем и как распознаваемую.
На втором этапе осуществим синтез модели на основе полной обучающей выборки, включающей как четные, так и нечетные анкеты.
Адаптация модели повышает точность идентификации объектов той же самой генеральной совокупности.
Под повторным синтезом (пересинтезом) модели понимается ее качественная модификация, осуществляемая путем включения в модель новых дополнительных классификационных и описательных шкал и градаций, представленных примерами в обучающей выборке.
Пересинтез модели обеспечивает возможность ее применения для идентификации объектов расширенной или новой генеральной совокупности.
Приведем пример синтеза новой модели, обобщающей предыдущую.
В модель добавлены новые классы распознавания (таблица 81).
Таблица 81 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ
№ |
Наименования классов распознавания |
1 |
Загадки о животных |
2 |
А.П.Чехов "Вишневый сад" |
3 |
Ф.М.Достоевский "Преступление и наказание" |
4 |
Н.В.Гоголь "Ревизор" |
5 |
А.С.Грибоедов "Горе от ума" |
6 |
И.А.Крылов |
7 |
М.Ю.Лермонтов "Мцыри" |
8 |
Фольклорные загадки о природе |
9 |
Некрасов "Кому на Руси жить хорошо" |
10 |
Пословицы |
Продолжение таблицы 81
№ |
Наименования классов распознавания |
11 |
А.С.Пушкин "Евгений Онегин" |
12 |
Загадки о саде и огороде |
13 |
В.Шекспир |
14 |
М.А.Шолохов "Тихий Дон" |
15 |
Скороговорки |
16 |
Л.Н.Толстой "Война и мир" |
17 |
И.С.Тургенев "Отцы и дети" |
Описательные шкалы и градации не приводятся, т.к. размерность составляет 6974 градации. Необходимо отметить, что текущая версия 12.5 системы "Эйдос" не имеет принципиальных ограничений на суммарное количество градаций классификационных и описательных шкал при синтезе модели и решении задач идентификации и прогнозирования, а также количество объектов обучающей выборки. Реально решались задачи с объемом обучающей выборки до 25000 объектов с 1500 классами и 7000 признаками. При этом был осуществлен синтез и исследование моделей, содержащих до 25 миллионов фактов.
В программном интерфейсе импорта данных из 17 исходных текстовых файлов, посвященных различным темам (см. таблицу 81) было сформировано 592 фрагмента, которые стали основой обучающей выборки.
После синтеза модели измеряется ее адекватность. Для этого обучающая выборка копируется в распознаваемую, после чего проводится распознавание и измерение валидности (рисунок 168). Продемонстрирована очень высокая внутренняя валидность новой модели.
|
Рисунок 168. Выходная форма с результатами
измерения |
Информационный портрет класса представляет собой список признаков в порядке убывания количества информации, содержащегося в этих признаках о принадлежности к данному классу.
Генерируются они 1-м режиме 5-й подсистемы "Типология" (рисунок 169). Информационные портреты классов отображаются системой "Эйдос" в виде экранных форм, круговых диаграмм и гистограмм, а также в распечатываются в форме таблиц в поддиректории TXT. Графические формы записываются в поддиректории PCX.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рисунок 169. Информационные портреты классов |
Кластерно-конструктивный анализ классов и признаков реализуется в 5-й подсистеме "Типология". В результате рассчитываются матрицы сходства классов и признаков, на основе которых генерируется и выводится ряд текстовых и графических форм. В данной работе мы приведем для примера лишь матрицу сходства классов (таблица 82 и отображающую ее в графической форме семантическую сеть классов (рисунок 170).
Таблица 82 – МАТРИЦА СХОДСТВА КЛАССОВ
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
1 |
100,0
|
-9,55
|
-8,94
|
-8,16
|
-9,46
|
6,32
|
-10,08
|
38,11
|
-6,24
|
33,86
|
-4,34
|
41,96
|
-11,12
|
-8,17
|
11,70
|
-8,00
|
-11,05
|
2 |
-9,55
|
100,0
|
-5,11
|
-0,35
|
-2,47
|
-7,84
|
-2,95
|
-9,07
|
-5,50
|
-5,44
|
-6,47
|
1,20
|
-16,31
|
-5,43
|
-10,08
|
-8,26
|
2,04
|
3 |
-8,94
|
-5,11
|
100,0
|
-2,39
|
1,12
|
-3,97
|
-6,81
|
-5,61
|
-0,10
|
-6,56
|
-3,05
|
-10,13
|
-0,41
|
-7,36
|
-11,47
|
-6,04
|
-6,32
|
4 |
-8,16
|
-0,35
|
-2,39
|
100,0
|
2,52
|
9,73
|
1,33
|
-4,36
|
-6,23
|
-9,19
|
-4,94
|
-8,33
|
-9,55
|
-1,41
|
-9,14
|
-1,91
|
3,14
|
5 |
-9,46
|
-2,47
|
1,12
|
2,52
|
100,0
|
-8,31
|
-1,87
|
-5,24
|
-12,74
|
-1,25
|
-5,30
|
-4,55
|
-12,89
|
-8,85
|
-6,73
|
-9,59
|
-3,52
|
6 |
6,32
|
-7,84
|
-3,97
|
9,73
|
-8,31
|
100,0
|
-6,55
|
-5,05
|
-12,06
|
0,49
|
-7,34
|
-2,99
|
-15,19
|
-11,13
|
8,18
|
-3,10
|
-8,75
|
7 |
-10,08
|
-2,95
|
-6,81
|
1,33
|
-1,87
|
-6,55
|
100,0
|
-4,35
|
-1,04
|
-6,10
|
-10,14
|
-5,71
|
-7,09
|
-0,21
|
-9,40
|
-3,97
|
3,67
|
8 |
38,11
|
-9,07
|
-5,61
|
-4,36
|
-5,24
|
-5,05
|
-4,35
|
100,0
|
-2,38
|
34,04
|
-6,03
|
41,21
|
-6,48
|
-4,72
|
0,87
|
-8,50
|
-8,17
|
9 |
-6,24
|
-5,50
|
-0,10
|
-6,23
|
-12,74
|
-12,06
|
-1,04
|
-2,38
|
100,0
|
-1,85
|
-8,20
|
-6,28
|
-12,89
|
-1,18
|
-2,41
|
0,73
|
-3,53
|
10 |
33,86
|
-5,44
|
-6,56
|
-9,19
|
-1,25
|
0,49
|
-6,10
|
34,04
|
-1,85
|
100,0
|
-8,76
|
39,59
|
-9,83
|
-9,07
|
-1,63
|
-11,22
|
-7,73
|
11 |
-4,34
|
-6,47
|
-3,05
|
-4,94
|
-5,30
|
-7,34
|
-10,14
|
-6,03
|
-8,20
|
-8,76
|
100,0
|
-7,79
|
13,47
|
-3,96
|
-5,98
|
-11,77
|
-2,47
|
12 |
41,96
|
1,20
|
-10,13
|
-8,33
|
-4,55
|
-2,99
|
-5,71
|
41,21
|
-6,28
|
39,59
|
-7,79
|
100,0
|
-8,80
|
-8,13
|
5,09
|
-8,29
|
-5,24
|
13 |
-11,12
|
-16,31
|
-0,41
|
-9,55
|
-12,89
|
-15,19
|
-7,09
|
-6,48
|
-12,89
|
-9,83
|
13,47
|
-8,80
|
100,0
|
-3,67
|
-3,20
|
-1,92
|
1,77
|
14 |
-8,17
|
-5,43
|
-7,36
|
-1,41
|
-8,85
|
-11,13
|
-0,21
|
-4,72
|
-1,18
|
-9,07
|
-3,96
|
-8,13
|
-3,67
|
100,0
|
-11,07
|
-0,69
|
-3,25
|
15 |
11,70
|
-10,08
|
-11,47
|
-9,14
|
-6,73
|
8,18
|
-9,40
|
0,87
|
-2,41
|
-1,63
|
-5,98
|
5,09
|
-3,20
|
-11,07
|
100,0
|
-8,44
|
-12,23
|
16 |
-8,00
|
-8,26
|
-6,04
|
-1,91
|
-9,59
|
-3,10
|
-3,97
|
-8,50
|
0,73
|
-11,22
|
-11,77
|
-8,29
|
-1,92
|
-0,69
|
-8,44
|
100,0
|
-5,50
|
17 |
-11,05
|
2,04
|
-6,32
|
3,14
|
-3,52
|
-8,75
|
3,67
|
-8,17
|
-3,53
|
-7,73
|
-2,47
|
-5,24
|
1,77
|
-3,25
|
-12,23
|
-5,50
|
100,0
|
|
Рисунок 170. Отображение матрицы сходства классов в графической форме семантической сети классов (отображены связи значимостью более 5%) |
Продемонстрирована возможность и эффективность применения технологии и инструментария системно-когнитивного анализа для решения ряда задач атрибуции текстов.
Приведен подробный численный пример (с большим количеством конкретных иллюстративных материалов) реализации всех этапов СК-анализа при атрибуции текстов: когнитивной структуризации и формализации предметной области; формирования обучающей выборки; синтеза семантической информационной модели; оптимизации и измерения адекватности модели; адаптации и пересинтеза модели; типологического и кластерно-конструктивного анализа модели.
1. Что такое атрибуция текстов?
2. Каким образом выполняется когнитивная структуризация предметной области?
3. В чем состоит формализацию предметной области и как ее осуществить в системе "Эйдос"?
4. Какие средства формирования обучающей выборки используются в системе "Эйдос" при решении задач атрибуции текстов?
5. В какой подсистеме и в каком режиме системы "Эйдос" осуществляется синтез семантической информационной модели и в чем он состоит?
6. В чем заключается оптимизация семантической информационной модели и как она осуществляется в системе "Эйдос"?
7. Как семантическая информационная модель проверяется на адекватность?
8. Как связана адекватность модели с внутренней и внешней, дифференциальной и интегральной валидностью?
9. Каким образом можно в системе "Эйдос" выполнить адаптацию модели и измерить, как изменилась ее адекватность?
10. Как в системе "Эйдос" осуществить пересинтез модели и измерить, как изменилась ее адекватность?
11. Чем отличается адаптация модели от пересинтеза в системе "Эйдос"?
12. В каких подсистемах и режимах системы "Эйдос" можно вывести информационные портреты?
13. В каких подсистемах и режимах системы "Эйдос" можно выполнить кластерно-конструктивный анализ модели?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Натуральные числа имеют ряд свойств, такие, например, как: делители, неделители, количество делителей и др. Существуют и более сложные свойства натуральных чисел, изучаемые в теории чисел. По этим свойствам числа классифицируются как простые, четные и т.д. Таким образом, исследование свойств чисел и является типичной задачей обучения распознаванию образов, идентификации и автоматической классификации. Эта задача довольно проста и наглядна, поэтому эта задача представляет для нас интерес в качестве учебной.
1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации.
1.2. Сконструировать описательные шкалы и градации.
1.3. Сгенерировать обучающую выборку.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).
Для этой цели используем 5-ю функцию 5-го режима 1-й подсистемы системы "Эйдос" (реальный исходный текст программы приводится ниже).
***************************************************************
*** Формирование модели для исследования свойств чисел ********
*** Луценко Е.В., 02/26/04 11:34am ****************************
***************************************************************
FUNCTION Div_chis()
scr_start=SAVESCREEN(0,0,24,79)
SHOWTIME(0,58,.T.,"rb/n")
Titul(.T.)
Mess = "=== ГЕНЕРАЦИЯ ИСХОДНЫХ ДАННЫХ ДЛЯ МОДЕЛИ ИССЛЕДОВАНИЯ
СВОЙСТВ ЧИСЕЛ ==="
@5,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"
*
0123456789012345678901234567890123456789012345678901234567890123456789012345678
* 0 10 20 30
40 50 60 70
@10,24 SAY
"Задайте максимальное число: #####" COLOR "w+/rb"
N_Obj = 99
@10,52 GET N_Obj PICTURE "#####" COLOR "rg+/r"
SET CURSOR ON;READ;SET CURSOR OFF
IF LASTKEY()=27
RESTSCREEN(0,0,24,79,scr23)
RETURN
ENDIF
*** Формирование справочника первичных признаков
A_Pr := {}
FOR j=1 TO N_Obj
AADD(A_Pr, "Делится на
"+ALLTRIM(STR(j,4)))
NEXT
FOR j=1 TO N_Obj
AADD(A_Pr, "Не делится
на "+ALLTRIM(STR(j,4)))
NEXT
FOR j=1 TO N_Obj
AADD(A_Pr, "Делителей:
"+ALLTRIM(STR(j,4)))
NEXT
USE Priz_per EXCLUSIVE NEW
ZAP
FOR j=1 TO LEN(A_Pr)
APPEND BLANK
REPLACE Kod WITH j
REPLACE Name WITH A_Pr[j]
NEXT
GenNtxPrp(.F.)
CLOSE ALL
*** Формирование справочника классов распознавания
USE Object EXCLUSIVE NEW
ZAP
FOR j=1 TO N_Obj
APPEND BLANK
REPLACE Kod WITH j
REPLACE Name WITH
ALLTRIM(STR(j,3))
NEXT
GenNtxObj(.F.)
CLOSE ALL
*** Формирование обучающей выборки
USE ObInfZag EXCLUSIVE NEW;ZAP
USE ObInfKpr EXCLUSIVE NEW;ZAP
FOR s=1 TO N_Obj
SELECT ObInfZag
APPEND BLANK
REPLACE Kod_ist WITH s
REPLACE Name_ist WITH
ALLTRIM(STR(s,4))
REPLACE Obj_1 WITH s
SELECT ObInfKpr
APPEND BLANK
REPLACE Kod_ist WITH s
p=0 && Позиция для
записи в БД
N_Del=0 && Кол-во делителей
*** Проверка делимости
FOR j=1 TO N_Obj
IF s-j*int(s/j) = 0
Kod = j
++N_Del
IF p+1 <= 11
FIELDPUT(++p+1,
Kod)
ELSE
APPEND BLANK
REPLACE
Kod_ist WITH s
p=0
FIELDPUT(++p+1,
Kod)
ENDIF
ENDIF
NEXT
************ Занесение
количества делителей
IF p+1 <= 11
FIELDPUT(++p+1,
N_Del+2*N_Obj)
ELSE
APPEND BLANK
REPLACE Kod_ist WITH s
p=0
FIELDPUT(++p+1,
N_Del+2*N_Obj)
ENDIF
*** Проверка не делимости
FOR j=1 TO N_Obj
IF s-j*int(s/j) <>
0
Kod = j+N_Obj
IF p+1 <= 11
FIELDPUT(++p+1,
Kod)
ELSE
APPEND BLANK
REPLACE
Kod_ist WITH s
p=0
FIELDPUT(++p+1,
Kod)
ENDIF
ENDIF
NEXT
NEXT
GenNtxOin(.F.)
@24,0 SAY REPLICATE("-",80) COLOR "rb/n"
Mess = " ПРОЦЕСС ГЕНЕРАЦИИ ШКАЛ И ОБУЧАЮЩЕЙ ВЫБОРКИ ЗАВЕРШЕН
УСПЕШНО !!! "
@24,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"
INKEY(0)
RESTSCREEN(0,0,24,79,scr_start)
SHOWTIME()
RETURN
Выберем в качестве классов натуральные числа от 1 до 30 (вместо 30 может быть взято другое число). В результате получим 30 классов с кодами от 1 до 30, наименования которых совпадают с их кодом. Приводить здесь эту элементарную таблицу не имеет смысла.
В качестве описательных шкал и градаций используем простейшие свойства натуральных чисел, такие как: делители, неделители, количество делителей (таблица 83). Могут быть использованы и более сложные свойства, изучаемые в теории чисел, но суть задачи от этого не изменится.
Таблица 83 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
Код |
Наименование
признака |
Код |
Наименование
признака |
Код |
Наименование
признака |
1 |
Делится на 1 |
31 |
Не делится на 1 |
61 |
Делителей: 1 |
2 |
Делится на 2 |
32 |
Не делится на 2 |
62 |
Делителей: 2 |
3 |
Делится на 3 |
33 |
Не делится на 3 |
63 |
Делителей: 3 |
4 |
Делится на 4 |
34 |
Не делится на 4 |
64 |
Делителей: 4 |
5 |
Делится на 5 |
35 |
Не делится на 5 |
65 |
Делителей: 5 |
6 |
Делится на 6 |
36 |
Не делится на 6 |
66 |
Делителей: 6 |
7 |
Делится на 7 |
37 |
Не делится на 7 |
67 |
Делителей: 7 |
8 |
Делится на 8 |
38 |
Не делится на 8 |
68 |
Делителей: 8 |
9 |
Делится на 9 |
39 |
Не делится на 9 |
69 |
Делителей: 9 |
10 |
Делится на 10 |
40 |
Не делится на 10 |
70 |
Делителей: 10 |
11 |
Делится на 11 |
41 |
Не делится на 11 |
71 |
Делителей: 11 |
12 |
Делится на 12 |
42 |
Не делится на 12 |
72 |
Делителей: 12 |
13 |
Делится на 13 |
43 |
Не делится на 13 |
73 |
Делителей: 13 |
14 |
Делится на 14 |
44 |
Не делится на 14 |
74 |
Делителей: 14 |
15 |
Делится на 15 |
45 |
Не делится на 15 |
75 |
Делителей: 15 |
16 |
Делится на 16 |
46 |
Не делится на 16 |
76 |
Делителей: 16 |
17 |
Делится на 17 |
47 |
Не делится на 17 |
77 |
Делителей: 17 |
18 |
Делится на 18 |
48 |
Не делится на 18 |
78 |
Делителей: 18 |
19 |
Делится на 19 |
49 |
Не делится на 19 |
79 |
Делителей: 19 |
20 |
Делится на 20 |
50 |
Не делится на 20 |
80 |
Делителей: 20 |
21 |
Делится на 21 |
51 |
Не делится на 21 |
81 |
Делителей: 21 |
22 |
Делится на 22 |
52 |
Не делится на 22 |
82 |
Делителей: 22 |
23 |
Делится на 23 |
53 |
Не делится на 23 |
83 |
Делителей: 23 |
24 |
Делится на 24 |
54 |
Не делится на 24 |
84 |
Делителей: 24 |
25 |
Делится на 25 |
55 |
Не делится на 25 |
85 |
Делителей: 25 |
26 |
Делится на 26 |
56 |
Не делится на 26 |
86 |
Делителей: 26 |
27 |
Делится на 27 |
57 |
Не делится на 27 |
87 |
Делителей: 27 |
28 |
Делится на 28 |
58 |
Не делится на 28 |
88 |
Делителей: 28 |
29 |
Делится на 29 |
59 |
Не делится на 29 |
89 |
Делителей: 29 |
30 |
Делится на 30 |
60 |
Не делится на 30 |
90 |
Делителей: 30 |
Обучающая выборка генерируется автоматически вместе с шкалами и градациями и здесь не приводится из-за ее большого объема.
Синтез модели осуществляется в 5-й функции 3-го режима 2-й подсистемы системы "Эйдос", а верификация (после копирования обучающей выборки в распознаваемую и распознавания со 2-м интегральным критерием сходства) – во 2-м режиме 6-й подсистемы. При этом получен результат, представленный на рисунке 171, который говорит о высокой степени адекватности модели и корректности выводов, полученных путем ее исследования.
|
Рисунок 171. Экранная форма режима измерения адекватности СИМ |
Идентификация проводится во 2-м режиме 4-й подсистемы системы "Эйдос". Результаты идентификации выводятся в форме карточек в 1-й и 2-й функциях 3-го режима 4-й подсистемы системы "Эйдос" (примеры карточек на рисунке 172).
|
Рисунок 172. Пример карточки идентификации объекта с классами |
Информационные портреты классов генерируются и отображаются в 1-й функции 1-го режима 5-й подсистемы системы "Эйдос" (рисунок 173).
|
Рисунок
173. Пример информационного портрета
класса |
Двухмерные и трехмерные профили классов и признаков генерируются и отображаются в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 174).
Информационные портреты признаков (факторов) генерируются и отображаются в 1-й функции 2-го режима 5-й подсистемы системы "Эйдос" (рисунок 175). Размеры секторов в круговой диаграмме соответствуют относительному вкладу признаков в общее количество информации, содержащейся в информационном портрете.
|
Рисунок 174. Пример профиля класса |
|
Рисунок
175. Экранная форма информационного
портрета фактора |
Из рисунка 148 видно, что система способна выявить простые числа по признаку: "Число делителей 2".
Этот анализ проводится в во 2-й функции 1-го и 2-го режимов 5-й подсистемы системы "Эйдос" (рисунок 176).
|
|
Рисунок 176. Примеры семантических сети классов и признаков |
Семантические сети отражают сходство классов по характеризующим их признакам и сходство признаков по тем классам, о принадлежности к которым они несут информацию.
Структуру любой линии в семантических сетях классов или признаков можно детально увидеть в когнитивных диаграммах классов и признаков (рисунок 177).
|
|
Рисунок 177. Примеры когнитивных диаграмм классов и признаков |
Нелокальные нейроны отражают систему детерминации состояний факторами т отображаются в 5-м режиме 6-й подсистемы системы "Эйдос", а нейронные сети представляют собой совокупность нейронов и отображаются в 6-м режиме той же подсистемы (рисунок 178).
|
|
Рисунок
178. Примеры нелокального нейрона |
Классическая когнитивная модель отражает структуру детерминации состояния с указанием сходств и различий между факторами и отображается в 7-м режиме 6-й подсистемы системы "Эйдос" (рисунок 179).
|
Рисунок 179. Пример классической когнитивной карты |
Интегральная когнитивная модель отражает структуру детерминации нескольких состояний с указанием сходств и различий между состояниями по их системам детерминации, между факторами, по влиянию, которое они оказывают на поведение объекта управления, отображаются в 7-м режиме 6-й подсистемы системы "Эйдос" (рисунок 180).
|
Рисунок 180. Пример интегральной когнитивной карты |
1. Какие свойства натуральных чисел мы рассматривали в качестве их признаков?
2. Какие образом выполняется когнитивная структуризация предметной области?
3. В чем состоит формализацию предметной области и как ее осуществить в системе "Эйдос" при изучении свойств натуральных чисел?
4. Какие средства формирования обучающей выборки используются в системе "Эйдос" при изучении свойств натуральных чисел?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Когда мы зрительно воспринимаем окружающую действительность, то постоянно решается задача идентификации трехмерных тел по их проекциям. При этом мы можем наблюдать одну, две или даже три проекции тела.
Одну проекцию мы наблюдаем при наблюдении тела на достаточно большом расстоянии, при котором бинокулярность зрения несущественна, или при монокулярном наблюдении за очень короткое время, за которое точка зрения на тело не меняется или оно не успевает повернутся.
Ясно, что наиболее сложными условиями для идентификации формы тела являются те, когда мы видим лишь одну его проекцию (большое расстояние и малое время наблюдения).
1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации.
1.2. Сконструировать описательные шкалы и градации.
1.3. Сгенерировать обучающую выборку.
2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.
3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.
3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).
3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).
3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).
3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.
3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).
3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).
Так как задачей является идентификация формы тела, то в качестве классов выберем для исследования простые и широко известные формы: шар, тетраэдр, куб, конус, пирамиду, призму и цилиндр, а также их наблюдения по две ортогональные проекции, которые будем обозначать числами 11, 12, 23, и одно наблюдение сразу трех проекций: 123 (таблица 84). Одновременно или последовательно наблюдаются проекции, в данном случае неважно.
Таблица
84 – КЛАССИФИКАЦИОННЫЕ
ШКАЛЫ И ГРАДАЦИИ
Код |
Наимено- вание |
Код |
Наимено-вание |
Код |
Наимено- вание |
Код |
Наимено-вание |
1 |
Шар |
11 |
Куб |
21 |
Пирамида |
31 |
Призма |
2 |
Шар-11 |
12 |
Куб-11 |
22 |
Пирамида-11 |
32 |
Призма-11 |
3 |
Шар-12 |
13 |
Куб-12 |
23 |
Пирамида-12 |
33 |
Призма-12 |
4 |
Шар-22 |
14 |
Куб-23 |
24 |
Пирамида-23 |
34 |
Призма-23 |
5 |
Шар-123 |
15 |
Куб-123 |
25 |
Пирамида-123 |
35 |
Призма-123 |
6 |
Тетраэдр |
16 |
Конус |
26 |
Цилиндр |
|
|
7 |
Тетраэдр-11 |
17 |
Конус-11 |
27 |
Цилиндр-11 |
|
|
8 |
Тетраэдр-12 |
18 |
Конус-12 |
28 |
Цилиндр-12 |
|
|
9 |
Тетраэдр-23 |
19 |
Конус-23 |
29 |
Цилиндр-23 |
|
|
10 |
Тетраэдр-123 |
20 |
Конус-123 |
30 |
Цилиндр-123 |
|
|
Проекциями перечисленных трехмерных тел на взаимно-ортогональные плоскости являются двухмерные фигуры: круг, квадрат и треугольник. Соответственно, сконструируем и описательные шкалы и градации, чтобы они позволяли отразить все варианты проекций трехмерных тел (таблица 85).
Таблица 85 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
Код |
Наименование |
[1] |
ВИД СПЕРЕДИ: |
1 |
Круг |
2 |
Квадрат |
3 |
Треугольник |
[2] |
ВИД СБОКУ: |
4 |
Круг |
5 |
Квадрат |
6 |
Треугольник |
[3] |
ВИД СВЕРХУ: |
7 |
Круг |
8 |
Квадрат |
9 |
Треугольник |
Чтобы сгенерировать обучающую выборку составим таблицу 86, в которой в наглядной форме изобразим проекции выбранных нами тел на ортогональные плоскости.
Таблица
86 – КОДИРОВАНИЕ ПРОЕКЦИЙ ТЕЛ
ДЛЯ ОБУЧАЮЩЕЙ ВЫБОРКИ
Код |
Тело |
Проекции |
1-я проекция X«Y вращение вокруг Z 1 |
2-я проекция X«Z вращение вокруг Y 2 |
3-я проекция Y«Z вращение вокруг X 3 |
||||||
X |
Y |
Z |
X |
Y |
Z |
X |
Y |
Z |
|||
1 |
Шар |
Вид |
O |
O |
O |
O |
O |
O |
O |
O |
O |
Код |
1 |
4 |
7 |
1 |
4 |
7 |
1 |
4 |
7 |
||
2 |
Тетраэдр |
Вид |
|
|
|
|
|
|
|
|
|
Код |
3 |
6 |
9 |
3 |
6 |
9 |
3 |
6 |
9 |
||
3 |
Куб |
Вид |
|
|
|
|
|
|
|
|
|
Код |
2 |
5 |
8 |
2 |
5 |
8 |
2 |
5 |
8 |
||
4 |
Конус |
Вид |
|
|
O |
O |
|
|
|
O |
|
Код |
3 |
6 |
7 |
1 |
6 |
9 |
3 |
4 |
9 |
||
5 |
Пирамида |
Вид |
|
|
|
|
|
|
|
|
|
Код |
3 |
6 |
8 |
2 |
6 |
9 |
3 |
5 |
9 |
||
6 |
Цилиндр |
Вид |
|
|
O |
O |
|
|
|
O |
|
Код |
2 |
5 |
7 |
1 |
5 |
8 |
2 |
4 |
8 |
||
7 |
Призма |
Вид |
|
|
|
|
|
|
|
|
|
Код |
2 |
5 |
9 |
3 |
5 |
8 |
2 |
6 |
8 |
С использованием таблицы 86 составим таблицу 87 с обучающей выборкой.
Таблица 87 – ФОРМА ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код |
Наименование |
Классы |
Признаки |
||||||||||
1 |
2 |
3 |
Проекция-1 |
Проекция-2 |
Проекция-3 |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|||||
1 |
Шар |
1 |
|
|
1 |
4 |
7 |
|
|
|
|
|
|
2 |
Шар-11 |
2 |
|
|
1 |
4 |
7 |
1 |
4 |
7 |
|
|
|
3 |
Шар-12 |
3 |
|
|
1 |
4 |
7 |
|
|
|
1 |
4 |
7 |
4 |
Шар-22 |
4 |
|
|
|
|
|
1 |
4 |
7 |
1 |
4 |
7 |
5 |
Шар-123 |
5 |
|
|
1 |
4 |
7 |
1 |
4 |
7 |
1 |
4 |
7 |
6 |
Тетраэдр |
6 |
|
|
3 |
6 |
9 |
|
|
|
|
|
|
7 |
Тетраэдр-11 |
7 |
|
|
3 |
6 |
9 |
3 |
6 |
9 |
|
|
|
8 |
Тетраэдр-12 |
8 |
|
|
3 |
6 |
9 |
|
|
|
3 |
6 |
9 |
9 |
Тетраэдр-23 |
9 |
|
|
|
|
|
3 |
6 |
9 |
3 |
6 |
9 |
10 |
Тетраэдр-123 |
10 |
|
|
3 |
6 |
9 |
3 |
6 |
9 |
3 |
6 |
9 |
Продолжение таблицы 87
Код |
Наименование |
Классы |
Признаки |
||||||||||
1 |
2 |
3 |
Проекция-1 |
Проекция-2 |
Проекция-3 |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|||||
11 |
Куб |
11 |
|
|
2 |
5 |
8 |
|
|
|
|
|
|
12 |
Куб-11 |
12 |
|
|
2 |
5 |
8 |
2 |
5 |
8 |
|
|
|
13 |
Куб-12 |
13 |
|
|
2 |
5 |
8 |
|
|
|
2 |
5 |
8 |
14 |
Куб-23 |
14 |
|
|
|
|
|
2 |
5 |
8 |
2 |
5 |
8 |
15 |
Куб-123 |
15 |
|
|
2 |
5 |
8 |
2 |
5 |
8 |
2 |
5 |
8 |
16 |
Конус |
16 |
|
|
3 |
6 |
7 |
|
|
|
|
|
|
17 |
Конус-11 |
17 |
|
|
3 |
6 |
7 |
1 |
6 |
9 |
|
|
|
18 |
Конус-12 |
18 |
|
|
3 |
6 |
7 |
|
|
|
3 |
4 |
9 |
19 |
Конус-23 |
19 |
|
|
|
|
|
1 |
6 |
9 |
3 |
4 |
9 |
20 |
Конус-123 |
20 |
|
|
3 |
6 |
7 |
1 |
6 |
9 |
3 |
4 |
9 |
21 |
Пирамида |
21 |
|
|
3 |
6 |
8 |
|
|
|
|
|
|
22 |
Пирамида-11 |
22 |
|
|
3 |
6 |
8 |
2 |
6 |
9 |
|
|
|
23 |
Пирамида-12 |
23 |
|
|
3 |
6 |
8 |
|
|
|
3 |
5 |
9 |
24 |
Пирамида-23 |
24 |
|
|
|
|
|
2 |
6 |
9 |
3 |
5 |
9 |
25 |
Пирамида-123 |
25 |
|
|
3 |
6 |
8 |
2 |
6 |
9 |
3 |
5 |
9 |
26 |
Цилиндр |
26 |
|
|
2 |
5 |
7 |
|
|
|
|
|
|
27 |
Цилиндр-11 |
27 |
|
|
2 |
5 |
7 |
1 |
5 |
8 |
|
|
|
28 |
Цилиндр-12 |
28 |
|
|
2 |
5 |
7 |
|
|
|
2 |
4 |
8 |
29 |
Цилиндр-23 |
29 |
|
|
|
|
|
1 |
5 |
8 |
2 |
4 |
8 |
30 |
Цилиндр-123 |
30 |
|
|
2 |
5 |
7 |
1 |
5 |
8 |
2 |
4 |
8 |
31 |
Призма |
31 |
|
|
2 |
5 |
9 |
|
|
|
|
|
|
32 |
Призма-11 |
32 |
|
|
2 |
5 |
9 |
3 |
5 |
8 |
|
|
|
33 |
Призма-12 |
33 |
|
|
2 |
5 |
9 |
|
|
|
2 |
6 |
8 |
34 |
Призма-23 |
34 |
|
|
|
|
|
3 |
5 |
8 |
2 |
6 |
8 |
35 |
Призма-123 |
35 |
|
|
2 |
5 |
9 |
3 |
5 |
8 |
2 |
6 |
8 |
Вводим классификационные и описательные шкалы и градации (в 1-м и 2-м режимах 1-й подсистемы), а также обучающую выборку (в 1-м режиме 2-й подсистемы) в систему "Эйдос" и осуществляем синтез модели (в 5-й функции 3-го режима 2-й подсистемы), а затем ее верификацию (во 2-м режиме 6-й подсистемы). В результате получаем семантическую информационную модель, обладающую достаточно высокой степенью адекватности: 94,29%, чтобы результаты ее исследования можно было считать исследованием самой моделируемой предметной области (рисунок 181).
|
Рисунок 181. Экранная форма по измерению адекватности СИМ |
После выполнения 2-го режима 4-й подсистемы "Распознавание" в 1-й функции 3-го режима 4-й подсистемы получаем итоговую форму по результатам идентификации (таблица 88).
Таблица 88 – ИТОГОВЫЕ РЕЗУЛЬТАТЫ ИДЕНТИФИКАЦИИ
Объект |
Класс |
Сходство |
||
Код |
Наименован. |
Код |
Наименован. |
|
1 |
Шар |
1 |
Шар |
94,083 |
2 |
Шар-11 |
1 |
Шар |
76,819 |
3 |
Шар-12 |
1 |
Шар |
76,819 |
4 |
Шар-23 |
1 |
Шар |
76,819 |
5 |
Шар-123 |
1 |
Шар |
54,319 |
6 |
Тетраэдр |
6 |
Тетраэдр |
94,257 |
7 |
Тетраэдр-11 |
6 |
Тетраэдр |
76,960 |
8 |
Тетраэдр-12 |
6 |
Тетраэдр |
76,960 |
9 |
Тетраэдр-23 |
6 |
Тетраэдр |
76,960 |
10 |
Тетраэдр-123 |
6 |
Тетраэдр |
54,419 |
11 |
Куб |
11 |
Куб |
94,189 |
12 |
Куб-11 |
11 |
Куб |
76,905 |
13 |
Куб-12 |
11 |
Куб |
76,905 |
14 |
Куб-23 |
11 |
Куб |
76,905 |
15 |
Куб-123 |
11 |
Куб |
54,380 |
16 |
Конус |
16 |
Конус |
92,171 |
17 |
Конус-11 |
17 |
Конус-11 |
75,941 |
18 |
Конус-12 |
20 |
Конус-123 |
77,354 |
19 |
Конус-23 |
20 |
Конус-123 |
82,367 |
20 |
Конус-123 |
20 |
Конус-123 |
69,532 |
Продолжение таблицы 88
Объект |
Класс |
Сходство |
||
Код |
Наименован. |
Код |
Наименован. |
|
21 |
Пирамида |
21 |
Пирамида |
94,257 |
22 |
Пирамида-11 |
22 |
Пирамида-11 |
66,725 |
23 |
Пирамида-12 |
23 |
Пирамида-12 |
64,571 |
24 |
Пирамида-23 |
24 |
Пирамида-23 |
62,412 |
25 |
Пирамида-123 |
32 |
Призма-11 |
44,934 |
26 |
Цилиндр |
26 |
Цилиндр |
92,128 |
27 |
Цилиндр-11 |
27 |
Цилиндр-11 |
77,694 |
28 |
Цилиндр-12 |
27 |
Цилиндр-11 |
77,694 |
29 |
Цилиндр-23 |
30 |
Цилиндр-123 |
82,136 |
30 |
Цилиндр-123 |
30 |
Цилиндр-123 |
69,328 |
31 |
Призма |
31 |
Призма |
94,189 |
32 |
Призма-11 |
32 |
Призма-11 |
67,933 |
33 |
Призма-12 |
33 |
Призма-12 |
63,420 |
34 |
Призма-23 |
34 |
Призма-23 |
62,412 |
35 |
Призма-123 |
32 |
Призма-11 |
44,934 |
Из таблицы 88 видно, что объект "Пирамида-123" неверно идентифицирован как класс "Призма-11". В остальных случаях тип объекта идентифицирован верно, что не исключает в ряде случаев неверной идентификации вида проекции (что, конечно, не имеет отношения к телам Платона – первым трем классам). Карточка, дающая расшифровку результатов идентификации 25-го объекта "Пирамида-123", представлена на рисунке 182.
|
Рисунок 182. Карточка результатов идентификации объекта 25. |
Если проанализировать коды признаков призмы и пирамиды, то можно увидеть, что они одни и те же, и отличие состоит лишь в количестве повторностей признаков. Это и является причиной сложностей при дифференцировании этих объектов.
В 1-й функции 1-го режима 5-й подсистемы системы "Эйдос" получим информационный портрет класса, а в 1-й функции 2-го режима той же подсистемы – информационный портрет признака (рисунок 183).
|
|
Рисунок
183. Примеры информационных портретов |
В 5-й операции 2-й функции 1-го и 2-го режимов 5-й подсистемы получим семантические сети классов и факторов (рисунок 184).
|
|
Рисунок 184. Примеры семантических сетей классов и факторов |
Интерпретацию семантических сетей дать самостоятельно.
В 3-й функции 1-го и 2-го режимов 5-й подсистемы получим когнитивные диаграммы классов и признаков (рисунок 185).
|
|
Рисунок 185. Пример когнитивных диаграмм, содержащих результаты содержательного сравнения классов и факторов |
Из диаграммы классов мы видим, что основной вклад в сходство конуса и цилиндра вносит то, что одна из проекций у них одинаковая, т.е. круг, а основной вклад в различие – что остальные проекции у конуса – треугольник, а у цилиндра – квадрат.
Из диаграммы сравнения признаков мы видим, что такие проекции есть и у пирамиды, и у призмы, а в различие – то, что эти проекции характерны для различных тел.
Задания 3.5 – 3.7 выполнить самостоятельно.
1. Что называется ортогональными проекциями тел?
2. В чем заключается сложность идентификации тел по их ортогональным проекциям?
3. За счет чего облегчается задача идентификации тел по их проекциям при наблюдении с нескольких точек или в движении?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
Исследование проведено совместно с О.А.Засухиной на базе Кубанского государственного аграрного университета в 1993-1996 годах [64]. Предложенные технологии АСК-анализа реализовывалась на базе системы "Эйдос". С помощью сформированной содержательной информационной модели прогнозировались количественные и качественные результаты выращивания культур и вырабатывались научно-обоснованные рекомендации по управлению продуктивностью сельхозкультур и качеством сельхозпродукции.
Созданная модель включала:
– объект управления (сельскохозяйственную культуру); классы (будущие состояния объекта управления, т.е. количественные и качественные результаты выращивания);
– факторы управляющей системы (агротехнологии, т.е. нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация севооборота и т.п.);
– факторы окружающей среды (вид почв, культуры–предшественники по предшествующим годам и др.).
На основе предложенной
технологии АСК-анализа разработать
конкретное приложение системы "Эйдос", обеспечивающее управление
урожайностью и качеством сельскохозяйственных культур путем выбора и применения
оптимальной агротехнологии в зависимости от поставленной цели и вида почв,
культуры–предшественника, а также ряда других параметров объекта управления и
окружающей среды, например, таких как: нормы высева, виды и нормы внесения
удобрений, методы вспашки, ротация и др.
При создании методики
выполнялись следующие работы:
1. Формулировка целей методики и в соответствии с ними разработка перечня прогнозируемых хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", рисунок 186):
|
Рисунок 186. Будущие состояния объекта управления: количественные и качественные результаты выращивания сельхозкультуры (зерновые колосовые) |
2. Разработка формализованного паспорта результатов выращивания сельхозкультур, позволяющего описать в пригодной для компьютерной обработки форме результаты выращивания конкретной сельхозкультуры на конкретном поле, по конкретной технологии при конкретных условиях окружающей среды.
Соответственно, формализованный паспорт результатов выращивания состоит из трех частей:
– первая содержит целевые и нежелательные количественные и качественные результаты выращивания (классы);
– вторая – технологические факторы, которые можно рассматривать как средство достижения желаемых хозяйственных результатов (рисунок 187).
– третья – описывает не зависящие от воли человека факторы окружающей среды, прежде всего метеорологические, а также виды и состояние почв;
|
Рисунок
187. Видеограмма с фрагментом
справочника описательных шкал |
3. Использование бумажного архива по выращиванию сельхозкультур для заполнения формализованных паспортов и ввода в программную инструментальную систему в качестве примеров выращивания (обучающей выборки) (рисунок 188). Синтез семантической информационной модели. Размерность модели составила: 35 прогнозируемых результатов выращивания, 188 градаций факторов, 217 прецедентов в обучающей выборке, 18594 факта.
|
4. Выявление (на основе предъявленных реальных
примеров выращивания сельхозкультур) взаимосвязей между применяемыми
технологиями и полученными результатами и формирование информационных портретов
по каждому возможному результату выращивания. Информационный портрет
хозяйственной ситуации представляет собой перечень технологических факторов с
количественным указанием того, какое влияние оказывает каждый из них на
осуществление данной ситуации (рисунок 189):
|
|
|
|
Рисунок 189. Примеры информационных портретов результатов выращивания "Высокое качество" и "Высокое количество" |
5. Каждый из технологических факторов на основе
приведенных примеров характеризуется тем, какое влияние он оказывает на
осуществление каждой (целевой или нежелательной) хозяйственной ситуации
(рисунок 190):
|
|
Рисунок
190. Семантический портрет признака: |
6. Сравнение различных хозяйственных ситуаций и
формирование групп наиболее сходных из них (кластеров), а также определение
кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом на
экспериментальной базе данных был выявлен конструкт
"качество–количество", означающий, что для получения высокого качества
и большого количества необходимы совершенно противоположные и несовместимые
(т.е. невозможные одновременно) почвы: предшественники и агротехнологические
приемы (рисунок 191):
|
|
Рисунок
191. Конструкт классов: "Качество
– количество" |
7. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти факторы предложено использовать для замены друг друга в случае необходимости (рисунок 192):
|
|
Рисунок 192. Конструкт факторов: "Предшественники бобовые … – Ротация первая…" и семантической сети факторов: "Предшественники – Глубина обработки почвы" |
8. Проверка способности созданного приложения
правильно прогнозировать хозяйственные результаты на массиве уже введенных
формализованных паспортов показала, что валидность оказалась недостаточно
высокой для практического применения: на уровне
58%. Причиной этого являются артефакты, из-за которых некоторые
хозяйственные ситуации оказались слабо детерминированными (рисунок 193). Удаление артефактов привело к повышению
интегральной валидности до 80%, что достаточно для практического использования
методики (рисунок 194)
|
|
Рисунок 193. Интегральная и дифференциальная валидность методики до исключения артефактов |
Рисунок 194. Интегральная и дифференциальная валидность методики после исключения артефактов |
Таким образом, были решены две основные задачи:
|
1. Прогнозирование того, какие хозяйственные результаты наиболее
вероятны (а какие практически невозможны) на данном виде почв и с данными
предшественниками, а также при условии применения имеющихся в распоряжении
агротехнологий (рисунок 195). Указана мера сходства прогнозируемой ситуации
с каждым будущим состоянием. |
Рисунок 195. Пример карточки прогнозирования для конкретных условий выращивания |
2. Разработка рекомендаций по
управляющим воздействиям,
т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии
должны быть, чтобы можно было рассчитывать с определенной уверенностью на заданный
хозяйственный результат (рисунок 189).
Система позволяет оценивать
степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не
просто дает рекомендацию, но и количественно оценивает степень ее надежности.
Кроме того, система дает характеристику влияния каждого технологического приема
и рекомендации по замене желательных, но очень дорогих или не имеющихся в
наличии технологических приемов, другими, более дешевыми и доступными, и, при
этом, имеющими сходное влияние на хозяйственные результаты.
Таким образом, данная методика
позволяет "просматривать" различные варианты технологии,
прогнозировать последствия применения различных технологических приемов, и на
этой основе вырабатывать научно обоснованные рекомендации по выбору
возделываемой культуры и оптимальной для поставленных целей агротехнологии.
В данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные.
1. Что выбирается в качестве классов распознавания и что в качестве факторов в задаче прогнозирования урожая?
2. Что такое "шкала качества" и "шкала количества"? Какие градации у этих шкал?
3. Как классифицировать факторы, влияющие на урожай?
4. В чем состоит задача прогнозирования количественных и качественных результатов выращивания сельхозкультур?
5. В чем состоит задача поддержки принятия решений при выборе зон и подзон выращивания, культур для выращивания, агротехнологий?
6. Каким образом можно научно обоснованно заменять одни факторы другими?
7. С какими проблемами сталкивается разработчик и исследователь при решении задачи прогнозирования урожая?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
– уровень сигнала может быть намного выше уровня шума, тогда шум можно считать несущественным;
– уровень сигнала может быть намного ниже уровня шума, тогда шум может существенно сказываться на свойствах модели.
Поэтому представляет интерес исследование семантической информационной модели, созданной на основе случайной обучающей выборки, в которой принадлежность анкет с описаниями объектов к классам и сам набор признаков в них – случайные.
Какая-то часть валидности обусловлена законами теории вероятностей, а какая-то – наличием закономерностей в предметной области и работой системы распознавания, причем в зависимости от параметров модели (размерности по классам и признакам и объема обучающей выборки).
Например, при увеличении объема выборки результат все ближе к предсказываемому теорией вероятностей. Но модель "борется" за повышение адекватности идентификации. И в результате получается валидность заметно выше, чем по теории вероятностей даже при довольно больших выборках.
Когда анализируешь величину интегральной валидности и оцениваешь ее в категориях "довольно хорошая", или "не достаточно высокая", то надо сравнивать ее с валидностью, получаемой по теории вероятностей. Например, если есть два класса, то валидность даже с неработающей системой распознавания должна быть 50% при равновероятных классах, а если классов 10, то валидность должна быть 10%. И только то, что свыше этого значения, предсказываемого теорией вероятности, можно отнести на счет закономерностей в предметной области и работы модели.
Если статистика мала и закон больших чисел не применим, то система "Эйдос" воспринимает шум как закономерности (причем даже иногда детерминистского характера, когда статистики вообще нет) и дает тем более высокую валидность модели, чем меньше статистика.
Получается, что о выявлении закономерностей в предметной области можно говорить только тогда, когда статистика достаточно велика, т.е. настолько велика, что модель может подавить или отсеять шум. Если бы в предметной области не было закономерностей (а был только шум), то валидность была бы близка с предсказываемой теорией вероятностей, но фактически она значительно выше.
При увеличении объема обучающей выборки:
Во-первых, валидность должна стремиться не к нулю, а к величине, предсказываемой теорией вероятностей для равновероятных событий. Можно, конечно, ввести некую величину (каузальная валидность), как разность фактической валидности в системе "Эйдос" и теоретически предсказанной по теории вероятностей. Вот она уже будет стремиться к нулю.
Во-вторых, свойства шума таковы, что эта каузальная валидность должна стремиться к нулю и при внутренней, и при внешней валидности. Это должно происходить просто по определению шума (корреляция белого шума с белым шумом равна нулю), и потому, что интегральный критерий сходства в модели представляет собой корреляцию.
В-третьих, то, что как показывают численные эксперименты, каузальная валидность довольно медленно стремится к нулю, может означать, с одной стороны, невысокое качество генератора псевдослучайных чисел, а с другой стороны, – высокое качество модели распознавания, по-видимому, являющейся мощным средством выявления закономерностей в предметной области. Кстати, учитывая это, можно сравнивать различные генераторы "на степень их случайности".
Можно исследовать случайную модель с такими же параметрами, как какая-нибудь из реальных моделей (с таким же количеством классов, признаков, анкет) и сравнить их валидность. Получится некая величина. Можно считать, что разница между валидностью в реальном примере и случайной модели обусловлена наличием причинно-следственных связей в предметной области.
2. Построить графики в Excel и дать их интерпретацию.
|
Рисунок 196. Интерфейс режима генерации случайной модели |
Реальный исходный текст реализации этой функции приведен ниже.
******** ФОРМИРОВАНИЕ
КЛАССИФИКАЦИОННЫХ И ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ, *****
******** А ТАКЖЕ ОБУЧАЮЩЕЙ
ВЫБОРКИ СЛУЧАЙНЫМ ОБРАЗОМ ************************
******** Луценко Е.В.,
04/16/04 02:01pm *************************************
FUNCTION InpRandom()
***** БЛОК-1. ОТОБРАЖЕНИЕ
ИНФОРМАЦИИ О ФУНКЦИЯХ ПРОГРАММНОГО ИНТЕРФЕЙСА **********************
scr23 = SAVESCREEN(0,0,24,79)
SET CURSOR OFF
SET DATE ITALIAN
SET DECIMALS TO 15
SET ESCAPE On
Titul(.T.)
SHOWTIME(0,60,.F.,"rg+/n",.F.,.F.)
Mess1 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНЫХ КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ === "
Mess2 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНЫХ ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ === "
Mess3 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНОЙ ОБУЧАЮЩЕЙ ВЫБОРКИ === "
@4,40-LEN(Mess1)/2 SAY Mess1
COLOR "rg+/rb"
@5,40-LEN(Mess2)/2 SAY Mess2
COLOR "rg+/rb"
@6,40-LEN(Mess3)/2 SAY Mess3
COLOR "rg+/rb"
** БЛОК-3. ЗАДАНИЕ В ДИАЛОГЕ
ДИАПАЗОНОВ СТОЛБЦОВ С КЛАССАМИ И ФАКТОРАМИ **********************
N_Obj = 2
Mess = "Задайте
количество классов : #####"
@10,40-LEN(Mess)/2 SAY Mess
COLOR "w+/rb"
@10,52 GET N_Obj PICTURE
"#####" COLOR "rg+/r+"
N_Atr = 10
Mess = "Задайте
количество признаков: #####"
@12,40-LEN(Mess)/2 SAY Mess
COLOR "w+/rb"
@12,52 GET N_Atr PICTURE
"#####" COLOR "rg+/r+"
N_Ank = 100
Mess = "Задайте количество
анкет : #####"
@14,40-LEN(Mess)/2 SAY Mess
COLOR "w+/rb"
@14,52 GET N_Ank PICTURE
"#####" COLOR "rg+/r+"
SET CURSOR ON;READ;SET CURSOR
OFF
IF LASTKEY()=27
RESTSCREEN(0,0,24,79,scr23)
RETURN
ENDIF
USE Setup EXCLUSIVE NEW
N_LogAnk = N_Obj && Макс. кол-во логических анкет
в одной физической
CLOSE ALL
** БЛОК-7. ГЕНЕРАЦИЯ
КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ ***************************************
Mess1 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНЫХ КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ === "
@4,40-LEN(Mess1)/2 SAY Mess1
COLOR "rg+*/rb"
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
x=0
CLOSE ALL
USE Object EXCLUSIVE NEW;ZAP
FOR j=1 TO N_Obj
APPEND BLANK
REPLACE Kod
WITH j
REPLACE Name WITH
"Obj_"+ALLTRIM(STR(j,5))
p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)
@24,0 SAY STR(p,3)+"%" COLOR
"w+/r+"
@24,4 SAY REPLICATE("-",0.76*p)
COLOR "rb+/n"
NEXT
** БЛОК-8. ГЕНЕРАЦИЯ
ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ ********************************************
Mess2 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНЫХ ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ === "
@5,40-LEN(Mess2)/2 SAY Mess2
COLOR "rg+*/rb"
USE Priz_ob EXCLUSIVE NEW;ZAP
USE Priz_per EXCLUSIVE
NEW;ZAP
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
FOR i=1 TO N_Atr
APPEND BLANK
REPLACE Kod
WITH i
REPLACE Name WITH "Atr_"+ALLTRIM(STR(i,5))
p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)
@24,0 SAY STR(p,3)+"%" COLOR
"w+/r+"
@24,4 SAY REPLICATE("-",0.76*p)
COLOR "rb+/n"
NEXT
** БЛОК-9. ГЕНЕРАЦИЯ
ОБУЧАЮЩЕЙ ВЫБОРКИ *******************************************************
Mess3 = " === ГЕНЕРАЦИЯ
СЛУЧАЙНОЙ ОБУЧАЮЩЕЙ ВЫБОРКИ === "
@6,40-LEN(Mess3)/2 SAY Mess3
COLOR "rg+*/rb"
USE ObInfZag EXCLUSIVE
NEW;ZAP
USE ObInfKpr EXCLUSIVE
NEW;ZAP
N_Rec = RECCOUNT()
FOR M_KodIst=1 TO N_Ank
SELECT ObInfZag
APPEND BLANK
REPLACE Kod_ist WITH M_KodIst
R = 1+INT(N_Obj*RANDOM()/65535) && Код класса
R = IF(R<1,1,R)
R = IF(R>N_Obj,N_Obj,R)
REPLACE Name_ist WITH
"Ist-"+STRTRAN(STR(M_KodIst,5),"
","0")+"-"+STRTRAN(STR(R,5),"
","0")
FIELDPUT(3,R)
***** Генерация массива кодов признаков в
для БД ObInfKpr
A_Kpr := {}
FOR j=1 TO N_Atr
M_KodPr =
1+INT(N_Atr*RANDOM()/65535) &&
Код признака
M_KodPr = IF(M_KodPr<1,1,M_KodPr)
M_KodPr = IF(M_KodPr>N_Atr,N_Atr,M_KodPr)
IF ASCAN(A_Kpr,M_KodPr) = 0 && Если признак еще не
стречался
IF LEN(A_Kpr)+1 <= 4000
AADD(A_Kpr,M_KodPr)
ENDIF
ENDIF
NEXT
ASORT(A_Kpr)
****** Запись массива кодов признаков в БД
ObInfKpr
SELECT ObInfKpr
APPEND BLANK
FIELDPUT(1,M_KodIst)
k=2
FOR j=1 TO LEN(A_Kpr)
IF k <= 12
FIELDPUT(k++,A_Kpr[j])
ELSE
APPEND BLANK
FIELDPUT(1,M_KodIst)
k=2
FIELDPUT(k ,A_Kpr[j])
ENDIF
NEXT
p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)
@24,0 SAY STR(p,3)+"%" COLOR
"w+/r+"
@24,4 SAY REPLICATE("-",0.76*p)
COLOR "rb+/n"
NEXT
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
GenNtxObj(.T.)
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
GenNtxPro(.T.)
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
GenNtxPrp(.T.)
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
GenNtxOin(.T.)
@24,0 SAY
REPLICATE("-",80) COLOR "rb/n"
Mess = " ПРОЦЕСС
ГЕНЕРАЦИИ ЗАВЕРШЕН УСПЕШНО !!! "
@24,40-LEN(Mess)/2 SAY Mess
COLOR "rg+/rb"
INKEY(0)
RESTSCREEN(0,0,24,79,scr23)
CLOSE ALL
RETURN
Алгоритм выполнения задания 1:
Шаг 0. Вход.
Шаг 1. Выполнить генерацию классификационных и описательных шкал и градаций, а также обучающей выборки при минимальном объеме обучающей выборки (например, при 2-х объектах).
Шаг 2. Произвести синтез модели.
Шаг 3. Скопировать обучающую выборку в распознаваемую.
Шаг 4. Произвести распознавание.
Шаг 5. Измерить внутреннюю интегральную валидность и занести информацию о параметрах случайной модели в Excel.
Шаг 6. Увеличить объем обучающей выборки на величину "Дельта".
Шаг 7. Если объем обучающей выборки меньше максимума, то перейти на шаг 2, иначе – на шаг 8.
Шаг 8. Выход.
Учащимся предлагается выполнить приведенный алгоритм самостоятельно.
1. Что такое "случайная модель"?
2. Почему необходимо исследовать свойства случайной модели?
3. Какие средства для генерации и исследования случайных моделей есть в системе "Эйдос"?
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. – 280с.
2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.