ЧАСТЬ II. ЛАБОРАТОРНЫЙ ПРАКТИКУМ

2.1. СООТВЕТСТВИЕ ЛАБОРАТОРНЫХ РАБОТ РАБОЧИМ ПРОГРАММАМ ПО СПЕЦИАЛЬНОСТЯМ

 

В соответствии  с рабочими программами при обучении по специальностям:

351401 "Прикладная информатика в экономике";

351403 "Прикладная информатика в юриспруденции"

рекомендуется несколько различные наборы лабораторных работ, приведенные в таблицах 40 и 41.

 

Таблица 40 – ЛАБОРАТОРНЫЕ РАБОТЫ,
РЕКОМЕНДУЕМЫЕ ПО СПЕЦИАЛЬНОСТИ:

351401 – Прикладная информатика в экономике

№ п/п

Наименование

Часов

1

ЛР-1: "Прогнозирование вероятных пунктов  назначения железнодорожных составов"

8

2

ЛР-2: "Прогнозирование учебных достижений студентов на основе их имеджевых фотороботов"

4

3

ЛР-5: "Идентификация слов по входящим в них буквам"

4

4

ЛР-7: "Идентификация и классификация  натуральных чисел по их свойствам"

4

5

ЛР-8: "Идентификация трехмерных тел  по их ортогональным проекциям"

4

6

ЛР-9: "Прогнозирование количественных  и качественных результатов выращивания зерновых колосовых и поддержка принятия решений по выбору агротехнологий"

4

7

ЛР-10: "Исследование случайной семантической информационной модели при различных объемах выборки"

4

 

Всего:

32

 

Таблица 41 – ЛАБОРАТОРНЫЕ РАБОТЫ,
РЕКОМЕНДУЕМЫЕ ПО СПЕЦИАЛЬНОСТИ:

351403 – Прикладная информатика в юриспруденции

№ п/п

Наименование

Часов

1

ЛР-1: "Прогнозирование вероятных пунктов  назначения железнодорожных составов"

8

2

ЛР-2: "Прогнозирование учебных достижений студентов на основе их имеджевых фотороботов"

4

3

ЛР-3: "Прогнозирование учебных достижений студентов на основе особенностей их почерка"

4

4

ЛР-4: "Прогнозирование учебных достижений студентов на основе информации об их социальном статусе"

4

5

ЛР-6: "Атрибуция анонимных  и псевдонимных текстов"

4

6

ЛР-9: "Прогнозирование количественных  и качественных результатов выращивания зерновых колосовых и поддержка принятия решений по выбору агротехнологий"

4

7

ЛР-10: "Исследование случайной семантической информационной модели при различных объемах выборки"

4

 

Всего:

32

На первую лабораторную работу отводится 8 часов, т.к. на ней у учащихся  будут формироваться первичные умения по применению универсальной когнитивной аналитической системы "Эйдос", которые на последующих лабораторных работах должны быть развиты и доведены до уровня навыков.

По технологии выполнения лабораторные работы имеют много общего, не смотря на различное содержание заданий. Это позволяет освоить эту технологию в общем виде на таком уровне, который в принципе позволяет учащимся самостоятельно осуществить формальную постановку и решение прикладной задачи применения систем искусственного интеллекта, независимо от предметной области. Кроме того, при такой структуре занятий материал лучше усваивается теми учащимися, которые пропускали занятия, что является реальностью, которую также необходимо учитывать.

 

2.2. СТРУКТУРА ЛАБОРАТОРНОЙ РАБОТЫ,
ПОРЯДОК ЕЕ УСТАНОВКИ, ВЫПОЛНЕНИЯ И СДАЧИ

 

2.2.1. Структура лабораторной работы

 

Лабораторные работы имеют типовую структуру, включающую следующие разделы:

– краткая теория;

– одно или несколько заданий;

– пример решения;

– контрольные вопросы;

– литература по данной лабораторной работе.

В разделе "Краткая теория" излагается минимум теоретических понятий, необходимых для осмысленного выполнения студентом данной работы.

В разделе "Задание" ставится цель лабораторной работы и формулируются этапы ее достижения.

В разделе "Пример решения" приводятся примеры выполнения некоторых этапов сформулированных заданий. Примеры выполнения служат для пояснения наиболее сложных этапов выполнения работы и не должны тождественно повторяться студентами в своих лабораторных работах.

Контрольные вопросы по лабораторной работе служат для проверки качества усвоения и понимания материала, могут быть заданы преподавателем при защите лабораторной работы и включены в экзаменационные билеты.

В разделе "Литература" приводятся конкретные литературные источники, использованные при разработке данной лабораторной работы.

 

2.2.2. Инструкция по установке лабораторной работы

 

Предварительно дадим некоторые пояснения. На учебных компьютерах, на которых проводятся лабораторные работы, на запись доступна только директория C:\WORK (или C:\STUDENT, далее будем упоминать только директорию C:\WORK). Система "Эйдос" и базы данных, подготовленные для проведения лабораторных работ, находятся не в этой директории, а в директории C:\AIDOS на диске C, которая доступна только на чтение, соответственно в поддиректориях C:\AIDOS\SYSTEM\  и  C:\AIDOS\LAB_RAB\.

Это сделано для того, чтобы студенты не могли нарушить исполнимый код системы "Эйдос", а также содержание учебного пособия и баз данных лабораторных работ (что, как показывает опыт преподавания, происходит незамедлительно, если директории, где находятся эти файлы, доступны на запись). Поэтому перед выполнением каждой лабораторной работы необходимо установить в директорию C:\WORK сначала саму систему "Эйдос", а затем в директорию, где она находится – базы данных выполняемой лабораторной работы. Это можно рассматривать как своеобразную плату за неуместную активность студентов.

Здесь необходимо отметить, что:

– текущая версия системы "Эйдос" (12.5) работает с базами данных, находящимися в той же директории, где установлена сама система;

– поскольку при работе системы ее базы данных модифицируются, то рабочая директория системы "Эйдос" должна быть доступна на запись.

 

ИНСТРУКЦИЯ
по установке системы "Эйдос" и баз данных лабораторной работы

 

1. Скопировать любым файл-менеджером поддиректорию SYSTEM (целиком, а не файлы находящиеся в ней) из директории AIDOS на диске С в поддиректорию C:\WORK.

2. Скопировать все файлы из указанной преподавателем поддиректории директории C:\AIDOS\LAB_RAB\ с подготовленными базами данных выполняемой лабораторной работы (или со своего носителя, в случае продолжения лабораторной работы) в поддиректорию C:\WORK\SYSTEM. При этом файлы копируются "поверх", т.е. с заменой имеющихся в этой директории.

3. Войти в директорию C:\AIDOS\SYSTEM\ и запустить на исполнение систему "Эйдос". Исполнимый модуль запуска системы называется AIDOS.EXE.

4. Во 2-м режиме 7-й подсистемы системы "Эйдос" выполнить переиндексацию всех баз данных.

5. В 4-м подрежиме 1-го режима 7-й подсистемы системы "Эйдос" сгенерировать базы данных распознаваемых анкет.

6. В 3-м подрежиме 1-го режима 7-й подсистемы системы "Эйдос" сгенерировать базы данных обучающей информации (по указанию преподавателя).

7. Перед окончанием занятия, в случае если планируется продолжить данную работу на следующем занятии, скопировать следующие базы данных на дискету или flash-диск: object.dbf, priz_per.dbf, priz_ob.dbf, obinfzag.dbf, obinfkpr.dbf.

 

 

 

 

2.2.3. Выполнение и сдача лабораторной работы

 

Выполняются лабораторные работы, как правило, студентами индивидуально. В качестве исключения (при недостатке компьютеров в классе) допускается выполнение одной работы небольшими группами по 2-3 студента.

Сдаются лабораторные работы студентами только индивидуально в форме:

– демонстрации и объяснению преподавателю созданного ими приложения на компьютере непосредственно в среде используемой интеллектуальной информационной системы;

– предъявления и анализа сгенерированных в системе текстовых и графических выходных форм (в виде файлов);

– ответов на контрольные вопросы к данной лабораторной работе и на понимание базовых понятий.

 

 

2.3. МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ПРОВЕДЕНИЯ ЛАБОРАТОРНЫХ РАБОТ В КОМПЬЮТЕРНОМ КЛАССЕ

 

2.3.1. Материально-техническое обеспечение

 

Для проведения лабораторных работ по дисциплине "Интеллектуальные информационные системы" необходим компьютерный класс с учебной доской, оснащенный 30 рабочими местами в составе:

1. Стол.

2. Стул или кресло.

3. ИБМ-совместимый персональный компьютер класса Pentium IV с монитором не менее 17 дюймов, оперативной памятью не менее 256 Мб и вешней памятью не менее 80 Гб.

Все рабочие места должны быть объединены в локальную сеть не менее 100 Мбит/с с выходом в Internet.

 

2.3.2. Общее программное обеспечение

 

2.3.2.1. Операционные системы:

MS DOS

MS Windows.

2.3.2.2. Программы под MS Windows

MS Word – текстовый редактор;

MS Excel – табличный процессор;

PhotoShop – графический редактор;

Windows & Total Commmander.

2.3.2.3. Программы под MS DOS

Norton Commander (NC) – файл-менеджер;

MultiEdit (ME) – текстовый редактор.

 

2.3.3. Специальное программное обеспечение

 

При выполнении лабораторных работ и заданий по самостоятельной работе студентов используется следующее специальное программное обеспечение:

– Универсальная когнитивная аналитическая система "Эйдос" версии 12.5 или выше.

– Нейросетевой пакет Neuro Office фирмы "АЛЬФА-СИСТЕМ" (C`Петербург).

 

2.4. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
К ЛАБОРАТОРНЫМ РАБОТАМ

 

ЛР-1:
"Прогнозирование вероятных пунктов
назначения железнодорожных составов"

 

Краткая теория

Данная задача взята из книги Д.Мичи и Р.Джонстона "Компьютер – творец" (c.205-208), в которой она приводится в качестве примера задачи, решаемой методами искусственного интеллекта. Авторами этой задачи являются Рышард Михальски и Джеймс Ларсон.

Суть этой задачи сводится к тому, чтобы выработать правила, обеспечивающие идентификацию железнодорожных составов и прогнозирование направления их следования на основе их формализованных или вербальных описаний.

Выбор данной задачи не накладывает ограничений на выводы, полученные в результате ее исследования. Это обусловлено тем, что она имеет ряд характерных особенностей, наблюдающихся в подобных задачах в самых различных предметных областях. Поэтому ее с полным основанием можно рассматривать как типовую для широкого класса задач идентификации и прогнозирования.

Эти особенности состоят в следующем:

1. Рассматривается ряд объектов, имеющих сложную многоуровневую структуру признаков.

2. Для каждого из этих объектов известно, к каким обобщенным категориям (классам) он относится.

3. Необходимо сформировать модель, обеспечивающую как идентификацию объектов, так и определение их принадлежности к обобщенным классам.

Если признаки и классы относятся к одному времени, то имеет место задача идентификации (распознавания). Если же признаки (факторы, причины) относятся к прошлому, а классы, характеризующие состояния объектов, – к будущему, то это задача прогнозирования. Математически эти задачи не отличаются.

Существуют различные подходы к решению данной задачи, отличающиеся способами формализации предметной области, объектов обучающей выборки и синтеза математической модели.

В данной работе мы исследуется два основных подхода:

1. "Классический", основанный на изучении объектов предметной области экспертами (когнитивный анализ), выделении признаков объектов и формировании описательных шкал и градаций, которым соответствуют уникальные коды.

2. "Лингвистический", в котором вербальные описания объектов предметной области на естественном языке используются для автоматизированной формализации предметной области, формирования обучающей выборки и синтеза модели.

Кратко рассмотрим реализацию обоих этих подходов в интеллектуальной технологии "Эйдос" [64]. Исходные данные к задаче представлены  в графической форме (рисунок 93).

 

Рисунок 93. Примеры поездов, идущих на запад и на восток

 

Железнодорожный состав является сложным объектом, имеющим несколько иерархических уровней и допускающим, соответственно, несколько уровней описания. Некоторые из этих уровней приведены в таблице 42.

Можно, например, описывать составы с использованием шкал только 2-го или только 3-го уровней. Возможны и смешанные варианты.

1-й вариант соответствует представлению о том, что на запад или восток идут не составы, а отдельные вагоны (отличающиеся типом и грузом), а состав идет туда же, куда и большинство вагонов.

2-й вариант предполагает, что составы как бы не состоят из различных вагонов с различными грузами, а свойства вагонов и грузов являются свойствами непосредственно состава.

 

Таблица 42 – УРОВНИ ОПИСАНИЯ ЖЕЛЕЗНОДОРОЖНЫХ СОСТАВОВ

Уровень описания

Шкала

Градация

1.

На уровне направления движения состава

Направление движения состава

Запад

Восток

2.

На уровне

поезда

Количество вагонов

в составе

2

3

4

Типы вагонов
с грузами

Закодировать все варианты

Порядок вагонов в составе: код 1-го вагона, код 2-го вагона и т.д.

 

3.

На уровне

признаков

вагонов и грузов

Форма вагона

V-образная

Прямоугольная

Ромбовидная

U-образная

Эллипсоидная

Длина вагона

Короткий

Длинный

Количество осей
вагона

2

3

Вид стенок вагона

Одинарные

Двойные

Вид крыши

Отсутствует

Гофрированная

Двухскатная

Прямая (эллипсоидная)

Вид и количество
груза

1 большой круг

2 маленьких круга

3 маленьких круга

1 квадрат

3 квадрата

1 короткий прямоугольник

2 коротких прямоугольника

1 длинный прямоугольник

1 треугольник

1 перевернутый треугольник

1 ромб

1 шестиугольник

Груз отсутствует

Необходимо отметить, что сравнительно небольшое количество признаков вагонов обеспечивает огромное количество различных типов вагонов с различными сочетаниями этих признаков, из которых реально в приведенных составах встречается лишь незначительная часть. Очевидно, существует еще большее число вариантов сочетаний различных типов вагонов с видами грузов, порядков следования вагонов и грузов друг за другом и т.п. Из этого следуют по крайней мере два основных вывода:

1. Составить исчерпывающий справочник для описания состава на 2-м уровне, в котором бы указывались все варианты сочетаний различных типов вагонов с различными грузами, на практике довольно трудоемко и вряд ли целесообразно (из-за его огромной размерности).

2. Реально встречающиеся в составах сочетания типов вагонов и видов грузов практически все будут являться уникальными, что обеспечит однозначную идентификацию составов, если их описывать только на 2-м уровне. Это превращает задачу в тривиальную. Поэтому будем рассматривать описание составов на 3-м уровне с элементами 2-го.

Вербальные описания железнодорожных составов практически на естественном языке являются их лингвистическими моделями, которые могут обрабатываться в системе "Эйдос". При этом в справочники будут заноситься, причем автоматически, только реально встретившиеся признаки составов.

Рассмотрим классический и лингвистический подходы на примере решения задач 1 и 2.

Задача 1

1. Формализовать задачу, создав классификационные и описательные шкалы (с использованием таблицы 42) и обучающую выборку на основе рисунка 93.

2. Осуществить синтез и верификацию модели.

3. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портреты классов").

4. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

5. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.

Задача 2

1. Создать стандартизированные (с использованием исходных данных, приведенных на рисунке 93) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB в виде: ####-zap.txt и ####-vos.txt.

2. Сгенерировать классификационные и описательные шкалы в режиме: "Автоввод первичных признаков и TXT-файлов", "Признаки – слова".

3. Сгенерировать обучающую выборку с использованием режима: "Ввод – корректировка обучающей выборки", "F7 InpTXT", "F6 Ввод из всех файлов". Дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток".

4. Осуществить синтез и верификацию семантической информационной модели.

5. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портеры классов").

6. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

7. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Отобразить в графической форме семантические сети составов, построить классические когнитивные карты для составов, идущих на запад и на восток.

Пример решения задачи 1
Пример решения задания 1.1: "Формализовать задачу, создав классификационные и описательные шкалы и обучающую выборку"

Для этих целей используем таблицу 43 и рисунок 93. В результате получим таблицы 43 и 44.

 

Таблица 43 – КЛАССИФИКАЦИОННЫЕ
И ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

КЛАССЫ

ПРИЗНАКИ

Таблица 44 – ОБУЧАЮЩАЯ ВЫБОРКА

Наименование состава

Коды классов

Коды признаков

1

Состав-1

1

3

3

5

5

5

5

9

9

10

10

11

11

11

12

13

13

13

13

15

15

15

17

19

29

27

23

 

 

 

 

 

 

 

 

2

Состав-2

1

4

2

5

4

7

9

9

9

2

2

2

13

13

13

15

15

18

20

24

27

 

 

 

3

Состав-3

1

5

2

5

6

5

10

9

9

12

11

11

13

13

13

18

18

15

28

27

19

 

 

 

4

Состав-4

1

6

3

5

8

5

4

9

9

9

9

13

13

13

14

15

15

15

18

22

29

27

27

11

11

11

11

 

 

 

 

 

 

 

 

5

Состав-5

1

7

2

5

5

5

9

9

10

11

11

12

13

13

14

18

18

15

19

26

27

 

 

 

6

Состав-6

2

8

1

5

5

9

10

11

11

13

13

15

18

27

21

 

 

 

 

 

 

 

 

 

7

Состав-7

2

9

2

5

5

7

10

9

9

11

11

11

13

13

14

16

15

15

31

27

19

 

 

 

8

Состав-8

2

10

1

7

5

9

10

11

12

19

26

15

18

13

13

 

 

 

 

 

 

 

 

 

9

Состав-9

2

11

3

4

4

5

5

9

9

9

10

11

11

11

11

13

13

13

13

15

15

15

16

19

24

26

19

 

 

 

 

 

 

 

 

10

Состав-10

2

12

1

5

7

9

10

11

11

13

13

15

15

25

24

 

 

 

 

 

 

 

 

 

 

Пример решения задачи 2
Пример решения задания 2.1: "Создать стандартизированные текстовые описания составов в виде отдельных файлов стандарта DOS-текст"

Создать стандартизированные (с использованием рисунка 1) текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB с именами вида: ####-zap.txt и ####-vos.txt, где #### – номер анкеты (состава): 0001, 0002 и т.д., а остальные символы – произвольные, но выбираются таким образом, чтобы они отражали содержание анкеты.

 

0001-VOS.TXT

Кол-во_вагонов=4

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=3

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_двухскатная

груз_1_большой_круг

груз_1_шестиугольник

груз_1_треугольник

груз_3_квадрата

0002-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_V-образная

форма_вагона_U-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_2_маленьких_круга

груз_1_короткий_прямоугольник

груз_1_треугольник

0003-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_ромбовидная

длина_вагона_длинный

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=3

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_прямая

крыша_вагона_прямая

груз_1_большой_круг

груз_1_треугольник

груз_1_перевернутый_треугольник

0004-VOS.TXT

Кол-во_вагонов=4

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_эллипсоидная

форма_вагона_V-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_двойные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_1_квадрат

груз_1_треугольник

груз_1_треугольник

груз_1_ромб

0005-VOS.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=3

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_двойные

крыша_вагона_отсутствует

крыша_вагона_прямая

крыша_вагона_прямая

груз_1_большой_круг

груз_1_треугольник

груз_1_длинный_прямоугольник

0006-ZAP.TXT

Кол-во_вагонов=2

форма_вагона_прямоугольная

форма_вагона_прямоугольная

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_3_маленьких_круга

груз_1_треугольник

 

0007-ZAP.TXT

Кол-во_вагонов=3

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_U-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_двойные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_гофрированная

груза_нет

груз_1_большой_круг

груз_1_треугольник

0008-ZAP.TXT

Кол-во_вагонов=2

форма_вагона_прямоугольная

форма_вагона_U-образная

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=3

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_прямая

груз_1_большой_круг

груз_1_длинный_прямоугольник

0009-ZAP.TXT

Кол-во_вагонов=4

форма_вагона_прямоугольная

форма_вагона_прямоугольная

форма_вагона_V-образная

форма_вагона_V-образная

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_отсутствует

крыша_вагона_гофрированная

груз_1_большой_круг

груз_1_большой_круг

груз_1_длинный_прямоугольник

груз_1_короткий_прямоугольник

0010-ZAP.TXT

Кол-во_вагонов=2

форма_вагона_прямоугольная

форма_вагона_U-образная

длина_вагона_короткий

длина_вагона_длинный

N_осей_вагона=2

N_осей_вагона=2

стенки_вагона_одинарные

стенки_вагона_одинарные

крыша_вагона_отсутствует

крыша_вагона_отсутствует

груз_1_короткий_прямоугольник

груз_2_коротких_прямоугольника

 

 

Пример решения задания 2.2: "Сгенерировать классификационные и описательные шкалы"

Для этого используем режим: "F1 Словари – Автоввод первичных признаков и TXT-файлов – F3 Признаки – слова".

Классы во втором задании те же самые, что и в первом. Признаки выглядят несколько иначе, т.к. формируются автоматически из текстовых описаний составов, но по смыслу они также совпадают (таблица 45).

 

 

 

Таблица 45 – КЛАССИФИКАЦИОННЫЕ И ОПИСАТЕЛЬНЫЕ
ШКАЛЫ И ГРАДАЦИИ

КЛАССЫ

=====================================

| Код  | Н а и м е н о в а н и е    |

|класса|   класса распознавания     |

|===================================|

|    1 | Состав следует на ВОСТОК   |

|    2 | Состав следует на ЗАПАД    |

|    3 | Состав-01                  |

|    4 | Состав-02                  |

|    5 | Состав-03                  |

|    6 | Состав-04                  |

|    7 | Состав-05                  |

|    8 | Состав-06                  |

|    9 | Состав-07                  |

|   10 | Состав-08                  |

|   11 | Состав-09                  |

|   12 | Состав-10                  |

=====================================

ПРИЗНАКИ

=======================================

|   1|N_осей_вагона=2                 |

|   2|N_осей_вагона=3                 |

|   3|Кол-во_вагонов=2                |

|   4|Кол-во_вагонов=3                |

|   5|Кол-во_вагонов=4                |

|   6|груз_1_большой_круг             |

|   7|груз_1_длинный_прямоугольник    |

|   8|груз_1_квадрат                  |

|   9|груз_1_короткий_прямоугольник   |

|  10|груз_1_перевернутый_треугольник |

|  11|груз_1_ромб                     |

|  12|груз_1_треугольник              |

|  13|груз_1_шестиугольник            |

|  14|груз_2_коротких_прямоугольника  |

|  15|груз_2_маленьких_круга          |

|  16|груз_3_квадрата                 |

|  17|груз_3_маленьких_круга          |

|  18|груза_нет                       |

|  19|длина_вагона_длинный            |

|  20|длина_вагона_короткий           |

|  21|крыша_вагона_гофрированная      |

|  22|крыша_вагона_двухскатная        |

|  23|крыша_вагона_отсутствует        |

|  24|крыша_вагона_прямая             |

|  25|стенки_вагона_двойные           |

|  26|стенки_вагона_одинарные         |

|  27|форма_вагона_U-образная         |

|  28|форма_вагона_V-образная         |

|  29|форма_вагона_прямоугольная      |

|  30|форма_вагона_ромбовидная        |

|  31|форма_вагона_эллипсоидная       |

=======================================

 

Пример решения задания 2.3: "Сгенерировать обучающую выборку"

Используем режим: "F2 Обучение – Ввод – корректировка обучающей выборки – F7 InpTXT – F6 Ввод из всех файлов". Затем необходимо дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток". Обучающая выборка будет иметь вид, приведенный в таблице 46.

 

Таблица 46 – ОБУЧАЮЩАЯ ВЫБОРКА

Этапы синтеза модели, ее оптимизации, проверки адекватности (которая в данном случае равна 100 %) и анализа подробно описаны в работах [64, 92]. Поэтому в данной работе мы приведем лишь их результаты.

 

Пример решения задания 2.4: "Осуществить синтез и верификацию семантической информационной модели"

Основная матрица семантической информационной модели приведена в таблице 47.

 

Таблица 47 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ

Атр

Коды классов

Сум.

Ср.

Отк.

1

2

3

4

5

6

7

8

9

10

11

12

1

-0,03

0,03

-0,08

0,09

-0,16

0,09

-0,16

0,07

0,09

-0,35

0,09

0,07

-0,23

-0,02

0,14

2

0,17

-0,34

0,39

 

0,55

 

0,55

 

 

0,78

 

 

2,11

0,18

0,32

3

 

0,5

 

 

 

 

 

0,96

 

0,96

 

0,96

3,37

0,28

0,43

4

0,17

-0,34

 

0,55

0,55

 

0,55

 

0,55

 

 

 

2,05

0,17

0,30

5

0,1

-0,16

0,56

 

 

0,56

 

 

 

 

0,56

 

1,62

0,14

0,26

6

-0,16

0,16

0,05

 

0,22

 

0,22

 

0,22

0,44

0,47

 

1,60

0,13

0,19

7

-0,32

0,26

 

 

 

 

0,73

 

 

0,96

0,56

 

2,18

0,18

0,37

8

0,35

 

 

 

 

1,22

 

 

 

 

 

 

1,57

0,13

0,36

9

-0,32

0,26

 

0,73

 

 

 

 

 

 

0,56

0,96

2,18

0,18

0,37

10

0,35

 

 

 

1,39

 

 

 

 

 

 

 

1,74

0,14

0,40

11

0,35

 

 

 

0

1,22

 

 

 

 

 

 

1,57

0,13

0,36

12

0,17

-0,34

-0,03

0,13

0,13

0,39

0,13

0,36

0,13

 

 

 

1,09

0,09

0,19

13

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

14

 

0,5

 

 

 

 

 

 

 

 

 

1,62

2,12

0,18

0,48

15

0,35

 

 

1,39

 

 

 

 

 

 

 

 

1,74

0,14

0,40

16

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

17

 

0,5

 

 

 

 

 

1,62

 

 

 

 

2,12

0,18

0,48

18

 

0,5

 

 

 

 

 

0

1,39

 

 

 

1,89

0,16

0,41

19

-0,14

0,15

0,32

 

0,06

 

0,06

0,29

0,06

0,29

-0,1

0,29

1,29

0,11

0,16

20

0,06

-0,08

-0,2

0,22

-0,03

0,22

-0,03

-0,22

-0,03

-0,22

0,05

-0,22

-0,48

-0,04

0,16

21

 

0,5

 

 

 

 

 

 

0,97

 

0,81

 

2,28

0,19

0,36

22

0,35

 

1,22

 

 

 

 

 

 

 

 

 

1,57

0,13

0,36

23

-0,04

0,05

0,11

0,03

-0,39

0,11

-0,39

-0,16

0,03

-0,16

0,11

0,26

-0,43

-0,04

0,20

24

0,17

-0,34

 

0,13

0,55

-0,03

0,55

0,36

 

0,36

 

 

1,77

0,15

0,27

25

0,1

-0,16

 

 

 

0,56

0,73

 

0,73

 

 

 

1,95

0,16

0,31

26

-0,01

0,01

0,07

0,06

0,06

-0,1

-0,18

0,05

-0,18

0,05

0,07

0,05

-0,05

0,00

0,10

27

-0,49

0,33

 

0,55

 

 

 

 

0,55

0,78

 

0,78

2,51

0,21

0,39

28

-0,07

0,08

 

0,55

 

0,39

 

 

 

 

0,81

0

1,76

0,15

0,28

29

0,04

-0,05

0,25

-0,42

 

-0,17

0,24

0,23

 

-0,19

-0,17

-0,19

-0,42

-0,03

0,21

30

0,35

 

 

 

1,39

 

 

 

 

 

 

 

1,74

0,14

0,40

31

0,35

 

 

 

 

1,22

 

 

 

 

 

 

1,57

0,13

0,36

Сум.

2,53

2,01

5,12

4,02

4,34

5,70

3,01

3,56

4,51

3,71

3,82

4,58

46,91

 

 

Ср.

0,08

0,06

0,17

0,13

0,14

0,18

0,10

0,12

0,15

0,12

0,12

0,15

 

0,13

 

Отк.

0,22

0,25

0,38

0,32

0,38

0,39

0,26

0,35

0,34

0,33

0,26

0,39

 

 

0,33

 

Пример решения задания 2.5 "Провести анализ модели, сформулировав правила для прогнозирования направления движения составов"

В подсистеме: "Типология", "Информационные портеры классов" системы "Эйдос" получаем следующие информационные портреты классов (таблицы 48 и 49).

 

 ТАБЛИЦА 48ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА РАСПОЗНАВАНИЯ:
Код:    1   Наименование: Состав следует на ВОСТОК

08-11-04  18:48:42      Фильтр: All, Positive       г.Краснодар

===============================================================

| N |Код |    Н а и м е н о в а н и я   |Инфор-|Инфор-|Суммар |

|п/п|приз|       п р и з н а к о в      |мат-ть|мат-ть|инф-ть |

|   |нака|                              | Бит. |  %   |  %%   |

|=============================================================|

|  1    8 груз_1_квадрат................. 0.347   9.67    9.7 |

|  2   10 груз_1_перевернутый_треугольник 0.347   9.67   19.3 |

|  3   11 груз_1_ромб.................... 0.347   9.67   29.0 |

|  4   13 груз_1_шестиугольник........... 0.347   9.67   38.7 |

|  5   15 груз_2_маленьких_круга......... 0.347   9.67   48.4 |

|  6   16 груз_3_квадрата................ 0.347   9.67   58.0 |

|  7   22 крыша_вагона_двухскатная....... 0.347   9.67   67.7 |

|  8   30 форма_вагона_ромбовидная....... 0.347   9.67   77.4 |

|  9   31 форма_вагона_эллипсоидная...... 0.347   9.67   87.0 |

| 10    2 N_осей_вагона=3................ 0.173   4.82   91.8 |

| 11    4 Кол-во_вагонов=3............... 0.173   4.82   96.7 |

| 12   12 груз_1_треугольник............. 0.173   4.82  101.5 |

| 13   24 крыша_вагона_прямая............ 0.173   4.82  106.3 |

| 14    5 Кол-во_вагонов=4............... 0.102   2.84  109.2 |

| 15   25 стенки_вагона_двойные.......... 0.102   2.84  112.0 |

| 16   20 длина_вагона_короткий.......... 0.057   1.59  113.6 |

| 17   29 форма_вагона_прямоугольная..... 0.038   1.07  114.7 |

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

| 18   26 стенки_вагона_одинарные........-0.008  -0.23  114.9 |

| 19    1 N_осей_вагона=2................-0.027  -0.75  115.6 |

| 20   23 крыша_вагона_отсутствует.......-0.041  -1.14  116.8 |

| 21   28 форма_вагона_V-образная........-0.072  -2.00  118.8 |

| 22   19 длина_вагона_длинный...........-0.143  -3.99  122.8 |

| 23    6 груз_1_большой_круг............-0.165  -4.60  127.4 |

| 24    7 груз_1_длинный_прямоугольник...-0.316  -8.83  136.2 |

| 25    9 груз_1_короткий_прямоугольник..-0.316  -8.83  145.0 |

| 26   27 форма_вагона_U-образная........-0.490 -13.67  158.7 |

===============================================================

Универсальная когнитивная аналитическая система     НПП *ЭЙДОС*

 

 

 

 

 ТАБЛИЦА 49 – ВЛИЯНИЕ ПРИЗНАКОВ
НА РЕЗУЛЬТАТ ПРОГНОЗИРОВАНИЯ:
"НАПРАВЛЕНИЕ СЛЕДОВАНИЯ  – НА ЗАПАД"

ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА РАСПОЗНАВАНИЯ:

Код:    2   Наименование: Состав следует на ЗАПАД

08-11-04  18:49:04       Фильтр: All, Positive      г.Краснодар

===============================================================

| N |Код |    Н а и м е н о в а н и я   |Инфор-|Инфор-|Суммар |

|п/п|приз|       п р и з н а к о в      |мат-ть|мат-ть|инф-ть |

|   |нака|                              | Бит. |  %   |  %%   |

|=============================================================|

|  1    3 Кол-во_вагонов=2..............  0.500  13.94   13.9 |

|  2   14 груз_2_коротких_прямоугольника  0.500  13.94   27.9 |

|  3   17 груз_3_маленьких_круга........  0.500  13.94   41.8 |

|  4   18 груза_нет.....................  0.500  13.94   55.8 |

|  5   21 крыша_вагона_гофрированная....  0.500  13.94   69.7 |

|  6   27 форма_вагона_U-образная.......  0.326   9.10   78.8 |

|  7    7 груз_1_длинный_прямоугольник..  0.255   7.12   85.9 |

|  8    9 груз_1_короткий_прямоугольник.  0.255   7.12   93.0 |

|  9    6 груз_1_большой_круг...........  0.162   4.52   97.6 |

| 10   19 длина_вагона_длинный..........  0.145   4.05  101.6 |

| 11   28 форма_вагона_V-образная.......  0.082   2.27  103.9 |

| 12   23 крыша_вагона_отсутствует......  0.049   1.36  105.2 |

| 13    1 N_осей_вагона=2...............  0.033   0.93  106.2 |

| 14   26 стенки_вагона_одинарные.......  0.010   0.29  106.5 |

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

| 15   29 форма_вагона_прямоугольная.... -0.053  -1.48  107.9 |

| 16   20 длина_вагона_короткий......... -0.083  -2.30  110.2 |

| 17    5 Кол-во_вагонов=4.............. -0.163  -4.55  114.8 |

| 18   25 стенки_вагона_двойные......... -0.163  -4.55  119.3 |

| 19    2 N_осей_вагона=3............... -0.337  -9.40  128.7 |

| 20    4 Кол-во_вагонов=3.............. -0.337  -9.40  138.1 |

| 21   12 груз_1_треугольник............ -0.337  -9.40  147.5 |

| 22   24 крыша_вагона_прямая........... -0.337  -9.40  156.9 |

===============================================================

Универсальная когнитивная аналитическая система     НПП *ЭЙДОС*

 

Пример решения задания 2.6: "Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи"

В подсистеме "Оптимизация" режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава (таблица 50).

 

 

 

 

 

Таблица 50 – ПРИЗНАКИ В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ

08-11-04            18:49:35                         г.Краснодар

================================================================

| N° | Код |    Н а и м е н о в а н и е    |Ценн.|Сумма| Сумма |

|п/п |п.пр.|       п р и з н а к о в       | Бит | Бит |   %   |

================================================================

|   1|  14 |груз_2_коротких_прямоугольника.|0.476|0.476|  4.888|

|   2|  17 |груз_3_маленьких_круга.........|0.476|0.953|  9.776|

|   3|   3 |Кол-во_вагонов=2...............|0.431|1.384| 14.201|

|   4|  18 |груза_нет......................|0.414|1.798| 18.448|

|   5|  10 |груз_1_перевернутый_треугольник|0.405|2.202| 22.599|

|   6|  15 |груз_2_маленьких_круга.........|0.405|2.607| 26.750|

|   7|  30 |форма_вагона_ромбовидная.......|0.405|3.011| 30.901|

|   8|  27 |форма_вагона_U-образная........|0.388|3.399| 34.885|

|   9|   7 |груз_1_длинный_прямоугольник...|0.372|3.772| 38.705|

|  10|   9 |груз_1_короткий_прямоугольник..|0.372|4.144| 42.526|

|  11|   8 |груз_1_квадрат.................|0.358|4.502| 46.203|

|  12|  11 |груз_1_ромб....................|0.358|4.861| 49.881|

|  13|  13 |груз_1_шестиугольник...........|0.358|5.219| 53.559|

|  14|  16 |груз_3_квадрата................|0.358|5.577| 57.236|

|  15|  22 |крыша_вагона_двухскатная.......|0.358|5.936| 60.914|

|  16|  31 |форма_вагона_эллипсоидная......|0.358|6.294| 64.591|

|  17|  21 |крыша_вагона_гофрированная.....|0.358|6.652| 68.266|

|  18|   2 |N_осей_вагона=3................|0.323|6.975| 71.577|

|  19|  25 |стенки_вагона_двойные..........|0.315|7.290| 74.807|

|  20|   4 |Кол-во_вагонов=3...............|0.304|7.594| 77.927|

|  21|  28 |форма_вагона_V-образная........|0.280|7.873| 80.797|

|  22|  24 |крыша_вагона_прямая............|0.266|8.139| 83.523|

|  23|   5 |Кол-во_вагонов=4...............|0.263|8.402| 86.224|

|  24|  29 |форма_вагона_прямоугольная.....|0.206|8.608| 88.340|

|  25|  23 |крыша_вагона_отсутствует.......|0.201|8.809| 90.403|

|  26|  12 |груз_1_треугольник.............|0.191|9.000| 92.358|

|  27|   6 |груз_1_большой_круг............|0.190|9.190| 94.307|

|  28|  19 |длина_вагона_длинный...........|0.160|9.350| 95.954|

|  29|  20 |длина_вагона_короткий..........|0.158|9.508| 97.573|

|  30|   1 |N_осей_вагона=2................|0.141|9.649| 99.015|

|  31|  26 |стенки_вагона_одинарные........|0.096|9.745|100.000|

================================================================

Универсальная когнитивная аналитическая система      НПП *ЭЙДОС*

 

Накопительная диаграмма селективной силы (Парето-диаграмма) приведена на рисунке 94.

 

Рисунок 94. Парето-диаграмма ценности признаков для решения задач
идентификации, прогнозирования и управления

 

 

Пример решения задания 2.7: "Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов. Построить классические когнитивные карты для составов, идущих на запад и на восток"

 

Сравним составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). В подсистеме "Типология" режиме "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов" выводим конструкт: "Идущие на запад" и "Идущие на восток" (рисунки 95 и 96).

 

Рисунок 95. Подсистема "Типология", режим "Типологический анализ классов распознавания – Кластерный и конструктивный анализ – просмотр и печать кластеров и конструктов"

 

Рисунок 96. Конструкт: "Идущие на запад" и "Идущие на восток"

 

Из рисунка 4 видно, что:

– составы 4-й, 1-й и 3-й являются типичными для "Идущих на восток", а 5-й и, особенно 2-й, – нетипичными;

– составы 10-й, 9-й и 8-й являются типичными для "Идущих на запад", а 7-й и, особенно 6-й, – нетипичными.

Выведем в графической форме семантические сети составов.

Семантические сети классов отображают результаты кластерно-конструктивного анализа в графической форме. Для этого используется режим: "Вывод 2d-семантических сетей классов" (рисунок 95). Результат приведен на рисунке 97.

 

Рисунок 97. Семантическая сеть классов

 

Построим классические когнитивные карты для составов, идущих на запад и на восток". В Системе "Эйдос" классическая когнитивная карта строится из двух графических диаграмм:

1. Неклассического нейрона (подсистема "Анализ", режим "Графическое отображение нелокальных нейронов" (рисунок 98)).

2. Семантической сети признаков (подсистема "Типология", режим "Кластерный и конструктивный анализ признаков – вывод 2d-семантических сетей признаков" (рисунок 99)).

 

Рисунок 98. Задание режима
отображения нелокальных
нейронов

Рисунок 99. Задание режима
отображения семантических
сетей признаков

 

Результаты, т.е. когнитивные карты для составов, идущих на восток и запад, приведены на рисунках 100 и 101.

 

Рисунок 100. Когнитивная карта
для составов, идущих на восток

Рисунок 101. Когнитивная карта
для составов, идущих на восток

 

Из этих рисунков видно, что классическая когнитивная карта может быть изображена в форме конуса, но для наглядности изображения большого объема информации его вершина и боковая поверхность показаны в форме нейрона, а основание – в форме семантической сети.

 

Выводы

Таким образом, вербальные описания объектов реальности на естественном языке с полным основанием могут рассматриваются как их иерархические лингвистические модели. Предложены методика и автоматизированная технология, основанные на универсальной когнитивной аналитической системе "Эйдос", которые обеспечивают:

– автоматизированную формализацию предметной области на основе вербального описания ее объектов;

– автоматизированное формирование описательных шкал и градаций;

– автоматизированную генерацию обучающей выборки;

– синтез семантической информационной модели, ее оптимизацию, проверку адекватности и анализ.

Предлагаемые технологии обеспечивают значительную экономию труда и времени по сравнению с традиционным подходом.

Необходимо отметить также, что в системе "Эйдос" реализована полнофункциональная интеллектуальная информационно-поисковая система, обеспечивающая работу по приведенной в работе технологии с объектами, описанными на естественном языке.

 

Контрольные вопросы

1. Что такое классификационные и описательные шкалы и градации?

2. Какие существуют виды шкал?

3. Как шкалы связаны с конструктами и с познанием?

4. Чем обусловлена возможность текстового описания объектов обучающей и распознаваемой выборки на естественном языке?

 

Литература по лабораторной работе

1. Мичи Д., Джонстон Р. Компьютер – творец. – М.: Мир, 1987. –251 с.

2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.

3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). – Краснодар: КЮИ МВД РФ, 1996. – 280 с.


 

ЛР-2:
"Прогнозирование учебных достижений студентов
на основе их имеджевых фотороботов
"

 

Краткая теория

Задачами данной лабораторной работы являются:

1. Продемонстрировать студентам возможность выявления причинно-следственных связей между признаками внешнего вида (описательные шкалы и градации), и их полом, успеваемостью, тем, откуда они родом, обучением в той или иной группе (классификационные шкалы и градации).

2. Сформировать у студентов навыки формализации предметной области, подготовки и ввода обучающей выборки, синтеза информационной семантической модели и проверки ее адекватности, анализа модели (информационные портреты, кластерно-конструктивный анализ, семантические сети и когнитивные диаграммы, графическое отображение векторов классов и признаков).

Задание

1. Формализовать задачу:

– создать классификационные и описательные шкалы;

– собрать исходную фактографическую информацию и ввести в систему обучающую выборку.

2. Осуществить синтез и верификацию модели.

3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

4. Провести анализ модели, дав ответы на следующие вопросы:

– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

– как сказывается пол на посещаемости?

– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;

Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

 

Пример решения

Пример решения задания 1: Формализовать задачу:
Пример решения задания 1.1: Формализовать задачу: создать классификационные и описательные шкалы

Один из вариантов классификационных шкал и градаций представлен в таблице 51, а описательных – в таблице 52:

 

 

Таблица 51 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ

 

Таблица 52 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Пример решения задания 1.2: Формализовать задачу: собрать исходную фактографическую информацию и ввести в систему обучающую выборку

С точки зрения методики организации занятия возможны различные варианты сбора и ввода информации обучающей выборки. Опыт проведения занятий по данной лабораторной работе показал, что с точки зрения экономии времени и обеспечения качества и единого вида обучающей выборки наиболее рациональным является вариант, приведенный ниже.

1. На доске чертится таблица вида 53. Это делается с таким расчетом, чтобы каждому присутствующему студенту группы соответствовала строка.

 

Таблица 53 – ШАБЛОН ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ

Код

Наименование

Классы

Признаки

1

2

3

4

5

6

1

2

3

4

5

6

7

8

9

10

11

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 50 и 52) описать каждому самого себя и занести эту информацию в таблицу 53 на доске. При необходимости количество строк и столбцов в этой таблице можно увеличить.

В результате на доске появляется таблица вида 54. Видно, что по ряду студентов нет описательной информации, а классификационная – минимальна. Это связано с тем, что они отсутствовали на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки. У этих студентов данная работа не была зачтена. При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы:

Object.txt и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 50 и 51.

Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000 и Windowsxp)

3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки".

 

Таблица 54 – ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА
ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ

Код

Наименование

Классы

Признаки

1

2

3

4

5

6

1

2

3

4

5

6

7

8

9

10

11

1

Бабенко ПИ-51

1

4

10

12

13

15

1

5

10

18

27

31

 

 

 

 

 

2

Воробьева ПИ-51

2

5

10

12

13

16

3

7

12

13

18

20

25

26

27

32

 

3

Гура ПИ-51

1

13

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

Гловнев ПИ-51

1

13

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

Дыбова ПИ-51

2

13

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

Жеребятьев ПИ51

1

5

8

12

13

20

2

8

10

18

21

27

30

 

 

 

 

7

Заяц ПИ-51

2

4

10

12

13

21

3

6

12

15

18

21

26

27

31

 

 

8

Иванова ПИ-51

2

3

7

12

13

22

2

5

12

13

14

15

18

21

26

32

 

9

Котенко ПИ-51

2

4

7

12

13

23

1

6

11

13

15

18

21

26

27

32

 

10

Кузина О. ПИ-51

2

3

8

12

13

24

1

7

11

14

18

22

26

27

32

 

 

11

Кузина Я. ПИ-51

2

3

8

12

13

25

1

7

14

17

22

32

 

 

 

 

 

12

Лях ПИ-51

1

3

8

12

13

26

1

5

9

13

17

18

20

24

26

27

31

13

Мясников ПИ-51

1

3

9

12

13

27

1

5

10

13

16

18

20

24

27

32

0

14

Нагапетян ПИ-51

1

4

9

12

13

28

1

6

11

15

18

21

24

26

27

30

0

15

Полонская ПИ-51

2

13

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

Трунина ПИ-51

2

13

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

Черкашина ПИ-51

2

4

10

12

13

31

3

6

11

13

18

21

24

26

27

30

 

18

Чепурченко ПИ51

1

13

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

Чушкин ПИ-51

1

13

33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

Шульгин ПИ-51

1

5

8

12

13

34

1

5

9

17

20

26

30

 

 

 

 

21

Арушунян ПИ-52

1

14

35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22

Быченок ПИ-52

1

14

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

23

Веревкина ПИ-52

2

3

9

12

14

37

1

8

9

15

18

21

28

33

 

 

 

24

Григорьева ПИ52

2

4

8

12

14

38

2

5

9

13

18

22

28

33

 

 

 

25

Давыдич ПИ-52

2

14

39

 

 

 

 

 

 

 

 

 

 

 

 

 

 

26

Дронова ПИ-52

2

14

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

27

Еременко ПИ-52

2

4

8

12

14

41

2

5

12

9

13

15

18

21

26

27

31

28

Жмурко ПИ-52

1

14

42

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29

Иванова ПИ-52

2

3

9

12

14

43

2

4

10

14

15

17

18

20

28

33

 

30

Костенко ПИ-52

2

14

44

 

 

 

 

 

 

 

 

 

 

 

 

 

 

31

Крейс ПИ-52

2

4

8

12

14

45

1

5

9

15

19

21

28

32

 

 

 

32

Куркина ПИ-52

2

3

8

12

14

46

3

6

11

13

15

18

19

22

26

27

32

33

Люлик ПИ-52

2

5

8

12

14

47

2

7

12

15

18

22

24

26

32

 

 

34

Максимов ПИ-52

1

14

48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35

Мануйлов ПИ-52

1

3

7

12

14

49

1

5

9

14

18

20

24

25

26

27

30

36

Нарижний ПИ-52

1

3

7

12

14

50

1

5

9

14

18

20

24

25

26

27

31

37

Ольховская ПИ52

2

14

51

 

 

 

 

 

 

 

 

 

 

 

 

 

 

38

Паршакова ПИ-52

2

6

8

12

14

52

2

6

11

13

19

22

26

32

 

 

 

39

Силенко ПИ-52

1

3

7

12

14

53

1

6

12

13

18

20

28

32

 

 

 

40

Соколова ПИ-52

2

4

8

12

14

54

1

5

12

17

18

22

24

26

27

32

 

41

Турбин ПИ-52

1

14

55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

42

Цисарь ПИ-52

2

5

9

12

14

56

2

7

11

13

18

22

27

33

 

 

 

 

 

Пример решения задания 2: Осуществить синтез и верификацию модели

Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.

Для этого студентам необходимо выполнить следующие действия:

1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД".

2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [64] корреляция".

3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".

 

Пример решения задания 3: Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 102:

 

Рисунок 102. Экранная форма "Селективная сила признаков"

 

Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.

Более подробно эта информация представлена в таблице 55:

 

Таблица 55 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)
В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)

10-10-04            16:15:55                                                  г.Краснодар

=========================================================================================

|N°|Код |Код | Наименование            | Наименование          |Интегр.|Сумм.инт|Сумм.ин|

|  |К.шк|град| классификационной шкалы | градации              |инф-ть |инф. Бит|  в %  |

=========================================================================================

| 1|  5 | 19 |ОДЕЖДА:.................. Юбка...................|  0.470|   0.470|  4.147|

| 2|  3 | 10 |ЦВЕТ ГЛАЗ:............... Голубые................|  0.467|   0.938|  8.271|

| 3|  8 | 30 |ПОСЕЩАЕМОСТЬ:............ Плохая.................|  0.456|   1.393| 12.290|

| 4|  8 | 33 |ПОСЕЩАЕМОСТЬ:............ Очень хорошая..........|  0.438|   1.831| 16.150|

| 5|  2 |  8 |ЦВЕТ ВОЛОС:.............. Очень светлые..........|  0.437|   2.268| 20.002|

| 6|  1 |  3 |ДЛИНА ВОЛОС:............. Длинные................|  0.429|   2.697| 23.788|

| 7|  2 |  7 |ЦВЕТ ВОЛОС:.............. Крашеные...............|  0.421|   3.118| 27.502|

| 8|  1 |  2 |ДЛИНА ВОЛОС:............. Средние................|  0.418|   3.536| 31.192|

| 9|  7 | 28 |ДОСТАТОК:................ Ничего нет.............|  0.413|   3.949| 34.836|

|10|  5 | 17 |ОДЕЖДА:.................. Пиджак.................|  0.408|   4.357| 38.432|

|11|  7 | 25 |ДОСТАТОК:................ Есть автомобиль........|  0.408|   4.765| 42.027|

|12|  4 | 16 |НАЛИЧИЕ УКРАШЕНИЙ:....... Браслет................|  0.404|   5.169| 45.590|

|13|  8 | 31 |ПОСЕЩАЕМОСТЬ:............ Средняя................|  0.400|   5.569| 49.122|

|14|  6 | 22 |МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Заметный...............|  0.399|   5.968| 52.638|

|15|  3 | 11 |ЦВЕТ ГЛАЗ:............... Карие..................|  0.398|   6.365| 56.147|

|16|  2 |  4 |ЦВЕТ ВОЛОС:.............. Очень темные...........|  0.391|   6.757| 59.599|

|17|  2 |  6 |ЦВЕТ ВОЛОС:.............. Каштановые.............|  0.389|   7.146| 63.032|

|18|  4 | 14 |НАЛИЧИЕ УКРАШЕНИЙ:....... Перстень...............|  0.381|   7.527| 66.395|

|19|  3 | 12 |ЦВЕТ ГЛАЗ:............... Зеленые................|  0.367|   7.894| 69.629|

|20|  6 | 20 |МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Отсутствует............|  0.361|   8.255| 72.817|

|21|  3 |  9 |ЦВЕТ ГЛАЗ:............... Серые..................|  0.356|   8.611| 75.958|

|22|  6 | 21 |МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Незаметный.............|  0.352|   8.963| 79.062|

|23|  4 | 15 |НАЛИЧИЕ УКРАШЕНИЙ:....... Серьги.................|  0.337|   9.300| 82.035|

|24|  8 | 32 |ПОСЕЩАЕМОСТЬ:............ Хорошая................|  0.324|   9.625| 84.897|

|25|  2 |  5 |ЦВЕТ ВОЛОС:.............. Русые..................|  0.322|   9.947| 87.739|

|26|  7 | 24 |ДОСТАТОК:................ Есть своя квартира.....|  0.318|  10.265| 90.545|

|27|  1 |  1 |ДЛИНА ВОЛОС:............. Короткие...............|  0.293|  10.558| 93.130|

|28|  4 | 13 |НАЛИЧИЕ УКРАШЕНИЙ:....... Цепочка................|  0.264|  10.822| 95.458|

|29|  7 | 26 |ДОСТАТОК:................ Есть компьютер.........|  0.218|  11.041| 97.384|

|30|  7 | 27 |ДОСТАТОК:................ Есть мобильный телефон.|  0.194|  11.235| 99.097|

|31|  5 | 18 |ОДЕЖДА:.................. Брюки или джинсы.......|  0.102|  11.337|100.000|

|32|  6 | 23 |МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Вызывающий.............|  0.000|  11.337|100.000|

|33|  8 | 29 |ПОСЕЩАЕМОСТЬ:............ Очень плохая...........|  0.000|  11.337|100.000|

=========================================================================================

Универсальная когнитивная аналитическая система                               НПП *ЭЙДОС*

 

Соответствующую логистическую кривую (накопительную селективной силы) можно получит в графической форме нажав на клавишу "F8 График".

 

Пример решения задания 4: Провести анализ модели

Анализ модели позволяет дать обоснованные ответы, например, на следующие вопросы:

1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

2. Как сказывается пол на посещаемости?

3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?

Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

 

 

Пример решения задания 4.1: Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков – Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость – это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 – 10. В результате получим экранную форму, приведенную на рисунке 103:

 

Рисунок 103. Информационный портрет признака:

30 "Посещаемость плохая", фильтр по успеваемости.

 

Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 104.

 

Рисунок 104. Информационный портрет признака:

32 "Посещаемость хорошая", фильтр по успеваемости.

 

Из этих рисунков видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей – высокая,  как и можно было ожидать. НО теперь этот вывод получен непосредственно на основе анализа эмпирических данных и является количественным.

Эту же информацию можно получить и другим способом.

В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе. Выход из настройки по клавише Esc. После этого в экранных формах в виде трехмерных графиков последовательно отображаются информативности выбранной подматрицы, которые имеется возможность записать в форме PCX-файлов, пропустить или распечатать. Некоторые из этих форм представлены на рисунках 105 – 106.

 

 

Рисунок 105. Некоторые варианты отображения подматрицы:
классификационная шкала "Успеваемость"
´ описательная шкала "Посещаемость" в системе "Эйдос"

 

Из анализа этих трехмерных графиков видно, что очень хорошая успеваемость слабо зависит от посещаемости, а низкая – сильно. На основании этого можно сформулировать гипотезу, что хорошая посещаемость может гарантировать от низкой успеваемости, но сама по себе не гарантирует высокой, для достижения которой, видимо, играют важную роль также другие факторы, например, уровень достатка. Чтобы проверить эту гипотезу в подсистеме F6 "Анализ" запустим режим "Просмотр профилей классов и признаков" и поставим курсор на класс: код 7 "Успеваемость – 5 более 75%", а затем нажмем F4 "Профили 2d", F1 "Класс распознавания" и зададим диапазон признаков, градаций описательных шкал: 24-33 (шкалы: "Достаток" и "Посещаемость"). В результате получим графическую форму, представленная на рисунке 106:

 

Рисунок 106. Профиль влияния описательных шкал: "Достаток"
и "Посещаемость" на классификационную шкалу "Успеваемость"

 

Из этой формы видно, что хорошая посещаемость (код 32) положительно влияет на высокую успеваемость примерно также, как наличие квартиры (код 24) и компьютера (код 26), но все эти факторы вместе взятые уступают влиянию одного фактора: "Есть автомобиль" (код 25).

Пример решения задания 4.2: Как сказывается пол на посещаемости?

В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания – Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость – это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти признаки, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 29 – 33. В результате получим экранную форму, приведенную на рисунке 107.

 

Рисунок 107. Информационный портрет класса:

1 "ПОЛ - мужской", фильтр по посещаемости.

 

Аналогично получим информационный портрет класса: код 2, "ПОЛ – женский". Результат представлен на рисунке 108.

 

Рисунок 108. Информационный портрет класса:

код 2 "ПОЛ – женский", фильтр по посещаемости.

 

Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек – очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем.

Пример решения задания 4.3: Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Посещаемость"?

Ответ на первые три вопроса дает анализ, который можно провести в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-14;

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок 109), а также получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 56):

 

Рисунок 109. Конструкт: "Пол"

 

 

 

Таблица 56 – КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ РАСПОЗНАВАНИЯ

 

 

Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме F5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-33;

– исключаем кластеры с одним признаком;

– не исключаем кластеры с тождественным набором признаков.

Результаты кластерно-конструктивного анализа признаков  можно получить в виде TXT-файла с именем Klas_prp.txt в поддиректории TXT (таблица 57):

 

Таблица 57 – КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ"

 

Пример решения задания 4.4: Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?

Чтобы ответить на этот вопрос необходимо провести в подсистеме: F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов);

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 58):

 

Таблица 58 – КОНСТРУКТ: "УЧЕБНАЯ ГРУППА"

15-10-04  10:53:27  Фильтр кодов: 13-56

========================================

|  Код |     Наименование     | Сход-  |

|класса| класса распознавания | ство % |

|=======================================

|   13 | ГРУППА ПИ-51.........|  100.00|

|   27 | Мясников ПИ-51.......|   43.60|

|   31 | Черкашина ПИ-51......|   40.11|

|   28 | Нагапетян ПИ-51......|   27.38|

|   15 | Бабенко ПИ-51........|   24.17|

|   21 | Заяц ПИ-51...........|   21.70|

|   20 | Жеребятьев ПИ-51.....|   16.21|

|   23 | Котенко ПИ-51........|   13.90|

|   34 | Шульгин ПИ-51........|    3.78|

|   46 | Куркина ПИ-52........|    0.98|

==========================================

|   16 | Воробьева ПИ-51......|   -0.35|

|   53 | Силенко ПИ-52........|   -1.79|

|   43 | Иванова ПИ-52........|   -3.81|

|   26 | Лях ПИ-51............|   -3.83|

|   24 | Кузина О. ПИ-51......|   -4.22|

|   25 | Кузина Я. ПИ-51......|   -5.27|

|   37 | Веревкина ПИ-52......|  -13.84|

|   54 | Соколова ПИ-52.......|  -14.71|

|   49 | Мануйлов ПИ-52.......|  -16.14|

|   45 | Крейс ПИ-52..........|  -17.43|

|   56 | Цисарь ПИ-52.........|  -23.11|

|   22 | Иванова ПИ-51........|  -23.42|

|   50 | Нарижний ПИ-52.......|  -24.32|

|   52 | Паршакова ПИ-52......|  -26.13|

|   41 | Еременко ПИ-52.......|  -30.56|

|   47 | Люлик ПИ-52..........|  -36.87|

|   38 | Григорьева ПИ-52.....|  -52.30|

|   14 | ГРУППА ПИ-52.........|  -64.51|

==========================================

 

Из таблицы 58 видно, что:

– студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51;

– студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52;

– студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков).

Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 13.

Пример решения задания 4.5: Результаты анализа отобразить в графической форме семантических сетей классов, нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для студентов с различной успеваемостью

Семантические сети классов отображаются на экране и записываются в форме PCX-файла в поддиректории: PCX/Klas-obj в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 110 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы).

Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: PCX/NeuroNet. На рисунке 111 приведен нелокальный нейрон: "Успеваемость: очень хорошая".

Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков – Кластерный и конструктивный анализ – Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде PCX-файла в поддиректории: PCX/Klas-att.

На рисунке 112 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке 111 нейроне (показаны только те связи между признаками, которые оказались больше 30%):

 

Рисунок 110. Семантическая сеть классов

 

Рисунок 111. Нелокальный нейрон: "Успеваемость: очень хорошая"

Рисунок 112.  Семантическая сеть признаков, оказавшихся наиболее значимыми в нелокальном нейроне: "Успеваемость: очень хорошая"

 

Если дополнить графическое изображение нейрона на рисунке 111 связями между признаками, показанными в семантической сети на рисунке 112, то получим классическую когнитивную карту. Студентам это предлагается сделать самостоятельно в 7-м режиме 6-й подсистемы, также как и получить когнитивные карты для других уровней успеваемости.

Контрольные вопросы

1. Что понимается под формализацией задачи.

2. Как создать классификационные и описательные шкалы в системе "Эйдос"?

3. Как собрать исходную фактографическую информацию и ввести в систему обучающую выборку?

4. Как осуществить синтез и верификацию модели?

5. Как оценить ценность признаков для прогнозирования и выделить признаки, наиболее существенные для решения поставленной задачи?

6. Как провести анализ модели, чтобы ответить на следующие вопросы:

– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

– как сказывается пол на посещаемости?

– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;

7. Как отобразить результаты анализа в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-3:
"Прогнозирование учебных достижений студентов
на основе особенностей их почерка"

 

Краткая теория

Известно, что подчерк каждого человека зависит от его темперамента и других генетически обусловленных, конституционных качеств личности, обладающих высокой стабильностью (некоторые из этих качеств могут быть измерены с применением 16PF-опросника Кеттела), а также от текущего психического и физического состояния человека.

Учебные достижения по различным дисциплинам также зависят от конституционных качеств. Поэтому вполне корректно поставить задачу прогнозирования учебных достижений студентов на основе изучения особенностей их подчерка.

Задание

1. Формализовать задачу.

1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.

1.2. В качестве описательных шкал и градаций использовать характеристики подчерка.

1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

3. Провести системно-когнитивный анализ модели:

3.1. Решить задачи идентификации и прогнозирования (для себя).

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

Пример решения

Задание 1. Формализовать задачу.
Задание 1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.

Пример формирования классификационных шкалы и градаций приведен в таблице 59.

 

Таблица 59 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ

Код

Наименование класса

Код

Наименование класса

1

ПОЛ - мужской

29

Полонская ПИ-51

2

ПОЛ - женский

30

Трунина ПИ-51

3

ОТКУДА РОДОМ - город-краевой центр

31

Черкашина ПИ-51

4

ОТКУДА РОДОМ - город-районный центр

32

Чепурченко ПИ-51

5

ОТКУДА РОДОМ - поселок городского типа

33

Чушкин ПИ-51

6

ОТКУДА РОДОМ - село

34

Шульгин ПИ-51

7

УСПЕВАЕМОСТЬ - "5" более 75%

35

Арушанян ПИ-52

8

УСПЕВАЕМОСТЬ - "5" более 50% но меньше 75%

36

Быченок ПИ-52

9

УСПЕВАЕМОСТЬ - "5" более 25% но меньше 50%

37

Веревкина ПИ-52

10

УСПЕВАЕМОСТЬ - "5" менее 25%

38

Григорьева ПИ-52

11

ФОРМА ОБУЧЕНИЯ - бюджетная

39

Давыдич ПИ-52

12

ФОРМА ОБУЧЕНИЯ - платная

40

Дронова ПИ-52

13

ГРУППА ПИ-51

41

Еременко ПИ-52

14

ГРУППА ПИ-52

42

Жмурко ПИ-52

15

Бабенко ПИ-51

43

Иванова ПИ-52

16

Воробьева ПИ-51

44

Костенко ПИ-52

17

Гура ПИ-51

45

Крейс ПИ-52

18

Головнев ПИ-51

46

Куркина ПИ-52

19

Дыбова ПИ-51

47

Люлик ПИ-52

20

Жеребятьев ПИ-51

48

Максимов ПИ-52

21

Заяц ПИ-51

49

Мануйлов ПИ-52

22

Иванова ПИ-51

50

Нарижний ПИ-52

23

Котенко ПИ-51

51

Ольховская ПИ-52

24

Кузина О. ПИ-51

52

Паршакова ПИ-52

25

Кузина Я. ПИ-51

53

Силенко ПИ-52

26

Лях ПИ-51

54

Соколова ПИ-52

27

Мясников ПИ-51

55

Турбин ПИ-52

28

Нагапетян ПИ-51

56

Цисарь ПИ-52

 

Задание 1.2. В качестве описательных шкал и градаций использовать характеристики подчерка.

Существует много различных систем выявления признаков подчерка. Мы в учебных целях воспользуемся одной из самых простых из них, используемой на сайте: Альянс-медиа "Деловые тесты":

http://www.businesstest.ru/test.asp?test_id=155&topic_id=3

В таблице 60 эта система приведена в виде, преобразованном для удобства использования в системе "Эйдос".

 

 

Таблица 60 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

СПРАВОЧНИК НАИМЕНОВАНИЙ ШКАЛ И ГРАДАЦИЙ ПРИЗНАКОВ

06-09-04  10:39:45                                             г.Краснодар

==========================================================================

|  N |  Код | Наименование                                               |

|========================================================================|

|    |[   1]|РАЗМЕР БУКВ:                                                |

|   1|    1 |Очень мелкие................................................|

|   2|    2 |Мелкие......................................................|

|   3|    3 |Средние.....................................................|

|   4|    4 |Крупные.....................................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   2]|НАКЛОН БУКВ:                                                |

|   5|    5 |Влево.......................................................|

|   6|    6 |Легкий влево................................................|

|   7|    7 |Вправо......................................................|

|   8|    8 |Резкий вправо...............................................|

|   9|    9 |Прямое написание............................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   3]|ФОРМА БУКВ:                                                 |

|  10|   10 |Округлые....................................................|

|  11|   11 |Бесформенные................................................|

|  12|   12 |Угловатые...................................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   4]|НАПРАВЛЕНИЕ ПОЧЕРКА:                                        |

|  13|   13 |Строчки "ползут" вверх......................................|

|  14|   14 |Строчки прямые..............................................|

|  15|   15 |Строчки "сползают" вниз.....................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   5]|ИНТЕНСИВНОСТЬ ПОЧЕРКА И СИЛА НАЖИМА:                        |

|  16|   16 |Легкая......................................................|

|  17|   17 |Средняя.....................................................|

|  18|   18 |Сильная.....................................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   6]|ХАРАКТЕР НАПИСАНИЯ СЛОВ:                                    |

|  19|   19 |Склонность к соединению букв................................|

|  20|   20 |Склонность к отделению букв друг от друга...................|

|  21|   21 |Смешанный стиль.............................................|

|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|

|    |[   7]|ОБЩАЯ ОЦЕНКА ПОЧЕРКА:                                       |

|  22|   22 |Почерк старательный, буквы аккуратные.......................|

|  23|   23 |Почерк неровный, одни слова видны, другие читаются с трудом.|

|  24|   24 |Буквы написаны кое-как, почерк неразборчивый и небрежный....|

==========================================================================

Универсальная когнитивная аналитическая система                НПП *ЭЙДОС*

 

 

Задание 1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.

Чтобы собрать информацию для обучающей выборки, студенты на доске рисуют и заполняют таблицу, аналогичную таблице 61. Каждый заполняет строку по себе, и все учащиеся переписывают таблицу целиком к себе в тетрадь. Затем, когда таблица в тетради заполнена – она заносится в систему "Эйдос" в 1-м режиме 2-й подсистемы.

 

 

Таблица 61 – ОБУЧАЮЩАЯ ВЫБОРКА

Код

Наименование

Коды классов

Коды признаков

2

Воробьева ПИ-51

2

5

10

12

13

16

4

7

10

14

17

21

23

3

Гура ПИ-51

1

13

17

0

0

0

3

7

11

15

17

21

24

5

Дыбова ПИ-51

2

13

19

0

0

0

 

 

 

 

 

 

 

6

Жеребятьев ПИ51

1

5

8

12

13

20

 

 

 

 

 

 

 

8

Иванова ПИ-51

2

3

7

12

13

22

3

6

7

12

14

17

19

9

Котенко ПИ-51

2

4

7

12

13

23

3

7

10

14

17

21

23

10

Кузина О. ПИ-51

2

3

8

12

13

24

3

7

12

14

17

21

22

11

Кузина Я. ПИ-51

2

3

8

12

13

25

3

7

11

14

17

21

22

12

Лях ПИ-51

1

3

8

12

13

26

2

6

11

14

16

20

24

13

Мясников ПИ-51

1

3

9

12

13

27

3

7

10

14

17

21

22

14

Нагапетян ПИ-51

1

4

9

12

13

28

3

8

12

13

18

19

23

15

Полонская ПИ-51

2

13

29

0

0

0

 

 

 

 

 

 

 

16

Трунина ПИ-51

2

13

30

0

0

0

3

7

12

13

18

19

23

17

Черкашина ПИ-51

2

4

10

12

13

31

3

7

12

14

17

19

23

18

Чепурченко ПИ51

1

13

32

0

0

0

3

8

12

13

16

19

23

19

Чушкин ПИ-51

1

13

33

0

0

0

3

6

11

14

17

20

23

20

Шульгин ПИ-51

1

5

8

12

13

34

 

 

 

 

 

 

 

21

Арушунян ПИ-52

1

14

35

0

0

0

 

 

 

 

 

 

 

22

Быченок ПИ-52

1

14

36

0

0

0

 

 

 

 

 

 

 

23

Веревкина ПИ-52

2

3

9

12

14

37

 

 

 

 

 

 

 

24

Григорьева ПИ52

2

4

8

12

14

38

 

 

 

 

 

 

 

25

Давыдич ПИ-52

2

14

39

0

0

0

 

 

 

 

 

 

 

26

Дронова ПИ-52

2

14

40

0

0

0

3

7

11

14

17

20

23

27

Еременко ПИ-52

2

4

8

12

14

41

 

 

 

 

 

 

 

28

Жмурко ПИ-52

1

14

42

0

0

0

3

7

10

14

17

21

23

29

Иванова ПИ-52

2

3

9

12

14

43

 

 

 

 

 

 

 

30

Костенко ПИ-52

2

14

44

0

0

0

 

 

 

 

 

 

 

31

Крейс ПИ-52

2

4

8

12

14

45

 

 

 

 

 

 

 

32

Куркина ПИ-52

2

3

8

12

14

46

 

 

 

 

 

 

 

33

Люлик ПИ-52

2

5

8

12

14

47

 

 

 

 

 

 

 

34

Максимов ПИ-52

1

14

48

0

0

0

 

 

 

 

 

 

 

35

Мануйлов ПИ-52

1

3

7

12

14

49

 

 

 

 

 

 

 

36

Нарижний ПИ-52

1

3

7

12

14

50

 

 

 

 

 

 

 

37

Ольховская ПИ52

2

14

51

0

0

0

 

 

 

 

 

 

 

38

Паршакова ПИ-52

2

6

8

12

14

52

 

 

 

 

 

 

 

39

Силенко ПИ-52

1

3

7

12

14

53

3

5

11

14

17

21

23

40

Соколова ПИ-52

2

4

8

12

14

54

 

 

 

 

 

 

 

41

Турбин ПИ-52

1

14

55

0

0

0

3

7

11

14

17

21

23

42

Цисарь ПИ-52

2

5

9

12

14

56

3

9

10

14

17

21

23

43

Бабенко ПИ-51

0

0

0

0

0

0

2

7

11

14

17

21

24

 

Так как по ряду студентов данных нет, то пример выполнения заданий 2 и 3 не приводится и они выполняются студентами самостоятельно.

 

 

 

 

Контрольные вопросы

1. Какие работы выполняются на этапе формализации задачи?

2. Как в системе "Эйдос" ввести классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки?

3. Как в системе "Эйдос" ввести описательные шкал и градации, использовав характеристики подчерка?

4. Каким образом подготовить и ввести в систему "Эйдос" обучающую выборку?

5. Как осуществить синтез и верификацию (измерение адекватности) семантической информационной модели в системе "Эйдос"?

6. Что включает системно-когнитивный анализ модели?

7. Как решаются задачи идентификации и прогнозирования в системе "Эйдос"?

8. В каких подсистемах и режимах системы "Эйдос" генерируются информационные портреты классов и факторов и отображаются в графической форме двухмерных и трехмерных профилей классов и факторов)?

9. Каким образом в системе "Эйдос" провести кластерно-конструктивный анализ классов и факторов и отобразить его в форме семантических сетей классов и факторов?

10. Как в системе "Эйдос" осуществить содержательное сравнение классов и факторов и отобразить результаты в форме когнитивных диаграмм классов и факторов?

11. Как в системе "Эйдос" построить нелокальные нейроны и интерпретируемые нейронные сети?

12. Как в системе "Эйдос" построить классические когнитивные модели и отобразить их в форме когнитивных карт?

13. Как в системе "Эйдос" построить интегральные когнитивные модели и отобразить в форме интегральных когнитивных карт?

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-4:
"Прогнозирование учебных достижений студентов
на основе информации об их социальном статусе"

 

Данная лабораторная работа основана на данных, полученных в Кубанском государственном технологическом университете (КубГТУ) при преподавании дисциплин кафедры Информатики: "Новые информационные технологии в учебном процессе" и "Комплексные технологии в науке и образовании" для специальности: 020300 – Социология (Социально-гуманитарный факультет), в 2002 году (акт внедрения имеется).

Краткая теория

При проведении в 2001 году одного из первых в г. Краснодаре экспериментов по централизованному компьютерному тестированию для поступлении в вуз его организаторы предложили заполнить всем тестирующимся дополнительную социологическую анкету. Если бы удалось собрать данные с помощью этой анкеты по ряду регионов России и обработать их совместно с результатами тестирования по предметной обученности по ряду предметов, то в принципе оказалось бы возможным найти зависимости между характеристиками социального статуса абитуриента и его учебными достижениями. Безусловно, такие результаты представляли бы огромный научный интерес. Однако провести это дополнительное тестирование не удалось по ряду причин, среди которых основными, по-видимому, явились следующие:

– это тестирование не было бы анонимным;

– в анкету были включены некоторые вопросы, имеющие спорный характер;

– работа по организации проведению этого дополнительного тестирования потребовало бы от абитуриентов и организаторов проведения тестирования ранее незапланированных затрат времени и других усилий.

Но то, что в свое время не удалось сделать в масштабе России, вполне возможно осуществить в рамках одной лабораторной работы, в которой и предлагается использовать "ту самую социологическую анкету".

Задание

1. Формализовать задачу.

1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки.

1.2. В качестве описательных шкал и градаций использовать предлагаемую анкету.

1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

3. Провести системно-когнитивный анализ модели:

3.1. Решить задачи идентификации и прогнозирования (для себя).

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

 

Пример решения

Задание 1. Формализовать задачу.
Задание 1.1. Сконструировать классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из образовательного стандарта или зачетной книжки.

Мы для выполнения этого задания используем данные, полученные в КубГТУ в 2002 году (таблица 62).

 

Таблица 62 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ

Код

Наименование класса

1

УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.) - высокая

2

УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.) - средняя

3

УСП.ПО ЦИКЛУ ДИСЦ.ГСД (гум.соц.-эк.дисц.) - низкая

4

УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) - высокая

5

УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) - средняя

6

УСП.ПО ЦИКЛУ ДИСЦ.ЕН (ест.научн.дисц.) - низкая

7

УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) - высокая

8

УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) - средняя

9

УСП.ПО ЦИКЛУ ДИСЦ.ОПД (общ.проф.дисц.) - низкая

10

УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) - высокая

11

УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) - средняя

12

УСП.ПО ЦИКЛУ ДИСЦ.СД (спец.дисц.) - низкая

13

УСП.ПО ДИСЦ.ГСД-01 (философия) - высокая

14

УСП.ПО ДИСЦ.ГСД-01 (философия) - средняя

15

УСП.ПО ДИСЦ.ГСД-01 (философия) - низкая

16

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - высокая

17

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - средняя

18

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - низкая

19

УСП.ПО ДИСЦ.ГСД-03 (культурология) - высокая

20

УСП.ПО ДИСЦ.ГСД-03 (культурология) - средняя

21

УСП.ПО ДИСЦ.ГСД-03 (культурология) - низкая

22

УСП.ПО ДИСЦ.ГСД-04 (история) - высокая

23

УСП.ПО ДИСЦ.ГСД-04 (история) - средняя

Продолжение таблицы 62

Код

Наименование класса

24

УСП.ПО ДИСЦ.ГСД-04 (история) - низкая

25

УСП.ПО ДИСЦ.ГСД-05 (физ.культура) - высокая

26

УСП.ПО ДИСЦ.ГСД-05 (физ.культура) - средняя

27

УСП.ПО ДИСЦ.ГСД-05 (физ.культура) - низкая

28

УСП.ПО ДИСЦ.ГСД-06 (право) - высокая

29

УСП.ПО ДИСЦ.ГСД-06 (право) - средняя

30

УСП.ПО ДИСЦ.ГСД-06 (право) - низкая

31

УСП.ПО ДИСЦ.ГСД-07 (экономика) - высокая

32

УСП.ПО ДИСЦ.ГСД-07 (экономика) - средняя

33

УСП.ПО ДИСЦ.ГСД-07 (экономика) - низкая

34

УСП.ПО ДИСЦ.ГСД-09 (политология) - высокая

35

УСП.ПО ДИСЦ.ГСД-09 (политология) - средняя

36

УСП.ПО ДИСЦ.ГСД-09 (политология) - низкая

37

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - высокая

38

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - средняя

39

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - низкая

40

УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по выбору) - высокая

41

УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по выбору) - средняя

42

УСП.ПО ДИСЦ.ГСД-11 (дисц.и курсы по выбору) - низкая

43

УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - высокая

44

УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - средняя

45

УСП.ПО ДИСЦ.ЕН-01 (маетматика и информатика) - низкая

46

УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - высокая

47

УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - средняя

48

УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - низкая

49

УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору) - высокая

50

УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору) - средняя

51

УСП.ПО ДИСЦ.ЕН-03 (дисц.и курсы по выбору) - низкая

52

УСП.ПО ДИСЦ.ОПД-01 (история социологии) - высокая

53

УСП.ПО ДИСЦ.ОПД-01 (история социологии) - средняя

54

УСП.ПО ДИСЦ.ОПД-01 (история социологии) - низкая

55

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - высокая

56

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - средняя

57

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - низкая

58

УСП.ПО ДИСЦ.ОПД-03 (мет.и техн.социолог.иссл.) - высокая

59

УСП.ПО ДИСЦ.ОПД-03 (мет.и техн.социолог.иссл.) - средняя

60

УСП.ПО ДИСЦ.ОПД-03 (мет.и техн.социолог.иссл.) - низкая

61

УСП.ПО ДИСЦ.ОПД-04 (демография) - высокая

62

УСП.ПО ДИСЦ.ОПД-04 (демография) - средняя

63

УСП.ПО ДИСЦ.ОПД-04 (демография) - низкая

64

УСП.ПО ДИСЦ.ОПД-05 (социальная статистика) - высокая

65

УСП.ПО ДИСЦ.ОПД-05 (социальная статистика) - средняя

66

УСП.ПО ДИСЦ.ОПД-05 (социальная статистика) - низкая

67

УСП.ПО ДИСЦ.ОПД-06 (социальная антропология) - высокая

68

УСП.ПО ДИСЦ.ОПД-06 (социальная антропология) - средняя

69

УСП.ПО ДИСЦ.ОПД-06 (социальная антропология) - низкая

70

УСП.ПО ДИСЦ.ОПД-07 (социальная психология) - высокая

71

УСП.ПО ДИСЦ.ОПД-07 (социальная психология) - средняя

Продолжение таблицы 62

Код

Наименование класса

72

УСП.ПО ДИСЦ.ОПД-07 (социальная психология) – низкая

73

УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - высокая

74

УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - средняя

75

УСП.ПО ДИСЦ.ОПД-08 (соц.труда и экон.соц.) - низкая

76

УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - высокая

77

УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - средняя

78

УСП.ПО ДИСЦ.ОПД-09 (социология организаций) - низкая

79

УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - высокая

80

УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - средняя

81

УСП.ПО ДИСЦ.ОПД-10 (социология коммуникаций) - низкая

82

УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - высокая

83

УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - средняя

84

УСП.ПО ДИСЦ.ОПД-11 (основы менеджмента) - низкая

85

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - высокая

86

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - средняя

87

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - низкая

88

УСП.ПО ДИСЦ.ОПД-13 (социология религий) - высокая

89

УСП.ПО ДИСЦ.ОПД-13 (социология религий) - средняя

90

УСП.ПО ДИСЦ.ОПД-13 (социология религий) - низкая

91

УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по выбору) - высокая

92

УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по выбору) - средняя

93

УСП.ПО ДИСЦ.ОПД-14 (дисц.и курсы по выбору) - низкая

94

УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - высокая

95

УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - средняя

96

УСП.ПО ДИСЦ.СД-01 (соц.прогнозирование и проект.) - низкая

97

УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - высокая

98

УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - средняя

99

УСП.ПО ДИСЦ.СД-02 (соц.проблемы изуч.общ.мнения) - низкая

100

УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - высокая

101

УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - средняя

102

УСП.ПО ДИСЦ.СД-03 (соц.полит.процессов) - низкая

103

УСП.ПО ДИСЦ.СД-04 (социология семьи) - высокая

104

УСП.ПО ДИСЦ.СД-04 (социология семьи) - средняя

105

УСП.ПО ДИСЦ.СД-04 (социология семьи) - низкая

106

УСП.ПО ДИСЦ.СД-05 (социология культуры) - высокая

107

УСП.ПО ДИСЦ.СД-05 (социология культуры) - средняя

108

УСП.ПО ДИСЦ.СД-05 (социология культуры) - низкая

109

УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору) - высокая

110

УСП.ПО ДИСЦ.СД-06 (дисц.и кусры по выбору) - средняя

111

УСП.ПО ДИСЦ.СД-06 (дисц.и курсы по выбору) - низкая

112

Группа-1

113

Группа-2

 

Задание 1.2. В качестве описательных шкал и градаций использовать предлагаемую анкету.

Анкета организаторов тестирования преобразована к виду, удобному для обработки в системе "Эйдос" (таблица 63).

 

Таблица 63 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Код

Наименования шкал и градаций признаков                  

[   1]

ВАШ ВОЗРАСТ:                                                     

1

17

2

18

3

19

4

20

5

21

6

22

7

23

8

24

9

25 или более

[   2]

ВЫ РОДИЛИСЬ В РОССИИ?                                           

10

Да

11

Нет

[   3]

ЕСЛИ ВЫ РОДИЛИСЬ НЕ В РОССИИ, ТО ВО СКОЛЬКО ЛЕТ ВЫ СЮДА ПРИЕХАЛИ?

12

До 7 лет

13

От 7 до 17 лет

14

Больше 17 лет

[   4]

КОЛИЧЕСТВО ЖИЛЫХ КОМНАТ У ВАС ДОМА:                             

15

1

16

2

17

3

18

4

19

5 или более

[   5]

СКОЛЬКО ВСЕГО ЧЕЛОВЕК ЖИВУТ У ВАС ДОМА?                         

20

1

21

2

22

3

23

4

24

5

25

6

26

7 и более

[   6]

ДОХОД НА ЧЛЕНА СЕМЬИ (В МЕСЯЦ):                                 

27

Низкий

28

Средний

29

Высокий

[   7]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО РУССКОМУ ЯЗЫКУ:  

30

Отличные

31

Хорошие

32

Средние

33

Низкие

[   8]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО АЛГЕБРЕ:         

34

Отличные

35

Хорошие

36

Средние

37

Низкие

[   9]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ГЕОМЕТРИИ:       

38

Отличные

39

Хорошие

40

Средние

41

Низкие

[  10]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ФИЗИКЕ:          

42

Отличные

43

Хорошие

44

Средние

45

Низкие

 

 

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

[  11]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ХИМИИ:           

46

Отличные

47

Хорошие

48

Средние

49

Низкие

[  12]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНФОРМАТИКЕ:     

50

Отличные

51

Хорошие

52

Средние

[  13]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО БИОЛОГИИ:        

54

Отличные

55

Хорошие

56

Средние

57

Низкие

[  14]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИСТОРИИ:         

58

Отличные

59

Хорошие

60

Средние

61

Низкие

[  15]

КАК ВЫ САМИ ОЦЕНИВАЕТЕ СВОИ ШКОЛЬНЫЕ ЗНАНИЯ ПО ИНОСТРАННОМУ ЯЗЫКУ

62

Отличные

63

Хорошие

64

Средние

65

Низкие

[  16]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО РУССКОМУ ЯЗЫКУ:  

66

Уроки в школе

67

Со знакомыми

68

С репетитором

69

Факультатив в школе

70

Курсы при ВУЗе

71

Заочно при ВУЗе

[  17]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО АЛГЕБРЕ:         

72

Уроки в школе

73

Со знакомыми

74

С репетитором

75

Факультатив в школе

76

Курсы при ВУЗе

77

Заочно при ВУЗе

[  18]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ГЕОМЕТРИИ:       

78

Уроки в школе

79

Со знакомыми

80

С репетитором

81

Факультатив в школе

82

Курсы при ВУЗе

83

Заочно при ВУЗе

[  19]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ФИЗИКЕ:          

84

Уроки в школе

85

Со знакомыми

86

С репетитором

87

Факультатив в школе

88

Курсы при ВУЗе

89

Заочно при ВУЗе

[  20]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ХИМИИ:           

90

Уроки в школе

91

Со знакомыми

92

С репетитором

93

Факультатив в школе

94

Курсы при ВУЗе

95

Заочно при ВУЗе

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

[  21]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНФОРМАТИКЕ:     

96

Уроки в школе

97

Со знакомыми

98

С репетитором

99

Факультатив в школе

100

Курсы при ВУЗе

101

Заочно при ВУЗе

[  22]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО БИОЛОГИИ:        

102

Уроки в школе

103

Со знакомыми

104

С репетитором

105

Факультатив в школе

106

Курсы при ВУЗе

107

Заочно при ВУЗе

[  23]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИСТОРИИ:         

108

Уроки в школе

109

Со знакомыми

110

С репетитором

111

Факультатив в школе

112

Курсы при ВУЗе

113

Заочно при ВУЗе

[  24]

КАК ВЫ ГОТОВИЛИСЬ К ВСТУПИТЕЛЬНОМУ ЭКЗАМЕНУ ПО ИНОСТРАННОМУ ЯЗЫКУ

114

Уроки в школе

115

Со знакомыми

116

С репетитором

117

Факультатив в школе

118

Курсы при ВУЗе

119

Заочно при ВУЗе

[  25]

СКОЛЬКО ВРЕМЕНИ СУММАРНО УХОДИТ У ВАС НА ВЫПОЛНЕНИЕ ДОМАШНИХ ЗАДАНИЙ?

120

До 15 минут

121

Около 30 минут

122

1 - 2 часа

123

Более 2-х часов

[  26]

УКАЖИТЕ УРОВЕНЬ ОБРАЗОВАНИЯ ОТЦА:                                

124

Неполное среднее

125

Среднее

126

Среднее техническое

127

Незаконченное высшее

128

Высшее

129

Кандидат наук

130

Доктор наук

[  27]

УКАЖИТЕ УРОВЕНЬ ОБРАЗОВАНИЯ МАТЕРИ:                             

131

Неполное среднее

132

Среднее

133

Среднее техническое

134

Незаконченное высшее

135

Высшее

136

Кандидат наук

137

Доктор наук

[  28]

УКАЖИТЕ НАЦИОНАЛЬНОСТЬ ОТЦА:                                    

138

Русский

139

Украинец

140

Белорус

141

Татарин

142

Мордвин

143

Удмурт

144

Мари

145

Башкир

146

Чуваш

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

147

Еврей

148

Калмык

149

Бурят

150

Коми

151

Грузин

152

Армянин

153

Азербайджанец

154

Другая

[  29]

УКАЖИТЕ НАЦИОНАЛЬНОСТЬ МАТЕРИ:                                  

155

Русский

156

Украинец

157

Белорус

158

Татарин

159

Мордвин

160

Удмурт

161

Мари

162

Башкир

163

Чуваш

164

Еврей

165

Калмык

166

Бурят

167

Коми

168

Грузин

169

Армянин

170

Азербайджанец

171

Другая

[  30]

ВЫ ПОСТОЯННО ЖИВЕТЕ В ДАННОМ МЕСТЕ ИЛИ ПЕРЕЕХАЛИ СЮДА ИЗ ДРУГОЙ МЕСТНОСТИ?

172

Родился и живу здесь постоянно

173

Приехал сюда из другого города России

174

Приехал из сельской местности России

175

Приехал из бывших республик СССР

[  31]

ВЫ ПРОЖИВАЕТЕ:                                                  

176

Москве

177

Санкт-Петербурге

178

В областном (краевом) центре или столице республики

179

В крупном городе

180

В среднем городе

181

В малом городе

182

В поселке, деревне, селе, хуторе и т.п.

[  32]

КАК ЧАСТО ВЫ ДОМА РАЗГОВАРИВАЕТЕ НА РУССКОМ ЯЗЫКЕ?              

183

Всегда

184

Почти всегда

185

Иногда

186

Очень редко

187

Никогда

[  33]

ВМЕСТЕ С ВАМИ ПОСТОЯННО ПРОЖИВАЮТ:                              

188

Мать

189

Отец

190

Отчим/мачеха

191

Братья/сестры

192

Бабушки/дедушки

193

Другие родственники

[  34]

КОЛИЧЕСТВО ДЕТЕЙ В СЕМЬЕ, ВКЛЮЧАЯ ВАС:                          

194

Один

195

Двое

196

Трое

197

Четверо или более

 

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

[  35]

ИМЕЕТ ЛИ ВАША СЕМЬЯ:                                            

198

Видеомагнитофон

199

Видеокамеру

200

Несколько цветных телевизоров

201

Компьютер

202

Отечественную автомашину

203

Несколько отечественных автомашин или иномарку

[  36]

ЕСЛИ ВЫ ИМЕЕТЕ КОМПЬЮТЕР ДОМА, ТО КАК ВЫ ЕГО ИСПОЛЬЗУЕТЕ?       

204

Для игр

205

Для изучения учебных предметов (например, иностранных языков)

206

Для обмена информацией с помощью модема, в т.ч. в Internet

207

Для оплачиваемой работы

[  37]

СКОЛЬКО ПРИМЕРНО КНИГ У ВАС В СЕМЬЕ (НЕ СЧИТАЯ УЧЕБНИКОВ И УЧЕБНЫХ ПОСОБИЙ)?

208

Менее 50

209

Около 100

210

Несколько сотен

211

Более тысячи

[  38]

ВАШЕ ОТНОШЕНИЕ К ПЕРИОДИЧЕСКОЙ ПЕЧАТИ:                          

212

Выписываем на дом

213

Покупаем ежедневно

214

Покупаем еженедельно

215

Почти не читаем

[  39]

ЖИЛИЩНЫЕ УСЛОВИЯ ВАШЕЙ СЕМЬИ:                                   

216

Комната в коммунальной квартире

217

1-комнатная квартира

218

2-комнатная квартира

219

Квартира из 3-х или более комнат

220

Обычный дом в сельской местности

221

Дом повышенной комфортности (особняк)

[  40]

ПРИ СОСТАВЛЕНИИ ПЛАНОВ НА БУДУЩЕЕ ЧЬЕ МНЕНИЕ ВЫ УЧИТЫВАЕТЕ В ПЕРВУЮ ОЧЕРЕДЬ (ВЫБЕРИТЕ ТОЛЬКО ОДИН ОТВЕТ):

222

Родителей

223

Учителей

224

Сверстников (друзей)

225

Средств массовой информации

226

Свое собственное

[  41]

ГДЕ ВЫ ОБЫЧНО ПРОВОДИТЕ ЕЖЕГОДНЫЙ ОТПУСК (КАНИКУЛЫ):            

227

Дома

228

На собственной даче

229

В другом городе или на даче у родственников или знакомых

230

В туристическом походе

231

На Черном море в России

232

В бывших республиках СССР

233

За рубежом

234

Другое

[  42]

ВЫ ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС:                                   

235

Общеобразовательный

236

Профилированный на ВУЗ

237

Гимназический или лицейский

238

другой (экономический, юридический и др.)

[  43]

ВЫ ЗАКОНЧИЛИ ВЫПУСКНОЙ КЛАСС С УГЛУБЛЕННЫМ ИЗУЧЕНИЕМ:           

239

Математики

240

Физики

241

Биологии

242

Химии

243

Географии

244

Информатики

245

Истории, обществоведения

246

Русского языка, литературы

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

247

Иностранных языков

[  44]

ВЫБЕРИТЕ ПРЕДМЕТЫ, КОТОРЫЕ ВАМ НРАВЯТСЯ:                        

248

Русский язык

249

Математика

250

Физика

251

Химия

252

Информатика

253

Биология

254

История

255

Иностранный язык

256

География

[  45]

ЧЕМ ВАМ НРАВИТСЯ ШКОЛА, КОТОРУЮ ВЫ ЗАКОНЧИЛИ?                   

257

Хорошие отношения со сверстниками

258

Хорошие учителя

259

Хорошая подготовка к поступлению в ВУЗ

260

Расположена рядом с домом

261

Ничем не нравится

262

Другое

[  46]

ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ ОТЦА:                     

263

Промышленность (тяжелая)

264

Промышленность (легкая)

265

Строительство

266

Сельское хозяйство

267

Транспорт

268

Коммерция, торговля, сфера бытового обслуживания

269

Экономика

270

Частный бизнес, предпринимательство

271

Государственная служба

272

Служба в силовых структурах

273

Выборные органы власти

274

Образование

275

Здравоохранение, медицина

276

Культура, искусство

277

Наука

278

Юриспруденция

279

Спорт

280

Религия

281

Другое

[  47]

ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ МАТЕРИ:                   

282

Промышленность (тяжелая)

283

Промышленность (легкая)

284

Строительство

285

Сельское хозяйство

286

Транспорт

287

Коммерция, торговля, сфера бытового обслуживания

288

Экономика

289

Частный бизнес, предпринимательство

290

Государственная служба

291

Служба в силовых структурах

292

Выборные органы власти

293

Образование

294

Здравоохранение, медицина

295

Культура, искусство

296

Наука

297

Юриспруденция

298

Спорт

299

Религия

300

Другое

 

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

 

[  48]

ОБЛАСТЬ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ, НАИБОЛЕЕ ПРИВЛЕКАЮЩАЯ МЕНЯ

301

Промышленность (тяжелая)

302

Промышленность (легкая)

303

Строительство

304

Сельское хозяйство

305

Транспорт

306

Коммерция, торговля, сфера бытового обслуживания

307

Экономика

308

Частный бизнес, предпринимательство

309

Государственная служба

310

Служба в силовых структурах

311

Выборные органы власти

312

Образование

313

Здравоохранение, медицина

314

Культура, искусство

315

Наука

316

Юриспруденция

317

Спорт

318

Религия

319

Другое

[  49]

УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ПРАКТИЧЕСКИ НЕ ИСПОЛЬЗУЕТЕ:    

320

Просмотр видео и кинофильмов

321

Чтение художественной литературы

322

Спорт, туризм

323

Дискотеки и т.п.

324

Общение с родителями

325

Общение с любимым человеком

326

Работа на дому

327

Оплачиваемая работа

328

Дополнительное образование

329

Техническое творчество

330

Занятия искусством

331

Коллекционирование

332

Посещение музеев и выставок

333

Посещение оперы и балета

334

Посещение драматических театров

335

Посещение концертов классической музыки

336

Посещение концертов попмузыки

337

Слушание радио

338

Слушание аудио-музыки

339

Просмотр теленовостей

340

Просмотр развлекательных TV-программ

341

Просмотр спортивных TV-программ

342

Просмотр мультфильмов

343

Просмотр телесериалов

344

Просмотр познавательных передач

345

Просмотр религиозных программ

346

Посещение религиозных центров

[  50]

УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ:    

347

Просмотр видео и кинофильмов

348

Чтение художественной литературы

349

Спорт, туризм

350

Дискотеки и т.п.

351

Общение с родителями

352

Общение с любимым человеком

353

Работа на дому

354

Оплачиваемая работа

355

Дополнительное образование

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

356

Техническое творчество

357

Занятия искусством

358

Коллекционирование

359

Посещение музеев и выставок

360

Посещение оперы и балета

361

Посещение драматических театров

362

Посещение концертов классической музыки

363

Посещение концертов попмузыки

364

Слушание радио

365

Слушание аудио-музыки

366

Просмотр теленовостей

367

Просмотр развлекательных TV-программ

368

Просмотр спортивных TV-программ

369

Просмотр мультфильмов

370

Просмотр телесериалов

371

Просмотр познавательных передач

372

Просмотр религиозных программ

373

Посещение религиозных центров

[  51]

УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ЧАСТО ИСПОЛЬЗУЕТЕ:             

374

Просмотр видео и кинофильмов

375

Чтение художественной литературы

376

Спорт, туризм

377

Дискотеки и т.п.

378

Общение с родителями

379

Общение с любимым человеком

380

Работа на дому

381

Оплачиваемая работа

382

Дополнительное образование

383

Техническое творчество

384

Занятия искусством

385

Коллекционирование

386

Посещение музеев и выставок

387

Посещение оперы и балета

388

Посещение драматических театров

389

Посещение концертов классической музыки

390

Посещение концертов попмузыки

391

Слушание радио

392

Слушание аудио-музыки

393

Просмотр теленовостей

394

Просмотр развлекательных TV-программ

395

Просмотр спортивных TV-программ

396

Просмотр мультфильмов

397

Просмотр телесериалов

398

Просмотр познавательных передач

399

Просмотр религиозных программ

400

Посещение религиозных центров

[  52]

УКАЖИТЕ ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПРАКТИЧЕСКИ ВСЕГДА:

401

Просмотр видео и кинофильмов

402

Чтение художественной литературы

403

Спорт, туризм

404

Дискотеки и т.п.

405

Общение с родителями

406

Общение с любимым человеком

407

Работа на дому

408

Оплачиваемая работа

409

Дополнительное образование

410

Техническое творчество

411

Занятия искусством

412

Коллекционирование

413

Посещение музеев и выставок

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

414

Посещение оперы и балета

415

Посещение драматических театров

416

Посещение концертов классической музыки

417

Посещение концертов попмузыки

418

Слушание радио

419

Слушание аудио-музыки

420

Просмотр теленовостей

421

Просмотр развлекательных TV-программ

422

Просмотр спортивных TV-программ

423

Просмотр мультфильмов

424

Просмотр телесериалов

425

Просмотр познавательных передач

426

Просмотр религиозных программ

427

Посещение религиозных центров

[  53]

УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС МАЛУЮ ЦЕННОСТЬ:          

428

Общение с друзьями

429

Общение с родителями

430

Наличие вещей, имеющих продуктивную работу и учебу

431

Наличие престижных вещей

432

Наличие вещей, обеспечивающих комфортные условия жизни

433

Возможность влияния на ход важных событий в семье

434

Материальная независимость

435

Свобода высказываться и публиковаться

436

Свобода религии

437

Удовольствия, развлечения

438

Работа и учеба как творчество

439

Работа на благо общества

440

Работа как средство заработка

441

Счастливая семья

442

Любовь

443

Красота человека

444

Природа

445

Культура, искусство

[  54]

УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС НЕКОТОРУЮ ЦЕННОСТЬ:      

446

Общение с друзьями

447

Общение с родителями

448

Наличие вещей, имеющих продуктивную работу и учебу

449

Наличие престижных вещей

450

Наличие вещей, обеспечивающих комфортные условия жизни

451

Возможность влияния на ход важных событий в семье

452

Материальная независимость

453

Свобода высказываться и публиковаться

454

Свобода религии

455

Удовольствия, развлечения

456

Работа и учеба как творчество

457

Работа на благо общества

458

Работа как средство заработка

459

Счастливая семья

460

Любовь

461

Красота человека

462

Природа

463

Культура, искусство

[  55]

УКАЖИТЕ СТОРОНЫ ЖИЗНИ, ИМЕЮЩИЕ ДЛЯ ВАС БОЛЬШУЮ ЦЕННОСТЬ:        

464

Общение с друзьями

465

Общение с родителями

466

Наличие вещей, имеющих продуктивную работу и учебу

467

Наличие престижных вещей

468

Наличие вещей, обеспечивающих комфортные условия жизни

469

Возможность влияния на ход важных событий в семье

Продолжение таблицы 63

Код

Наименования шкал и градаций признаков                  

470

Материальная независимость

471

Свобода высказываться и публиковаться

472

Свобода религии

473

Удовольствия, развлечения

474

Работа и учеба как творчество

475

Работа на благо общества

476

Работа как средство заработка

477

Счастливая семья

478

Любовь

479

Красота человека

480

Природа

481

Культура, искусство

 

Задание 1.3. Обучающую выборку заполнить на основе данных по учащимся своей группы и дополнить данными параллельной группы.

Для этих целей каждый учащийся заполняет данными о себе "Карточку респондента", имеющую вид, представленный на таблице 64:

 

Таблица 64 – КАРТОЧКА РЕСПОНДЕНТА № _____

Учебная группа:

 

Фамилия, имя, отчество:

 

Коды классов, к которым он принадлежит:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коды признаков, которыми он характеризуется:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При необходимости строки с кодами добавляются. На каждой карточке имеется номер студента по списку группы, который затем используется как номер анкеты в обучающей выборке. Необходимо сначала ввести пустые анкеты обучающей выборки по списку группы, а затем заполнить их, используя карточки. Учащиеся передают друг другу карточки передавать по компьютерному классу. В графе "Наим.физ.источника" указываются полностью: фамилия, и сокращенно: имя и отчество студента. Аналогично поступаем с карточками студентов 2-й группы, за исключением того, что для определения номера анкеты в обучающей выборке к списочному номеру студента 2-й группы прибавляется номер последнего студента 1-й группы.

 

Задание 2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

Синтез и верификация модели осуществляется в соответствующих подсистемах системы "Эйдос". Результаты верификации представлены в таблице 65.

 

Таблица 65 – РЕЗУЛЬТАТЫ ВЕРИФИКАЦИИ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ

Код

Наименование класса

Ко-во

лог.

анк.

% верной

идентификации

ВЫСОКАЯ адекватность модели

1

87

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - низкая

1

100,00

2

106

УСП.ПО ДИСЦ.СД-05 (социология культуры) - высокая

27

88,89

3

46

УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - высокая

35

88,57

4

55

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - высокая

26

88,46

5

45

УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - низкая

8

87,50

6

85

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - высокая

24

87,50

7

13

УСП.ПО ДИСЦ.ГСД-01 (философия) - высокая

23

86,96

8

28

УСП.ПО ДИСЦ.ГСД-06 (право) - высокая

35

85,71

9

37

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - высокая

26

84,62

10

14

УСП.ПО ДИСЦ.ГСД-01 (философия) - средняя

6

83,33

11

16

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - высокая

24

83,33

12

18

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - низкая

6

83,33

СРЕДНЯЯ адекватность модели

13

24

УСП.ПО ДИСЦ.ГСД-04 (история) - низкая

9

77,78

14

22

УСП.ПО ДИСЦ.ГСД-04 (история) - высокая

17

76,47

15

17

УСП.ПО ДИСЦ.ГСД-02 (иностр.язык) - средняя

12

75,00

16

56

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - средняя

8

75,00

17

57

УСП.ПО ДИСЦ.ОПД-02 (общая социология) - низкая

8

75,00

18

43

УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - высокая

15

73,33

19

29

УСП.ПО ДИСЦ.ГСД-06 (право) - средняя

7

71,43

20

47

УСП.ПО ДИСЦ.ЕН-02 (конц.совр.естествознания) - средняя

7

71,43

НИЗКАЯ адекватность модели

21

113

Группа-2

23

69,57

22

23

УСП.ПО ДИСЦ.ГСД-04 (история) - средняя

16

68,75

23

44

УСП.ПО ДИСЦ.ЕН-01 (математика и информатика) - средняя

19

68,42

24

39

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - низкая

3

66,67

25

112

Группа-1

19

63,16

26

15

УСП.ПО ДИСЦ.ГСД-01 (философия) - низкая

13

61,54

ОЧЕНЬ НИЗКАЯ адекватность модели

27

107

УСП.ПО ДИСЦ.СД-05 (социология культуры) - средняя

11

54,55

28

38

УСП.ПО ДИСЦ.ГСД-10 (психология и педагогика) - средняя

13

53,85

29

86

УСП.ПО ДИСЦ.ОПД-12 (социальная экология) - средняя

17

52,94

30

108

УСП.ПО ДИСЦ.СД-05 (социология культуры) - низкая

4

50,00

 

 

Из таблицы 65 видно, что:

– из 113 классов сформированными оказались лишь 30, т.к. по остальным в обучающей выборке просто не было данных;

– если исключить из модели не сформированные классы, а также классы с дифференциальной валидностью (% верной идентификации) меньше 70% (строки с 21 по 30), то получившаяся в результате модель по 20 классам модель будет иметь среднюю адекватность не ниже 70%. Для автоматизации этой операции в системе "Эйдос" в подсистеме измерения адекватности имеется специальный режим. Необходимо отметить, что этот прием аналогичен исключению из рассмотрения результатов обработки с низким доверительным интервалом, что широко используется в дискриминантом анализе.

 

Задание 3. Провести системно-когнитивный анализ модели:
Задание 3.1. Решить задачи идентификации и прогнозирования (для себя).

Эти операции выполняются в 4-й подсистеме системы "Эйдос". Результаты выводятся в двух разрезах:

– индивидуальная универсальная характеристика конкретного респондента (рисунок 113);

– выборка респондентов, имеющих наивысшие сходство с заданным классом (рисунок 114).

Анализ карточек прогноза успеваемости показывает, что вариабельность внутри группы успевающих студентов гораздо выше, чем в группе неуспевающих. В результате в среднем уровень сходства конкретных респондентов с обобщенными образами классов, соответствующих высоким уровням успеваемости, гораздо ниже, чем с классами, соответствующими низким уровням успеваемости.

Это дает основание предложить гипотезу, что высокая успеваемость детерминируется менее жестко, чем низкая, т.е. существуют конкретные факторы, фактически предопределяющие низкую успеваемость, тогда как для высокой успеваемости можно говорить лишь о системе факторов, способствующих высокой успеваемости.

Конечно, чтобы подобные выводы имели достаточную научную достоверность необходима значительно большая статистика, чем использованная в данном учебном примере. Например, если бы подобное исследование было проведено хотя бы в масштабах КубГАУ (более 17000 студентов), то тогда уже с достаточной уверенностью можно было бы говорить о реально обнаруженных закономерностях.

 

Рисунок 113. Прогноз успеваемости по различным предметам
для конкретного студента

 

 

Рисунок 114. Список респондентов в порядке убывания сходства
с заданным классом

 

Формы, подобные представленной на рисунке 113, могут интересовать потенциальных работодателей, а также приемную комиссию вуза в качестве дополнительной информации для принятия решения.

 

 

Задание 3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования.

Определим, как влияют "ФОРМЫ ДОСУГА, КОТОРЫЕ ВЫ ИСПОЛЬЗУЕТЕ ПО ВОЗМОЖНОСТИ" на успеваемость по философии. Для этого в 1-м режиме 5-й подсистемы системы "Эйдос" получим информационный портрет класса с кодом 13: УСП.ПО ДИСЦ.ГСД-01 (философия) – высокая и нажав клавишу F6 зададим фильтр по диапазону градаций названной шкалы с кодом 50: {347, 373}. В результате получим информационный портрет данного класса, представленный в таблице 66.

 

Таблица 66 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА, КОД: 13

 

 

Профиль класса в разрезе по диапазону факторов можно получить в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 115).

 

Рисунок 115. Профиль влияния образовательного уровня отца
на отличную успеваемость студента по философии

 

Из этого рисунка видно, что на отличную успеваемость студента по философии наиболее положительно сказывается если его отец – доктор наук.

В этой связи позволим себе немного повеселить читателей  следующей историей. Профессор спрашивает абитуриента на вступительном экзамене:

– из каких соображений Вы выбрали для поступления именно наш вуз и именно эту специальность?

– не задавай глупых вопросов, папа!

отвечает абитуриент.

Оставшуюся часть задания студентам предлагается выполнить самостоятельно.

 

Задание 3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

В 5-й подсистеме системы "Эйдос" получены следующие семантические сети классов, отражающие степень их сходства по детерминирующим их факторам (рисунок 116), и факторов, отражающие, их сходство и различие по влиянию на уровень учебных достижений учащихся (рисунок 117).

 

Рисунок 116. Пример семантической сети классов

Рисунок 117. Пример семантической сети факторов

 

Задание 3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

Для этого в 3-й функции 1-го режиме 5-й подсистемы системы "Эйдос" зададим коды классов 13 и 15 (высокая и низкая успеваемость по философии) и фильтр по факторам для обоих портретов от 347 до 373 (влияние образовательного уровня отца). В результате получим когнитивную диаграмму, представленную на рисунке 118.

 

Рисунок 118. Когнитивная диаграмма, показывающая результаты содержательного сравнения двух классов по системам их детерминации

 

Проинтерпретировать данную когнитивную диаграмму студенты должны самостоятельно.

 

Задание 3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

Это задание предлагается выполнить самостоятельно. При этом использовать 6-й режим 6-й подсистемы системы "Эйдос".

 

Задание 3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

В 7-м режиме 6-й подсистемы системы "Эйдос" при задании кода класса 13 и диапазона кодов факторов 1 – 11 генерируется следующая классическая когнитивная карта (рисунок 119).

 

Рисунок 119. Пример классической когнитивной карты

 

Задание 3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

В 7-м режиме 6-й подсистемы системы "Эйдос" при задании диапазона кода классов {13, 15} и диапазона кодов факторов {1, 11} генерируется следующая классическая когнитивная карта (рисунок 120), которая, по сути, является суперпозицией нескольких классических когнитивных карт.

Из этого рисунка видно, что факторы с кодами 3, 5, 11 сходны по влиянию на учебные достижения по философии:

– они все препятствуют достижению результата с кодом 13;

– они все способствуют достижению результата с кодом 15;

– результаты с кодами 13 и 15 детерминируются несовместимыми системами факторов и одновременно недостижимы, на что указывает антикорреляция между ними в семантической сети классов;

– фактор 3 способствует результату 14 и препятствует результату 13, а фактор 2, наоборот, препятствует 14 и способствует 13, и факторы 2 и 3 имеют различное влияние на поведение объекта управления, на что указывает антикорреляция между ними в семантической сети факторов.

 Насколько известно, система "Эйдос" на данный момент является единственной системой, обеспечивающей автоматический синтез непосредственно на основе эмпирических данных и отображение в графической форме классических и интегральных когнитивных карт (интегральные когнитивные карты впервые предложены автором).

 

Рисунок 120. Пример интегральной когнитивной карты

 

 

Контрольные вопросы

1. Какие работы выполняются на этапе формализации задачи?

2. Как в системе "Эйдос" ввести классификационные шкалы и градации, выбрав в качестве классов – различные уровни учебных достижений по различным дисциплинам, перечень которых взять из зачетной книжки?

3. Как в системе "Эйдос" ввести описательные шкал и градации, использовав характеристики подчерка?

4. Каким образом подготовить и ввести в систему "Эйдос" обучающую выборку?

5. Как осуществить синтез и верификацию (измерение адекватности) семантической информационной модели в системе "Эйдос"?

6. Что включает системно-когнитивный анализ модели?

7. Как решаются задачи идентификации и прогнозирования в системе "Эйдос"?

8. В каких подсистемах и режимах системы "Эйдос" генерируются информационные портреты классов и факторов и отображаются в графической форме двухмерных и трехмерных профилей классов и факторов)?

9. Каким образом в системе "Эйдос" провести кластерно-конструктивный анализ классов и факторов и отобразить его в форме семантических сетей классов и факторов?

10. Как в системе "Эйдос" осуществить содержательное сравнение классов и факторов и отобразить результаты в форме когнитивных диаграмм классов и факторов?

11. Как в системе "Эйдос" построить нелокальные нейроны и интерпретируемые нейронные сети?

12. Как в системе "Эйдос" построить классические когнитивные модели и отобразить их в форме когнитивных карт?

13. Как в системе "Эйдос" построить интегральные когнитивные модели и отобразить в форме интегральных когнитивных карт?

14. Кто такой "респондент"?

15. Что понимается под "социальным статусом" респондента?

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-5:
"Идентификация слов по входящим в них буквам"

 

Первую лабораторную работу рассмотрим более подробно, чтобы студенты могли ознакомиться с базовой системой "Эйдос", на которой основан курс лекций и лабораторных работ.

В данной работе исследуется возможность идентификации слов по входящим в них буквам. При этом слова рассматриваются как классы распознавания, а буквы – как признаки. Подробно описана технология синтеза и анализа модели с применением инструментария СК-анализа – системы "Эйдос", приведены видеограммы, табличные и графические выходные формы, причем впервые – классическая и интегральная когнитивные карты, генерируемые в версии 12.5. Продемонстрировано на численных примерах, что при идентификации слов главную роль играет информация о входящих в них буквах, а последовательность букв и их сочетаний не играет особой роли. Продемонстрирована устойчивость модели от неполноты и зашумленности информации.

Краткая теория

Язык является мощным средством моделирования реальности. Иерархическая структура языка, включающего в частности такие структуры, как символы, слова, предложения и тексты, является ярким примером иерархической структуры обработки информации, обеспечивающей адекватное отражение структуры реальности. Описание некоторых объектов на естественном языке является их моделированием и позволяет решать задачи идентификации, прогнозирования, сравнения и классификации этих объектов. Автоматизированный синтез моделей объектов, описанных на естественном языке, представляет большой интерес для теории и практики систем искусственного интеллекта.

Эффективность языка, как системы моделирования, удивительна: 32 буквы русского алфавита позволяют составить более 40 тысяч слов русского языка, из которых может быть образовано огромное количество осмысленных предложений.

Каждый символ содержит некоторое количество информации о словах, предложениях и текстах, в которые он входит, каждое слово – о предложениях и текстах, и каждое предложение – о текстах. Однако в буквах содержится больше информации о словах, в словах – о предложениях, в предложениях – о текстах. Поэтому на основе анализа букв целесообразно идентифицировать лишь слова, а на основе слов – предложения, на основе предложений – тексты.

В данной работе исследуется возможность идентификации слов по входящим в них буквам. При этом слова рассматриваются как классы распознавания, а буквы – как признаки.

Эта задача проста и наглядна. Поэтому она рекомендуется в качестве первой лабораторной работы для освоения инструментария системно-когнитивного анализа – универсальной когнитивной аналитической системы "Эйдос" [64, 92].

Подобные задачи имеют большое практическое значение и решаются в ряде систем, например, в редакторе Word – при проверке орфографии и подборе рекомендуемых слов для замены, в системе FineReader – для поиска слов с неверно распознанными символами и др.

Задание

1. Создать файл в стандарте DOS-текст с концами строк, записать его в поддиректорию DOB.

2. Сгенерировать классификационные и описательные шкалы и градации, а также обучающую выборку.

3. Осуществить синтез и верификацию модели.

4. Провести анализ устойчивости модели к неполноте информации и наличию шума.

5. Проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого.

6. Оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв.

7. Выполнить кластерно-конструктивный анализ слов и букв, вывести информационные и семантические портреты слов и букв, построить их профили.

8. Вывести в графической форме семантические сети и когнитивные диаграммы слов и букв, а также классическую и интегральную когнитивные карты.

Пример решения

Пример решения задания 1: "Создать файл в стандарте DOS-текст с концами строк, записать его в поддиректорию DOB"

Текстовый файл создается в редакторе Word или MultiEdit. Если он создан в Word, то при сохранении выбирается режим: "Файл – Сохранить как – Тип файла: Текст DOS  с разбиением на строки". Имя файла произвольное, но удовлетворяющее требованиям DOS. Этот файл каждый студент создает самостоятельно из двух – трех абзацев текста. Например, это может быть краткая биография студента или текст может быть взят из какого-либо файла, имеющегося на компьютере. Могут использоваться и русский, и латинский алфавиты, а также цифры. Регистр роли не играет.

Пример текста файла:

 

Молоко око срок окорок огород В. Г. Белинский
высоко и по достоинству оценил гениальное творение
нашего национального поэта. Великий критик писал:
"Пусть идет время и приводит с собой новые
потребности, пусть растет русское общество и обгоняет
"Онегина": как бы далеко оно ни ушло, всегда будет
оно любить эту поэму, всегда будет останавливать на
ней исполненный любви и благодарности взор...".

 

Слова из этого файла будут использованы системой для выполнения следующего этапа работы.

Пример решения задания 2: "Сгенерировать классификационные и описательные шкалы и градации, а также обучающую выборку"

Генерация классификационных и описательных шкал и градаций осуществляется в соответствующих режимах системы "Эйдос": "Автоввод первичных признаков и TXT-файлов", "F5 Признаки – Буквы". (рисунки 121 и 122):

 

Рисунок 121. Выбор режима "Импорт данных из TXT-файлов
стандарта DOS-текст

Рисунок 122. Выбор режима "Признаки – F5 Буквы"

 

В результате будут автоматически сгенерированы классификационные и описательные шкалы и градации, а также обучающая выборка (приведена полностью) (таблицы 67, 68, 69).

 

 

 

Таблица 67 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ (СЛОВА)

Код

Слово

Код

Слово

Код

Слово

1

БЕЛИНСКИЙ

16

ЛЮБВИ

31

ОЦЕНИЛ

2

БЛАГОДАРНОСТИ

17

ЛЮБИТЬ

32

ПИСАЛ

3

БУДЕТ

18

МОЛОКО

33

ПОТРЕБНОСТИ

4

ВЕЛИКИЙ

19

НАЦИОНАЛЬНОГО

34

ПОЭМУ

5

ВЗОР

20

НАШЕГО

35

ПОЭТА

6

ВРЕМЯ

21

НЕЙ

36

ПРИВОДИТ

7

ВСЕГДА

22

НОВЫЕ

37

ПУСТЬ

8

ВЫСОКО

23

ОБГОНЯЕТ

38

РАСТЕТ

9

ГЕНИАЛЬНОЕ

24

ОБЩЕСТВО

39

РУССКОЕ

10

ДАЛЕКО

25

ОГОРОД

40

СОБОЙ

11

ДОСТОИНСТВУ

26

ОКО

41

СРОК

12

ИДЕТ

27

ОКОРОК

42

ТВОРЕНИЕ

13

ИСПОЛНЕННЫЙ

28

ОНЕГИНА

43

УШЛО

14

КАК

29

ОНО

44

ЭТУ

15

КРИТИК

30

ОСТАНАВЛИВАТЬ

 

 

 

 

 

Таблица 68 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (БУКВЫ)

Код

Буква

Код

Буква

Код

Буква

Код

Буква

1

0

18

H

35

Y

52

П

2

1

19

I

36

Z

53

Р

3

2

20

J

37

А

54

С

4

3

21

K

38

Б

55

Т

5

4

22

L

39

В

56

У

6

5

23

M

40

Г

57

Ф

7

6

24

N

41

Д

58

Х

8

7

25

O

42

Е

59

Ц

9

8

26

P

43

Ж

60

Ч

10

9

27

Q

44

З

61

Ш

11

A

28

R

45

И

62

Щ

12

B

29

S

46

Й

63

Ъ

13

C

30

T

47

К

64

Ы

14

D

31

U

48

Л

65

Ь

15

E

32

V

49

М

66

Э

16

F

33

W

50

Н

67

Ю

17

G

34

X

51

О

68

Я

 

 

 

 

 

 

 

Таблица 69 – ОБУЧАЮЩАЯ ВЫБОРКА

Класс

Коды признаков

1

БЕЛИНСКИЙ

38

42

48

45

50

54

47

45

46

77

 

 

 

 

2

БЛАГОДАРНОСТИ

38

48

37

40

51

41

37

53

50

51

54

55

45

81

3

БУДЕТ

38

56

41

42

55

73

 

 

 

 

 

 

 

 

4

ВЕЛИКИЙ

39

42

48

45

47

45

46

75

 

 

 

 

 

 

5

ВЗОР

39

44

51

53

72

 

 

 

 

 

 

 

 

 

6

ВРЕМЯ

39

53

42

49

68

73

 

 

 

 

 

 

 

 

7

ВСЕГДА

39

54

42

40

41

37

74

 

 

 

 

 

 

 

8

ВЫСОКО

39

64

54

51

47

51

74

 

 

 

 

 

 

 

9

ГЕНИАЛЬНОЕ

40

42

50

45

37

48

65

50

51

42

78

 

 

 

10

ДАЛЕКО

41

37

48

42

47

51

74

 

 

 

 

 

 

 

11

ДОСТОИНСТВУ

41

51

54

55

51

45

50

54

55

39

56

79

 

 

12

ИДЕТ

45

41

42

55

72

 

 

 

 

 

 

 

 

 

13

ИСПОЛНЕННЫЙ

45

54

52

51

48

50

42

50

50

64

46

79

 

 

14

КАК

47

37

47

71

 

 

 

 

 

 

 

 

 

 

15

КРИТИК

47

53

45

55

45

47

74

 

 

 

 

 

 

 

16

ЛЮБВИ

48

67

38

39

45

73

 

 

 

 

 

 

 

 

17

ЛЮБИТЬ

48

67

38

45

55

65

74

 

 

 

 

 

 

 

18

МОЛОКО

49

51

48

51

47

51

74

 

 

 

 

 

 

 

19

НАЦИОНАЛЬНОГО

50

37

59

45

51

50

37

48

65

50

51

40

51

81

20

НАШЕГО

50

37

61

42

40

51

74

 

 

 

 

 

 

 

21

НЕЙ

50

42

46

71

 

 

 

 

 

 

 

 

 

 

22

НОВЫЕ

50

51

39

64

42

73

 

 

 

 

 

 

 

 

23

ОБГОНЯЕТ

51

38

40

51

50

68

42

55

76

 

 

 

 

 

24

ОБЩЕСТВО

51

38

62

42

54

55

39

51

76

 

 

 

 

 

25

ОГОРОД

51

40

51

53

51

41

74

 

 

 

 

 

 

 

26

ОКО

51

47

51

71

 

 

 

 

 

 

 

 

 

 

27

ОКОРОК

51

47

51

53

51

47

74

 

 

 

 

 

 

 

28

ОНЕГИНА

51

50

42

40

45

50

37

75

 

 

 

 

 

 

29

ОНО

51

50

51

71

 

 

 

 

 

 

 

 

 

 

30

ОСТАНАВЛИВАТЬ

51

54

55

37

50

37

39

48

45

39

37

55

65

81

31

ОЦЕНИЛ

51

59

42

50

45

48

74

 

 

 

 

 

 

 

32

ПИСАЛ

52

45

54

37

48

73

 

 

 

 

 

 

 

 

33

ПОТРЕБНОСТИ

52

51

55

53

42

38

50

51

54

55

45

79

 

 

34

ПОЭМУ

52

51

66

49

56

73

 

 

 

 

 

 

 

 

35

ПОЭТА

52

51

66

55

37

73

 

 

 

 

 

 

 

 

36

ПРИВОДИТ

52

53

45

39

51

41

45

55

76

 

 

 

 

 

37

ПУСТЬ

52

56

54

55

65

73

 

 

 

 

 

 

 

 

38

РАСТЕТ

53

37

54

55

42

55

74

 

 

 

 

 

 

 

39

РУССКОЕ

53

56

54

54

47

51

42

75

 

 

 

 

 

 

40

СОБОЙ

54

51

38

51

46

73

 

 

 

 

 

 

 

 

41

СРОК

54

53

51

47

72

 

 

 

 

 

 

 

 

 

42

ТВОРЕНИЕ

55

39

51

53

42

50

45

42

76

 

 

 

 

 

43

УШЛО

56

61

48

51

72

 

 

 

 

 

 

 

 

 

44

ЭТУ

66

55

56

71

 

 

 

 

 

 

 

 

 

 

 

Пример решения задания 3: " Осуществить синтез и верификацию модели"

Синтез модели осуществляется на основе обучающей выборки (таблица 69) в соответствующем режиме (рисунок 123) после формирования классификационных и описательных шкал и градаций и обучающей выборки.

 

Рисунок 123. Режим "Синтез семантической информационной модели"
системы "Эйдос"

 

В результате синтеза семантической информационной модели рассчитываются две ее основные матрицы: матрица абсолютных частот (таблица 70) и матрица информативностей (таблица 71).

В матрице частот отражается суммарное количество встреч каждого признака у объектов каждого класса по данным обучающей выборки. Каждый элемент матрицы информативностей показывает, какое количество информации о переходе объекта управления в состояние, соответствующее классу, мы получаем, если узнаем, что действует некоторый признак.

 

 

 

 

 

Таблица 70 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ (ФРАГМЕНТ)

Коды
букв

Коды классов (слов)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

37

 

2

 

 

 

 

1

 

1

1

 

 

 

1

 

 

 

 

2

38

1

1

1

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

39

 

 

 

1

1

1

1

1

 

 

1

 

 

 

 

1

 

 

 

40

 

1

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

1

41

 

1

1

 

 

 

1

 

 

1

1

1

 

 

 

 

 

 

 

42

1

 

1

1

 

1

1

 

2

1

 

1

1

 

 

 

 

 

 

43

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

44

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

45

2

1

 

2

 

 

 

 

1

 

1

1

1

 

2

1

1

 

1

46

1

 

 

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

47

1

 

 

1

 

 

 

1

 

1

 

 

 

2

2

 

 

1

 

48

1

1

 

1

 

 

 

 

1

1

 

 

1

 

 

1

1

1

1

49

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

1

 

50

1

1

 

 

 

 

 

 

2

 

1

 

3

 

 

 

 

 

3

51

 

2

 

 

1

 

 

2

1

1

2

 

1

 

 

 

 

3

3

52

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

53

 

1

 

 

1

1

 

 

 

 

 

 

 

 

1

 

 

 

 

54

1

1

 

 

 

 

1

1

 

 

2

 

1

 

 

 

 

 

 

55

 

1

1

 

 

 

 

 

 

 

2

1

 

 

1

 

1

 

 

56

 

 

1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

Таблица 71 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ (ФРАГМЕНТ)

Коды
букв

Коды классов (слов)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

37

 

1,0

 

 

 

 

1,1

 

0,6

1,1

 

 

 

1,7

 

 

 

 

1,0

38

1,2

0,9

1,8

 

 

 

 

 

 

 

 

 

 

 

 

1,8

1,6

 

 

39

 

 

 

1,1

1,6

1,4

1,3

1,3

 

 

0,7

 

 

 

 

1,4

 

 

 

40

 

1,0

 

 

 

 

1,7

 

1,2

 

 

 

 

 

 

 

 

 

1,0

41

 

1,0

1,9

 

 

 

1,7

 

 

1,7

1,1

2,1

 

 

 

 

 

 

 

42

0,4

 

0,9

0,6

 

0,9

0,7

 

0,9

0,7

 

1,1

0,2

 

 

 

 

 

 

43

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

44

 

 

 

 

4,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

45

1,0

 

 

1,3

 

 

 

 

0,3

 

0,2

1,1

0,2

 

1,4

0,9

0,7

 

 

46

1,8

 

 

2,0

 

 

 

 

 

 

 

 

1,6

 

 

 

 

 

 

47

0,8

 

 

1,0

 

 

 

1,2

 

1,2

 

 

 

2,5

1,9

 

 

1,2

 

48

0,8

0,4

 

1,0

 

 

 

 

0,7

1,2

 

 

0,6

 

 

1,4

1,2

1,2

0,4

49

 

 

 

 

 

2,8

 

 

 

 

 

 

 

 

 

 

 

2,7

 

50

0,4

 

 

 

 

 

 

 

0,9

 

0,2

 

1,2

 

 

 

 

 

1,1

51

 

 

 

 

0,4

 

 

0,7

-0,5

 

0,1

 

-0,6

 

 

 

 

1,1

0,3

52

 

 

 

 

 

 

 

 

 

 

 

 

1,3

 

 

 

 

 

 

53

 

0,6

 

 

1,7

1,5

 

 

 

 

 

 

 

 

1,3

 

 

 

 

54

0,6

0,2

 

 

 

 

1,0

1,0

 

 

1,1

 

0,4

 

 

 

 

 

 

55

 

0,1

1,0

 

 

 

 

 

 

 

0,9

1,2

 

 

0,8

 

0,8

 

 

56

 

 

2,0

 

 

 

 

 

 

 

1,3

 

 

 

 

 

 

 

 

 

Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую (рисунок 124), распознавания (рисунок 125, 126) и измерения дифференциальной и интегральной валидности (рисунок 127):

 

Рисунок 124. Режим "Ввод-корректировка обучающей выборки"
системы "Эйдос" (копирование ее в распознаваемую – F5)

 

Рисунок 125. Выбор режима "Пакетное распознавание"
системы "Эйдос"

 

Рисунок 126. Выполнение режима "Пакетное распознавание"
системы "Эйдос"

 

Рисунок 127. Выбор режима "Измерение адекватности модели"
системы "Эйдос"

 

Рисунок 128. Режим "Измерение адекватности модели"
системы "Эйдос"

 

Видим, что модель адекватна, т.к. интегральная валидность составляет 100%. Это означает, что при идентификации слов на основе знания входящих в них букв системой не было допущено ни одной ошибки, причем необходимо специально отметить, что при этом в модели не учитывались последовательность букв и их сочетаний.

 

Пример решения задания 4: "Проверить устойчивость модели к неполноте информации и наличию шума"

В примере, исследуемом в данной лабораторной работе, неполнота информации – это пропуск букв, а наличие шума – замена верных букв неверными.

Устойчивость модели к неполноте информации

Подготовим распознаваемую выборку, состоящую из идентифицируемых слов с отсутствующими буквами.

Для этого выполним следующую последовательность шагов:

Шаг 1. Сбросим распознаваемую выборку в режиме "F7 Сервис – Генерация (сброс) баз данных – Распознаваемые анкеты" (рисунок 129):

 

Рисунок 129. Режим "Сброс распознаваемой выборки"
системы "Эйдос"

 

Шаг 2. Скопируем, например, первую анкету из обучающей выборки в распознаваемую, используя возможности режима "F2 Обучение – Ввод-корректировка обучающей выборки" (рисунок 124);

Шаг 3. Выберем режим "F4 Распознавание – Ввод-корректировка распознаваемой выборки" (рисунок 130):

 

Рисунок 130. Выбор режима "Ввод-корректировка распознаваемой
выборки" системы "Эйдос"

 

Выбор режима осуществляется нажатием клавиши Enter.

Шаг 4. Перейдем в правое окно, в котором задаются коды признаков, нажав клавишу "TAB".

Шаг 5. Удаляем последний код признака и дублируем анкету, нажав клавишу "F5 Дублирование анкеты".

Повторяем шаги 4 и 5 до тех пор, пока в описании слова останется одна буква. В результате получится видеограмма, представленная на  рисунке 131.

Студенты при выполнении этого этапа работы могут взять несколько анкет на выбор. При этом набор анкет должен отличаться у разных студентов.

Обучающая выборка в этом случае будет иметь вид, представленный на таблице 72:

 

Таблица 72 – ВАРИАНТЫ КОДИРОВАНИЯ ОБЪЕКТА ОБУЧАЮЩЕЙ ВЫБОРКИ, ОТЛИЧАЮЩИЕСЯ СТЕПЕНЬЮ НЕПОЛНОТЫ ИНФОРМАЦИИ

Класс

Коды признаков

1

БЕЛИНСКИЙ

38

42

48

45

50

54

47

45

46

 

 

 

 

 

2

БЕЛИНСКИЙ

38

42

48

45

50

54

47

45

 

 

 

 

 

 

3

БЕЛИНСКИЙ

38

42

48

45

50

54

47

 

 

 

 

 

 

 

4

БЕЛИНСКИЙ

38

42

48

45

50

54

 

 

 

 

 

 

 

 

5

БЕЛИНСКИЙ

38

42

48

45

50

 

 

 

 

 

 

 

 

 

6

БЕЛИНСКИЙ

38

42

48

45

 

 

 

 

 

 

 

 

 

 

7

БЕЛИНСКИЙ

38

42

48

 

 

 

 

 

 

 

 

 

 

 

8

БЕЛИНСКИЙ

38

42

 

 

 

 

 

 

 

 

 

 

 

 

9

БЕЛИНСКИЙ

38

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Жирным шрифтом выделены символы, коды которых есть в анкете.

 

Рисунок 131. Выполнение режима "Ввод-корректировка
распознаваемой выборки" системы "Эйдос"

 

Шаг 6. Выполним пакетное распознавание, выбрав и выполнив режим "F4 Распознавание – Пакетное распознавание", как показано на рисунках 125 и 126.

Шаг 7. Затем выберем и выполним режим "F4 Распознавание – Вывод результатов распознавания" (рисунок 132):

 

Рисунок 132. Выбор режима "Вывод результатов распознавания"
системы "Эйдос"

 

Шаг 8. Войдя в этот режим получим видеограмму, представленную на рисунке 133:

 

Рисунок 133. Обобщенная форма по результатам выполнения режима
"Вывод результатов распознавания" системы "Эйдос"

 

Шаг 9. Нажав клавишу "F1 Карта идентификации объекта с классами" получим более подробные результаты идентификации, представленные в карточках распознавания на рисунке 134:

 

 

 

 

 

 

Рисунок 134. Идентификация в условиях неполноты информации
в системе "Эйдос"

 

Из обобщенных и детальных выходных форм по результатам распознавания слова по его неполному описанию видно, что модель обладает очень высокой устойчивостью к неполноте информации в описании идентифицируемых объектов.

Устойчивость модели к наличию шума

Шум можно рассматривать как сочетание неполноты информации (т.к. некоторые значащие символы исчезают из описаний объектов), и дезинформации (т.к. в описание включаются ложные символы).

Поэтому замену символов в словах на символы, которые не встречаются по обучающей выборке можно считать неполнотой информации. Этот случай мы рассматривать не будем, т.к. по сути уже рассмотрели его в предыдущем пункте.

Рассмотрим пример, в котором одно слово заменой букв преобразуется в другое слово, например, слово "критик" преобразуется в слово "окорок". Каждой замене будет соответствовать одна анкета распознаваемой выборки (таблица 73):

 

Таблица 73 – ВАРИАНТЫ КОДИРОВАНИЯ ОБЪЕКТА ОБУЧАЮЩЕЙ ВЫБОРКИ, ОТЛИЧАЮЩИЕСЯ УРОВНЕМ ШУМА

Класс

Коды признаков

1

КРИТИК

47

53

45

55

45

47

 

 

 

 

 

 

 

 

2

КРОТИК

47

53

51

55

45

47

 

 

 

 

 

 

 

 

3

КРОТОК

47

53

51

55

51

47

 

 

 

 

 

 

 

 

4

ОКОРОК

47

53

51

51

51

47

 

 

 

 

 

 

 

 

 

Результаты идентификации представлены на рисунке 135:

 

 

 

 

 

 

 

Рисунок 135. Результаты идентификации в условиях шума
в системе "Эйдос"

 

Видим, что модель обладает определенной устойчивостью и к шуму.

Пример решения задания 5: "Проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого"

С этой целью в текстовый файл специально включены такие слова, как: "око", "окорок", "молоко".

Результаты их идентификации приведены на рисунке 136:

 

 

 

Рисунок 136. Карточка результатов распознавания системы "Эйдос"
в случае идентификации классов, один из которых
является подмножеством других

 

Как видим, идентификация классов, один из которых является подмножеством других, осуществляется правильно. Это является важным достоинством семантической информационной модели системы "Эйдос", т.к. представляет собой проблему для многих типов нейронных сетей. Достаточно отметить, что возможность решения подобных задач считается одним из основных достоинств развитой модели нейронной сети, реализованной в неокогнитроне Фукушимы.

 

Пример решения задания 6: Оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв

Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок 137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.

 

Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления

 

Рисунок 138. Парето-диаграмма ценности букв для идентификации слов

 

Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.

 

Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ

Код

Буква

Ценность (бит)

Ценность (бит)
"нарастающим итогом"

Ценность (%)
"нарастающим итогом"

1

66

Э

0,76988

0,76988

4,841

2

56

У

0,74529

1,51517

9,526

3

49

М

0,71090

2,22607

13,996

4

46

Й

0,69728

2,92335

18,380

5

61

Ш

0,68748

3,61083

22,703

6

47

К

0,68569

4,29652

27,014

7

67

Ю

0,66376

4,96028

31,187

8

52

П

0,66014

5,62042

35,338

9

64

Ы

0,65157

6,27199

39,434

10

41

Д

0,64023

6,91222

43,460

11

68

Я

0,63612

7,54834

47,459

12

44

З

0,62131

8,16965

51,366

13

65

Ь

0,59697

8,76662

55,119

14

38

Б

0,59622

9,36284

58,868

15

53

Р

0,58610

9,94894

62,553

16

59

Ц

0,57201

10,52095

66,149

17

40

Г

0,56958

11,09053

69,730

18

39

В

0,55490

11,64543

73,219

19

62

Щ

0,52045

12,16588

76,492

20

37

А

0,51477

12,68065

79,728

21

48

Л

0,50010

13,18075

82,872

22

54

С

0,47977

13,66052

85,889

23

55

Т

0,47498

14,13550

88,875

24

51

О

0,46548

14,60098

91,802

25

50

Н

0,45089

15,05187

94,637

26

45

И

0,43046

15,48233

97,343

27

42

Е

0,42253

15,90486

100,000

 

Пример решения задания 7: "Выполнить кластерно-конструктивный анализ слов и букв, вывести информационные и семантические портреты слов и букв, построить их профили"
Кластерно-конструктивный анализ слов

Кластерно-конструктивный анализ выполняется в 5-й подсистеме "Типология" (рисунок 139). Сначала на основе матрицы информативностей рассчитывается матрица сходства классов (таблица 75), а затем на основе нее формируется таблица кластеров и конструктов классов (таблица 76).

 

Рисунок 139. Запуск режима кластерно-конструктивного анализа классов (слов)

 

Таблица 75 – ФРАГМЕНТ МАТРИЦЫ СХОДСТВА КЛАССОВ (СЛОВ)

Код

Коды классов

1

2

3

4

5

6

7

8

9

10

11

12

1

100,0

20,0

19,0

78,1

-6,6

-5,5

1,3

9,7

12,9

22,2

5,3

13,3

2

20,0

100,0

43,1

-1,4

4,3

1,5

68,2

-4,6

32,4

54,0

23,9

31,5

3

19,0

43,1

100,0

-2,4

-5,5

-1,6

29,5

-6,7

2,2

36,3

65,5

57,8

4

78,1

-1,4

-2,4

100,0

7,2

7,9

11,7

19,5

12,9

29,3

5,6

18,3

5

-6,6

4,3

-5,5

7,2

100,0

17,2

8,3

10,2

-7,2

-5,5

4,9

-4,9

6

-5,5

1,5

-1,6

7,9

17,2

100,0

9,6

5,1

0,0

-1,4

1,4

1,7

7

1,3

68,2

29,5

11,7

8,3

9,6

100,0

18,0

35,1

49,5

47,9

44,5

8

9,7

-4,6

-6,7

19,5

10,2

5,1

18,0

100,0

-10,6

9,6

19,6

-6,0

9

12,9

32,4

2,2

12,9

-7,2

0,0

35,1

-10,6

100,0

23,3

-5,8

11,7

10

22,2

54,0

36,3

29,3

-5,5

-1,4

49,5

9,6

23,3

100,0

25,3

53,4

11

5,3

23,9

65,5

5,6

4,9

1,4

47,9

19,6

-5,8

25,3

100,0

51,4

12

13,3

31,5

57,8

18,3

-4,9

1,7

44,5

-6,0

11,7

53,4

51,4

100,0

13

42,0

-2,2

-5,7

36,4

-7,0

-5,8

-2,4

46,5

16,9

2,4

0,5

-2,3

14

19,8

23,2

-4,6

24,4

-3,5

-4,4

14,7

25,7

7,8

55,9

-5,1

-4,1

15

32,9

8,4

2,5

39,0

13,0

9,4

-7,2

18,2

-1,5

23,9

9,2

28,2

16

30,3

18,2

15,4

26,5

6,9

3,9

6,5

6,7

4,0

7,7

4,3

2,8

17

24,1

15,2

18,0

9,3

-5,6

-7,0

-8,2

-6,9

35,3

5,0

1,2

9,0

18

14,6

0,1

-6,1

18,9

-1,6

43,7

-6,8

14,5

-2,5

26,9

-5,1

-5,5

19

-0,6

24,6

-7,8

-3,6

-5,0

-7,4

19,5

-4,9

57,2

10,9

-5,7

-7,0

20

-2,3

29,7

-1,1

-2,9

-4,9

-2,2

33,7

-5,8

36,1

10,5

-5,7

2,3

21

61,5

-6,4

5,7

59,9

-4,1

3,0

4,1

-5,0

24,2

6,3

-3,1

11,8

22

0,1

-7,4

1,2

14,9

10,8

12,4

17,4

80,2

12,3

1,6

8,2

5,5

23

13,3

30,3

21,5

-4,9

-4,3

51,6

19,3

-4,0

20,5

-3,2

0,5

6,2

24

13,9

10,1

18,6

4,7

4,8

3,7

12,0

11,3

-4,4

-3,2

15,7

5,2

 

 

Таблица 76 – КОНСТРУКТ СЛОВ: "КРИТИК – ВСЕГДА"

Код
слова

Слово

Уровень
сходства

Код
слова

Слово

Уровень
сходства

1

15

КРИТИК

100,00

23

2

БЛАГОДАРНОСТИ

8,37

2

27

ОКОРОК

71,79

24

28

ОНЕГИНА

7,32

3

41

СРОК

65,59

25

31

ОЦЕНИЛ

5,70

4

14

КАК

52,61

26

44

ЭТУ

5,67

5

26

ОКО

51,07

27

16

ЛЮБВИ

5,34

6

42

ТВОРЕНИЕ

40,52

28

30

ОСТАНАВЛИВАТЬ

3,81

7

39

РУССКОЕ

40,23

29

35

ПОЭТА

2,59

8

36

ПРИВОДИТ

39,13

30

3

БУДЕТ

2,53

9

4

ВЕЛИКИЙ

38,98

31

37

ПУСТЬ

1,54

10

38

РАСТЕТ

37,88

32

23

ОБГОНЯЕТ

-1,37

11

1

БЕЛИНСКИЙ

32,92

33

9

ГЕНИАЛЬНОЕ

-1,50

12

33

ПОТРЕБНОСТИ

29,38

34

24

ОБЩЕСТВО

-1,55

13

12

ИДЕТ

28,16

35

13

ИСПОЛНЕННЫЙ

-3,75

14

10

ДАЛЕКО

23,87

36

29

ОНО

-4,20

15

18

МОЛОКО

19,13

37

21

НЕЙ

-4,87

16

8

ВЫСОКО

18,23

38

43

УШЛО

-5,20

17

25

ОГОРОД

16,45

39

22

НОВЫЕ

-5,51

18

5

ВЗОР

12,98

40

40

СОБОЙ

-5,64

19

6

ВРЕМЯ

9,39

41

20

НАШЕГО

-5,81

20

32

ПИСАЛ

9,36

42

34

ПОЭМУ

-6,07

21

11

ДОСТОИНСТВУ

9,19

43

19

НАЦИОНАЛЬНОГО

-7,01

22

17

ЛЮБИТЬ

8,54

44

7

ВСЕГДА

-7,17

 

Кластерно-конструктивный анализ букв

Аналогично в режиме кластерно-конструктивного анализа признаков (рисунок 140) получаем матрицу сходства букв и конструкты букв (таблицы 77 и 78).

 

Рисунок 140. Запуск режима кластерно-конструктивного анализа
признаков (букв)

 

Таблица 77 – ФРАГМЕНТ МАТРИЦЫ СХОДСТВА ПРИЗНАКОВ (БУКВ)

Код

Коды букв

37

38

39

40

41

42

43

44

45

46

47

48

37

100,0

-22,5

-11,1

33,7

5,4

-1,6

0,0

-9,0

-15,9

-20,6

5,1

6,5

38

-22,5

100,0

-2,1

-3,6

3,3

-6,5

0,0

-7,5

9,4

18,5

-20,9

13,9

39

-11,1

-2,1

100,0

-11,3

1,2

10,7

0,0

36,7

7,5

-7,3

-15,9

-6,5

40

33,7

-3,6

-11,3

100,0

22,9

15,2

0,0

-7,0

-15,4

-16,0

-24,7

-14,5

41

5,4

3,3

1,2

22,9

100,0

21,7

0,0

-7,0

8,5

-16,0

-13,8

-10,4

42

-1,6

-6,5

10,7

15,2

21,7

100,0

0,0

-12,0

6,1

20,8

-23,3

-11,4

43

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

44

-9,0

-7,5

36,7

-7,0

-7,0

-12,0

0,0

100,0

-9,1

-5,3

-8,2

-9,4

45

-15,9

9,4

7,5

-15,4

8,5

6,1

0,0

-9,1

100,0

15,3

5,4

35,3

46

-20,6

18,5

-7,3

-16,0

-16,0

20,8

0,0

-5,3

15,3

100,0

-1,8

8,1

47

5,1

-20,9

-15,9

-24,7

-13,8

-23,3

0,0

-8,2

5,4

-1,8

100,0

-2,8

48

6,5

13,9

-6,5

-14,5

-10,4

-11,4

0,0

-9,4

35,3

8,1

-2,8

100,0

49

-15,9

-13,3

7,9

-12,4

-12,4

-1,0

0,0

-4,1

-16,1

-9,5

0,5

3,9

50

0,9

-17,8

-16,8

29,0

-25,0

35,9

0,0

-8,8

-5,8

28,7

-29,0

-4,8

51

-31,8

2,6

-15,6

-0,9

-6,2

-36,3

0,0

7,6

-32,1

-6,3

30,3

-14,0

52

9,1

-13,2

-15,5

-19,5

-7,0

-30,2

0,0

-6,5

8,0

-4,7

-22,9

-1,6

53

-19,2

-20,2

15,7

-6,9

0,5

-4,8

0,0

36,4

-0,6

-20,4

19,8

-34,1

54

1,8

5,0

-0,5

-12,2

-4,6

-14,4

0,0

-9,6

-14,8

9,2

4,4

-14,3

55

-1,9

13,6

-12,1

-23,1

18,7

2,1

0,0

-10,3

10,2

-23,5

-25,1

-28,2

56

-25,1

-2,0

-20,5

-19,6

6,3

-12,3

0,0

-6,5

-23,8

-14,9

-14,9

-4,3

57

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

58

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

59

5,1

-10,6

-12,8

6,2

-9,9

4,9

0,0

-3,3

8,7

-7,6

-11,6

24,3

60

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

0,0

 

Таблица 78 – КОНСТРУКТ БУКВ: "А – О"

Код буквы

Буква

Уровень сходства

Код буквы

Буква

Уровень сходства

1

37

А

100,00

13

42

Е

-1,57

2

40

Г

33,67

14

55

Т

-1,90

3

65

Ь

11,94

15

44

З

-8,98

4

52

П

9,08

16

62

Щ

-8,98

5

61

Ш

8,37

17

39

В

-11,08

6

48

Л

6,54

18

68

Я

-12,81

7

41

Д

5,41

19

67

Ю

-12,84

8

47

К

5,13

20

64

Ы

-15,79

9

59

Ц

5,13

21

45

И

-15,90

10

66

Э

4,66

22

49

М

-15,92

11

54

С

1,79

23

53

Р

-19,19

12

50

Н

0,90

24

46

Й

-20,58

 

 

 

 

25

38

Б

-22,52

 

 

 

 

26

56

У

-25,09

 

 

 

 

27

51

О

-31,79

 

Информационные портреты классов (слов)

Информационные портреты классов (слов) представляют собой списки признаков (букв), проранжированных в порядке убывания количества информации, содержащихся в них о принадлежности к данным классам.

Выход на режим генерации информационных портретов классов показан на рисунке 140. На рисунке 141 приведена круговая диаграмма информационного портрета класса (слова) "Достоинству". Обращает внимание, что в 4-х буквах из 8: "У", "Д", "С", "Т" содержится более 80% информации о принадлежности к данному слову.

 

Рисунок 141.  Информационный портрет слова "Достоинству"

 

Профили слов

Профиль класса представляет собой гистограмму, в которой показан вклад каждого признака в общее количество информации, содержащееся в образе данного класса.

Профили классов и признаков отображаются в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 142). Для примера на рисунке 143 показан профиль того же слова "Достоинству".

 

Рисунок 142.  Выход на режим вывода профилей классов и признаков

 

Рисунок 143.  Профиль слова "Достоинству"

 

Семантические портреты и профили букв

Выход на режим генерации семантических портретов признаков (букв) показан на рисунке 140. Один таких портретов, а именно портрет буквы "Й", приведен на рисунке 144, а ее профиль – на рисунке 145.

 

Рисунок 144.  Информационный портрет буквы "Й"

 

Рисунок 145.  Профиль буквы "Й"

 

Пример решения задания 8: "Вывести в графической форме семантические сети и когнитивные диаграммы слов и букв, классическую и интегральную когнитивные карты"

Эти возможности реализуются в режимах, выход на которые показан на рисунке 140. Семантическая сеть классов отображает в графической форме результаты кластерно-конструктивного анализа слов (рисунок 146), а признаков – букв (рисунок 147). Красный цвет линии связи в семантических сетях означает сходство, а синяя – различие, толщина линии соответствует степени выраженности этого свойства. Детальную структуру любой линии связи на семантических сетях можно исследовать на когнитивных диаграммах классов (рисунок 148) и признаков (рисунок 149). Классическая когнитивная карта для слова "Останавливать" приведена на рисунке 150. Классическая когнитивная карта представляет собой графическую диаграмму, объединяющую изображение нейрона и семантической сети его рецепторов. Классическая когнитивная карта представляет собой подмножество "Интегральной когнитивной карты", в которой объединены семантический сети нейронов и рецепторов и фрагмент нейронной сети, соединяющей рецепторы с нейронами. Режим системы "Эйдос" "Классические и интегральные когнитивные карты" позволяет при соответствующих параметрах, задаваемых в диалоге, генерировать и выводить в графической форме как интегральные,  так и классические когнитивные карты, а также инвертированные когнитивные карты, представляющие собой семантическую сеть нейронов, соединенных фрагментов нейронной сети с одним рецептором.

 

Рисунок 146. Семантическая сеть классов (слов)

Рисунок 147. Семантическая сеть признаков (букв)

Рисунок 148. Детальная структура сходства слов "Молоко" и "Око"

Рисунок 149. Детальная структура сходства букв "Е" и "Н"

Рисунок 150. Классическая когнитивная карта для слова
"Останавливать", генерируемая системой "Эйдос" версии 10.7

Рисунок 151. Пример интегральной когнитивной карты,
генерируемой системой "Эйдос" версии 12.5

 

Выводы

На основе вышеизложенного можно сделать вывод о том, что для надежной и достоверной идентификации слов (по крайней мере при сравнительно небольшом их количестве) вполне достаточно информации о входящих в них буквах, и для этого нет особой необходимости привлекать дополнительную информацию о последовательности букв и их сочетаний. Продемонстрирована устойчивость модели от неполноты и зашумленности информации. Приведено более 30 графических форм, генерируемых системой "Эйдос", в т.ч. новые формы – классическая и интегральная когнитивные карты.

Контрольные вопросы

1. Каким образом провести анализ устойчивости модели к неполноте информации и наличию шума?

2. Каким образом можно проверить способность модели правильно идентифицировать классы, один из которых является подмножеством другого?

3. Как оценить ценность букв для идентификации слов. Сравнить суммарную ценность для этой цели гласных и согласных букв?

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

 

ЛР-6:
"Атрибуция анонимных
и псевдонимных текстов"

 

Краткая теория

Данная лабораторная работа является продолжением предыдущей, поэтому внимательно прочитайте теорию по предыдущей лабораторной работе. В этой работе исследуется возможность атрибуции текстов с применением технологии и инструментария системно-когнитивного анализа. Приведен подробный численный пример реализации всех этапов СК-анализа при атрибуции текстов, т.е. когнитивной структуризации и формализации предметной области; формирования обучающей выборки; синтеза семантической информационной модели; ее оптимизации и измерения адекватности; адаптации и пересинтеза; а также типологического и кластерно-конструктивного анализа.

Под атрибуцией анонимных и псевдонимных текстов понимается установление их вероятного авторства ([1-5] рекомендуемой литературы).

Анонимные тексты – это тексты вообще без подписи автора, а псевдонимные – подписанные не фамилией автора, а псевдонимом.

Задача идентификации текстов на основе анализа предложений является тривиальной из-за практически абсолютной уникальности предложений. Поэтому больший интерес представляет задача идентификация текстов на основе анализа слов, т.е. задача атрибуции текстов, имеющая очень большое научное и практическое значение. К этой задаче сводится определение вероятного авторства текстов в случае, когда автор не указан (анонимный текст) или указан его псевдоним (псевдонимный текст), а также датировка текста.

Но самое главное, что к задаче атрибуции текстов сводятся задачи идентификации, прогнозирования, сравнения и классификации объектов, описанных на естественном языке (причем не важно, на каком именно).

С ней связаны также задачи автоматического выделения дескрипторов и задачи нечеткого поиска и идентификации.

Все эти задачи имеют практическое значение для специалистов по прикладной информатики в экономике и юриспруденции, которых готовит Кубанский государственный аграрный университет.

Одному из вариантов рения этих задач с применением интеллектуальной технологии "Эйдос" и посвящена данная лабораторная работа.

 

Задания

Следуя логике Системно-когнитивного анализа выполнить следующие работы.

1. Осуществить когнитивную структуризацию предметной области.

2. Выполнить формализацию предметной области.

3. Сформировать обучающую выборку.

4. Осуществить синтез семантической информационной модели.

5. Оптимизировать семантическую информационную модель.

6. Проверить семантическую информационную модель на адекватность, измерить внутреннюю и внешнюю, дифференциальную и интегральную валидность.

7. Выполнить адаптацию модели и измерить, как изменилась ее адекватность.

8. Осуществить пересинтез модели и измерить, как изменилась ее адекватность.

9. Вывести информационные портреты текстов и дать их интерпретацию.

10. Выполнить кластерно-конструктивный анализ модели.

 

Пример решения

1. Осуществить когнитивную структуризацию предметной области.

Под когнитивной структуризацией в СК-анализе понимается определение причин и следствий, факторов и состояний объекта управления, исходной информации и того, на что она влияет.

В данной лабораторной работе необходимо решить задачу идентификации текстов по входящим в них словам. Следовательно, необходимо будет сформировать обобщенные образы текстов, соответствующих определенной тематике или автору (будем считать, что сочинение принадлежит тому писателю, творчеству которого оно посвящено). Для этого в качестве объектов обучающей выборки использоваться фрагменты текстов школьных сочинений, взятые из Internet, а в качестве признаков текстов будут использоваться входящие в них слова.

Каждое сочинение разобьем случайным образом на примерно равные по размеру небольшие фрагменты, которые используем в качестве объектов обучающей выборки.

2. Выполнить формализацию предметной области.

Под формализацией предметной области понимается разработка классификационных и описательных шкал и градаций и ввод их в программную систему "Эйдос", являющуюся инструментарием СК-анализа.

2.1. Формирование классификационных шкал и градаций

В подсистеме "Классификационные шкалы и градации" введем классы, соответствующие следующим писателям: Ф.М. Достоевский; Н.В. Гоголь; А.С. Грибоедов; М.Ю. Лермонтов; А.С. Пушкин; Л.Н. Толстой; И.С. Тургенев (рисунок 152).

 

Рисунок 152. Ввод классов

 

2.1. Формирование описательных шкал и градаций

Для этого исходные файлы для формирования объекты обучающей выборки должны быть средствами Word представлены в виде текстовых файлов, стандарта "Текст DOS" (без разбиения на строки).

Затем каждый из этих файлов разбивается на столько файлов, сколько в нем строк, причем имена этих файлов должны иметь вид: ####SUBSTR(File_name,4).TXT, где #### – сквозной номер файлов, соответствующий будущему номеру анкеты обучающей выборки, SUBSTR(File_name,4) – первые 4 символа имени исходного файла.

Полученные файлы должны быть помещены в поддиректорию DOB системы "Эйдос", а исходные – удалены из нее.

Это осуществляется одним из трех способов:

1. Вручную.

2. С использованием специальной программы, текст которой приводится ниже (язык программирования xBase).

3. В режиме: "Словари – Программные интерфейсы для импорта данных – Импорт данных из TXT-файлов стандарта "Текст DOS", формируем описательные шкалы и градации (рисунок 153), причем в качестве признаков выбираем слова.

 

 

 

Исходный текст программы записи TXT-файлов с данными по строкам

**************************************************************************

********** Разбиение текстовых файлов DOS на нумерованные файлы по строкам

********** Луценко Е.В., 03/31/04 04:24pm

**************************************************************************

scr_start=SAVESCREEN(0,0,24,79)

SHOWTIME(0,58,.T.,"rb/n")

FOR j=0 TO 24

    @j,0 SAY SPACE(80) COLOR "n/n"

NEXT

********** Удаление TXT-файлов, имена которых начинаются на 0

FILEDELETE("0*.TXT")

***** РЕКОГНОСЦИРОВКА

Count = ADIR("*.TXT")             && Кол-во TXT-файлов

IF Count = 0

   Mess = "В текущей директории TXT-файлов не обнаружено !!!"

   @15,40-LEN(Mess)/2 SAY Mess COLOR "gr+/n"

   INKEY(0)

   RESTSCREEN(0,0,24,79,scr_start)

   SHOWTIME()

   QUIT

ENDIF

PRIVATE Name[Count],Size[Count]   && Имена и размеры файлов

Count = ADIR("*.txt",Name,Size)

SortData(Name,Size,LEN(Name),1)   && Сортировка файлов по алфавиту

CrLf = CHR(13)+CHR(10)            && Конец строки (абзаца) (CrLf)

*** Загрузка TXT-файлов

Num_pp = 0                        && Номера выходных файлов

FOR f = 1 TO Count                && Начало цикла по TXT-файлам

    ****** Загрузка файла

    Buffer = FILESTR(Name[f],.T.)

    Buffer = CHARONE(" ",Buffer)  && Удаление повторяющихся пробелов

    Buffer = Buffer + CrLf

    Len = AT(CrLf,Buffer)

    DO WHILE Len > 0 .AND. LASTKEY() <> 27     && Цикл по строкам

       Len = AT(CrLf,Buffer)

       IF Len > 0

          ****** Запись фрагмента файла

          Str_pr = ALLTRIM(SUBSTR(Buffer,1,Len-1))

          Fn_out = STRTRAN(STR(++Num_pp,4)," ","0")+SUBSTR(Name[f],1,4)+".TXT"

          STRFILE(Str_pr,Fn_out)

          ****** Исключение из буфера записанной строки

          Buffer = ALLTRIM(SUBSTR(Buffer,Len+1))

       ENDIF

    ENDDO

NEXT

*** Удаление исходных TXT-файлов

FOR f=1 TO Count

    FILEDELETE(Name[f])

NEXT

RESTSCREEN(0,0,24,79,scr_start)

SHOWTIME()

QUIT

 

Рисунок 153. Выход на режим генерации справочников
на основе текстовых файлов

 

На рисунке 154 приведена экранная форма, отображающая ход процесса генерации описательных шкал и градаций и TXT-файлов, содержащих примеры текстов с разбиением по строкам.

 

Рисунок 154. Генерация описательных шкал и градаций
на основе TXT-файлов

 

 

В результате получаем классификационные и описательные шкалы и градации, приведенные в таблицах 79 и 80.

 

Таблица 79 – КЛАССИФИКАЦИОННЫЕ
ШКАЛЫ И ГРАДАЦИИ

Код

Наименование

1

Достоевский

2

Гоголь

3

Грибоедов

4

Лермонтов

5

Пушкин

6

Толстой

7

Тургенев

 

Таблица 80 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (фрагмент)

Код

Наименование

Код

Наименование

Код

Наименование

1

!

41

Бедные

81

Все

2

(

42

Без

82

Вспомним

3

(основной

43

Бездушных

83

Встреча

4

)

44

Безумным

84

Всюду

5

,

45

Безумных

85

Вы

6

-

46

Безухов

86

Вызывают

7

.

47

Безухову

87

Высокие

8

1812

48

Белинский

88

Высокопарные

9

20-

49

Бессильной

89

Г

10

30-е

50

Бог

90

Герой

11

30-х

51

Боже

91

Главная

12

60-х

52

Болконский

92

Глухость

13

:

53

Болконскому

93

Говоря

14

;

54

Бордо

94

Гоголь

15

?

55

Борис

95

Гоголя

16

Bcтает

56

Бориса

96

Годунов

17

XIX

57

Бородинским

97

Горе

18

А

58

Бородинского

98

Гости

19

Автор

59

Буянов

99

Грибоедов

20

Авторский

60

Была

100

Грибоедова

21

Агрессивная

61

В

101

Гулливера

22

Адама

62

Ведь

102

Да

23

Александр

63

Везде

103

Даже

24

Александра

64

Век

104

Дворянин-аристократ

25

Алексевна

65

Великий

105

Действительно

26

Алексеевна

66

Великолепная

106

Дельвигу

27

Аммоса

67

Вернулся

107

Денисова

28

Андреевич

68

Взволнованный

108

Дидло

29

Андрей

69

Взгляды

109

Для

30

Андрею

70

Власы

110

Дмитриевна

31

Анной

71

Вместе

111

Добролюбова

32

Архивам

72

Внешней

112

Достоевского

33

Афанасьевича

73

Внешние

113

Драматична

34

Ах

74

Воды

114

Друбецкого

35

Базаров

75

Возникает

115

Другое

36

Базарова

76

Война

116

Думы

37

Базаровым

77

Вообще

117

Дуни

38

Балы

78

Вопрос

118

Дуня

39

Бегущим

79

Вот

119

Душа

40

Бедность

80

Время

120

Евгений

 

Приводится лишь фрагмент описательных шкал и градаций, т.к. размерность справочника составляет 3522 градации (т.е. слова).

3. Сформировать обучающую выборку

Обучающая выборка представляет собой фрагменты текстов различных авторов, используемые в качестве примеров для формирования семантической информационной модели. На основе анализа этих примеров выявляются взаимосвязи между теми или иными словами и принадлежностью текстов разным авторам.

Для генерации обучающей выборки используется 1-й режим 2-й подсистемы, функция F7InpTXT – F6Ввод из всех файлов. При этом в качестве признаков, также как при формировании описательных шкал и градаций, выбираются слова (рисунок 155).

 

Рисунок 155. Генерация обучающей выборки из TXT-файлов

 

В результате формируется обучающая выборка, состоящая из 151 примера фрагментов текстов различных авторов. Остается лишь проставить в каждом примере (анкете) код писателя, о котором данный текст, т.е. код класса (в левом окне).

4. Осуществить синтез семантической информационной модели

Синтез модели осуществляется во 2-й подсистеме, 4-м режиме, 5-й функции (рисунок 156).

 

Рисунок 156. Запуск режима:
"Синтез семантической информационной модели"

 

Стадия процесса синтеза отображается в ряде экранных форм, одна из которых приводится на рисунке 157.

 

Рисунок 157. Экранная форма, отображающая одну из стадий процесса синтеза семантической информационной модели

 

 

5. Оптимизировать семантическую информационную модель

Оптимизация модели представляет собой исключение из нее малозначащих признаков без потери адекватности модели. Эта операция осуществляется во 2-м режиме 3-й подсистемы (рисунок 158).

 

Рисунок 158. Выход на режимы оптимизации модели

 

При том имеется возможность вывести график ценности признаков "нарастающим итогом", т.е. Паретто-диаграмму признаков (рисунок 159).

 

Рисунок 159. Паретто-диаграмма признаков

 

Видно, что в системе признаков нет имеющих очень малую или нулевую ценность. Это связано с тем, что все слова являются практически уникальными для фрагментов текстов, т.е. встречаются во всех текстах в основном от 1 до 5 раз (рисунок 160).

 

Рисунок 160. Частотное распределение частот признаков

 

6. Проверить семантическую информационную модель на адекватность, измерить внутреннюю и внешнюю, дифференциальную и интегральную валидность
6.1. Внутренняя дифференциальная и интегральная валидность

Под внутренней валидностью понимается способность модели верно идентифицировать объекты, входящие в обучающую выборку.

Для измерения адекватности модели необходимо выполнить следующие действия:

1. Скопировать обучающую выборку в распознаваемую (во 1-м режиме 2-й подсистемы нажав клавишу F5).

2. Выполнить пакетное распознавание (во 2-м режиме 4-й подсистемы, задав 1-й критерий сходства) (рисунок 161).

3. Измерить адекватность модели (во 2-м режиме 6-й подсистемы) (рисунки 162 и 163).

 

Рисунок 161. Выход на режим пакетного распознавания

 

Рисунок 162. Выход на режим измерения адекватности модели

 

Рисунок 163. Экранная форма управления измерением адекватности модели и отображения результатов

 

Эта форма может прокучиваться вправо-влево. В верхней части формы приведены показатели интегральной валидности (средневзвешенные по всей обучающей выборке), а в самой таблице – дифференциальной валидности, т.е. в разрезе по классам.

Кроме того, результаты измерения адекватности модели выводятся в форме файлов с именами ValidSys.txt (рисунок 164) и ValAnkSt.txt (рисунок 165) стандарта "TXT-текст DOS" в поддиректории TXT. Первый файл имеет вид:

 

 

Рисунок 164. Выходная форма ValidSys.txt с результатами измерения
адекватности модели и отображения результатов

 

 

Рассмотрим, что означают графы этой выходной формы.

"Всего логических анкет" – это количество анкет (примеров текстов) в обучающей выборке, на основе которых формировался образ данного класса.

"Идентифицировано верно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся.

"Идентифицировано ошибочно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации).

"Неидентифицировано верно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся.

"Неидентифицировано ошибочно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации).

В правой части формы приведены те же показатели, но в процентом выражении:

– для анкет, идентифицированных верно и неидентифицированных ошибочно за 100% принимается количество логических анкет обучающей выборки по данному классу;

– для анкет, идентифицированных ошибочно и неидентифицированных верно за 100% принимается суммарное количество логических анкет обучающей выборки за вычетом логических анкет по данному классу.

 

 

Рисунок 165. Фрагмент выходной формы ValAnkSt.txt с результатами измерения адекватности модели и отображения результатов

 

В данной форме приведены коды анкет обучающей выборки, которые были учтены в каждой графе предыдущей формы по каждому классу.

6.2. Внешняя дифференциальная и интегральная валидность

Под внешней валидностью понимается способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.

 

Для измерения внешней валидности необходимо выполнить следующие действия:

1. В режиме измерения адекватности модели запустить режим измерения внешней валидности (нажав F8 Измерение внешней валидности) (рисунок 166).

2. Выбрать один из режимов удаления объектов обучающей выборки, приведенный на экранной форме (рисунок 167).

 

Рисунок 166. Режим переноса анкет обучающей выборки
в распознаваемую для измерения внешней валидности

 

Результат выполнения всех указанных на рисунке 166 действий приведен на рисунке 167.

 

 

Рисунок 167. Выходная форма с результатами измерения
внешней валидности методом бутстрепной статистики

 

При этом исходная выборка была разделена на две:

– в обучающей выборке остались только нечетные анкеты;

– в распознаваемую выборку были включены только четные анкеты;

– при распознавании был использован 2-й интегральный критерий: сумма количества информации.

Анализ отчета по внешней валидности, приведенного на рисунке 167, позволяет сделать вывод о высокой степени адекватности семантической информационной модели. Это значит, что взаимосвязи между словами, использованными в текстах, и принадлежностью этих текстов различным авторам, выявленные по примерам обучающей выборки, оказались имеющими силу и для других фрагментов текстов, приведенных в распознаваемой выборке. Это означает, что они относятся к генеральной совокупности, по отношению к которой обучающая выборка репрезентативна.

7. Выполнить адаптацию модели и измерить, как изменилась ее адекватность

Под адаптацией модели понимается ее количественная модификация, осуществляемая путем включения в обучающую выборку дополнительных примеров реализации объектов, относящихся к тем же самым классам и описанным в той же системе признаков.

На первом этапе, для изучения адаптивности модели осуществим ее синтез на основе обучающей выборки, состоящей из нечетных анкет, которая использовалась в примере для измерения внешней валидности. Но в отличие от этого примера эту же выборку используем и как распознаваемую.

На втором этапе осуществим синтез модели на основе полной обучающей выборки, включающей как четные, так и нечетные анкеты.

Адаптация модели повышает точность идентификации объектов той же самой генеральной совокупности.

8. Осуществить пересинтез модели и измерить, как изменилась ее адекватность

Под повторным синтезом (пересинтезом) модели понимается ее качественная модификация, осуществляемая путем включения в модель новых дополнительных классификационных и описательных шкал и градаций, представленных примерами в обучающей выборке.

Пересинтез модели обеспечивает возможность ее применения для идентификации объектов расширенной или новой генеральной совокупности.

Приведем пример синтеза новой модели, обобщающей предыдущую.

В модель добавлены новые классы распознавания (таблица 81).

 

Таблица 81 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ

Наименования классов распознавания

1

Загадки о животных

2

А.П.Чехов "Вишневый сад"

3

Ф.М.Достоевский "Преступление и наказание"

4

Н.В.Гоголь "Ревизор"

5

А.С.Грибоедов "Горе от ума"

6

И.А.Крылов

7

М.Ю.Лермонтов "Мцыри"

8

Фольклорные загадки о природе

9

Некрасов "Кому на Руси жить хорошо"

10

Пословицы

Продолжение таблицы 81

Наименования классов распознавания

11

А.С.Пушкин "Евгений Онегин"

12

Загадки о саде и огороде

13

В.Шекспир

14

М.А.Шолохов "Тихий Дон"

15

Скороговорки

16

Л.Н.Толстой "Война и мир"

17

И.С.Тургенев "Отцы и дети"

 

Описательные шкалы и градации не приводятся, т.к. размерность составляет 6974 градации. Необходимо отметить, что текущая версия 12.5 системы "Эйдос" не имеет принципиальных ограничений на суммарное количество градаций классификационных и описательных шкал при синтезе модели и решении задач идентификации и прогнозирования, а также количество объектов обучающей выборки. Реально решались задачи с объемом обучающей выборки до 25000 объектов с 1500 классами и 7000 признаками. При этом был осуществлен синтез и исследование моделей, содержащих до 25 миллионов фактов.

В программном интерфейсе импорта данных из 17 исходных текстовых файлов, посвященных различным темам (см. таблицу 81) было сформировано 592 фрагмента, которые стали основой обучающей выборки.

После синтеза модели измеряется ее адекватность. Для этого обучающая выборка копируется в распознаваемую, после чего проводится распознавание и измерение валидности (рисунок 168). Продемонстрирована очень высокая внутренняя валидность новой модели.

 

 

Рисунок 168. Выходная форма с результатами измерения
внутренней валидности после пересинтеза модели

 

9. Вывести информационные портреты текстов и дать их интерпретацию

Информационный портрет класса представляет собой список признаков в порядке убывания количества информации, содержащегося в этих признаках о принадлежности к данному классу.

Генерируются они 1-м режиме 5-й подсистемы "Типология" (рисунок 169). Информационные портреты классов отображаются системой "Эйдос" в виде экранных форм, круговых диаграмм и гистограмм, а также в распечатываются в форме таблиц в поддиректории TXT. Графические формы записываются в поддиректории PCX.

 

 

Рисунок 169. Информационные портреты классов

 

10. Выполнить кластерно-конструктивный анализ модели

Кластерно-конструктивный анализ классов и признаков реализуется в 5-й подсистеме "Типология". В результате рассчитываются матрицы сходства классов и признаков, на основе которых генерируется и выводится ряд текстовых и графических форм. В данной работе мы приведем для примера лишь матрицу сходства классов (таблица 82 и отображающую ее в графической форме семантическую сеть классов (рисунок 170).

 

Таблица 82 – МАТРИЦА СХОДСТВА КЛАССОВ

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

1

100,0

-9,55

-8,94

-8,16

-9,46

6,32

-10,08

38,11

-6,24

33,86

-4,34

41,96

-11,12

-8,17

11,70

-8,00

-11,05

2

-9,55

100,0

-5,11

-0,35

-2,47

-7,84

-2,95

-9,07

-5,50

-5,44

-6,47

1,20

-16,31

-5,43

-10,08

-8,26

2,04

3

-8,94

-5,11

100,0

-2,39

1,12

-3,97

-6,81

-5,61

-0,10

-6,56

-3,05

-10,13

-0,41

-7,36

-11,47

-6,04

-6,32

4

-8,16

-0,35

-2,39

100,0

2,52

9,73

1,33

-4,36

-6,23

-9,19

-4,94

-8,33

-9,55

-1,41

-9,14

-1,91

3,14

5

-9,46

-2,47

1,12

2,52

100,0

-8,31

-1,87

-5,24

-12,74

-1,25

-5,30

-4,55

-12,89

-8,85

-6,73

-9,59

-3,52

6

6,32

-7,84

-3,97

9,73

-8,31

100,0

-6,55

-5,05

-12,06

0,49

-7,34

-2,99

-15,19

-11,13

8,18

-3,10

-8,75

7

-10,08

-2,95

-6,81

1,33

-1,87

-6,55

100,0

-4,35

-1,04

-6,10

-10,14

-5,71

-7,09

-0,21

-9,40

-3,97

3,67

8

38,11

-9,07

-5,61

-4,36

-5,24

-5,05

-4,35

100,0

-2,38

34,04

-6,03

41,21

-6,48

-4,72

0,87

-8,50

-8,17

9

-6,24

-5,50

-0,10

-6,23

-12,74

-12,06

-1,04

-2,38

100,0

-1,85

-8,20

-6,28

-12,89

-1,18

-2,41

0,73

-3,53

10

33,86

-5,44

-6,56

-9,19

-1,25

0,49

-6,10

34,04

-1,85

100,0

-8,76

39,59

-9,83

-9,07

-1,63

-11,22

-7,73

11

-4,34

-6,47

-3,05

-4,94

-5,30

-7,34

-10,14

-6,03

-8,20

-8,76

100,0

-7,79

13,47

-3,96

-5,98

-11,77

-2,47

12

41,96

1,20

-10,13

-8,33

-4,55

-2,99

-5,71

41,21

-6,28

39,59

-7,79

100,0

-8,80

-8,13

5,09

-8,29

-5,24

13

-11,12

-16,31

-0,41

-9,55

-12,89

-15,19

-7,09

-6,48

-12,89

-9,83

13,47

-8,80

100,0

-3,67

-3,20

-1,92

1,77

14

-8,17

-5,43

-7,36

-1,41

-8,85

-11,13

-0,21

-4,72

-1,18

-9,07

-3,96

-8,13

-3,67

100,0

-11,07

-0,69

-3,25

15

11,70

-10,08

-11,47

-9,14

-6,73

8,18

-9,40

0,87

-2,41

-1,63

-5,98

5,09

-3,20

-11,07

100,0

-8,44

-12,23

16

-8,00

-8,26

-6,04

-1,91

-9,59

-3,10

-3,97

-8,50

0,73

-11,22

-11,77

-8,29

-1,92

-0,69

-8,44

100,0

-5,50

17

-11,05

2,04

-6,32

3,14

-3,52

-8,75

3,67

-8,17

-3,53

-7,73

-2,47

-5,24

1,77

-3,25

-12,23

-5,50

100,0

 

Рисунок 170. Отображение матрицы сходства классов в графической форме семантической сети классов (отображены связи значимостью более 5%)

Выводы

Продемонстрирована возможность и эффективность применения технологии и инструментария системно-когнитивного анализа для решения ряда задач атрибуции текстов.

Приведен подробный численный пример (с большим количеством конкретных иллюстративных материалов) реализации всех этапов СК-анализа при атрибуции текстов: когнитивной структуризации и формализации предметной области; формирования обучающей выборки; синтеза семантической информационной модели; оптимизации и измерения адекватности модели; адаптации и пересинтеза модели; типологического и кластерно-конструктивного анализа модели.

Контрольные вопросы

1. Что такое атрибуция текстов?

2. Каким образом выполняется когнитивная структуризация предметной области?

3. В чем состоит формализацию предметной области и как ее осуществить в системе "Эйдос"?

4. Какие средства формирования обучающей выборки используются в системе "Эйдос" при решении задач атрибуции текстов?

5. В какой подсистеме и в каком режиме системы "Эйдос" осуществляется синтез семантической информационной модели и в чем он состоит?

6. В чем заключается оптимизация семантической информационной модели и как она осуществляется в системе "Эйдос"?

7. Как семантическая информационная модель проверяется на адекватность?

8. Как связана адекватность модели с внутренней и внешней, дифференциальной и интегральной валидностью?

9. Каким образом можно в системе "Эйдос" выполнить адаптацию модели и измерить, как изменилась ее адекватность?

10. Как в системе "Эйдос" осуществить пересинтез модели и измерить, как изменилась ее адекватность?

11. Чем отличается адаптация модели от пересинтеза в системе "Эйдос"?

12. В каких подсистемах и режимах системы "Эйдос" можно вывести информационные портреты?

13. В каких подсистемах и режимах системы "Эйдос" можно выполнить кластерно-конструктивный анализ модели?

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-7:
"Идентификация и классификация
натуральных чисел по их свойствам"

 

Краткая теория

Натуральные числа имеют ряд свойств, такие, например, как: делители, неделители, количество делителей и др. Существуют и более сложные свойства натуральных чисел, изучаемые в теории чисел. По этим свойствам числа классифицируются как простые, четные и т.д. Таким образом, исследование свойств чисел и является типичной задачей обучения распознаванию образов, идентификации и автоматической классификации. Эта задача довольно проста и наглядна, поэтому эта задача представляет для нас интерес в качестве учебной.

Задание

1. Формализовать задачу.

1.1. Сконструировать классификационные шкалы и градации.

1.2. Сконструировать описательные шкалы и градации.

1.3. Сгенерировать обучающую выборку.

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

3. Провести системно-когнитивный анализ модели:

3.1. Решить задачи идентификации и прогнозирования.

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

 

Пример решения

1. Формализовать задачу.

Для этой цели используем 5-ю функцию 5-го режима 1-й подсистемы системы "Эйдос" (реальный исходный текст программы приводится ниже).

 

***************************************************************

*** Формирование модели для исследования свойств чисел ********

*** Луценко Е.В., 02/26/04 11:34am ****************************

***************************************************************

 

FUNCTION Div_chis()

 

scr_start=SAVESCREEN(0,0,24,79)

 

SHOWTIME(0,58,.T.,"rb/n")

 

Titul(.T.)

 

Mess = "=== ГЕНЕРАЦИЯ ИСХОДНЫХ ДАННЫХ ДЛЯ МОДЕЛИ ИССЛЕДОВАНИЯ СВОЙСТВ ЧИСЕЛ ==="

@5,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"

*    0123456789012345678901234567890123456789012345678901234567890123456789012345678

*    0         10        20        30        40        50        60        70

@10,24 SAY                  "Задайте максимальное число: #####" COLOR "w+/rb"

N_Obj = 99

@10,52 GET N_Obj PICTURE "#####" COLOR "rg+/r"

SET CURSOR ON;READ;SET CURSOR OFF

IF LASTKEY()=27

   RESTSCREEN(0,0,24,79,scr23)

   RETURN

ENDIF

 

*** Формирование справочника первичных признаков

 

A_Pr  := {}

FOR j=1 TO N_Obj

    AADD(A_Pr, "Делится на "+ALLTRIM(STR(j,4)))

NEXT

FOR j=1 TO N_Obj

    AADD(A_Pr, "Не делится на "+ALLTRIM(STR(j,4)))

NEXT

FOR j=1 TO N_Obj

    AADD(A_Pr, "Делителей: "+ALLTRIM(STR(j,4)))

NEXT

 

USE Priz_per EXCLUSIVE NEW

ZAP

FOR j=1 TO LEN(A_Pr)

    APPEND BLANK

    REPLACE Kod  WITH j

    REPLACE Name WITH A_Pr[j]

NEXT

GenNtxPrp(.F.)

CLOSE ALL

 

*** Формирование справочника классов распознавания

USE Object EXCLUSIVE NEW

ZAP

FOR j=1 TO N_Obj

    APPEND BLANK

    REPLACE Kod  WITH j

    REPLACE Name WITH ALLTRIM(STR(j,3))

NEXT

GenNtxObj(.F.)

CLOSE ALL

 

*** Формирование обучающей выборки

USE ObInfZag EXCLUSIVE NEW;ZAP

USE ObInfKpr EXCLUSIVE NEW;ZAP

FOR s=1 TO N_Obj

    SELECT ObInfZag

    APPEND BLANK

    REPLACE Kod_ist  WITH s

    REPLACE Name_ist WITH ALLTRIM(STR(s,4))

    REPLACE Obj_1    WITH s

    SELECT ObInfKpr

    APPEND BLANK

    REPLACE Kod_ist  WITH s

    p=0                   && Позиция для записи в БД

    N_Del=0               && Кол-во делителей

    *** Проверка делимости

    FOR j=1 TO N_Obj

        IF s-j*int(s/j) = 0

           Kod = j

           ++N_Del

           IF p+1 <= 11

              FIELDPUT(++p+1, Kod)

           ELSE

              APPEND BLANK

              REPLACE Kod_ist  WITH s

              p=0

              FIELDPUT(++p+1, Kod)

           ENDIF

        ENDIF

    NEXT

    ************ Занесение количества делителей

    IF p+1 <= 11

       FIELDPUT(++p+1, N_Del+2*N_Obj)

    ELSE

       APPEND BLANK

       REPLACE Kod_ist  WITH s

       p=0

       FIELDPUT(++p+1, N_Del+2*N_Obj)

    ENDIF

    *** Проверка не делимости

    FOR j=1 TO N_Obj

        IF s-j*int(s/j) <> 0

           Kod = j+N_Obj

           IF p+1 <= 11

              FIELDPUT(++p+1, Kod)

           ELSE

              APPEND BLANK

              REPLACE Kod_ist  WITH s

              p=0

              FIELDPUT(++p+1, Kod)

           ENDIF

        ENDIF

    NEXT

NEXT

GenNtxOin(.F.)

 

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

Mess = " ПРОЦЕСС ГЕНЕРАЦИИ ШКАЛ И ОБУЧАЮЩЕЙ ВЫБОРКИ ЗАВЕРШЕН УСПЕШНО !!! "

@24,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"

INKEY(0)

 

RESTSCREEN(0,0,24,79,scr_start)

SHOWTIME()

 

RETURN

 

1.1. Сконструировать классификационные шкалы и градации.

Выберем в качестве классов натуральные числа от 1 до 30 (вместо 30 может быть взято другое число). В результате получим 30 классов с кодами от 1 до 30, наименования которых совпадают с их кодом. Приводить здесь эту элементарную таблицу не имеет смысла.

 

1.2. Сконструировать описательные шкалы и градации.

В качестве описательных шкал и градаций используем простейшие свойства натуральных чисел, такие как: делители, неделители, количество делителей (таблица 83). Могут быть использованы и более сложные свойства, изучаемые в теории чисел, но суть задачи от этого не изменится.

 

Таблица 83 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Код

Наименование

признака

Код

Наименование

признака

Код

Наименование

признака

1

Делится на 1

31

Не делится на 1

61

Делителей: 1

2

Делится на 2

32

Не делится на 2

62

Делителей: 2

3

Делится на 3

33

Не делится на 3

63

Делителей: 3

4

Делится на 4

34

Не делится на 4

64

Делителей: 4

5

Делится на 5

35

Не делится на 5

65

Делителей: 5

6

Делится на 6

36

Не делится на 6

66

Делителей: 6

7

Делится на 7

37

Не делится на 7

67

Делителей: 7

8

Делится на 8

38

Не делится на 8

68

Делителей: 8

9

Делится на 9

39

Не делится на 9

69

Делителей: 9

10

Делится на 10

40

Не делится на 10

70

Делителей: 10

11

Делится на 11

41

Не делится на 11

71

Делителей: 11

12

Делится на 12

42

Не делится на 12

72

Делителей: 12

13

Делится на 13

43

Не делится на 13

73

Делителей: 13

14

Делится на 14

44

Не делится на 14

74

Делителей: 14

15

Делится на 15

45

Не делится на 15

75

Делителей: 15

16

Делится на 16

46

Не делится на 16

76

Делителей: 16

17

Делится на 17

47

Не делится на 17

77

Делителей: 17

18

Делится на 18

48

Не делится на 18

78

Делителей: 18

19

Делится на 19

49

Не делится на 19

79

Делителей: 19

20

Делится на 20

50

Не делится на 20

80

Делителей: 20

21

Делится на 21

51

Не делится на 21

81

Делителей: 21

22

Делится на 22

52

Не делится на 22

82

Делителей: 22

23

Делится на 23

53

Не делится на 23

83

Делителей: 23

24

Делится на 24

54

Не делится на 24

84

Делителей: 24

25

Делится на 25

55

Не делится на 25

85

Делителей: 25

26

Делится на 26

56

Не делится на 26

86

Делителей: 26

27

Делится на 27

57

Не делится на 27

87

Делителей: 27

28

Делится на 28

58

Не делится на 28

88

Делителей: 28

29

Делится на 29

59

Не делится на 29

89

Делителей: 29

30

Делится на 30

60

Не делится на 30

90

Делителей: 30

 

1.3. Сгенерируем обучающую выборку.

Обучающая выборка генерируется автоматически вместе с шкалами и градациями и здесь не приводится из-за ее большого объема.

 

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

Синтез модели осуществляется в 5-й функции 3-го режима 2-й подсистемы системы "Эйдос", а верификация (после копирования обучающей выборки в распознаваемую и распознавания со 2-м интегральным критерием сходства) – во 2-м режиме 6-й подсистемы. При этом получен результат, представленный на рисунке 171, который говорит о высокой степени адекватности модели и корректности выводов, полученных путем ее исследования.

Рисунок 171. Экранная форма режима измерения адекватности СИМ

 

3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.

Идентификация проводится во 2-м режиме 4-й подсистемы системы "Эйдос". Результаты идентификации выводятся в форме карточек в 1-й и 2-й функциях 3-го режима 4-й подсистемы системы "Эйдос" (примеры карточек на рисунке 172).

 

Рисунок 172. Пример карточки идентификации объекта с классами

 

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

Информационные портреты классов генерируются и отображаются в 1-й функции 1-го режима 5-й подсистемы системы "Эйдос" (рисунок 173).

 

Рисунок 173. Пример информационного портрета класса
в форме круговой диаграммы

 

 

Двухмерные и трехмерные профили классов и признаков генерируются и отображаются в 4-м режиме 6-й подсистемы системы "Эйдос" (рисунок 174).

Информационные портреты признаков (факторов) генерируются и отображаются в 1-й функции 2-го режима 5-й подсистемы системы "Эйдос" (рисунок 175). Размеры секторов в круговой диаграмме соответствуют относительному вкладу признаков в общее количество информации, содержащейся в информационном портрете.

 

Рисунок 174. Пример профиля класса

 

Рисунок 175. Экранная форма информационного портрета фактора
в форме таблицы

 

Из рисунка 148 видно, что система способна выявить простые числа по признаку: "Число делителей 2".

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

Этот анализ проводится в во 2-й функции 1-го и 2-го режимов 5-й подсистемы системы "Эйдос" (рисунок 176).

Рисунок 176. Примеры семантических сети классов и признаков

Семантические сети отражают сходство классов по характеризующим их признакам и сходство признаков по тем классам, о принадлежности к которым они несут информацию.

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

Структуру любой линии в семантических сетях классов или признаков можно детально увидеть в когнитивных диаграммах классов и признаков (рисунок 177).

 

Рисунок 177. Примеры когнитивных диаграмм классов и признаков

3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

Нелокальные нейроны отражают систему детерминации состояний факторами т отображаются в 5-м режиме 6-й подсистемы системы "Эйдос", а нейронные сети представляют собой совокупность нейронов и отображаются в 6-м режиме той же подсистемы (рисунок 178).

 

Рисунок 178. Примеры нелокального нейрона
и Паретто-подмножества нейронной сети

 

3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

Классическая когнитивная модель отражает структуру детерминации состояния с указанием сходств и различий между факторами и отображается в 7-м режиме 6-й подсистемы системы "Эйдос"  (рисунок 179).

 

Рисунок 179. Пример классической когнитивной карты

 

3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

Интегральная когнитивная модель отражает структуру детерминации нескольких состояний с указанием сходств и различий между состояниями по их системам детерминации, между факторами, по влиянию, которое они оказывают на поведение объекта управления, отображаются в 7-м режиме 6-й подсистемы системы "Эйдос" (рисунок 180).

 

Рисунок 180. Пример интегральной когнитивной карты

 

Контрольные вопросы

1. Какие свойства натуральных чисел мы рассматривали в качестве их признаков?

2. Какие образом выполняется когнитивная структуризация предметной области?

3. В чем состоит формализацию предметной области и как ее осуществить в системе "Эйдос" при изучении свойств натуральных чисел?

4. Какие средства формирования обучающей выборки используются в системе "Эйдос" при изучении свойств натуральных чисел?

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-8:
"Идентификация трехмерных тел
по их ортогональным проекциям"

 

Краткая теория

Когда мы зрительно воспринимаем окружающую действительность, то постоянно решается задача идентификации трехмерных тел по их проекциям. При этом мы можем наблюдать одну, две или даже три проекции тела.

Одну проекцию мы наблюдаем при наблюдении тела на достаточно большом расстоянии, при котором бинокулярность зрения несущественна, или при монокулярном наблюдении за очень короткое время, за которое точка зрения на тело не меняется или оно не успевает повернутся.

Ясно, что наиболее сложными условиями для идентификации формы тела являются те, когда мы видим лишь одну его проекцию (большое расстояние и малое время наблюдения).

Задание

1. Формализовать задачу.

1.1. Сконструировать классификационные шкалы и градации.

1.2. Сконструировать описательные шкалы и градации.

1.3. Сгенерировать обучающую выборку.

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

3. Провести системно-когнитивный анализ модели:

3.1. Решить задачи идентификации и прогнозирования.

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

3.5. Построить нелокальные нейроны и интерпретируемые нейронные сети.

3.6. Построить классические когнитивные модели (отобразить в форме когнитивных карт).

3.7. Построить интегральные когнитивные модели (отобразить в форме интегральных когнитивных карт).

 

Пример решения

1. Формализовать задачу.
1.1. Сконструировать классификационные шкалы и градации.

Так как задачей является идентификация формы тела, то в качестве классов выберем для исследования простые и широко известные формы: шар, тетраэдр, куб, конус, пирамиду, призму и цилиндр, а также их наблюдения по две ортогональные проекции, которые будем обозначать числами 11, 12, 23, и одно наблюдение сразу трех проекций: 123 (таблица 84). Одновременно или последовательно наблюдаются проекции, в данном случае неважно.

 

Таблица 84 – КЛАССИФИКАЦИОННЫЕ
ШКАЛЫ И ГРАДАЦИИ

Код

Наимено-

вание

Код

Наимено-вание

Код

Наимено-

вание

Код

Наимено-вание

1

Шар

11

Куб

21

Пирамида

31

Призма

2

Шар-11

12

Куб-11

22

Пирамида-11

32

Призма-11

3

Шар-12

13

Куб-12

23

Пирамида-12

33

Призма-12

4

Шар-22

14

Куб-23

24

Пирамида-23

34

Призма-23

5

Шар-123

15

Куб-123

25

Пирамида-123

35

Призма-123

6

Тетраэдр

16

Конус

26

Цилиндр

 

 

7

Тетраэдр-11

17

Конус-11

27

Цилиндр-11

 

 

8

Тетраэдр-12

18

Конус-12

28

Цилиндр-12

 

 

9

Тетраэдр-23

19

Конус-23

29

Цилиндр-23

 

 

10

Тетраэдр-123

20

Конус-123

30

Цилиндр-123

 

 

 

1.2. Сконструировать описательные шкалы и градации.

Проекциями перечисленных трехмерных тел на взаимно-ортогональные плоскости являются двухмерные фигуры: круг, квадрат и треугольник. Соответственно, сконструируем и описательные шкалы и градации, чтобы они позволяли отразить все варианты проекций трехмерных тел (таблица 85).

 

Таблица 85 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Код

Наименование

[1]

ВИД СПЕРЕДИ:

1

Круг

2

Квадрат

3

Треугольник

[2]

ВИД СБОКУ:

4

Круг

5

Квадрат

6

Треугольник

[3]

ВИД СВЕРХУ:

7

Круг

8

Квадрат

9

Треугольник

 

1.3. Сгенерировать обучающую выборку.

Чтобы сгенерировать обучающую выборку составим таблицу 86, в которой в наглядной форме изобразим проекции выбранных нами тел на ортогональные плоскости.

 

Таблица 86 – КОДИРОВАНИЕ ПРОЕКЦИЙ ТЕЛ
ДЛЯ ОБУЧАЮЩЕЙ ВЫБОРКИ

Код

Тело

Проекции

1-я проекция

X«Y вращение вокруг Z

1

2-я проекция

X«Z вращение вокруг Y

2

3-я проекция

Y«Z вращение вокруг X

3

X

Y

Z

X

Y

Z

X

Y

Z

1

Шар

Вид

O

O

O

O

O

O

O

O

O

Код

1

4

7

1

4

7

1

4

7

2

Тетраэдр

Вид

Код

3

6

9

3

6

9

3

6

9

3

Куб

Вид



















Код

2

5

8

2

5

8

2

5

8

4

Конус

Вид

O

O

O

Код

3

6

7

1

6

9

3

4

9

5

Пирамида

Вид







Код

3

6

8

2

6

9

3

5

9

6

Цилиндр

Вид





O

O







O



Код

2

5

7

1

5

8

2

4

8

7

Призма

Вид













Код

2

5

9

3

5

8

2

6

8

 

С использованием таблицы 86 составим таблицу 87 с обучающей выборкой.

 

Таблица 87 – ФОРМА ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ

Код

Наименование

Классы

Признаки

1

2

3

Проекция-1

Проекция-2

Проекция-3

1

2

3

4

5

6

7

8

9

1

Шар

1

 

 

1

4

7

 

 

 

 

 

 

2

Шар-11

2

 

 

1

4

7

1

4

7

 

 

 

3

Шар-12

3

 

 

1

4

7

 

 

 

1

4

7

4

Шар-22

4

 

 

 

 

 

1

4

7

1

4

7

5

Шар-123

5

 

 

1

4

7

1

4

7

1

4

7

6

Тетраэдр

6

 

 

3

6

9

 

 

 

 

 

 

7

Тетраэдр-11

7

 

 

3

6

9

3

6

9

 

 

 

8

Тетраэдр-12

8

 

 

3

6

9

 

 

 

3

6

9

9

Тетраэдр-23

9

 

 

 

 

 

3

6

9

3

6

9

10

Тетраэдр-123

10

 

 

3

6

9

3

6

9

3

6

9

 

 

Продолжение таблицы 87

Код

Наименование

Классы

Признаки

1

2

3

Проекция-1

Проекция-2

Проекция-3

1

2

3

4

5

6

7

8

9

11

Куб

11

 

 

2

5

8

 

 

 

 

 

 

12

Куб-11

12

 

 

2

5

8

2

5

8

 

 

 

13

Куб-12

13

 

 

2

5

8

 

 

 

2

5

8

14

Куб-23

14

 

 

 

 

 

2

5

8

2

5

8

15

Куб-123

15

 

 

2

5

8

2

5

8

2

5

8

16

Конус

16

 

 

3

6

7

 

 

 

 

 

 

17

Конус-11

17

 

 

3

6

7

1

6

9

 

 

 

18

Конус-12

18

 

 

3

6

7

 

 

 

3

4

9

19

Конус-23

19

 

 

 

 

 

1

6

9

3

4

9

20

Конус-123

20

 

 

3

6

7

1

6

9

3

4

9

21

Пирамида

21

 

 

3

6

8

 

 

 

 

 

 

22

Пирамида-11

22

 

 

3

6

8

2

6

9

 

 

 

23

Пирамида-12

23

 

 

3

6

8

 

 

 

3

5

9

24

Пирамида-23

24

 

 

 

 

 

2

6

9

3

5

9

25

Пирамида-123

25

 

 

3

6

8

2

6

9

3

5

9

26

Цилиндр

26

 

 

2

5

7

 

 

 

 

 

 

27

Цилиндр-11

27

 

 

2

5

7

1

5

8

 

 

 

28

Цилиндр-12

28

 

 

2

5

7

 

 

 

2

4

8

29

Цилиндр-23

29

 

 

 

 

 

1

5

8

2

4

8

30

Цилиндр-123

30

 

 

2

5

7

1

5

8

2

4

8

31

Призма

31

 

 

2

5

9

 

 

 

 

 

 

32

Призма-11

32

 

 

2

5

9

3

5

8

 

 

 

33

Призма-12

33

 

 

2

5

9

 

 

 

2

6

8

34

Призма-23

34

 

 

 

 

 

3

5

8

2

6

8

35

Призма-123

35

 

 

2

5

9

3

5

8

2

6

8

 

 

 

2. Осуществить синтез и верификацию (измерение адекватности) семантической информационной модели.

Вводим классификационные и описательные шкалы и градации (в 1-м и 2-м режимах 1-й подсистемы), а также обучающую выборку (в 1-м режиме 2-й подсистемы) в систему "Эйдос" и осуществляем синтез модели (в 5-й функции 3-го режима 2-й подсистемы), а затем ее верификацию (во 2-м режиме 6-й подсистемы). В результате получаем семантическую информационную модель, обладающую достаточно высокой степенью адекватности: 94,29%, чтобы результаты ее исследования можно было считать исследованием самой моделируемой предметной области (рисунок 181).

 

Рисунок 181. Экранная форма по измерению адекватности СИМ

 

3. Провести системно-когнитивный анализ модели:
3.1. Решить задачи идентификации и прогнозирования.

После выполнения 2-го режима 4-й подсистемы "Распознавание" в 1-й функции 3-го режима 4-й подсистемы получаем итоговую форму по результатам идентификации (таблица 88).

 

Таблица 88 – ИТОГОВЫЕ РЕЗУЛЬТАТЫ ИДЕНТИФИКАЦИИ

Объект

Класс

Сходство

Код

Наименован.

Код

Наименован.

1

Шар

1

Шар

94,083

2

Шар-11

1

Шар

76,819

3

Шар-12

1

Шар

76,819

4

Шар-23

1

Шар

76,819

5

Шар-123

1

Шар

54,319

6

Тетраэдр

6

Тетраэдр

94,257

7

Тетраэдр-11

6

Тетраэдр

76,960

8

Тетраэдр-12

6

Тетраэдр

76,960

9

Тетраэдр-23

6

Тетраэдр

76,960

10

Тетраэдр-123

6

Тетраэдр

54,419

11

Куб

11

Куб

94,189

12

Куб-11

11

Куб

76,905

13

Куб-12

11

Куб

76,905

14

Куб-23

11

Куб

76,905

15

Куб-123

11

Куб

54,380

16

Конус

16

Конус

92,171

17

Конус-11

17

Конус-11

75,941

18

Конус-12

20

Конус-123

77,354

19

Конус-23

20

Конус-123

82,367

20

Конус-123

20

Конус-123

69,532

Продолжение таблицы 88

Объект

Класс

Сходство

Код

Наименован.

Код

Наименован.

21

Пирамида

21

Пирамида

94,257

22

Пирамида-11

22

Пирамида-11

66,725

23

Пирамида-12

23

Пирамида-12

64,571

24

Пирамида-23

24

Пирамида-23

62,412

25

Пирамида-123

32

Призма-11

44,934

26

Цилиндр

26

Цилиндр

92,128

27

Цилиндр-11

27

Цилиндр-11

77,694

28

Цилиндр-12

27

Цилиндр-11

77,694

29

Цилиндр-23

30

Цилиндр-123

82,136

30

Цилиндр-123

30

Цилиндр-123

69,328

31

Призма

31

Призма

94,189

32

Призма-11

32

Призма-11

67,933

33

Призма-12

33

Призма-12

63,420

34

Призма-23

34

Призма-23

62,412

35

Призма-123

32

Призма-11

44,934

 

Из таблицы 88 видно, что объект "Пирамида-123" неверно идентифицирован как класс "Призма-11". В остальных случаях тип объекта идентифицирован верно, что не исключает в ряде случаев неверной идентификации вида проекции (что, конечно, не имеет отношения к телам Платона – первым трем классам). Карточка, дающая расшифровку результатов идентификации 25-го объекта "Пирамида-123", представлена на рисунке 182.

 

Рисунок 182. Карточка результатов идентификации объекта 25.

 

Если проанализировать коды признаков призмы и пирамиды, то можно увидеть, что они одни и те же, и отличие состоит лишь в количестве повторностей признаков. Это и является причиной сложностей при дифференцировании этих объектов.

3.2. Сгенерировать информационные портреты классов и факторов, т.е. решить обратную задачу прогнозирования (результаты отобразить в графической форме двухмерных и трехмерных профилей классов и факторов).

В 1-й функции 1-го режима 5-й подсистемы системы "Эйдос" получим информационный портрет класса, а в 1-й функции 2-го режима той же подсистемы – информационный портрет признака (рисунок 183).

 

Рисунок 183. Примеры информационных портретов
классов и признаков

3.3. Провести кластерно-конструктивный анализ классов и факторов (результаты отобразить в форме семантических сетей классов и факторов).

В 5-й операции 2-й функции 1-го и 2-го режимов 5-й подсистемы получим семантические сети классов и факторов (рисунок 184).

Рисунок 184. Примеры семантических сетей классов и факторов

Интерпретацию семантических сетей дать самостоятельно.

3.4. Осуществить содержательное сравнение классов и факторов (результаты отобразить в форме когнитивных диаграмм классов и факторов).

В 3-й функции 1-го и 2-го режимов 5-й подсистемы получим когнитивные диаграммы классов и признаков (рисунок 185).

Рисунок 185. Пример когнитивных диаграмм, содержащих результаты содержательного сравнения классов и факторов

Из диаграммы классов мы видим, что основной вклад в сходство конуса и цилиндра вносит то, что одна из проекций у них одинаковая, т.е. круг, а основной вклад в различие – что остальные проекции у конуса – треугольник, а у цилиндра – квадрат.

Из диаграммы сравнения признаков мы видим, что такие проекции есть и у пирамиды, и у призмы, а в различие – то, что эти проекции характерны для различных тел.

Задания 3.5 – 3.7 выполнить самостоятельно.

Контрольные опросы

1. Что называется ортогональными проекциями тел?

2. В чем заключается сложность идентификации тел по их ортогональным проекциям?

3. За счет чего облегчается задача идентификации тел по их проекциям при наблюдении с нескольких точек или в движении?

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-9:
"Прогнозирование количественных
и качественных результатов выращивания
зерновых колосовых и поддержка принятия решений по выбору агротехнологий"

 

Краткая теория

Исследование проведено совместно с О.А.Засухиной на базе Кубанского государственного аграрного университета в 1993-1996 годах [64]. Предложенные технологии АСК-анализа реализовывалась на базе системы "Эйдос". С помощью сформированной содержательной информационной модели прогнозировались количественные и качественные результаты выращивания культур и вырабатывались научно-обоснованные рекомендации по управлению продуктивностью сельхозкультур и качеством сельхозпродукции.

Созданная модель включала:

– объект управления (сельскохозяйственную культуру); классы (будущие состояния объекта управления, т.е. количественные и качественные результаты выращивания);

– факторы управляющей системы (агротехнологии, т.е. нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация севооборота и т.п.);

– факторы окружающей среды (вид почв, культуры–предшественники по предшествующим годам и др.).

 

Задание

На основе предложенной технологии АСК-анализа разработать конкретное приложение системы "Эйдос", обеспечивающее управление урожайностью и качеством сельскохозяйственных культур путем выбора и применения оптимальной агротехнологии в зависимости от поставленной цели и вида почв, культуры–предшественника, а также ряда других параметров объекта управления и окружающей среды, например, таких как: нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация и др.

 

Пример решения

При создании методики выполнялись следующие работы:

1. Формулировка целей методики и в соответствии с ними разработка перечня прогнозируемых хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", рисунок 186):

 

Рисунок 186. Будущие состояния объекта управления: количественные и качественные результаты выращивания сельхозкультуры (зерновые колосовые)

 

 

 

 

2. Разработка формализованного паспорта результатов выращивания сельхозкультур, позволяющего описать в пригодной для компьютерной обработки форме результаты выращивания конкретной сельхозкультуры на конкретном поле, по конкретной технологии при конкретных условиях окружающей среды.

Соответственно, формализованный паспорт результатов выращивания состоит из трех частей:

– первая содержит целевые и нежелательные количественные и качественные результаты выращивания (классы);

– вторая – технологические факторы, которые можно рассматривать как средство достижения желаемых хозяйственных результатов (рисунок 187).

– третья – описывает не зависящие от воли человека факторы окружающей среды, прежде всего метеорологические, а также виды и состояние почв;

 

Рисунок 187. Видеограмма с фрагментом справочника описательных шкал
(технологические факторы)

 

3. Использование бумажного архива по выращиванию сельхозкультур для заполнения формализованных паспортов и ввода в программную инструментальную систему в качестве примеров выращивания (обучающей выборки) (рисунок 188). Синтез семантической информационной модели. Размерность модели составила: 35 прогнозируемых результатов выращивания, 188 градаций факторов, 217 прецедентов в обучающей выборке, 18594 факта.

 

Рисунок 188. Интерфейс ввода обучающей выборки

 

4. Выявление (на основе предъявленных реальных примеров выращивания сельхозкультур) взаимосвязей между применяемыми технологиями и полученными результатами и формирование информационных портретов по каждому возможному результату выращивания. Информационный портрет хозяйственной ситуации представляет собой перечень технологических факторов с количественным указанием того, какое влияние оказывает каждый из них на осуществление данной ситуации (рисунок 189):

 

Рисунок 189. Примеры информационных портретов результатов выращивания "Высокое качество" и "Высокое количество"

 

5. Каждый из технологических факторов на основе приведенных примеров характеризуется тем, какое влияние он оказывает на осуществление каждой (целевой или нежелательной) хозяйственной ситуации (рисунок 190):

 

Рисунок 190. Семантический портрет признака:
"Предшественники – бобовые многолетние травы"

 

6. Сравнение различных хозяйственных ситуаций и формирование групп наиболее сходных из них (кластеров), а также определение кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом на экспериментальной базе данных был выявлен конструкт "качество–количество", означающий, что для получения высокого качества и большого количества необходимы совершенно противоположные и несовместимые (т.е. невозможные одновременно) почвы: предшественники и агротехнологические приемы (рисунок 191):

 

Рисунок 191. Конструкт классов: "Качество – количество"
и семантическая сеть классов по шкалам: "Качество – количество"

 

7. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти факторы предложено использовать для замены друг друга в случае необходимости (рисунок 192):

 

Рисунок 192. Конструкт факторов: "Предшественники бобовые … – Ротация первая…" и семантической сети факторов: "Предшественники – Глубина обработки почвы"

 

8. Проверка способности созданного приложения правильно прогнозировать хозяйственные результаты на массиве уже введенных формализованных паспортов показала, что валидность оказалась недостаточно высокой для практического применения: на уровне  58%. Причиной этого являются артефакты, из-за которых некоторые хозяйственные ситуации оказались слабо детерминированными (рисунок 193). Удаление артефактов привело к повышению интегральной валидности до 80%, что достаточно для практического использования методики (рисунок 194)

 

Рисунок 193. Интегральная и дифференциальная валидность методики до исключения артефактов

Рисунок 194. Интегральная и дифференциальная валидность методики после исключения артефактов

 

Таким образом, были решены две основные задачи:

 

1. Прогнозирование того, какие хозяйственные результаты наиболее вероятны (а какие практически невозможны) на данном виде почв и с данными предшественниками, а также при условии применения имеющихся в распоряжении агротехнологий (рисунок 195). Указана мера сходства прогнозируемой ситуации с каждым будущим состоянием.

Рисунок 195. Пример карточки прогнозирования для конкретных условий выращивания

 

2. Разработка рекомендаций по управляющим воздействиям, т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии должны быть, чтобы можно было рассчитывать с определенной уверенностью на заданный хозяйственный результат (рисунок 189).

Система позволяет оценивать степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не просто дает рекомендацию, но и количественно оценивает степень ее надежности. Кроме того, система дает характеристику влияния каждого технологического приема и рекомендации по замене желательных, но очень дорогих или не имеющихся в наличии технологических приемов, другими, более дешевыми и доступными, и, при этом, имеющими сходное влияние на хозяйственные результаты.

Таким образом, данная методика позволяет "просматривать" различные варианты технологии, прогнозировать последствия применения различных технологических приемов, и на этой основе вырабатывать научно обоснованные рекомендации по выбору возделываемой культуры и оптимальной для поставленных целей агротехнологии.

В данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные.

 

Контрольные вопросы

1. Что выбирается в качестве классов распознавания и что в качестве факторов в задаче прогнозирования урожая?

2. Что такое "шкала качества" и "шкала количества"? Какие градации у этих шкал?

3. Как классифицировать факторы, влияющие на урожай?

4. В чем состоит задача прогнозирования количественных и качественных результатов выращивания сельхозкультур?

5. В чем состоит задача поддержки принятия решений при выборе зон и подзон выращивания, культур для выращивания, агротехнологий?

6. Каким образом можно научно обоснованно заменять одни факторы другими?

7. С какими проблемами сталкивается разработчик и исследователь при решении задачи прогнозирования урожая?

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

2. Луценко Е. В.       Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.


 

ЛР-10:
"Исследование случайной семантической информационной модели при различных объемах выборки"

 

Краткая теория

Любая реальная информация о предметной области содержит как полезную информацию о закономерностях, так и шум. Соотношение между полезной информацией (сигналом) и шумом может быть различное:

– уровень сигнала может быть намного выше уровня шума, тогда шум можно считать несущественным;

– уровень сигнала может быть намного ниже уровня шума, тогда шум может существенно сказываться на свойствах модели.

Поэтому представляет интерес исследование семантической информационной модели, созданной на основе случайной обучающей выборки, в которой принадлежность анкет с описаниями объектов к классам и сам набор признаков в них – случайные.

Какая-то часть валидности обусловлена законами теории вероятностей, а какая-то – наличием закономерностей в предметной области и работой системы распознавания, причем в зависимости от параметров модели (размерности по классам и признакам и объема обучающей выборки).

Например, при увеличении объема выборки результат все ближе к предсказываемому теорией вероятностей. Но модель "борется" за повышение адекватности идентификации. И в результате получается валидность заметно выше, чем по теории вероятностей даже при довольно больших выборках.

Когда анализируешь величину интегральной валидности и оцениваешь ее в категориях "довольно хорошая", или "не достаточно высокая", то надо сравнивать ее с валидностью, получаемой по теории вероятностей. Например, если есть два класса, то валидность даже с неработающей системой распознавания должна быть 50% при равновероятных классах, а если классов 10, то валидность должна быть 10%. И только то, что свыше этого значения, предсказываемого теорией вероятности, можно отнести на счет закономерностей в предметной области и работы модели.

Если статистика мала и закон больших чисел не применим, то система "Эйдос" воспринимает шум как закономерности (причем даже иногда детерминистского характера, когда статистики вообще нет) и дает тем более высокую валидность модели, чем меньше статистика.

Получается, что о выявлении закономерностей в предметной области можно говорить только тогда, когда статистика достаточно велика, т.е. настолько велика, что модель может подавить или отсеять шум. Если бы в предметной области не было закономерностей (а был только шум), то валидность была бы близка с предсказываемой теорией вероятностей, но фактически она значительно выше.

При увеличении объема обучающей выборки:

Во-первых, валидность должна стремиться не к нулю, а к величине, предсказываемой теорией вероятностей для равновероятных событий. Можно, конечно, ввести некую величину (каузальная валидность), как разность фактической валидности в системе "Эйдос" и теоретически предсказанной по теории вероятностей. Вот она уже будет стремиться к нулю.

Во-вторых, свойства шума таковы, что эта каузальная валидность должна стремиться к нулю и при внутренней, и при внешней валидности. Это должно происходить просто по определению шума (корреляция белого шума с белым шумом равна нулю), и потому, что интегральный критерий сходства в модели представляет собой корреляцию.

В-третьих, то, что как показывают численные эксперименты, каузальная валидность довольно медленно стремится к нулю, может означать, с одной стороны, невысокое качество генератора псевдослучайных чисел, а с другой стороны, – высокое качество модели распознавания, по-видимому, являющейся мощным средством выявления закономерностей в предметной области. Кстати, учитывая это, можно сравнивать различные генераторы "на степень их случайности".

Можно исследовать случайную модель с такими же параметрами, как какая-нибудь из реальных моделей (с таким же количеством классов, признаков, анкет) и сравнить их валидность. Получится некая величина. Можно считать, что разница между валидностью в реальном примере и случайной модели обусловлена наличием причинно-следственных связей в предметной области.

 

Задание

1. Исследовать зависимость интегральной валидности семантической информационной модели в зависимости от объема обучающей выборки при различном количестве классов и признаков.

2. Построить графики в Excel и дать их интерпретацию.

 

Пример решения

В системе "Эйдос" в 1-й подсистеме в 5-м режиме встроена 4-я функция, обеспечивающая генерацию случайной модели (классификационных и описательных шкал и обучающей выборки) при заданных в диалоге параметрах модели (рисунок 170).

 

Рисунок 196. Интерфейс режима генерации случайной модели

 

Реальный исходный текст реализации этой функции приведен ниже.

 

******** ФОРМИРОВАНИЕ КЛАССИФИКАЦИОННЫХ И ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ, *****

******** А ТАКЖЕ ОБУЧАЮЩЕЙ ВЫБОРКИ СЛУЧАЙНЫМ ОБРАЗОМ ************************

******** Луценко Е.В., 04/16/04 02:01pm *************************************

 

FUNCTION InpRandom()

 

***** БЛОК-1. ОТОБРАЖЕНИЕ ИНФОРМАЦИИ О ФУНКЦИЯХ ПРОГРАММНОГО ИНТЕРФЕЙСА **********************

 

scr23 = SAVESCREEN(0,0,24,79)

 

SET CURSOR OFF

SET DATE ITALIAN

SET DECIMALS TO 15

SET ESCAPE On

 

Titul(.T.)

 

SHOWTIME(0,60,.F.,"rg+/n",.F.,.F.)

 

Mess1 = " === ГЕНЕРАЦИЯ СЛУЧАЙНЫХ КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ === "

Mess2 = " === ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ === "

Mess3 = " === ГЕНЕРАЦИЯ СЛУЧАЙНОЙ ОБУЧАЮЩЕЙ ВЫБОРКИ === "

@4,40-LEN(Mess1)/2 SAY Mess1 COLOR "rg+/rb"

@5,40-LEN(Mess2)/2 SAY Mess2 COLOR "rg+/rb"

@6,40-LEN(Mess3)/2 SAY Mess3 COLOR "rg+/rb"

 

** БЛОК-3. ЗАДАНИЕ В ДИАЛОГЕ ДИАПАЗОНОВ СТОЛБЦОВ С КЛАССАМИ И ФАКТОРАМИ **********************

 

N_Obj = 2

Mess = "Задайте количество классов  : #####"

@10,40-LEN(Mess)/2 SAY Mess COLOR "w+/rb"

@10,52 GET N_Obj PICTURE "#####" COLOR "rg+/r+"

N_Atr = 10

Mess = "Задайте количество признаков: #####"

@12,40-LEN(Mess)/2 SAY Mess COLOR "w+/rb"

@12,52 GET N_Atr PICTURE "#####" COLOR "rg+/r+"

N_Ank = 100

Mess = "Задайте количество анкет    : #####"

@14,40-LEN(Mess)/2 SAY Mess COLOR "w+/rb"

@14,52 GET N_Ank PICTURE "#####" COLOR "rg+/r+"

 

SET CURSOR ON;READ;SET CURSOR OFF

IF LASTKEY()=27

   RESTSCREEN(0,0,24,79,scr23)

   RETURN

ENDIF

 

USE Setup EXCLUSIVE NEW

N_LogAnk = N_Obj       && Макс. кол-во логических анкет в одной физической

CLOSE ALL

 

** БЛОК-7. ГЕНЕРАЦИЯ КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ ***************************************

 

Mess1 = " === ГЕНЕРАЦИЯ СЛУЧАЙНЫХ КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ === "

@4,40-LEN(Mess1)/2 SAY Mess1 COLOR "rg+*/rb"

 

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

x=0

 

CLOSE ALL

USE Object EXCLUSIVE NEW;ZAP

FOR j=1 TO N_Obj

    APPEND BLANK

    REPLACE Kod  WITH j

    REPLACE Name WITH "Obj_"+ALLTRIM(STR(j,5))

    p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)

    @24,0 SAY STR(p,3)+"%" COLOR "w+/r+"

    @24,4 SAY REPLICATE("-",0.76*p) COLOR "rb+/n"

NEXT

 

** БЛОК-8. ГЕНЕРАЦИЯ ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ ********************************************

 

Mess2 = " === ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ === "

@5,40-LEN(Mess2)/2 SAY Mess2 COLOR "rg+*/rb"

 

USE Priz_ob  EXCLUSIVE NEW;ZAP

USE Priz_per EXCLUSIVE NEW;ZAP

 

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

 

FOR i=1 TO N_Atr

    APPEND BLANK

    REPLACE Kod  WITH i

    REPLACE Name WITH "Atr_"+ALLTRIM(STR(i,5))

    p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)

    @24,0 SAY STR(p,3)+"%" COLOR "w+/r+"

    @24,4 SAY REPLICATE("-",0.76*p) COLOR "rb+/n"

NEXT

 

** БЛОК-9. ГЕНЕРАЦИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ *******************************************************

 

Mess3 = " === ГЕНЕРАЦИЯ СЛУЧАЙНОЙ ОБУЧАЮЩЕЙ ВЫБОРКИ === "

@6,40-LEN(Mess3)/2 SAY Mess3 COLOR "rg+*/rb"

 

USE ObInfZag EXCLUSIVE NEW;ZAP

USE ObInfKpr EXCLUSIVE NEW;ZAP

 

N_Rec = RECCOUNT()

 

FOR M_KodIst=1 TO N_Ank

 

    SELECT ObInfZag

    APPEND BLANK

    REPLACE Kod_ist  WITH M_KodIst

    R = 1+INT(N_Obj*RANDOM()/65535)              && Код класса

    R = IF(R<1,1,R)

    R = IF(R>N_Obj,N_Obj,R)

    REPLACE Name_ist WITH "Ist-"+STRTRAN(STR(M_KodIst,5)," ","0")+"-"+STRTRAN(STR(R,5)," ","0")

    FIELDPUT(3,R)

 

    ***** Генерация массива кодов признаков в для БД ObInfKpr

    A_Kpr := {}

    FOR j=1 TO N_Atr

        M_KodPr = 1+INT(N_Atr*RANDOM()/65535)    && Код признака

        M_KodPr = IF(M_KodPr<1,1,M_KodPr)

        M_KodPr = IF(M_KodPr>N_Atr,N_Atr,M_KodPr)

        IF ASCAN(A_Kpr,M_KodPr) = 0              && Если признак еще не стречался

           IF LEN(A_Kpr)+1 <= 4000

              AADD(A_Kpr,M_KodPr)

           ENDIF

        ENDIF

    NEXT

    ASORT(A_Kpr)

    ****** Запись массива кодов признаков в БД ObInfKpr

    SELECT ObInfKpr

    APPEND BLANK

    FIELDPUT(1,M_KodIst)

    k=2

    FOR j=1 TO LEN(A_Kpr)

        IF k <= 12

           FIELDPUT(k++,A_Kpr[j])

        ELSE

           APPEND BLANK

           FIELDPUT(1,M_KodIst)

           k=2

           FIELDPUT(k  ,A_Kpr[j])

        ENDIF

    NEXT

    p=++x/(N_Obj+N_Atr+N_Ank)*100;p=IF(p<=100,p,100)

    @24,0 SAY STR(p,3)+"%" COLOR "w+/r+"

    @24,4 SAY REPLICATE("-",0.76*p) COLOR "rb+/n"

NEXT

 

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

GenNtxObj(.T.)

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

GenNtxPro(.T.)

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

GenNtxPrp(.T.)

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

GenNtxOin(.T.)

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

 

Mess = " ПРОЦЕСС ГЕНЕРАЦИИ ЗАВЕРШЕН УСПЕШНО !!! "

@24,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"

 

INKEY(0)

 

RESTSCREEN(0,0,24,79,scr23)

CLOSE ALL

 

RETURN

 

Алгоритм выполнения задания 1:

Шаг 0. Вход.

Шаг 1. Выполнить генерацию классификационных и описательных шкал и градаций, а также обучающей выборки при минимальном объеме обучающей выборки (например, при 2-х объектах).

Шаг 2. Произвести синтез модели.

Шаг 3. Скопировать обучающую выборку в распознаваемую.

Шаг 4. Произвести распознавание.

Шаг 5. Измерить внутреннюю интегральную валидность и занести информацию о параметрах случайной модели в Excel.

Шаг 6. Увеличить объем обучающей выборки на величину "Дельта".

Шаг 7. Если объем обучающей выборки меньше максимума, то перейти на шаг 2, иначе – на шаг 8.

Шаг 8. Выход.

Учащимся предлагается выполнить приведенный алгоритм самостоятельно.

 

Контрольные вопросы

1. Что такое "случайная модель"?

2. Почему необходимо исследовать свойства случайной модели?

3. Какие средства для генерации и исследования случайных моделей есть в системе "Эйдос"?

 

Литература по лабораторной работе

1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. – 280с.

2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар:  КубГАУ. 2002. – 605 с.