Предлагая когнитивную концепцию автор исходил из неклассической теории развития техники,
развитой в работах [14], [67], [70], [76]. Суть этой теории очень кратко
состоит в следующем.
На любом этапе развития общества технологический базис
общества основан на тех уровнях Реальности, которые осознаются как объективное при соответствующей данному
этапу форме сознания. Технологический прогресс состоит в последовательной
передаче трудовых функций организма человека средствам труда.
Когда средствам передается очередная трудовая функция -
происходит технологическая революция, которая с неизбежностью вызывает
революцию экономическую и социальную, а значит переход к новой
общественно-экономической формации и соответствующему состоянию сознания (этапу
общественного познания). Так формулируется закон перераспределения трудовых функций в
системе “человек-машина”, т.е. закон количественного повышения базиса.
Когда средствам труда полностью и в массовом масштабе
передается последняя функция некоторого тела человека (физического,
астрального, ментального или др.), то это вызывает переход к следующей
группе общественно-экономических формаций и к следующему типу сознания.
При этом человек как объективное начинает осознавать
соответствующий качественно новый уровень Реальности и постепенно начинает
действовать на нем как человек используя принцип свободы воли, в
частности: сначала пользоваться тем, что "лежит на поверхности и ждет
когда его возьмут", а затем трудиться и производить для потребления то,
чего "на поверхности" не оказалось, и, наконец, производить
средства производства. Таким образом при переходе к следующей группе
формаций технологический базис общества повышается качественно, т.е. включает в
себя средства труда, созданные на тех уровнях Реальности, которые ранее
осознавались основной массой людей как субъективные. Так
формулируется закон повышения качества базиса.
Таким образом, в процессе развития технологии создаются
технические системы, в состав которых входят уровни Реальности, поддерживающие
так называемые субъективные функции (чувственно-эмоциональное восприятие и
формально-логическое мышление), которые на предыдущих этапах эволюции общества
осознавались как субъективные и относились не к базису, а к
надстройке. В результате этого изменяется положение границы между базисом и
надстройкой и соответственно изменяется содержание этих понятий, хотя их
соотношение остается тем же что и раньше. Конечно, в этой связи изменяется и
содержание таких понятий, как “производственная сфера” и “непроизводственная
сфера”, под которыми при “окончательно построенном развитом социализме”
понимались соответственно “сфера материального производства” и сфера
производства самого человека, т.е. в основном культура, наука, образование и
медицина.
Следуя логике неклассической теории развития техники Л.А.Бакурадзе и автор в 1979 - 1981 годах предложили ряд
перспективных технических решений [12,13], которые в настоящее время уже
практически реализованы в развитых странах [119]. Предложенная и развитая автором
когнитивная концепция является теоретической основой для создания
функциональных прототипов ряда программных продуктов, входящих в состав этих и
подобных перспективных технических систем.
Поэтому при разработке данной когнитивной концепции ставилась весьма прагматичная
задача: с одной стороны, описать процессы восприятия и познания в форме
допускающей формализацию в виде ясной математической модели, а с другой
стороны, одновременно сохранить максимум наиболее существенного из того, что
известно о процессах восприятия и познания человека, причем постоянно имея в
виду будущую программную реализацию.
Различие между различными видами
информации удобнее всего рассмотреть на наглядном и несколько упрощенном
примере.
Допустим у нас имеется некоторая
группа избирателей (электорат). Кандидаты в депутаты зарегистрированы по 20 партийным
спискам. Результаты голосования показали, что голоса избирателей распределились
следующим образом:
· за
КПРФ отдали свои голоса |
22
человека; |
· за
ЛДПР |
11
человек; |
· за
“НАШ ДОМ - РОССИЯ” |
9
человек; |
· за
“ЯБЛОКО” |
7
человек; |
· за
все остальные партии |
51
человек. |
Всего: |
100 человек. |
Информация о том, что за КПРФ отдали голоса 22
человека само по себе, изолированно, совершенно ни о чем не говорит если
неизвестно общее количество проголосовавших избирателей. Например если их 1000,
то это очень мало, а если 100 - то много. Мы видим, что в нашем примере мы
имеем как раз второй вариант. Таким образом оценку по шкале “много - мало” мы не можем дать
используя только абсолютную информацию, а можем это сделать взяв отношение
абсолютного количества к численности всей совокупности, т.е. только используя информацию
относительную. Общеизвестно, что абсолютные числа, такие как абсолютное количество
проголосовавших, значительно менее информативны чем относительные, такие как проценты.
Абсолютная
информация - это информация содержащаяся в
абсолютных числах, таких как количество чего-либо, взятого “само по себе”, т.е.
безотносительно к объему совокупности, из которой оно собственно “взято”.
Относительная
информация - это информация, содержащаяся в
отношениях абсолютного количества к объему совокупности. Относительная
информация измеряется в частях, процентах, промиле и других единицах.
Продолжим наш анализ примера,
переписав результаты голосования в процентах:
· за
КПРФ отдали свои голоса |
22
% |
· за
ЛДПР |
11
% |
· за
“НАШ ДОМ - РОССИЯ” |
9
% |
· за
“ЯБЛОКО” |
7
% |
· за
все остальные партии |
51
% |
Когда мы видим перед собой весь список результатов голосования,
особенно, если он рассортирован по
процентам полученных голосов избирателей, -
то мы сразу непроизвольно сравниваем
одни проценты с другими. При это не
представляет большого труда заметить, что КПРФ набрала наибольший
процент голосов из всех партий, т.е. победила на выборах. Но если бы список был
из 2000 строк, а не из 4-х, то труд по анализу (сравнению) был бы 500 раз большим.
Однако если бы у нас перед
глазами была только одна строчка:
“за КПРФ отдали голоса 22%
избирателей”, то мы бы не смогли сделать вывода о том, “много это или мало”, т.к. это понятия относительные. Это означает, что для того, чтобы сказать много это
или мало, надо данное число (22%) с чем-то сравнивать,
например с другим числом, соответствующим “контрольной группе” или базе оценки.
Во-первых, может быть за какую-то
другую партию отдано 43% голосов. Во-вторых, 22% голосов избирателей, отданных
в поддержку КПРФ по сути дела это означает, что КПРФ не поддерживает 78% процентов избирателей, т.е. подавляющее их
большинство. Как же такая партия может победить на выборах? А очень просто,
если учесть, что другие партии не поддерживает
еще большее количество избирателей: так ЛДПР не поддерживает 89%
избирателей, НДР - 91%, “ЯБЛОКО”- 93%
и т.д. И только “на этом фоне” мы видим, что хотя КПРФ и
не поддерживают 78% избирателей, все же этот процент “неподдерживающих” для КПРФ самый низкий из всех партий.
Очевидно, что и из относительной
информации, взятой изолированно, вырванной из контекста, делать какие-либо
обоснованные выводы не представляется возможным. Те, кто иногда делает это
сознательно, просто вводит в заблуждение некомпетентных слушателей.
Для того, чтобы о чем-то
судить по процентам, нужен их сопоставительный анализ.
Вариантов такого анализа может
быть много, но суть не в этом, а в том, что такой анализ необходим. Рассмотрим
один из возможных вариантов соспоставительного анализа процентных
распределений на нашем примере. Этот вариант предполагает использование в
качестве “базы оценки” среднего по всей совокупности.
Мы уже упоминали, что по нашему
примеру в выборах участвовало 20 партий. Очевидно, что если бы они все были в равной степени, т.е. одинаково
популярны (или наоборот, непопулярны) у избирателей, то они набрали бы по 5%
голосов. Логично считать, что партии, набравшие в этих условиях больше 5% могут быть названы в определенном смысле
пользующимися поддержкой и доверием избирателей (популярными), а набравшие
меньше 5% - не пользующимися их поддержкой и доверием (непопулярными). Поэтому
само существование некоторого барьера процента набранных голосов для
прохождения в Думу выглядит обоснованным, но нужно понимать, что сам это
процент зависит от количества партий, участвующих в выборах (если партия не
участвует в выборах, то в рассматриваемом контексте ее можно не считать
партией).
Но вот Дума сформирована.
Возникает вопрос, а какие партии
образуют в Думе доминирующие фракции, а какие второстепенные? На этот
вопрос также невозможно ответить без сопоставительного анализа процентов
голосов избирателей, набранных каждой партией.
В нашем примере:
· за
КПРФ отдали свои голоса |
22
% |
· за
ЛДПР |
11
% |
· за
“НАШ ДОМ - РОССИЯ” |
9
% |
· за
“ЯБЛОКО” |
7
% |
Это означает, что согласно нашей
методики соспоставительного анализа, мы должны
сложить все эти проценты:
22 + 11 + 9 + 7 = 49
Затем разделить сумму на число
фракций:
49 / 4 = 12.25
Эта величина 12.25 и составляет
“новый барьер”, который дает нам количественный
критерий и формальную процедуру (алгоритм) для ответа на поставленный
вопрос. Теперь мы можем сравнивать набранные партиями проценты уже с этой
величиной нового барьера.
Сравнивать можно по-разному:
· простейший
вариант - просто смотреть “больше или меньше” набранный процент, чем величина
барьера;
· более
развитый и предпочитаемый автором способ - это брать отношение набранных процентов или вероятностей (которые отличаются
от процентов в 100 раз) к величине барьера и смотреть, насколько это отношение больше или меньше единицы.
В результате получим
(округленно):
· за
КПРФ отдали свои голоса |
22
% |
1.796 |
· за
ЛДПР |
11
% |
0.898 |
· за
“НАШ ДОМ - РОССИЯ” |
9
% |
0.735 |
· за
“ЯБЛОКО” |
7
% |
0.571 |
После этого анализа мы видим, что
в действительности при данном распределении голосов в Думе будет всего одна
доминирующая фракция - КПРФ, а остальные являются второстепенными.
Но весь этот анализ мы здесь
привели, естественно, вовсе не для того, чтобы делать какие-либо политические
выводы, а лишь с целью ввести понятие аналитической (сопоставительной) формы информации.
“Смотреть”, насколько отношение
больше или меньше единицы также можно либо “глазами”, либо используя
дополнительную математическую обработку, например, предварительно взяв двоичный
логарифм от данного отношения. Принципиального значения это не имеет и по сути
сводится к преобразованию единиц
измерения. Однако при использовании логарифма отношения мы получаем
возможность измерять количество аналитической информации в единицах, наиболее
подходящих для измерения количества информации, а именно в так называемых
двоичных единицах информации - БИТах. Этот вариант и принят в Системе “ЭЙДОС”.
Подобно великолепному
мольеровскому господину Жюрдену, который только к 50 годам узнал, что
оказывается он всю жизнь говорил прозой, большинство людей активно пользуется
анлитической формой информации, но сами совершенно не подазревают об этом.
Например, недавно я видел плакат, на котором было написано примерно следующее:
“Исследования показали, что среди совершивших ДТП в состоянии алкогольного
опьянения количество смертельных случаев в 1,3 раза выше, чем по всей группе”. Это
пример типичного аналитического высказывания.
Аналитическая
(сопоставительная)
информация
- это информация, содержащаяся в отношении вероятности (или процента) к
некоторой базовой величине, например к средней вероятности по всей выборке.
Аналитическая информация измеряется в БИТах.
Очевидно,
именно аналитическая информация является наиболее кондиционной для
употребления с той точки зрения, что позволяет непосредственно делать содержательные
выводы об исследуемой предметной области (точнее будет сказать, что она
сама и является выводом), тогда как для того, чтобы сделать аналогичные
выводы на основе относительной, и особенно абсолютной информации требуется ее
значительная предварительная обработка.
К
слову сказать, эта “предварительная обработка” и составляет значительную долю
трудоемкости труда аналитиков и экспертов, которые полагаются во многом
на чисто качественную (невербализуемую, интуитивную)
оценку имеющейся у них сырой относительной информации, т.к. проводить расчеты,
подобные вышеприведенному, для реальных объемов данных вручную не
представляется возможным, а автоматизированные системы, обеспечивающие
количественную обработку и генерацию аналитической информации практически
отсутствуют (если не считать Систему “ЭЙДОС”).
В настоящее время наиболее
популярной и практически единственной системой, используемой для
социологических и политологических исследований, а также
в прикладной психологии, является американская статистическая система SPSS
(имеется версия под WINDOWS), которая не является аналитической системой, т.к.
позволяет генерировать только процентные распределения различных видов. По этой
причине сравнивать ее с Системой “ЭЙДОС” не совсем правильно. В то же время, естественно, Система
“ЭЙДОС” генерирует и позволяет выводить различные процентные распределения,
являющиеся в этой системе предварительным этапом получения аналитической информации.
Необходимо отметить, что широкому
распространению аналитической системы “ЭЙДОС” препятствует недостаточное знакомство практических
социологов и политологов (чаще всего
“гуманитариев” по образованию и стилю мышления) с самим понятием аналитической
информации, а также методами ее количественной автоматизированной обработки. В
то же время уровень арифметических и статистических автоматизированных систем
(типа SPSS и STATGRAPHICS) ими уже освоен, поэтому подход, развиваемый в данной
работе, является весьма актуальным и можно сказать уже “витает в воздухе”.
При предъявлении воспринимающему и познающему человеку
некоторой новой конкретной реализации какого-либо объекта, который относится к
уже сформированной на основе других примеров обобщенной категории, но ранее еще
ни разу не предъявлялся, он сразу поступает
на вход системы идентификации, т.е. человек пытается сопоставить этот новый
объект с уже имеющимися у него образами и определить на сколько данный объект
похож на эти образы. После
получения дополнительной достоверной (верифицирующей) информации о
принадлежности данного объекта к некоторой конкретной обобщенной категории
(информация “обратной связи”), описание данного объекта на языке признаков поступает на вход системы обучения,
т.е. используется для доформирования соответствующей категории, при этом семантические нагрузки всех
признаков (а не только тех, которые встретились у данного объекта) изменяются,
как и информационное содержание всех
имеющихся у человека образов. В результате система адаптируется к количественным изменениям предметной области на уровне
изменения семантической нагрузки признаков.
Из теоремы Геделя,
рассмотренной выше, следует, что любой системе распознавания всегда может быть предъявлен объект, который
имеет практически нулевое сходство с образами всех сформированных в данной
системе классов распознавания. Добавление данного объекта в качестве образца нового класса распознавания принципиально
расширяет предметную область применимости данной системы распознавания и
обеспечивает адаптацию системы к качественным
изменениям предметной области.
Таким образом воспринимая и познавая, а также получая за
счет обратной связи (практики) информацию о степени адекватности результатов
нашего восприятия и познания, мы учимся воспринимать и познавать. Очевидно, что
процесс восприятия, как некоторый организованный процесс, предполагает наличие
некоторой исходной информации (тезауруса), которая может быть получена только в
результате исходного обучения.
Каждый признак содержит некоторую информацию, которая
характеризуется с количественной (синтаксической) и качественной (содержательной,
семантической) стороны.
Количественный и качественный аспекты информации существуют
в органическом и неразрывном единстве. Это иллюстрируется следующим диалогом:
- Я только что сообщил тебе 8 бит информации.
- А о чем?
- Да ни о чем!
Невозможно сообщить никакого количества информации
одновременно не сообщив при этом в чем состоит эта информация или какое
содержание этой информации. Таким образом количественный
аспект информации не может существовать без качественного, содержательного.
Изучать количественные характеристики информационных потоков, совершенно при
этом абстрагируясь от их содержательной стороны, невозможно. Содержательная
сторона в теории информации изучается, как правило,
с использованием понятия “тезаурус”, под которым понимается информация, которой
обладает приемник сообщения и от количества и содержания которой зависит
сколько и какой информации он может воспринять от источника. Приемник с нулевым
тезаурусом вообще не является приемником, т.к. не может воспринять из информационного
канала ни одного бита информации никакого содержания.
Таким образом, выражаясь свободно, количество (синтаксис) “тащит” за собой
качество (семантику). Но, с другой стороны, и содержание, качество, семантика
информации “тащит” за собой количество, причем вполне определенное в каждом
конкретном случае.
Например, признак “Цвет - красный” имеет совершенно
различный смысл, т.е. говорит о совершенно разных вещах в зависимости от того,
к какому объекту относится данный признак: светофору, флагу в руках
демонстранта или цвету лужи на асфальте около алкогольного ларька. Количество
информации, которое мы получаем в каждом из этих трех случаев, узнав о наличии
данного признака, также совершенно различно.
Следовательно, в различных случаях один и тот же признак
может иметь совершенно различный смысл и нести нам различное количество
информации, т.е. “говорить о разных вещах и с различной определенностью”.
Семантический анализ
предполагает:
· изучение смысловой нагрузки
признаков, т.е. того о чем и насколько определенно эти признаки говорят;
· изучение информационного
содержания образов (обобщенных категорий объектов и ситуаций, классов
распознавания), т.е. того, какой вклад (по
величине и знаку) в полную информацию, содержащуюся в каждом образе, вносят
различные признаки;
· изучение сходств и различий между признаками по их смыслу;
· изучение сходств и различия между
образами, если рассматривать их с точки зрения их информационного содержания.
В данном разделе:
·
дано обоснование необходимости
когнитивной концепции;
·
сформулирована базовая когнитивная концепция, реализованная в математической
модели и алгоритмах адаптивного семантического анализа информации в
универсальной автоматизированной системе распознавания образов “ЭЙДОС-
·
проанализированы тенденции и
метатеоретические идеи, вдохновлявшие творцов науки от эпохи Возрождения до наших дней, а
также возможность и целесообразность развития Системы “ЭЙДОС” в направлении обеспечения поддержки типовых
познавательных операций, используемых человеком.
Универсальная
автоматизированная система распознавания образов “ЭЙДОС-6.2.” разрабатывалась
автором в качестве программного средства, реализующего концепцию автоматизации
основных когнитивных функций, без которых немыслима успешная
деятельность человека в любой предметной области.
Сформулированную
в данном разделе когнитивную концепцию (т.е. концепцию восприятия и
познания) автор рассматривает как метатеоретическую (психологическую и даже гносеологическую)
базу, без наличия которой невозможно раскрыть тему данного исследования, а
также содержательно понять математическую модель Системы “ЭЙДОС-
Прежде
всего процесс познания начинается с процесса восприятия объектов и явлений Реальности. Процесс восприятия
осуществляется с помощью органов восприятия: прежде всего зрения, а также
слуха, осязания и других. Органы восприятия дают человеку чувственную информацию
о признаках наблюдаемых объектов.
На
самых первых этапах жизни человека эти признаки объектов не образуют устойчивых
взаимосвязанных комплексов, т.е. целостных образов объектов. Но опыт
взаимодействия человека с реальными объектами приводит к выявлению взаимосвязей между признаками. Так в
результате опыта обнаруживается, что некоторые признаки наблюдаются как правило
вместе друг с другом (наличие
пространственно-временных корреляций), другие же наоборот, вместе практически
не встречаются. Могут быть также признаки, которые встречаются как бы случайным
образом и, по-видимому, никак не связаны с другими.
Существование устойчивых
взаимосвязей между признаками говорит о том, что они не являются
самостоятельной реальностью, а отражают нечто стоящее за ними и их
объединяющее, т.е. реальные объекты. С другой стороны это означает, что признаки не генерируются из
ничего, а имеют объективное содержание.
Каждому Реальному объекту или явлению Реальности в сознании человека
соответствует некоторая своя устойчивая взаимосвязь признаков (этого объекта),
т.е. свой определенный образ, а именно конкретный
чувственный образ данного конкретного
(этого) объекта. Конкретный
чувственный образ объекта представляют собой совокупность всех его
воспринимаемых признаков, как общих с другими объектами, так и в большей или
меньшей степени специфических именно для данного конкретного объекта.
Следующий
этап познания Реальности состоит в том, что некоторый взрослый человек -
учитель (обычно мать или отец) показывает ребенку окружающие его объекты и произносит их названия на некотором символическом языке, т.е. дает им
некоторые условные наименования или
имена.
Если чувственно воспринимаемые
признаки конкретного объекта имеют объективное происхождение, то
наименование объекта устанавливает его принадлежность к некоторой категории
объектов, включающей вообще говоря много различных объектов, объединенных по их
назначению или иной функциональной роли в природе или обществе с точки
зрения познающего человека (общества), или роль данного объекта для самого
познающего человека.
Необходимо
также отметить, что у животных, в отличие от человека, сам набор обобщенных
образов довольно жестко фиксирован (свой для каждого вида) и количественно
очень ограничен.
На
этом этапе весьма существенным обстоятельством является то, что самые различные
объекты одного функционального назначения получают одинаковое название,
например различные мячи все получают наименование “Мяч”, столы - “Стол” и так
далее.
При
этом ребенок устанавливает (корреляционные) взаимосвязи:
·
между
наблюдаемыми признаками данного
конкретного объекта и наименованием
социально-обусловленной обобщенной
категории, к которой данный объект относится;
·
между наименованиями признаков и наименованиями
обобщенных категорий объектов.
Благодаря
существованию этих связей и
становится возможным говорить о смысле
признаков, т.е. о том, что каждое
физическое свойство конкретного объекта несет определенную информацию о роли
этого объекта в природе, обществе или для конкретного человека.
Таким образом введение в обиход наименований
объектов становится важнейшей предпосылкой для формирования их абстрактных обобщенных
образов, причем сама возможность обобщения связана с классификацией объектов по
их социальной роли (назначению).
Среди
различных окружающих объектов совершенно аналогично формируется предметный
образ и такого
специфического для каждого конкретного человека объекта, как его собственное
физическое тело. Так формируется “образ Я”, характерный для физической формы
сознания, формируется предметное сознание и самосознание.
Когда
абстрактные обобщенные образы объектов сформированы, то становится возможным узнавание конкретных объектов, т.е. их
идентификация. Операция узнавания состоит в сравнении конкретного чувственного
образа определенного объекта с обобщенными абстрактными образами и определение
степени сходства и различия между данным конкретным чувственным образом и
обобщенными образами. В результате, т.е. когда
конкретный объект узнан, человек может назвать его наименование, т.е.
может восстановить его функциональную роль в природе, обществе или лично для
себя. Если человек в состоянии это сделать, то считается, что он понимает
смысл того, что он воспринимает.
Таким
образом, узнавание это процесс установления соответствия между объективным
описанием объекта, как дискретной
совокупности признаков и его единым и неделимым (континуальным) именем, т.е. наименованием той обобщенной категории,
к которой данный объект относится по
своей социально-обусловленной роли. У человека интенсиональные (дискретное) и
экстенсиональное (континуальное) описания объектов обрабатываются двумя различными
взаимно-дополнительными системами отражения, работа которых обеспечивается
различными полушариями мозга, и лишь
взаимодействие этих двух систем обеспечивает обработку смысла.
По
мере накопления опыта выясняется, что некоторые специфические признаки практически
однозначно позволяют идентифицировать объекты, т.е. отнести их к определенным
обобщенным категориям, другие же встречаются примерно с одинаковой вероятностью
у самых различных объектов и для целей идентификации являются практически
бесполезными. Умение человека определить ценность
тех или иных признаков для решения задачи идентификации уже говорит о
накоплении достаточно большого опыта восприятия и обобщения.
Когда
такой достаточно значительный опыт накоплен, то следующим совершенно естественным
этапом познания является выделение всего
наиболее существенного путем отбрасывания случайных и не несущих существенной информации
признаков, а также дублирующих и избыточных признаков, имеющих очень сходный
друг с другом смысл. В результате этой операции, называющейся “абстрагирование”, первоначальное
описание объекта на языке признаков, включающее все его чувственно-воспринимаемые признаки, заменяется значительно
более сжатым и экономным описанием, содержащим только наиболее существенные для
идентификации объекта признаки. После
этой операции процесс ориентации в предметной области становится более экономным по затратам всех видов
ресурсов, более легким и быстрым, чем до этого, причем при сохранении
необходимого высокого качества.
Высвобождение
сил познающего человека после исключения из анализа второстепенной и
несущественной информации позволяет подойти к решению более сложных задач, таких как выявление сходств и различий между обобщенными образами различных видов
объектов Реальности, а также выявление
смысловых взаимосвязей между различными признаками этих объектов. Кроме
того использование сжатых и высокоинформативных образов объектов позволяет быстро и с
минимальными внутренними затратами относить конкретные чувственно-наблюдаемые
объекты к тем или иным обобщенным категориям, функции и свойства которых уже
известны, и таким образом эффективно
ориентироваться в некоторой предметной области (окружающей среде).
В
дальнейшем, применяя на практике ранее сформированные модели Реальности, человек
получает новую достоверную информацию о степени их эффективности и, соответственно,
адекватности. Эта информация обратной
связи используется для уточнения и развития конкретной
чувственно-эмоциональной и обобщенной, абстрактной (формальной) модели Реальности, в чем и состоит ее адаптивность.
Выявление
сходств и различий между обобщенными образами различных видами объектов
Реальности позволяет выявить среди них образы двух основных
“крайних” или “полярных” типов, - это образы, которые с некоторой
степенью условности можно назвать “жесткие”
(“детерминистские”) и “аморфные”
(“статистические”).
Жесткие (детерминистские) образы - это четко оформленные образы, практически совершенно
не связанные (не имеющие сходства
или антисходства - различия) с другими образами, описанные в
основном детерминистскими признаками с очень высокой информативностью. Детерминистские
признаки являются таковыми, т.к. практически не встречаются у остальных
образов. Поэтому обнаружение таких признаков у некоторого объекта позволяет без
труда и практически однозначно отнести данный объект к соответствующему
обобщенному образу (классу).
Аморфные (статистические,
вероятностные) образы - это расплывчатые, слабо сформированные
образы, которые сильно связаны с
другими такими же аморфными образами, т.е. имеют с ними высокий уровень
сходства или антисходства (различия). Аморфные образы описываются
статистическими признаками, которые встречаются и у них, и у других образов с
различными вероятностями: у одних чаще, чем в среднем по всем образам, а у
других реже, чем в среднем, но также встречаются. Поэтому, естественно,
статистические признаки имеют значительно меньшую информативность, чем
детерминистские.
Реально
формируемые в процессе познания обобщенные образы различных видов объектов реальности, их
состояний и различных явлений всегда находятся где-то между этими крайними
полюсами, по своей степени “жесткости” или “аморфности”, как и их признаки, которые,
соответственно, в различной степени близки к детерминистским - высокоинформативным или к практически бесполезным для идентификации “всегда
встречающимся” признакам.
Исходя
из этого может показаться, что в системе признаков, описывающих некоторую
предметную область желательно иметь как можно больше детерминистских и как
можно меньше статистических признаков. Если ставить перед собой только задачу идентификации (различения
друг от друга, распознавания) объектов
этой предметной области, то это верно. Однако существуют и другие важные
задачи, например задача объективной классификации объектов, которая сводится к
определению степени их сходства и различия, объединению наиболее сходных друг с
другом объектов в кластеры, определение
наиболее непохожих друг на друга кластеров и формирование конструктов.
Конструктом называется понятие, имеющее противоположные смысловые
полюса и спектр промежуточных смысловых значений, расположенных по некоторой
шкале [см.127]. Например,
понятие “температура” имеет полюса “горячее” и “холодное” с промежуточными значениями
“теплое” и “прохладное” и шкалой Цельсия для количественного измерения температуры.
Другие примеры конструктов: “вес”,
“размер”, “возраст”, “цвет”, “нота” и т.д. Часто бывает, что конструкт четко выражен своими полюсами и спектром, но
не имеет своего конструктивного названия. Например: “Дух-материя”, “добро-зло”.
Свойство человеческого интеллекта
мыслить бинарными конструктами (т.е. конструктами с
двумя полюсами) является одним из наиболее фундаментальных его свойств.
Как правило, люди мыслят именно полюсами конструктов, а не промежуточными
смысловыми оттенками.
Очевидно,
без наличия общих, т.е. статистических признаков все объекты будут максимально
непохожими друг на друга и вообще не будут иметь какого-либо сходства.
Следовательно, задача классификации будет иметь очень неинтересное тривиальное
решение: в каждом кластере будет по одному объекту, а конструкты вообще не образуются.
Итак:
создание обобщенных
образов без некоторой вариабельности признаков у входящих
в эти образы объектов и наличия
статистических признаков невозможно;
1. только наличие статистических
признаков позволяет решить задачу формирования кластеров и конструктов.
Роль
жестких и аморфных образов в процессе познания реальности можно сравнить,
соответственно, с ролью ствола и крупных ветвей, как опоры “древа познания
жизни”, и мелких веточек и листьев - как его бесконечного многообразия, “которое
вечно цветет и зеленеет”.
“Драма
идей”, ареной которой является сам процесс становления и развития процесса
познания, является предметом рассмотрения в нашей “когнитивной концепции”, т.к. имеет самое непосредственное
отношение к проблемам принципиальной распознаваемости (идентифицируемости) и теме данной
работы в целом. Рассмотрим “эту драму” подробнее.
Упрощенное
(естественнонаучное, формально-логическое) мышление, сосредотачивающееся на наиболее
фундаментальных (базовых) закономерностях познаваемой предметной области, стремится освободится от аморфных образов и
свести все многообразие этой предметной области к минимальному количеству
детерминистских, “жестких” образов. Этот процесс освобождения от аморфных
образов по существу является процессом абстрагирования
и может быть назван также процессом ВЫЯВЛЕНИЯ
БАЗИСНЫХ ВЗАИМНО ОРТОНОРМИРОВАННЫХ ПОНЯТИЙ.
Значение
этого процесса невозможно переоценить. Например
известно, что осознание А.Лобачевским независимости (ортогональности) образа
аксиомы о параллельности прямых от системы образов остальных аксиом геометрии
привело к созданию неевклидовой геометрии. Дальнейшим развитием по пути
“неевклидовости” явилась
геометрия Римана, ставшая
основой теории гравитации А.Эйнштейна.
Другим
ярким примером такого
естественно-научного формально-логического подхода является классическая
механика, которая сводит невообразимо громадное многообразие по-видимому
различных явлений к небольшому числу таких фундаментальных понятий, как трехмерное
пространство (три координаты
которого взаимно перпендикулярны, т.е. ортогональны),
время, масса и энергия. Очень
важно заметить, что в рамках классической механики возможно два по существу эквивалентных
и взаимноодназначно получающихся одно из другого описания любого
явления: пространственно-временное и импульсно-энергетическое. Это означает,
что в действительности взаимно ортогональными являются с одной стороны, только
понятия трех измерений пространства и времени, а с другой стороны, энергии и
импульса. Это в дальнейшем развитии познания нашло отражение в создании
четырехмерного формализма Г.Минковского и “геометродинамике” общей теории
относительности А.Эйнштейна, в которой
существует только четыре взаимно ортогональных измерения единого
пространства-времени, а гравитационные силы
и энергия сводятся к искривлениям пространства-времени.
Успехи
данного направления развития познания породили своеобразную “ЭЙФОРИЮ
ДЕТЕРМИНИЗМА И ДЕДУКЦИИ”, которой “отдали дань” Лейбниц и
Конан-Дойль, но которую лучше всего (по мнению автора) выразил Пьер Лаплас в
своем знаменитом высказывании: “Мы
должны рассматривать существующее состояние Вселенной как следствие предыдущего
состояния и как причину последующего. Ум, который в данный момент знал бы все
силы, действующие в природе, и относительное положение всех составляющих ее
сущностей, если бы он был еще столь обширным, чтобы ввести в расчет все эти
данные, охватил бы единой формулой движения крупнейших тел Вселенной и
легчайших атомов. Ничего не было бы для него недостоверным, и будущее, как и
прошлое, стояло бы перед его глазами.”
В
этом высказывании есть очень много “если”, т.е. предположений, которые должны
быть истинными, чтобы все высказывание было истинным. Они заслуживают того,
чтобы рассмотреть их по порядку:
Во-первых,
Лаплас абсолютно убежден в жесткой и ничем не ограниченной детерминированности явлений самой
природы.
Однако,
квантовая теория открыла “многослойность” явлений и
объектов Реальности, а также фазовые переходы объектов между этими слоями из
нередуцированного состояния в редуцированное и обратно, которые имеют принципиально вероятностный
характер. Таким образом, с точки зрения современной науки свойства Реальности
таковы, что строгого логического алгоритма, описывающего наблюдаемые явления,
не может существовать даже в принципе. В современной теории физического
вакуума (из которой как частные случаи вытекают ОТО и КТП), вводится
также понятие “кручения” пространства-времени и связанные с этим разновидность гравитационных полей,
которая называется торсионными полями. С этими последними видами физических
полей связываются надежды на физическое объяснение ряда психологических явлений
[140].
Во-вторых,
Лаплас представлял себе эту всеобъемлющую теорию как теорию такого же типа,
какие ему были известны, т.е. наподобие классической механики И.Ньютона. В качестве
языка, на котором должна быть изложена эта теория, предполагалось использовать
язык математики, прежде всего дифференциальное и интегральное исчисление, язык
дифференциальных уравнений.
Само
по себе это предположение выглядит чрезвычайно странным и даже наивным, т.к. в
развитии науки мы видим, что изменяется не только “содержание”, но и сами
принципы построения научных теорий, эволюционируют сами “научные парадигмы”
[61]. Кроме того, это “очень сильное”
предположение, что Вселенная-в-целом, а также все
процессы и явления в ней протекающие, могут быть описана ограниченным (счетным,
или даже “небольшим”) числом фундаментальных, т.е. независимых друг от друга
(физических?) законов, из “суперпозиции” которых
строятся все остальные закономерности Реальности.
В-третьих,
Лаплас ВЕРИТ в принципиальную
возможность создания, а может быть даже существование, такой ЛОГИЧЕСКОЙ ТЕОРИИ, которая абсолютно
точно отражает процессы ВСЕЛЕННОЙ В
ЦЕЛОМ, т.е. теории, которая представляет собой логически полную знаковую модель, абсолютно изоморфную Реальности.
Очевидно,
что если бы такая теория даже и была бы возможна, то пользоваться ей мог бы
только разум, либо имеющий доступ к бесконечным вычислительным ресурсам, либо
сам обладающий ими. Допускать существование такой всеобъемлющей теории
практически тоже самое, что допускать существование такого разума или
компьютера с бесконечными возможностями. Естественно, в их существование можно
только верить (или не верить), но доказательство их существования - это задача
не для логики.
Но
что можно сказать сегодня о Вселенной-в-целом,
т.е. о предмете всеобъемлющей теории? По-видимому, только то, что она существует. Очевидно, также,
что существуют ее части.
Почти очевидным является и то, что Вселенная-в-целом состоит из своих
частей.
Эти части образуют системы,
различного уровня иерархии. Но как отразить в теории Вселенную-в-целом? По-видимому,
всеобъемлющая теория должна описывать как взаимодействуют части
Вселенной-в-целом друг с другом и с самой Вселенной-в-целом.
Однако
даже самый первый вопрос о логическом понимании существования частей Вселенной-в-целом
наталкивается на непреодолимые логические трудности. В теории множеств существует парадокс “О множестве всех множеств”, которое
может быть простейшей логической моделью Вселенной-в-целом. Если такое
множество существует, то оно является одновременно и целым, которое включает все множества, а значит включает
и самого себя, а также частью,
которое входит в состав этого целого, т.е. является частью самого себя.
Следовательно (с точки зрения логики), либо Вселенная-в-целом вообще не является множеством, включающем
части, т.е. является “пустым” множеством, либо она не существует [128].
Читателю
предоставляется решить, существование чего для него более достоверно установлено:
·
существование частей (но тогда
неизвестно частей чего, но уж точно
не Вселенной-в-целом),
·
либо существование целого, т.е.
Вселенной-в-целом (но тогда неизвестно, что же мы все наблюдаем, как мир многообразия),
а
также подумать, как совместить по
крайней мере все это в рамках логически непротиворечивой и полной действительно всеобъемлющей теории.
Эти проблемы имеют непосредственное отношению к
семейству логических парадоксов, построенных по принципу парадокса
Рассела (более того, само это высказывание также является
парадоксом Рассела).
Примечание:
автором предложена следующая система вложенных парадоксов Рассела. “Нет правил
без исключений. Предыдущее высказывание является правилом. Следовательно и у него
существует исключение. Этим исключением является само это правило”.
Современная
наука не предлагает решения всех этих проблем, - она просто доказывает принципиальную некорректность самой
постановки вопроса о логическом
познании Вселенной-в-целом,
т.к. эта задача, по-видимому, значительно более сложная, чем построение карты
рельефа Солнца путем ползания по нему и ощупывания пальцами. Здесь, по мнению автора,
естественным образом возникают следующие вопросы:
·
о совершенствовании самой логики,
разработки многозначной (даже “бесконечно-значной”) и “нечеткой” логики;
·
о возможном выходе науки за пределы
логической формы познания;
·
об использовании учеными исследователями других форм сознания, которые
могут более адекватными для познания (и “освоения”) других “слоев” или форм Реальности.
Начиная
с XIX века логика была математизирована, а математика
логизирована. Понятие
логического рассуждения и вывода приобрело математически четкий смысл. Появился
шанс решить уже возникшие в науке логические проблемы (дать определение понятия
“проблема”) на новом уровне. И вот в числе 23-х наиболее актуальных математических проблем, провозглашенных
Гильбертом на 2-м Международном конгрессе математиков
была сформулирована и следующая: “Математическое
изложение аксиом физики” [34]. Если
бы это удалось сделать, то появилась бы надежда на принципиальную достижимость
идеала Лапласа. Это был бы триумф логической формы познания,
доказательство бесконечной ничем не ограниченной силы логики, перед которой не
только практически, даже в принципе не может быть никаких преград.
Однако
в 1931 году выдающийся логик и математик современности Курт Гедель доказал свою знаменитую первую теорему - “теорему о неполноте”, согласно которой утверждение
о непротиворечивости формальной логической системы невозможно
доказать в рамках самой этой системы, если эта логическая система
непротиворечива. Если же формальная
логическая система противоречива, то в ней можно доказать ЛЮБОЕ утверждение, в
том числе и утверждение, что она непротиворечива.
Таким образом, попытка построения
формально-логической системы, в которой было бы доказано, что она
является логически полной и непротиворечивой, может привести к тому, что все грандиозное здание логики
рухнет, как карточный домик, когда него
вытаскивают “не ту карту”. Может показаться, что этого делать не следует,
однако по мнению автора (и последователей Зен) как раз это и является “прямым и
кратчайшим путем наверх”. Формальная
система либо непротиворечива и неполна, либо противоречива и полна.
Может быть поэтому не стоит особенно выискивать логические противоречия в
Библии и других эзотерических текстах. Похоже что Истина не может быть
выражена непротиворечивым способом, т.е. действительно, “гений -
парадоксов друг”.
В
последующем было доказано существование в любой формально-логической системе
неограниченного количества таких корректно сформулированных на ее языке
утверждений, которые в рамках данной
системы нельзя ни доказать, ни опровергнуть. Включение любого из этих
утверждений (вместе с определенным утверждением о ее истинности или ложности) в
качестве аксиомы в систему аксиом данной
формально-логической системы, “порождает” новую логически
непротиворечивую формально-логическую систему.
Аналогично,
системе распознавания всегда может быть предъявлен объект, который
имеет практически нулевое сходство с образами всех сформированных в данной
системе классов распознавания. Добавление данного объекта в качестве образца нового класса распознавания принципиально
расширяет предметную область применимости данной системы распознавания.
Теорема
Геделя доказана для всех формальных логических систем
достаточно развитых, чтобы включать в себя формальную арифметику. Работа Геделя
была первым строгим исследованием ВОЗМОЖНОСТЕЙ
ДЕДУКТИВНОГО МЕТОДА ПОЗНАНИЯ ВООБЩЕ, и важнейшим и полностью обоснованным
результатом этого исследования является вывод о том, процедуры дедуктивного и вычислительного характера обладают
определенной внутренней ограниченностью, вследствие которой достаточно
развитый процесс познания (начиная с математики) не может быть представлен в
форме завершенной формальной системы, т.е. не может быть сведен к системе
аксиом и правил вывода заключений из них. Проще говоря, ПРОЦЕСС ПОЗНАНИЯ НЕ
СВОДИТСЯ ИСКЛЮЧИТЕЛЬНО К ФОРМАЛЬНО ЛОГИЧЕСКОМУ ПРОЦЕССУ. О том, какие еще
способы познания, кроме формально-логического, необходимы для полноценного
развития достаточно сложного процесса познания, об этом в теореме Геделя
содержательной информации не содержится, т.е. “она об этом говорит в
отрицательной форме”. Автор предполагает, что в данном случае в теореме Геделя,
“речь идет” о таких формах познания как интуиция
и вдохновение, которые играют исключительно большую, часто решающую роль в
творчестве всех выдающихся и гениальных ученых, особенно на первых этапах
создания ими своих новаторских концепций.
Возникает
также вопрос о способности формально-логической системы адекватно отражать всю
полноту Реальности не только в целом, но даже в каком-либо из ее аспектов. Одно
из следствий теоремы Геделя состоит в том, что по-видимому, Реальность по своей природе несводима к
формально-логической схеме и в принципе не может быть полно и адекватно
отражена формально-логическим средствами, т.е. в принципе невозможно построить
логически полную знаковую модель, абсолютно изоморфную Реальности.
Автор считает, что теорема К.Геделя является одним из наивысших в принципе
возможных достижений интеллекта, и весьма удивительным и
закономерным, преисполненным глубочайшего смысла является то обстоятельство,
что именно в этом своем непревзойденном взлете интеллект отчетливо увидел
границы своих собственных возможностей и возможностей интеллектуальной формы
познания вообще.
По
мнению автора, чтобы “компенсировать” принципиальную неполноту
формально-логических систем необходима другая форма познания Реальности,
основанная на совершенно иных принципах (если
о ней вообще уместно говорить, что она основана на каких-то “принципах”).
Это гуманитарное, образное мышление, которое видит в богатстве
ассоциаций и связей аморфных образов возможность для более тонкого изучения
таких проблем, в которых применение “жестких” образов выглядит грубым, даже
вульгарным, и совершенно неприемлемым. Сердце и интуиция с успехом ведут нас к
таким высотам, где слова и логика бессильно замолкают.
Очевидно,
оба эти способа мышления (формально-логический, т.е. вербальный, и образный,
т.е. невербальный)
функционально дополняют друг друга в смысле принципа дополнительности Н.Бора, т.е. полноценное
познание Реальности невозможно с использованием только одного из этих способов
познания.
Интересно
и очень важно, что эти два способа
познания поддерживаются у большинства людей различными полушариями головного
мозга, т.е. существует функциональная (и даже морфологическая) асимметрия
полушарий. Распределение функций по полушариям отличается у правшей и левшей, но это различие более сложное, чем просто
противоположность. Нейрофизиология изучила функции полушарий используя данные о
больных с поражением одного из полушарий, нарушением их взаимодействия. Но
основной объем данных получен с использованием метода электрошокового торможения деятельности, который позволяет “выключить”
заданное полушарие на определенное время как бы “усыпив” его, оставив при этом
второе полушарие активно действующим, “бодрствующим”. При этом выявились интереснейшие
и очень глубокие закономерности, основные из которых приведены ниже в таблице
“Функциональная асимметрия полушарий”.
Грамотные
китайцы, корейцы и японцы (но, конечно, не только они) пользуются одновременно
иероглификой - понятийным словесным письмом, в котором
каждое значение передается определенным иероглифом, и слоговой азбукой,
записывающей звучание слов, но не их смысл. При поражении левого полушария у
представителей этих народов страдает слоговое письмо (хиригана и катакана), но совершенно
не страдает иероглифика [52].
ФУНКЦИОНАЛЬНАЯ АСИММЕТРИЯ
ПОЛУШАРИЙ
№ |
ЛЕВОЕ ПОЛУШАРИЕ |
ПРАВОЕ ПОЛУШАРИЕ |
1 |
Левое,
мужское, ян |
Правое,
женское, инь |
2 |
Звуковая
оболочка, т.е. звучание слов |
Содержание,
т.е. смысл слов |
3 |
Логическая
структура речи |
Интонация, “выражение” речи, смысл
речи |
4 |
Абстрактное |
Конкретное |
5 |
Знак |
Значение |
6 |
Синтаксис,
грамматика |
Семантика |
7 |
Вербальное |
Невербальное |
8 |
Формальное,
логическое |
Наглядное,
образное |
9 |
Абстрактно-логическое
“Истинное” и “ложное”, формальная “Истинность” |
Конкретное
“Истинное”, практическое соответствие действительности |
10 |
Сознательное
критическое мышление, все подвергающее сомнению (действие “цензора”) |
Подсознание,
некритическое восприятие информации “как данного”, внушение |
11 |
Математическое
(естественно-научное) |
Гуманитарное |
12 |
Объект рассматривается как
состоящий из частей. Анализ, изучение состава, признаков и свойств
объектов |
Объект рассматривается как
нечто целостностное. Изучение сходств и различий объектов |
13 |
Свойства и признаки
рассматриваются как “метки”, “указатели” на определенные объекты. Синтез
объектов по их свойствам и признакам, распознавание и идентификация объектов |
Признак (свойство)
рассматривается как нечто самостоятельное от объекта (например: “улыбка
Чеширского кота”). Изучение смысловых сходств и
различий между признаками |
14 |
Фонетическое
(звуковое) письмо |
Иероглифы |
15 |
Текст,
числа |
Пиктограммы,
графика |
16 |
Музыкальные
ритмы |
Музыкальные
мелодии |
17 |
Звуки
высокого тона (женская речь) |
Звуки
низкого тона (мужская речь) |
18 |
Формальный
анализ и планирование будущего |
Эмоциональное
переживание настоящего (“здесь и теперь”, вечное “сейчас”) |
19 |
Грамматический
порядок слов и знаков в тексте |
Индивидуальные
особенности почерка (аналог интонации) |
№ |
ЛЕВОЕ ПОЛУШАРИЕ |
ПРАВОЕ ПОЛУШАРИЕ |
20 |
Звуковое
чтение “по слогам”, смысл извлекается из слов только после их звукового
воспроизведения, хотя бы в форме внутренней речи. Скорость извлечения смысла
ограничена скоростью звукового воспроизведения (350-500 слов в минуту) |
Семантическое
чтение по словам - “скорочтение”,
слова рассматриваются как иероглифы, непосредственно несущие смысл без
необходимости их звукового воспроизведения даже в форме внутренней речи. Скорость
чтения не ограничена скоростью внутренней речи и достигает до 20000 слов в минуту. |
21 |
Глагольные
предложения, формально-логическое отражение движения |
Именные
предложения, “телеграфный стиль” (Например: “Ночь. Улица. Фонарь. Аптека.
Бессмысленный и тусклый свет.” А.Блок).
Движения нет, есть вечное “здесь и сейчас” |
Каждому целостному
наглядному образу объекта в правом полушарии соответствует его представление в
левом полушарии в виде последовательности дискретных символов (свойств -
признаков). Процесс познания и понимания состоит в установлении связи
(тождества) между этими двумя альтернативными формами отражения объекта.
Глубинный
структура языка образуется рядом наглядных чувственно-эмоциональных образов
которые облекаются во внешнюю дискретную языковую оболочку,
построенную по правилам логики и грамматики, которая образует внешнюю
структуру языка. В естественном языке далеко не каждое грамматически
правильное сочетание слов является осмысленным
предложением. Свободная генерация левым полушарием при неработающем правом грамматически правильных но
бессмысленных предложений называется “вербальным бредом”. И наоборот, свободная
манифестация подсознания, например в сновидениях, представляет собой осмысленный ряд образов не выраженных в
языковой форме. Символы подсознания имеют, по-видимому, иероглифический
характер. Здесь уместно заметить, что психоанализ, по нашему мнению, представляет
собой попытку выразить содержание подсознания в форме речи, и, таким образом, осознать его. С помощью языка человек
освобождается от той власти, которую имеют над ним неосознаваемые явления внутреннего и внешнего мира. И наоборот,
того, чья власть признается, избегают называть по имени.
По
соотношению и относительной роли соответствующих форм познания действительности
вполне можно говорить о “левополушарных” и
“правополушарных” культурах
(цивилизациях). Так Европейская - “Западная”, а также африканская культура
являются ярко выраженными “левополушарными” культурами,
а Азиатская - “Восточная”, прежде всего китайская, японская, а также Русская и
Индийская культура являются “правополушарными”. Люди с
доминантностью левого или правого полушария, т.е. истинные
“правши” или “левши”
соответственно, отличаются друг от друга доминирующим типом мышления (формально-логическое
или образное), а также очевидными различиями в своей ориентацией в
пространстве, а также очень интересными различиями в ориентации во времени.
Последнее проявляется в особенностях музыки, которая нравится правшам или левшам (ритмичная - или мелодичная
соответственно), а также в том, что правши к прошлому относятся
чувственно-эмоционально (переживают о нем), а к будущему формально-логически
(“строят планы”), тогда как левши - наоборот: живут будущим, а к прошлому
относятся “по-философски”. Во второй половине ХХ века стала заметной тенденция к синтезу обоих
этих видов культур. Известно также, что при переходе в высшие формы сознания
функции правого и левого полушарий изменяются таким образом, что преодолевается
ярко выраженная доминантность какого-либо одного из них.
Необходимо
также отметить, что основное отличие напечатанного (на машинке, принтере или в
типографии) текста и рукописного состоит в том, что рукописный текст содержит невербальную информацию, характеризующую самого писавшего,
а не то, о чем он пишет. Информация о самом писавшем, содержащаяся в почерке,
обычно рассматривается как помеха для восприятия смысла написанного (почерк
может быть и “неразборчивый”), однако это верно только в том случае, если мы стремимся воспринять только
этот чисто формальный смысл. Если же представляет интерес не только то что написано, но и кем написано, т.е. интересен сам автор, то рукопись имеет очевидное
преимущество перед напечатанным текстом. Один лист подлинной рукописи Пушкина
стоит значительно дороже, чем целый том его стихов, отпечатанный в
типографии. Психографология (изучение автора по почерку) невозможна по
шрифтам пишущих машинок или принтеров. Искусство каллиграфии сродни искусству
писать иероглифы. Японские стихи, написанные поэтом иероглифами не могут быть
напечатаны фонетической азбукой без потери очень существенной своей части,
более того, сами иероглифы должны быть воспроизведены не в своем “типичном”,
т.е. типографском начертании, а именно в начертании поэта, т.к. в этом
содержится важный компонент его творчества и искусства.
Попытка
адекватно и корректно отобразить движение
логическими средствами по-видимому является исторически первой задачей при
решении которой человечество впервые столкнулось с принципиальной ограниченностью самой логики (необходимо отметить,
что в эзотерических учениях это было известно ВСЕГДА). Известные парадоксы (апории) Зенона [132], которые
логически доказывают “невозможность движения вообще, а также невозможность
движения с разными скоростями” в действительности доказывают лишь невозможность
адекватно отразить сущность движения средствами, которые принадлежат самому
миру движения, т.е. средствами субъективной относительной логики.
Логика,
собственными средствами осознала собственную принципиальную ограниченность в
тереме Курта Геделя “О неполноте” - и это является наивысшим
возможным достижением ограниченной относительной субъективной логики.
Существование
этого достижения позволяет поставить задачу такого логического анализа апорий Зенона, который вскрыл бы в
самой логике причины невозможности логического отражения движения. Эту
же проблему можно сформулировать и в более общей и глубокой форме. Известно,
что язык как таковой является не просто средством общения между людьми и
людьми, но и между людьми и самой Реальностью. Поэтому с необходимостью язык
является не только средством отображения Реальности, например в науке, но и сам
является отображением Реальности. Очевидно, без этого он не мог бы выполнять и
других своих функций. Поэтому, вообще говоря, все объекты и явления Реальности
можно рассматривать как некоторые тексты на некотором языке. Вспомним самые первые слова Библии: “В Начале
было Слово...”. Ясно, конечно, что это было не совсем такое слово, какие мы
произносим много раз за день. То есть, в самой структуре языка отражены самые
глубокие закономерности Реальности. Каждый язык отражает специфический исторический
опыт познания Реальности того народа, который создал этот язык.
Фокусом
логических проблем, связанных с адекватностью логического отражения движения,
очевидно является логический статус глагола.
Логическое мышление о движении локализовано в левом полушарии. Глагол
образуется из столкновения двух результатов, двух образов - начального и
конечного. Сцепление двух образов передает отношение между ними, т.е.
соответствует по смыслу глаголу. Сами образы локализуются в правом полушарии и в языке
отображаются существительными [18, 52].
Когда два существительных ставится рядом, то между ними может быть вставлен
глагол, отображающий трансформацию первого существительного во второе.
Например: “Зерно. Земля. Вода. Цветок.” приводит к: “Возьми зерно. Посади зерно в землю. Полей
землю водой. Тогда из зерна вырастет
цветок.” Однако глагол представляет собой лишь обозначение и констатацию
факта процесса трансформации, но не вскрывает механизма этой трансформации. Очевидно, для отображения механизма движения
необходимо представить глагол в форме цепочки существительных. Однако это требует
осознания времени в форме, в которой мы сейчас осознаем пространство.
Условия, при которых это возможно, требуют специального исследования и не
являются общедоступными. Поэтому логика позволяет отобразить лишь
результат движения, т.е. перемещение, но не позволяет ухватить сам механизм
движения. Самая глубокая причина этой ситуации состоит в том, что сущность
механизма движения и самого времени не принадлежит тому миру, в котором
родилась и существует относительная субъективная логика.
До
доказательства Куртом Геделем своей знаменитой теоремы “О неполноте” господствовало
мнение, что парадоксы и антиномии указывают на незавершенность здания логики. Считалось, что в корректно работающем
логическом аппарате парадоксов не должно быть. Гедель доказал, что формальная система либо непротиворечива и неполна, либо противоречива и полна.
В то время как одни математики и логики как-то сразу смирились с принципиальной
неполнотой развиваемых ими логических систем, другие начали исследования
естественных и формальных языков с целью локализовать и выявить те языковые
конструкции, которые и приводят к логическим парадоксам (являющимся конкретным
проявлением неполноты). В этих исследованиях были выявлены так называемые “ЭГОцентрические слова” - которые имеют различный
смысл, зависящий от того, кто их употребляет. В числе таких слов на первом
месте без сомнения нужно назвать слово “Я” и его производные, затем все
местоимения: “ОН”, “ОНА”, “ОНО”, “ОНИ”, слова “ЭТО”, “ЗДЕСЬ”, “СЕЙЧАС”, а также
производные от этих слов и некоторые другие. В
известном “парадоксе лжеца”: “Это утверждение,
которое я здесь и сейчас делаю,
ложно” эгоцентрические слова, выделенные жирным шрифтом, буквально
взрывают смысл всего высказывания. В
естественном языке парадокс вызывается СУБЪЕКТИВНОСТЬЮ языка, благодаря которой
в самом высказывании содержаться отсылки к нему самому - в эгоцентрических
словах. По мнению Бертрана Рассела [114], который и ввел термин
“эгоцентрические слова”, “Целью как науки , так и обыденного здравого смысла
является замещение изменчивой субъективности эгоцентрических слов нейтральными
общественными терминами... в этом процессе нашего избавления от субъективности
истолкование эгоцентрических слов представляет собой один из существенных
шагов”. Исследования речи людей с “выключенным” с помощью электрошока правым
полушарием показало, что в речи таких людей резко возрастает количество
“эгоистических слов”, в частности личных местоимений первого лица.
Этот признак сближает продукты субъективной логики с “вербальным бредом”.
Из работ автора по измененным, в частности высшим формам сознания, следует, что
процесс
развития сознания можно рассматривать как процесс последовательного преодоления
ЭГО.
Само ЭГО имеет сложную структуру, модель которой также была предложена автором.
Исходя из всего вышеизложенного автор предполагает, что в принципе возможна объективная
логика, не содержащая никаких эгоцентрческих слов, но это логика не может быть логикой
какого-либо существа, которое считает, что “Я есть ЭТО”, или “Я есть ТО”, таким
образом неэгоцентрическая логика - это логика Вселенной-в-целом. Это не означает,
что она недоступна никакому конечному существу, а означает лишь, что это
существо должно иметь такую ФОРМУ СОЗНАНИЯ, при которой оно не отождествляет
себя с какой-либо конечной материальной структурой, например структурой типа
физического тела.
Мышление такого существа может быть в принципе не отличается от самой
Реальности (в индийском эзотеризме есть глубочайшая идея, что весь Мир - это сон
Шивы). В работе
[115] Роберт Г.Джан и Бренда Дж.Данн, наиболее
выдающиеся исследователи микротелекинеза и других y - явлений
современными научными методами, высказывают глубокую мысль, что поскольку
физическая реальность зависит от сознания (а именно это доказано ими с
небывалой надежностью и убедительностью), то строго говоря не существует
непреодолимого барьера между физической и психической реальностью. Из этого
вытекают очень значительные мировоззренческие выводы [14, 67, 70, 76].
В
этой связи представляет интерес глубокая аналогия между задачей Учителя (такого
как И.А.Соколянский), который
обучает слепо-глухо-немых и делает их полноценными членами нашего общества
(видящих, слышащих и говорящих на физическом уровне Реальности), и задачей Гуру - который ведет нас - слепых, глухих и немых
на высших уровнях Реальности к высшим формам сознания. Мы все действительно
являемся слепыми, глухими и немыми с точки зрения человека, у которого раскрыты
центры высшего сознания (чакры).
Действительно можно с полным основанием ожидать, что преодолев физическое ЭГО и перейдя в ментальное сознание [67] человек овладеет абсолютной
объективной логикой, лишенной в своей структуре тех причин неполноты, которые
имеются в относительной субъективной логике
и которые с наивысшей убедительностью вскрыты в теореме Курта Геделя и последовавшими за ней исследованиях Бертрана Рассела и Х.Рейхенбаха.
Что
же можно сегодня сказать об этой абсолютной логике? Некоторое представление о
ней можно получить, если в предельно
обостренной форме поставить человека перед логическими проблемами,
принципиально неразрешимыми средствами субъективной логики. Если человек решает
эти проблемы - он переходит в высшую форму сознания. Такие ситуации, из которых существует только один выход, а именно выход
вверх, называются в Дзен-буддизме коанами [8].
Внешне с формальной точки зрения коаны чаще всего являются неразрешимыми парадоксами.
Таким образом парадокс если и не выражает саму истину, то во всяком случае
прозрачно намекает на ее существование и в определенном смысле указывает на
истину. Традиция выражать некоторые высшие знания в форме парадоксов или
системы взаимно исключающих высказываний (антиномий), о которых утверждается
что они оба верны, глубоко укоренилась в эзотерической традиции. Учитывая результаты Геделя очевидно, что такой подход до основания
разрушает субъективную логическую машину, делая её полной, но и внутренне противоречивой.
Абсолютная объективная логика выходит за
пределы как непротиворечивой и неполной
субъективной логики, так и ее абсолютного отрицания - полной и противоречивой
субъективной логики.
Рассмотрим подробнее два момента
в предложенной нами концепции, имеющие с нашей точки зрения особое значение:
это адаптивность и семантический
анализ.
При решении задач распознавания образов (тестирования, диагностики,
прогнозирования, и т.п.) возникает
серьезная проблема выбора такого набора первичных признаков, который обеспечил
бы максимальную достоверность распознавания и одновременно был бы минимальным
по количеству (по стоимости сбора информации). В этом, в основном, и
заключается разработка оптимальной методики тестирования.
Решение подобных задач на
максимальной системе признаков требует значительных затрат времени и ресурсов
на всех этапах работ и вряд ли целесообразно, а чаще всего и просто невозможно.
В Системе эта проблема решается
следующим образом:
·
Разрабатывается так называемая
“максимальная анкета”, т.е. на первом этапе формируется максимальная (по
количеству) система признаков.
·
Затем формируется обучающая выборка, т.е. определяется группа объектов,
описания которых на языке признаков будет использовано для обучения Системы
распознавания,
·
Обучающая выборка вводится в Систему,
т.е. Системе сообщается каким образом “выглядит” каждый объект и к какому
классу распознавания он относится, при этом один и тот же объект
обучающей выборки одновременно может относиться к
нескольким классам распознавания,
·
Выполняется обучение Системы, - это
процесс, в результате которого Система формирует статистику встреч признаков в
разрезе по классам распознавания и на основе строгой модели вычисляет для
каждого признака количество информации, которое Система получает о каждом
классе распознавания, когда ей сообщается, что некоторый объект обладает данным
признаком. Одновременно для каждого признака вычисляется интегральная информативность.
Это понятие является краеугольным
для понимания Системы и его необходимо четко и глубоко понимать. Поэтому мы его
поясним следующим образом. Допустим что процесс распознавания еще не начался и объекты, относящиеся к
различным классам распознавания предъявляются на вход системы распознавания с
равной (или неизвестной) вероятностью. Тогда вероятности, т.е. ожидания, что
предъявлен некоторый данный объект, для всех объектов равны. Но вот мы (т.е.
Система) узнали, что предъявленный объект обладает некоторым признаком и этим
самым получили определенную информацию. Как повлияла эта информация на наши
ожидания? Вероятности того, что предъявленный объект относится к тем или иным
классам распознавания в результате этого изменились, а может быть и не
изменились, а если изменились, то в большей или меньшей степени. Так вот, интегральная информативность признака (или его
селективная сила, вклад в дисперсию ожиданий) - это количественная величина (измеряемая
в Бит), которая показывает НА СКОЛЬКО определеннее становятся наши знания о
принадлежности предъявленного объекта к классам распознавания при обнаружении у
этого объекта того или иного признака.
Когда для каждого признака из
максимальной системы признаков на основе обучающей выборки определена интегральная
информативность, то,
естественно, возникает настойчивое желание корректным образом выбросить из максимальной
системы признаков все незначимые признаки, причем так, чтобы качество решения
задачи распознавания не пострадало (а может и улучшилось), а
признаков осталось как можно меньше. В Системе реализовано три различных
оптимизационных алгоритма, которые позволяют корректно и качественно
решать эту задачу при заданных ПОЛЬЗОВАТЕЛЕМ ограничениях. Результат -
ОПТИМАЛЬНАЯ МЕТОДИКА ТЕСТИРОВАНИЯ, т.е. анкета, содержащая при МИНИМУМЕ
вопросов МАКСИМУМ информации о предметной области, а также технология ее обработки.
Оптимизированную анкету гораздо легче и быстрее, чем максимальную,
заполнять, водить в Систему, и обрабатывать, т.к. в ней гораздо меньше “воды”
(или “воздуха”) что позволяет организовать действительно массовые обследования
при наиболее рациональном и эффективном использовании всех видов ресурсов как
компьютера, так и человека.
Углубленный анализ результатов
тестирования, который обычно представляет особый интерес, практически возможно
осуществить на реальных компьютерах (даже класса 486) только на оптимизированных данных.
Необходимо, также, специально
отметить, что Система “ЭЙДОС-
Под математической моделью автор
понимает не только чисто аналитическую модель, которая выражена в виде системы
формул, но и более общую алгоритмическую модель, которая на аналитическом
(формульном) языке в настоящее время
не имеет представления и выражается лишь в операционной форме, например в форме
ориентированных графов, сетей Петри или блок-схем.
Основное
требование, которому должна удовлетворять
математическая модель, это обеспечить
адекватное формальное описание основных когнитивных операций, психологическое
описание которых дано в базовой когнитивной концепции (см. 1.3.2.2):
1.
восприятие: интенсиональное (дискретное)
представление чувственного образа конкретного объекта в форме совокупности
признаков;
2.
присвоение
формальных имен: экстенсиональное (континуальное)
представление чувственного образа конкретного объекта в форме принадлежности к
некоторым градациям определенных смысловых шкал;
3.
обобщение: формирование, т.е. синтез обобщенных образов различных
категорий объектов на основе одновременного использования экстенсиональных и
интенсиональных описаний конкретных объектов, которые используются в качестве примеров;
4.
анализ
обобщенных образов: выявление общего и особенного
для каждого обобщенного образа;
5.
анализ
признаков: выявление общего и особенного в
смысловом содержании каждого признака;
6.
абстрагирование: определение для каждого признака
его вклада в различие друг от друга обобщенных образов; контролируемое и
корректное удаление незначимых признаков с сохранением всей существенной
информации;
7.
классификация
обобщенных образов: определение сходств и различий
обобщенных образов друг с другом; объединение сходных образов в кластеры;
формирование биполярных систем наиболее непохожих кластеров, т.е. конструктов
образов;
8.
классификация
признаков: определение сходств и различий
признаков по их смыслу; объединение сходных по смыслу признаков в кластеры;
формирование биполярных систем наиболее непохожих кластеров, т.е. конструктов
признаков;
9.
содержательное
сравнение обобщенных образов: определение признаков, по которым
заданные два образа несопоставимы, которыми они сходны и которыми они
отличаются друг от друга;
10. содержательное
сравнение признаков: определение элементов смысла, по
которым заданные два признака несопоставимы, которыми они сходны и которыми они
отличаются друг от друга;
11. распознавание
(идентификация) конкретных объектов: сравнение чувственного образа
конкретного объекта со всеми обобщенными образами.
Дополнительные
требования к математической модели имеют в
основном прагматический характер, т.е. вытекают из необходимости
эксплуатировать модель на практически значимых приложениях достаточно больших
размерностей на реальных компьютерах при разумных затратах машинного времени.
Попытка удовлетворить этим
требованиям наталкиваются на необходимость решения следующих научных и
технических проблем:
1.
проблема комбинаторного взрыва, которая
возникает при попытке классификации обобщенных образов и признаков путем
объединения их в кластеры в различных количествах и в различных сочетаниях в кластерах;
2. проблема выбора адекватной меры
смысла признака, т.е. семантической меры информации;
3.
проблема разработки адекватной семантической
модели признака;
4.
проблема разработки адекватной модели
обобщенного образа класса;
5.
проблема обеспечения работоспособности
модели на нерепрезентативных выборках и при отсутствии достаточной статистики;
6.
проблема обеспечения структурной
репрезентативности выборки;
7.
проблема обеспечения независимости
времени распознавания (идентификации) от объема обучающей выборки;
8.
проблема обеспечения адаптивности
обобщенных образов за счет учета информации обратной связи о правильности или
ошибочности идентификации конкретных объектов.
В предложенной автором модели
предложены варианты решения как основной проблемы, так и всех вышеперечисленных
математических проблем.
Степень адекватности
математической модели с одной стороны когнитивной концепции, а с другой
реальности может быть определена лишь экспериментальным путем, т.е. путем экспертных
оценок степени правильности результатов применения модели. Эта проверка должна
быть проведена в тех предметных областях, в которых планируется применение
модели.
Важным
достоинством теории конструктов является снятие проблемы
так называемого “комбинаторного взрыва”, что является наиболее трудно
преодолимым препятствием в решении задач кластеризации. В данной модели кластер представляет собой
просто положительный полюс конструкта, но в системе формируются не кластеры, а сразу конструкты.
Название критериального подхода
связано с основным предположением, состоящим в том, что каждую отдельно взятую
альтернативу можно оценить некоторым конкретным (одним) числом, после чего
сравнение альтернатив сводится к сравнению соответствующих им чисел.
Пусть, например, {X} – множество альтернатив, а x – некоторая определенная альтернатива,
принадлежащая этому множеству: xX. Тогда считается, что для всех x может быть задана функция: q(x),
которая называется критерием (критерием качества, целевой функцией, функцией
предпочтения, функцией полезности и т.п.), обладающая тем свойством, что если
альтернатива x1
предпочтительнее x2:
(обозначается: x1 > x2),
то:
q(x1)
> q(x2).
При этом выбор сводится к
отысканию альтернативы с наибольшим значением критериальной функции.
Однако, на практике использование
лишь одного критерия для сравнения степени предпочтительности альтернатив
оказывается неоправданным упрощением, т.к. более подробное рассмотрение
альтернатив приводит к необходимости оценивать их не по одному, а по многим
критериям, которые могут иметь различную природу и качественно отличаться друг
от друга.
Например, при выборе наиболее
приемлемого для пассажиров и эксплуатирующей организации типа самолета на
определенных видах трасс сравнение идет одновременно по многим группам
критериев: техническим, технологическим, экономическим, социальным, эргономическим
и др.
Многокритериальные задачи не
имеют однозначного общего решения. Поэтому предлагается много способов придать
многокритериальной задаче частный вид, допускающий единственное общее решение.
Естественно, что для разных способов эти решения являются в общем случае
различными. Поэтому едва ли не главное в решении многокритериальной задачи –
обоснование данного вида ее постановки.
Используются различные варианты
упрощения многокритериальной задачи выбора. Перечислим некоторые из них.
1. Условная максимизация
(находится не глобальный экстремум суперкритерия, а локальный экстремум
основного критерия).
2. Поиск альтернативы с заданными
свойствами.
3. Нахождение множества Парето.
4. Сведение многокритериальной
задачи к однокритериальной, путем ввода суперкритерия.
Рассмотрим подробнее формальную
постановку метода сведения многокритериальной задачи к однокритериальной.
Введем суперкритерий q0(x), как скалярную функцию
векторного аргумента:
q0(x)=
q0((q1(x), q2(x),…, qn(x)).
Суперкритерий позволяет
упорядочить альтернативы по величине q0,
выделив тем самым наилучшую (в смысле этого критерия). Вид функции q0 определяется тем, как конкретно мы
представляем себе вклад каждого критерия в суперкритерий. Обычно используют
аддитивные и мультипликативные функции:
Коэффициенты si обеспечивают:
1. безразмерность или единую
размерность числа aiqi/si
(различные частные критерии могут иметь разную размерность, и тогда над ними
нельзя производить арифметических операций и свести их в суперкритерий);
2. нормировку, т.е. обеспечение
условия: biqi/si<1.
Коэффициенты ai и bi
отражают относительный вклад частных критериев qi в суперкритерий.
Итак, в многокритериальной постановке
задача принятия решения о выборе одной из альтернатив сводится к максимизации
суперкритерия:
Основная проблема в
многокритериальной постановке задачи принятия решений состоит в том, что
необходимо найти такой аналитический вид коэффициентов ai и bi,
который бы обеспечил следующие свойства модели:
1. высокую степень адекватности
предметной области и точке зрения экспертов;
2. минимальные вычислительные
трудности максимизации суперкритерия, т.е. его расчета для разных альтернатив;
3. устойчивость результатов
максимизации суперкритерия от малых возмущений исходных данных.
Устойчивость решения означает,
что малое изменение исходных данных должно приводить к малому изменению
величины суперкритерия, и, соответственно, к малому изменению принимаемого
решения. То есть практически на тех же исходных данных должно приниматься или
тоже самое, или очень близкое решение.
Эти требования удовлетворяются
при выборе в качестве коэффициентов, учитывающих вклад каждого критерия в
суперкритерий, семантической меры информации.
Краеугольным камнем
математической модели является семантическая мера информации. Это количество информации, которое мы
получаем о принадлежности некоторого конкретного объекта к обобщенной
категории, когда узнаем, что этот объект обладает определенным признаком.
Первоначальная версия данной
математической модели была разработана автором в 1979 году для медицинской
диагностики. При этом в качестве классов распознавания выступали нозологические
образы (диагнозы), а в качестве признаков - симптомы и синдромы.
Кратко и несколько упрощенно суть
данной математической модели состоит в следующем:
1.
На основе обучающей выборки формируется
корреляционная матрица распределения абсолютных частот признаков по классам
распознавания.
2.
Непосредственно на основе матрицы
абсолютных частот рассчитывается матрица информативностей признаков.
Введем
обозначения:
W |
количество классов в списке
классов; |
A |
количество признаков в списке
признаков; |
|
количество встреч i-го признака у объектов (конкретных
реализаций) j-го класса; |
|
суммарное количество наблюдений
i-го признака по всем классам; |
|
суммарное количество признаков,
обнаруженных у объектов j-го
класса; |
|
суммарное количество признаков,
обнаруженное у предъявленных объектов по всем классам; |
|
вероятность встретить i-й признак при предъявлении
какого-либо объекта из имеющихся в обучающей выборке; |
|
Вероятность встретить i-й признак при предъявлении объекта,
принадлежащего к j-му классу; |
|
Количество информации в i-м признаке о принадлежности к j-му классу, семантическая мера информации. |
На основе обучающей выборки
системой рассчитывается матрица абсолютных частот встреч признаков по классам,
которая имеет вид:
|
К
л а с с ы |
|||
Признаки |
... |
j |
... |
Сумма |
... |
|
|
|
|
i |
|
|
|
|
... |
|
|
|
|
Сумма |
|
|
|
|
Верхний индекс обозначает класс,
а нижний - признак.
Средняя вероятность встретить i-й признак при случайном предъявлении
вообще какого-либо объекта, из имеющихся в обучающей выборке:
...................................................( A )
Вероятность встретить i-й признак при предъявлении объекта,
относящегося к j-му классу:
.........................................................( B )
Если вероятность встретить i-й признак при предъявлении объекта j-го класса такая же, как и в среднем:
то обнаружение данного признака
не дает системе никакой информации о том, к какому классу относится
предъявленный объект.
Если у объектов j-го класса i-й признак встречается с большей вероятностью, чем в среднем по
всем классам:
то при обнаружении данного
признака система получает некоторую информацию в пользу того, что предъявлен
объект, относящийся к j-му классу.
Если у объекта, относящегося к j-му классу, i-й признак встречается с меньшей вероятностью, чем в среднем по
всем классам:
то при обнаружении данного
признака система получает некоторую информацию в пользу того, что предъявлен
объект НЕ ОТНОСЯЩИЙСЯ к j-му классу
(при этом количество информации отрицательное).
Всем этим достаточно убедительным
соображениям удовлетворяет так называемая семантическая
мера целесообразности информации А.А.Харкевича [4, с.56], которая в наших
обозначениях выглядит следующим образом:
................................................( C )
Подставив и из (1) и (2) получим:
................................( D )
Окончательное выражение для
расчета количества информации в i-м
признаке о принадлежности некоторого конкретного объекта к j-му классу имеет вид:
...........................( E )
где:
- нормировочный коэффициент, переводящий
количество информации в двоичные единицы информации - Биты.
Непосредственно на основе матрицы
частот встреч признаков система “ЭЙДОС”
формирует матрицу информативностей
признаков , которая имеет структуру, аналогичную структуре матрицы
абсолютных частот.
Обобщенным образом (профилем)
класса распознавания является столбец матрицы информативностей, т.е.
совокупность всех информативностей признаков данного класса. Обобщенным образом
(профилем) признака является строка матрицы информативностей, т.е. совокупность
всех информативностей данного признака.
Матрица информативностей признаков
представляет собой, с одной стороны, количественное формальное описание
объектов (классов) на языке признаков, а с другой стороны, количественное
описание признаков на языке классов. При этом каждый класс описан числами
соответствующего столбца. Это описание называется “профиль класса распознавания” и
представляет собой обобщенный образ этого класса. Профиль класса показывает, какое количество информации о принадлежности
(или не принадлежности) к данному классу содержится в каждом из признаков.
Аналогично, в профиле признака мы видим какое количество информации содержится
в данном признаке о принадлежности (или не принадлежности) обладающего им
объекта к каждому из классов.
Описание конкретного
распознаваемого объекта представляет собой список кодов имеющихся у него
признаков. Для каждого из признаков известно, какое количество информации он
содержит о принадлежности обладающего этим признаком объекта к каждому из классов
распознавания. Имея эту информацию
по каждому из признаков нетрудно подсчитать, какое количество информации о
принадлежности к каждому из классов распознавания содержится во всей системе
признаков данного объекта. Список классов распознавания, в котором классы
расположены в порядке убывания количества информации о принадлежности к ним, и
представляет собой результат распознавания объекта, описанного данной системой
признаков.
С
точки зрения теории принятия решений, данный подход, реализованный в системе
«ЭЙДОС», является одним из вариантов решения задачи сведения многокритериального
подхода к однокритериальному (эта задача поставлена в разделе 1.2.2.1 настоящей
работы).
Если
будет нужно, этот раздел будет написан.
Вероятность того, что
предъявленный объект является j-м объектом, если у него обнаружен i-й признак:
......................................................................(
F)
Известно, что вероятность
совместного появления двух независимых событий равна произведению их индивидуальных
вероятностей. Таким образом, если рассматривать обнаружение данного j-го
объекта и данного i-го признака как независимые события, то вероятность P их
случайного совместного наблюдения при предъявлении j-го объекта, учитывая (2) и
(6), равна:
..................................................( G)
Очевидно, если фактическая
вероятность наблюдения i-го признака при предъявлении j-го объекта равна
теоретической, вычисленной по формуле (7), то наблюдение данного признака никак
не связано с наблюдением данного объекта, т.е. не несет никакой информации о данном
объекте.
Статистика c2
представляет
собой просто сумму вероятностей совместного наблюдения признаков и объектов по
всей корреляционной матрице или определенным ее подматрицам.
Поэтому наличие статистической
связи между признаками и классами распознавания (т.е. отличие вероятностей их совместных
наблюдений от предсказываемого в соответствии со случайным нормальным
распределением) приводит к увеличению фактической статистики по сравнению с
теоретической величиной.
В Системе “ЭЙДОС-
Описанная выше математическая
модель обеспечивает инвариантность результатов обучения Системы относительно
следующих параметров обучающей выборки:
1. суммарное
количество и порядок ввода анкет обучающей выборки,
2. количество
анкет обучающей выборки по каждому классу распознавания,
3. суммарное
количество признаков во всех анкетах обучающей выборки,
4. суммарное
количество признаков по эталонным описаниям различных классов распознавания,
5. количество
признаков и их порядок в отдельных анкетах обучающей выборки.
Это обеспечивает высокое качество
решения задач системой распознавания на неполных и разнородных (в вышеперечисленных
аспектах) данных как обучающей, так и
распознаваемой выборки, т.е. при таких статистических характеристиках потоков
этих данных, которые чаще всего и встречается на практике и которыми невозможно
или очень сложно управлять. Таким образом данная модель не требует, чтобы обучающая выборка была репрезентативной по частотному распределению по отношению к
генеральной совокупности,
как в большинстве статистических систем. Однако эта репрезентативность необходима для того, чтобы можно было доверять
анализу одномерных частотных распределений и двумерных матриц сопряженности, которые дают
статистические системы, а также Система “ЭЙДОС-
Примечание:
Здесь уместно рассмотреть один часто встречающийся вопрос, который состоит в
следующем. Если для формирования образов классов распознавания предъявлено настолько малое количество
обучающих анкет, что говорить об обобщении и статистике
не приходится (как известно, в соответствии с критерием Пирсона, логических
анкет должно быть не менее 5 на каждый образ), то как это может повлиять на
качество формирования этих образов и на достоверность распознавания? Если бы была статистика, то как показывает
опыт, около 95% анкет, формирующих образ оказывается типичными для него, а
остальные не типичными. Если этот образ формируется на основе буквально одной -
двух анкет, то вероятнее всего (т.е. с вероятностью около 95%) они являются
типичными, и, следовательно, образ будет сформирован практически таким же, как
и при большой статистике, т.е. правильным. При увеличении статистики в этом
случае мало что меняется, т.е. практически не меняются информативности признаков, составляющих образ). Но есть
некоторая, сравнительно незначительная вероятность (около 5%), что попадется
нетипичная анкета. Тогда при увеличении статистики образ быстро и радикально
изменится и “быстро сойдется” к адекватному.
При незначительной статистике
относительный вклад каждой анкеты в некоторый образ, сформированный с ее
применением, будет достаточно велик. Поэтому в этом случае при распознавании Система уверенно относит анкету к этому
образу. При большой статистике Система также уверенно относит типичные анкеты к
образам, сформированным с их применением. Незначительное количество нетипичных
анкет могут быть распознаны ошибочно, т.е. не отнесены Системой к тем образам,
к которым их отнесли эксперты.
Наличие в системе классов
распознавания очень сходных образов (по данным кластерно-конструктивного
анализа) также может формально уменьшать валидность Системы. Однако фактически очень сходные
образы целесообразно объединить в один, т.к.
по-видимому, их разделение объективно ничем не оправдано, т.е. не соответствует
действительности. Для осуществления данной операции предназначен режим:
“Получение стат.характеристики обучающей выборки и объединение классов распознавания
(ручной ремонт обучающей выборки)”.
Используя корреляционный анализ,
а именно коэффициент корреляции Пирсона:
Rxy = Sxy /
(Sx ´ Sy)
где: Sxy - ковариация профилей X и Y,
Sx
- стандартное отклонение информативностей профиля X,
Sy
- стандартное отклонение информативностей профиля Y,
можно сравнивать эталонные образы объектов X и Y друг с другом (и сформировать
матрицу сходства классов для кластерного анализа), а также с объектами, предъявленными
для распознавания. Аналогично
(с использованием профилей признаков) рассчитывается и матрица сходства
признаков, которая является основой для расчета кластеров и конструктов признаков.
Анкета распознаваемой выборки
также представляется в виде определенной кривой (меандра), в которой
присутствующим признакам соответствует значение +1, а отсутствующим - 0
(поэтому анкета обучающей выборки никогда не имеет 100% сходства с
эталонным описанием класса распознавания, даже с тем,
который сформирован с использованием только данной анкеты).
Сам процесс распознавания состоит в последовательном сравнении каждого
объекта, предъявленного на распознавание, с каждым из
классов распознавания и в составлении для каждого из объектов списка классов в
порядке убывания сходства, а для каждого класса - списка объектов в порядке убывания сходства.
Интересно и очень важно отметить,
что коэффициенты ряда Фурье по своей математической форме и смыслу представляют
собой ни что иное, как коэффициенты корреляции между разлагаемой в ряд кривой и
функциями SIN и СOS соответствующих частот и амплитуд [21].
С этой точки зрения процесс
распознавания,
реализованный в Системе “ЭЙДОС-
При развитии данной аналогии
естественным образом возникают следующие вопросы:
о полноте и избыточности системы
профилей, как функций, по которым будет вестись разложение;
о сходимости, т.е. вообще
возможности и корректности такого разложения.
Вообще говоря, анкета в
формализованном виде описывающая произвольный объект совершенно не обязательно
будет разлагаться в ряд по профилям классов таким образом, что сумма ряда во
всех точках будет в точности равна значениям исходной функции (т.е. анкеты).
Это означает, что система профилей не обязательно будет полна по отношению к
данной анкете, и, тем более, ко всем возможным анкетам. Автор предлагает считать неразлагаемые в ряд, т.е. плохо
распознаваемые объекты (анкеты) суперпозицией хорошо распознаваемых
объектов (“похожих” на те, которые использовались для формирования образов), и
объектов, которые и не должны распознаваться, так как объекты этого типа не использовались для
формирования образов.
Нераспознаваемую компоненту можно рассматривать либо как шум,
либо считать ее полезным сигналом, несущим ценную информацию о еще не
исследованных объектах интересующей нас предметной области (в зависимости от
целей и тезауруса исследователей).
Первый вариант нет оснований
драматизировать, т.к. примененный в Системе “ЭЙДОС-6.2.”
алгоритм сравнения исходных анкет с образами, основанный на вычислении
нормированной корреляции Пирсона (сумма произведений), является весьма
устойчивым к наличию шума в идентифицируемом сигнале. Из опыта автора по применению
данного подхода в геофизике, при поиске свип-сигналов в сильно зашумленном отраженном принятом сигнале, следует, что
данный метод позволяет обнаружить свип-сигнал при отношении “сигнал/шум “ до
0.01 и еще меньших (при достаточном количестве отсчетов - признаков).
Во втором случае необходимо
дообучить Систему распознаванию объектов, несущих такую компоненту
(адаптивность Системы “ЭЙДОС-
Но на практике гораздо чаще
наблюдается противоположная ситуация (можно даже сказать, что она типична),
когда система профилей избыточна, т.е. в системе классов распознавания есть очень похожие классы (между которыми
имеет место высокая корреляция, наблюдаемая в режиме: “кластерно-конструктивный
анализ”). Практически это означает, что у нас в Системе сформировано несколько
практически одинаковых образов с разными наименованиями. Для исследователя это
само по себе является очень ценной информацией. Однако, если исходить только из
потребности разложения распознаваемого объекта в ряд по профилям классов (чтобы
определить суперпозицией каких образов он является, т.е. “разложить его
на компоненты”), то наличие сильно коррелирующих друг с другом профилей представляется
неоправданным, т.к. просто увеличивает размерности данных внося в них мало нового по существу. Поэтому
возникает задача ИСКЛЮЧЕНИЯ ИЗБЫТОЧНОСТИ СИСТЕМЫ КЛАССОВ РАСПОЗНАВАНИЯ, т.е.
выбора из всей системы классов распознавания такого минимального их набора, в
котором профили классов минимально коррелируют друг с другом, Т.Е. ОРТОГОНАЛЬНЫ В ФАЗОВОМ
ПРОСТРАНСТВЕ ПРИЗНАКОВ. Это условие в теории рядов называется
“ортонормируемостью” системы
базовых функций, а в факторном анализе связано с идеей выделения “главных компонент”.
В настоящее время в Системе
“ЭЙДОС-
исключение неформирующихся, расплывчатых
или дублирующих классов;
объединение почти идентичных по
содержанию классов;
но сделать это пользователь
должен сам, используя соответствующие режимы. Вся необходимая и достаточная
информация для (при) принятия соответствующих решений, предоставляется
пользователю Системой “ЭЙДОС”.
Если считать, что функции образов
при соблюдении условия ортонормированности образуют формально-логическую систему, к
которой применима теорема Геделя, то можно
сформулировать эту теорему для данного случая следующим образом:
Для любой ортонормированной системы базисных функций всегда существует по
крайней мере одна такая функция, что она не может быть разложена в ряд по
данной системе базисных функций, т.е. всегда существует функция, которая
является ортонормированной ко всей системе базисных функций в целом.
Если система базисных функций не
является ортонормированной, то не
существует ни одной функции, которая являлась бы ортонормированной ко всей этой
системе базисных функций в целом. Следовательно любая функция может быть
разложена в ряд по неортонормированной системе функций.
“Чистая математика” и фундаментальная наука не
рассматривают случаи разложения по неполной или избыточной (неортонормированной) системе произвольных
базисных функций и с математической точки зрения данная область мало исследована,
но на практике подобные операции представляют значительный интерес и вполне
допустимы. “Чистых математиков” часто не устраивает прагматическая манера, в
которой обращаются с их разработками физики, и тем более социологи, но
последних и их заказчиков этот стиль вполне устраивает. Более того, если “метод
работает”, то заказчиков часто не очень интересует формальное научное обоснование
корректности его использования, разработка которых как правило запаздывает или
не разрабатывается вообще. Идеи, изложенные в перспективной когнитивной концепции, позволяют предположить, что
рассматривая эти проблемы мы касаемся самых тонких и глубоких вопросов, с
решением которых ассоциируется дальнейший прогресс познания и сознания.
В системе “ЭЙДОС” версии
-6.2., реализован автоматизированный режим, обеспечивающий рациональный выбор
минимального числа наименее взаимосвязанных, т.е. взаимно ортогональных
“базисных” классов распознавания, позволяющих
классифицировать объекты заданной предметной области.
Очевидно, невзаимосвязанными друг с другом могут быть только четко
оформленные, детерминистские образы, т.е. образы
с высокой степенью редукции (“степень сформированности конструкта”). Поэтому в
процессе выявления взаимно-ортогональных базисных образов в первую очередь
будут выброшены аморфные “расплывчатые” образы, которые связаны практически со
всеми остальными образами. Возникает вопрос, а хорошо это или плохо? Ответ на
этот вопрос должен быть конкретным. В некоторых случаях результат такого
процесса представляет интерес и это делает оправданным его реализацию. Однако,
исходя из “перспективной когнитивной концепции”, мы можем с большой долей
уверенности предположить, что наличие расплывчатых образов в системе является
оправданным, т.к. в этом случае система образов не будет формальной и
подчиняющейся теореме Геделя,
следовательно система распознавания будет БОЛЕЕ ПОЛНА в том смысле, что
повышается вероятность идентификации любого объекта, предъявленного ей на
распознавание. Конечно
уровень сходства с аморфным образом не может быть столь же высоким, как с четко
оформленным, поэтому в этом случае может быть более уместно применить термин
“ассоциация”, чем “однозначная идентификация”.
Итак, можно сделать следующий
вывод: “Возможность наличия в системе образов не только четко оформленных
(детерминистских), но и аморфных, расплывчатых образов является важным
достоинством системы распознавания “ЭЙДОС”, т.к.
обеспечивает ей возможность устойчивой работы даже в тех случаях, в которых
системы распознавания (идентификации) и информационно-поисковые системы
детерминистского типа практически неработоспособны. В этих условиях система
“ЭЙДОС” работает как система АССОЦИАТИВНОЙ, т.е. невербальной идентификации”.
Таким образом универсальная
автоматизированная Система распознавания образов “ЭЙДОС” по сути дела
осуществляет разложение объектов (меандров распознаваемых анкет) по объектам (их профилям
в базе данных конструктов), т.е.
осуществляет “Объектный анализ” (по аналогии с гармоническим или
Фурье-анализом), позволяя рассматривать
распознаваемые объекты как суперпозицию обобщенных образов
объектов различного типа с различными амплитудами.