ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫe.lib.vlsu.ru/bitstream/123456789/1162/3/01066.pdf · вом широко распространены

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

Владимирский государственный университет

Д. Н. ВАСИЛЬЕВ, В. Г. ЧЕРНОВ

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Основы теории построения Учебное пособие

Владимир 2008

2

УДК 519.68 ББК 32.813я73 В19

Рецензенты: Кандидат технических наук, профессор

зав. кафедрой информатики и вычислительной техники Владимирского государственного педагогического университета

Ю.А. Медведев

Кандидат технических наук, доцент кафедры вычислительной техники

Владимирского государственного университета В.Б. Буланкин

Печатается по решению редакционного совета Владимирского государственного университета

Васильев, Д. Н. Интеллектуальные информационные системы: основы теории по-строения : учеб. пособие / Д. Н. Васильев, В. Г. Чернов ; Владим. гос. ун-т. – Владимир : Изд-во Владим. гос. ун-та, 2008. – 120 с. ISBN 978-5-89368-879-5.

Посвящено изучению основ построения интеллектуальных информационных сис-

тем: экспертных систем, систем извлечения знаний, интеллектуальных систем модели-рования. Описаны методы искусственного интеллекта, лежащие в основе таких про-граммных комплексов, приведена классификация как методов, так и систем. После ка-ждого раздела даны варианты контрольных вопросов.

Предназначено для студентов старших курсов всех форм обучения специальности 080801 – прикладная информатика в экономике.

Табл. 3. Ил. 54. Библиогр.: 28 назв. УДК 519.68

ББК 32.813я73

ISBN 978-5-89368-879-5 © Владимирский государственный университет, 2008

В19

3

ВВЕДЕНИЕ В современных условиях на рынке программных продуктов, предна-

значенных как для организации бизнеса, так и для управления производст-вом широко распространены программы анализа и прогнозирования, пла-нирования, цель которых – повышение эффективности принятия управ-ленческих решений. Среди них с каждым годом увеличивается число про-грамм, использующих не традиционные математические методы и извест-ные прикладные модели, а подходы так или иначе связанные с научным направлением, называемым «искусственный интеллект». Такие программ-ные комплексы, обеспечивающие одновременно и поддержку информаци-онного решения экономических задач, называют интеллектуальными ин-формационными системами.

Особенность использования таких инструментов состоит в том, что не для каждой предметной области и решаемой в ее рамках задачи целесо-образно их внедрение, а там, где оно необходимо, требуется очень тонкий подбор инструментальных средств и методов. Таким образом ответы на вопросы: «Стоит ли применять интеллектуальную программу?», «Какой метод, технологию и программный продукт выбрать?» и «Как его “вжи-вить” в деятельность организации?» составляют при проектировании ин-теллектуальных информационных систем значительную часть успеха, оп-ределяют экономическую эффективность ее дальнейшего использования и затраты на внедрение. Данное пособие – первое из серии планируемых, рассматривающих проблематику построения интеллектуальных информа-ционных систем и их использования в решении экономических задач.

Цель данного учебного пособия – ознакомление студентов, обучаю-щихся по специальности «Прикладная информатика в экономике» с осно-

4

вами искусственного интеллекта, границами его применимости в интел-лектуальных экономических системах, получение ими навыков рациональ-ного выбора инструментального средства, использующего интеллектуаль-ные технологии, для решения прикладных экономических задач.

Содержание учебного пособия направлено на обзор, систематизацию и сравнение различных методов искусственного интеллекта, того, как они применяются в различных программных продуктах, как сочетаются с тра-диционными системами обработки информации, образуя гибридные вы-числительные комплексы. Важное внимание уделяется разграничению об-ласти применимости каждой из рассматриваемых технологий.

Структурно учебное пособие состоит из пяти глав. В первой главе рассматриваются базовые понятия искусственного интеллекта, определе-ние интеллектуальных систем и их классификация. Вторая посвящена рас-смотрению базовых основ информационных систем: понятиям о данных, информации и знаниях. В третьей описываются методы приобретения и модели представления знаний. Экспертные системы уже давно вошли и стали классическим примером интеллектуальной системы, без которого не обходится ни одна книга по искусственному интеллекту. Они рассматри-ваются в следующей главе работы. Заключительная, самая обширная глава посвящена методам интеллектуального моделирования: нейронным сетям, генетическим алгоритмам, моделям искусственной жизни и методам из-влечения знаний.

В конце каждой главы приведен список тестовых вопросов.

5

1. ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ: ОБЩИЕ СВЕДЕНИЯ

1.1. История развития интеллектуальных систем Развитие искусственного интеллекта как научного направления на-

чалось в 40-х гг. XX в., когда Н.Винер издал основополагающие работы по новой науке – кибернетике. Развитие последовало в 60-х гг. XX в. при по-явлении более мощных ЭВМ. Первые попытки были сделаны в решении шахматных задач, доказательстве теорем и создании универсального ре-шателя задач. После признания искусственного интеллекта самостоятель-ной отраслью науки произошло разделение на два основных направления: нейрокибернетику и кибернетику «черного ящика».

Основную идею нейрокибернетики можно сформулировать следую-щим образом: единственный объект, способный мыслить, – это человече-ский мозг, поэтому любое «мыслящее» устройство должно каким-то обра-зом воспроизводить его структуру.

Таким образом, нейрокибернетика ориентирована на аппаратное мо-делирование структур, подобных структуре мозга. Физиологами давно ус-тановлено, что основа человеческого мозга – большое количество связан-ных между собой и взаимодействующих нервных клеток – нейронов, по-этому усилия нейрокибернетики были сосредоточены на создании элемен-тов, аналогичных нейронам, и их объединении в функционирующие систе-мы. Эти системы принято называть нейронными сетями, или нейросетями.

В 1943 г. У. Маккалох и У. Питтс сформулировали основные положе-ния теории деятельности головного мозга и разработали математическую модель нейрона. Принципы, изложенные в работах Маккалоха – Питтса, были в 1958 г. воплощены Ф. Розенблаттом в оригинальном устройстве –

6

персептроне, способном сносно распознавать печатные буквы и обучаться на примерах.

В середине 80-х гг. в Японии в рамках проекта разработки компью-тера V поколения, основанного на знаниях, был создан нейрокомпьютер, моделирующий структуру мозга человека.

В основу кибернетики «черного ящика» лег принцип, противопо-ложный нейрокибернетике. Не имеет значения, как устроено «мыслящее» устройство. Главное, чтобы на заданные входные воздействия оно реаги-ровало так же, как человеческий мозг. Это направление искусственного интеллекта было ориентировано на поиски алгоритмов решения интеллек-туальных задач.

В конце 50-х гг. родилась модель лабиринтного поиска. Этот подход представляет задачу как некоторый граф, отражающий пространство со-стояний, в этом графе проводится поиск оптимального пути от входных данных к результирующим. Начало 60-х гг. – эпоха эвристического про-граммирования. Эвристика – правило, теоретически не обоснованное, но позволяющее сократить количество переборов в пространстве поиска. Эв-ристическое программирование – разработка стратегии действий на основе известных, заранее заданных эвристик. В 1963 – 1970 гг. к решению задач стали подключать методы математической логики. В 1973 г. на основе ме-тода резолюций, позволившего автоматически доказывать теоремы при наличии набора исходных аксиом, создается язык Пролог.

Существенный прорыв в практических приложениях искусственного интеллекта произошел в середине 70-х гг., когда на смену поискам универ-сального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. В США появились первые коммерческие системы, основанные на знаниях, или экспертные системы. Появился но-вый подход к решению задач искусственного интеллекта - представление знаний. Созданы MYCIN и DENDRAL – ставшие уже классическими экс-пертные системы для медицины и химии. Объявлено несколько глобаль-ных программ развития интеллектуальных технологий – ESPRIT (Евро-пейский Союз), DARPA (министерство обороны США), японский проект машин V поколения.

В России развитие искусственного интеллекта началось в 1954 г., ко-гда в МГУ под руководством профессора А. А. Ляпунова (1911 – 1973) на-чал свою работу семинар «Автоматы и мышление». Среди наиболее зна-чимых результатов, полученных отечественными учеными, следует отме-

7

тить алгоритм «Кора» М. Бонгарда, моделирующий деятельность челове-ческого мозга при распознавании образов (60-е гг.).

В 1945 – 1964 гг. создаются отдельные программы, и исследуется по-иск решения логических задач. В Ленинграде (ЛОМИ – Ленинградское отде-ление математического института им. В.А.Стеклова) создается программа, автоматически доказывающая теоремы. Она основана на оригинальном об-ратном выводе С. Ю. Маслова, аналогичном методу резолюций Робинсона.

В 1965 – 1980 гг. получает развитие новая наука – ситуационное управление. Основоположник этой научной школы – профессор Д. А. По-спелов. Разработаны специальные модели представления ситуаций – пред-ставления знаний. В 1980 – 1990 гг. проводятся активные исследования в области представления знаний, разрабатываются языки представления зна-ний, экспертные системы (более 300). В Московском государственном уни-верситете создается алгоритмический язык рекурсивных функций РЕФАЛ.

В 1988 г. создается АИИ – Ассоциация искусственного интеллекта. Ее членами являются более 300 исследователей. Президент Ассоциации – Д.А.Поспелов. Крупнейшие центры – в Москве, Петербурге, Переславле-Залесском, Новосибирске.

1.2. Основные понятия искусственного интеллекта и определение интеллектуальной информационной системы Искусственный интеллект – это то, что делает машины «интеллекту-

альными» – действие, подобное тому, которое мы могли ожидать от лю-дей. Машина может быть признана мыслящей, если человек, ведя с ней диалог по достаточно широкому кругу вопросов, не сможет отличить ее ответы от ответов человека – такую мерку интеллектуальности на одной из конференций по искусственному интеллекту предложил А. Тьюринг и она названа по имени ученого ее сформулировавшего критерием Тьюринга.

Искусственный интеллект – это одно из направлений науки, цель ко-торого разработка аппаратно-программных средств, позволяющих пользо-вателю-непрограммисту ставить и решать задачи, традиционно считаю-щиеся интеллектуальными, общаясь с ЭВМ на ограниченном подмножест-ве естественного языка.

Таким образом, искусственный интеллект – это научное направле-ние, отличие которого в том, что с использованием его методов решают творческие задачи, либо используют способы решения как у человека, на-

8

пример: дедуктивный вывод (Ш. Холмс), индуктивное обобщение, фреймы как подобие системы отражения человеком реальности.

Какие же задачи можно назвать творческими? Как правило, инфор-мация в них представляется в символьной форме. Алгоритм решения зара-нее не известен и задача априорно предполагает наличие выбора в услови-ях неопределенности. Этот недетерминизм носит фундаментальный харак-тер, эта свобода действия – существенная составляющая искусственного интеллекта.

В творческих задачах можно выделить ряд причин, из-за которых алгоритм решения неизвестен: 1. Неясность цели – часто цель уточняется в процессе решения. 2. Неопределенность всех способов достижения цели, т.е. наложенные ог-

раничения не запрещают использования любых методов, явно никак не относящихся к данной задаче.

3. Неясность условий задачи возникает из-за ненадежных данных или зна-ний, изменяющихся во времени.

4. Неоднозначность в постановке задачи. 5. Невозможность учета всех факторов и большое пространство поиска.

Программную систему, решающую творческие задачи, либо «мысля-щую» как человек, называют интеллектуальной, а обобщенную способность системы распознавать, обучаться и запоминать –интеллектуальностью (рис. 1).

Рис. 1. Взаимодействие интеллектуальной системы со средой

В общем случае под интеллектуальной системой понимают челове-

ко-машинную систему, в которой функции решения задач, в том числе и творческих, распределены между человеком и компьютером. Ее внутрен-няя структура формируется под воздействием внешней среды из образов,

9

представляющих собой абстракцию объектов реального мира. Современ-ные исследования в области искусственного интеллекта направлены на то, чтобы все большую долю творческих способностей перенести на ЭВМ.

1.3. Направления развития интеллектуальных систем Как научное направление искусственный интеллект стоит на стыке

многих дисциплин, среди них психология, математика, биология, киберне-тика, системология, генетика, информатика. Первоначально в искусствен-ном интеллекте создавались отдельные методы, впоследствии из них сформировалось два направления: когнитивное и логическое, которые за-тем стали объединяться.

Представление знаний, ориентированное на решение задач, изуча-лось исследователями когнитивного направления. Они опирались на прин-ципы организации человеческой памяти и моделирование вывода на их основе. Типичные модели – продукции и фреймы.

Исследователи логического направления продвинули теоретические методы представления знаний. Результат – модели на основе логики пре-дикатов первого порядка. Здесь акцент – представление знаний и генера-ция выводов на основе строгой теоретической системы. В основе этих ме-тодов – математическая формализация и логическая полнота.

Когнитивному подходу свойственна выразительность и решение сложных реальных задач. А логическому подходу – простые задачи. В на-стоящее время в искусственном интеллекте выделяют 6 направлений:

Представление знаний: задачи формализации и представления зна-ний в памяти интеллектуальной системы, для этого разрабатываются мо-дели представления знаний, языки описания знаний, выделяют типы и классифицируют знания. Изучаются источники знаний и создаются прие-мы и методы приобретения.

Манипулирование знаниями: строятся способы пополнения знаний на основе их неполных описаний, изучаются процедуры обобщения и форми-рования абстрактных понятий, создаются методы достоверного и правдо-подобного вывода, предлагаются модели рассуждений, имитирующих че-ловеческие. Тесно связано с первым направлением.

Общение: задача понимания связных текстов на естественном языке, синтез связных текстов, понимание и синтез речи, теория моделей комму-никации между интеллектуальной системой и человеком. Сюда относится

10

задача формирования объяснений, которая решается лингвистическими процессорами и экспертными системами.

Восприятие: проблемы анализа 3-мерных сцен, разработка методов представления информации в зрительных образах в базах знаний, создание перехода от зрительных сцен к их текстовому описанию и обратно, разра-ботка процедур когнитивной графики.

Обучение: включает методы, позволяющие интеллектуальной систе-ме развивать свои способности:

• формирование условий задачи по описанию проблемной ситуации или наблюдению за ней;

• переход от решения частных задач к общим; • декомпозиция, то есть разбиение задач на мелкие составляющие; • формирование моделей обучения. Поведение: разработка поведенческих процедур, позволяющих адек-

ватно взаимодействовать с человеком, окружающей средой, другими ин-теллектуальными системами. Созданы модели целесообразного, норма-тивного, ситуативного и подражательного поведения.

Существуют несколько иные классификации проблем, решаемых в искусственном интеллекте, среди них: когнитивное моделирование, мате-матика и автоматическое доказательство теорем, теория игр, теория реше-ния задач. Исследователи выделяют следующие перспективные области исследования искусственного интеллекта, оказывающие высокое влияние на развитие интеллектуального программного обеспечения:

Интеллектуальное моделирование: системы, которые генерируют виртуальные или имитируемые реальные компьютерные миры, поддержи-вают моделирование способностей людей, сознательное поведение и раз-витие живых существ, устройство их организма.

Интеллектуальные информационные ресурсы: системы, поддержи-вающие эффективное использование обширных ресурсов информационной среды. В их функции входит определение информационных потребностей, управление информационными потоками и извлечение информации.

Интеллектуальное проектирование: программное обеспечение, ко-торое запоминает приемы проектирования, накапливает опыт в процессе ручной разработки сложных технических устройств, компьютерных про-грамм, экономических моделей, то есть обучается и далее на основе полу-ченных метазнаний управляет проектами в автоматическом режиме.

11

Роботы: разнообразные технические устройства, начиная от самых простых, которые реализуют функции перемещения предметов в про-странстве, до более сложных, выполняющих, например, хирургические операции по заданной программе, и, наконец, систем, способных передви-гаться, адаптироваться к среде, обладающих техническим зрением, чувст-вительными рецепторами, способностью к обучению.

1.4. Классификация интеллектуальных систем Специфика задачи классификации интеллектуальных систем заклю-

чается в том, что рассматривается не столько то, какие функции выполняет данная система, но, прежде всего, какие методы искусственного интеллек-та используются в ней. В традиционной классификации не всегда возмож-но однозначно конкретную программу отнести в ту или иную категорию, поэтому предложен многомерный классификатор, принцип которого со-стоит в выделении независимых признаков классификации, каждый их ко-торых определял бы непересекающиеся с остальными свойства объекта, образуя аналог множества «линейно независимых» векторов – классифика-торов. В этом случае программа становится точкой, а набор схожих про-граммных систем – областью в пространстве признаков:

• используемый механизм (методы искусственного интеллекта); • глубина представления информации; • способ взаимодействия с пользователем; • форма представления; • характер обработки информации; • архитектура имитационной модели; • вид инструментальных средств; • функциональное назначение; • стадия существования. По используемому механизму выделяют: автоматическое порожде-

ние гипотез, анализ формальных понятий (формальный концептуальный анализ), статистические подходы, нейронные сети, системы рассуждений на основе аналогий, деревья решений, эволюционное моделирование (эво-люционное программирование, генетические алгоритмы), алгоритмы огра-ниченного перебора, нечеткие системы, фреймовые и продукционные сис-темы, семантические сети.

12

По глубине представления информации рассматривают такие струк-туры, как базы данных и базы знаний, электронные библиотеки, электрон-ные коллекции, тезаурусы и онтологии, а по способу взаимодействия с пользователем – диалоговые, потоковые, пакетные и системы реального времени. По стадии существования: демонстрационный и исследователь-ский прототипы, опытная система, промышленный прототип, коммерче-ская система.

По функциональному назначению (по области применения) выделя-ют: экспертные системы, компьютерные системы с обработкой естествен-ного языка, компьютерные системы интеллектуального анализа данных, обучающие системы, программы для распознавания, анализа и синтеза изображений (образов), распознавания, анализа и синтеза речи, системы поддержки принятия решений, робототехника (интеллектуальные роботы), многоагентные интеллектуальные системы, интеллектуальные системы проектирования (интеллектуальные САПР), интеллектуальные системы реинжиниринга предприятий (CASE), инструментальные средства созда-ния интеллектуальных модулей и систем, машинное творчество.

Интеллектуальные системы в зависимости от архитектуры можно классифицировать на однокомпонентные (single component) и многоком-понентные (multi component). Однокомпонентные интеллектуальные сис-темы основаны на использовании единственного средства искусственного интеллекта, такого, например, как нечеткая логика или нейронная сеть. Многокомпонентные системы объединяют в себе различные средства ис-кусственного интеллекта в единую вычислительную модель.

Необходимость формализации разнообразных данных и знаний при-вела к появлению гибридных интеллектуальных систем, сочетающих тра-диционные средства обработки информации и методы искусственного ин-теллекта. Они позволили более эффективно объединять формализуемые и не формализуемые знания.

1.5. Вопросы и задания

1. Когда и с какого события началась история развития искусственного интеллекта как науки?

2. Перечислите основные вехи развития искусственного интеллекта. 3. Поясните понятие «интеллектуальная система». 4. Какими способностями должна обладать интеллектуальная система? 5. Чем отличается интеллектуальная система от информационной?

13

6. Назовите виды задач, решаемых методами искусственного интеллекта. 7. Перечислите свойства творческой задачи. 8. Каковы условия неизвестности алгоритма решения творческой задачи? 9. Перечислите способы измерения интеллекта.

10. Назовите методы искусственного интеллекта, предназначенные для ре-шения задач прогноза, оптимизации, классификации.

11. Сравните когнитивное и логическое направления в историческом разви-тии искусственного интеллекта.

12. Как связаны «представление знаний» и «манипулирование знаниями» – два направления в искусственном интеллекте?

13. Назовите перспективные области исследования в искусственном интел-лекте.

14. Поясните суть интеллектуального моделирования и проектирования. 15. Приведите примеры интеллектуальных информационных ресурсов. 16. Перечислите задачи, решаемые в рамках направлений искусственного

интеллекта: «восприятие», «общение». 17. Назовите известные модели поведения. 18. Какие науки внесли наибольший вклад в развитие методов искусствен-

ного интеллекта? Приведите примеры. 19. По каким признакам классифицируют интеллектуальные системы? 20. Перечислите виды интеллектуальных систем по функциональному на-

значению, используемому механизму. 21. Приведите примеры методов искусственного интеллекта.

14

2. ИНФОРМАЦИЯ, ДАННЫЕ И ЗНАНИЯ

2.1. Понятие об информации, данных и знаниях Для правильного понимания функционирования интеллектуальных

систем важное значение приобретает изучение особенностей понятий «знания», «данные» и «информация», между которыми проходит доста-точно тонкая граница. Приведем несколько определений.

Данные – это, с одной стороны, отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства. С другой стороны, данные рассматривают как объекты, отличные от команд, и как входные переменные в противоположность результатам.

В разной литературе данные смешивают с информацией: данные – это информация, представленная в виде, воспринимаемом для формальной обработки автоматическими устройствами или человеком; элемент инфор-мации и, наоборот, информация – это определенным образом подготов-ленные данные. Еще есть определение данных как поименованного эле-мента памяти.

Информация (от лат. informatio – разъяснение, изложение) – это об-щенаучное понятие, охватывающее обмен сведениями между людьми, че-ловеком и автоматом, автоматом и автоматом; обмен сигналами в живот-ном и растительном мире; передачу признаков от клетки к клетке, от орга-низма к организму. В кибернетике – понятие, предполагающее наличие материального носителя, источника, передатчика, приемника и канала свя-зи между источником и приемником.

15

В то же время информацию понимают как совокупность символов, как образы, несущие смысловую нагрузку, как отражение предметного ми-ра, выражаемого в виде сигналов и знаков. Информацией называют и со-держание, значение данных, которое видят в них люди, а также говорят, что данные становятся информацией в определенном контексте.

В теории информации – это количественная мера устранения неоп-ределенности (энтропии) или мера организованности системы. Информа-цию выражают математически и измеряют с помощью информационных единиц, таких как бит, нат, дит.

Знания – это закономерности предметной области (принципы, связи, законы), позволяющие решать возникающие в ней задачи. Вместе с тем знания – это результат накопленного опыта, объединяющий образы, моде-ли окружающего мира, хранимые в памяти, сформировавшиеся механизмы их преобразования и обработки и управляющий центр, который определя-ет цели функционирования системы и координирует взаимодействие пер-вых двух составляющих для их достижения.

Можно выделить несколько аспектов знаний: декларативно-описательный: совокупность сведений, образующих

целостное описание, соответствующее некоторому уровню осведомленно-сти интеллектуальной системы об описываемом вопросе, предмете, про-блеме;

целевой: материально-логическое содержание опыта, отраженное в памяти и конкретизирующее его использование при решении конкретной задачи (удовлетворении конкретной потребности);

структурно-логический: текущая структура интеллектуальной сис-темы, включающая множество составляющих элементов и связей элемен-тов друг с другом, которая и определяет адаптацию системы к внешней среде, ее реакцию на поступающие информацию и сигналы и поведение (интеллектуальное или не очень).

Знания связаны с данными, основываются на них, но представляют результат мыслительной деятельности человека, обобщают его опыт, по-лученный в ходе выполнения какой-либо практической деятельности.

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

• данные как результат измерений и наблюдений; • данные на материальных носителях информации (таблицы, про-

токолы, справочники);

16

• модели (структуры) данных в виде диаграмм, графиков, функций; • данные в компьютере на языке их описания; • базы данных на машинных носителях. Знания трансформируются аналогично данным: • знания в памяти человека как результат мышления; • материальные носители знаний (учебники, методические посо-

бия); • поле знаний – условное описание основных объектов предметной

области, их атрибутов и закономерностей, их связывающих; • знания, описанные на языках представления знаний (продукцион-

ные языки, семантические сети, фреймы - см. далее); • базы знаний.

2.2. Свойства, отличающие данные от знаний В ЭВМ знания так же, как и данные, хранятся и отображаются в зна-

ковой форме – в виде формул, текста, файлов, информационных массивов. Можно сказать, что знания – это особым образом организованные данные, но это слишком узкое понимание. В системах искусственного интеллекта выделяют ряд характерных «ступеней», которые приближают некоторую совокупность сигналов – данные – к осмысленному опыту – знаниям.

Внутренняя интерпретируемость. Каждая информационная едини-ца (элемент, «порция» данных или знаний) имеет уникальное имя, по кото-рому интеллектуальная система находит ее, а также отвечает на запросы, в которых это имя упомянуто. Когда данные, хранящиеся в памяти, лишены имен, то отсутствует возможность их идентификации системой.

При переходе к знаниям в памяти хранится информация о структуре информационных единиц, например, словари или структуры таблиц баз данных. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируемости всех информационных единиц, хранящихся в базе данных.

Структурированность. Информационные единицы должны обла-дать гибкой структурой. Для них должен выполняться «принцип матреш-ки», т.е. рекурсивная вложенность одних информационных единиц в дру-гие. Каждая информационная единица может быть включена в состав лю-бой другой, и из каждой информационной единицы можно выделить неко-торые составляющие ее информационные единицы. Другими словами,

17

должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа «часть – це-лое», «род – вид» или «элемент – класс».

Связность. В информационной базе между информационными едини-цами должна быть предусмотрена возможность установления связей различ-ного типа. Прежде всего, эти связи могут характеризовать отношения между информационными единицами. Семантика отношений может носить декла-ративный или процедуральный характер. Например, две или более информа-ционные единицы могут быть связаны отношением «одновременно», две ин-формационные единицы – отношением «причина – следствие» или отноше-нием «быть рядом». Приведенные отношения характеризуют декларативные знания. Если между двумя информационными единицами установлено от-ношение «аргумент – функция», то оно характеризует процедурное знание, связанное с вычислением определенных функций. Далее будем различать отношения структуризации, функциональные отношения, каузальные от-ношения и семантические отношения. С помощью первых задаются иерар-хии информационных единиц, вторые несут процедурную информацию, по-зволяющую находить (вычислять) одни информационные единицы через другие, третьи задают причинно-следственные связи, четвертые соответст-вуют всем остальным отношениям.

Между информационными единицами могут устанавливаться и иные связи, например, определяющие порядок выбора информационных единиц из памяти или указывающие на то, что две информационные единицы не-совместимы друг с другом в одном описании.

Перечисленные три особенности знаний позволяют ввести общую модель представления знаний, которую можно назвать семантической сетью, пред-ставляющей собой иерархическую сеть, в вершинах которой находятся инфор-мационные единицы. Эти единицы снабжены индивидуальными именами. Дуги семантической сети соответствуют различным связям между информационны-ми единицами. При этом иерархические связи определяются отношениями структуризации, а неиерархические связи - отношениями иных типов.

Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее ситуа-ционную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами. Его можно было бы назвать отно-шением релевантности для информационных единиц. Такое отношение дает возможность выделять в информационной базе некоторые типовые

18

ситуации (например, «покупка», «регулирование движения на перекрест-ке»). Отношение релевантности при работе с информационными единица-ми позволяет находить знания, близкие к уже найденным.

Активность. С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, проте-кающие в ЭВМ, инициируются командами, а данные используются этими командами лишь в случае необходимости. Для интеллектуальной системы эта ситуация не приемлема. Как и у человека, в интеллектуальной системе актуализации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в интеллектуальной систе-ме должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей мо-жет стать источником активности системы.

Перечисленные пять особенностей информационных единиц опреде-ляют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний. Совокупность средств, обеспечивающих рабо-ту со знаниями, образует систему управления базой знаний (СУБЗ). В на-стоящее время не существует баз знаний, в которых в полной мере были бы реализованы внутренняя интерпретируемость, структуризация, связ-ность, введена семантическая мера и обеспечена активность знаний.

2.3. Классификация знаний Существует множество способов определять понятия. Один из ши-

роко применяемых способов основан на идее интенсионала. Интенсионал понятия – это его определение через понятие более высокого уровня абст-ракции с указанием специфических свойств, например, телефон – это уст-ройство, предназначенное для голосовой связи двух абонентов. Другой способ определяет понятие через перечисление или указание объектов или фактов более низкого уровня иерархии, например, по телефону можно раз-говаривать, вот стоит телефон, телефон с дисковым набором. Это есть оп-ределение через данные, или экстенсионал понятия. Такими способами определяются и знания, которые соответственно называются интенсио-нальными или экстенсиональными. Математические зависимости, выра-женные формулами, являются примерами интенсиональных знаний, а таб-лицами с конкретными значениями переменных – экстенсиональными.

19

Знания могут быть классифицированы: на поверхностные – знания о видимых взаимосвязях между отдель-

ными событиями и фактами в предметной области; глубинные – абстракции, аналогии, схемы, отображающие целиком

всю структуру предметной области и процессов, происходящих в ней. Кроме того, знания можно разделить на процедурные, декларатив-

ные и управляющие. Исторически первичными были процедурные знания, т.е. знания, «растворенные» в алгоритмах. Они управляли данными. Одна-ко с развитием искусственного интеллекта приоритет данных постепенно изменялся, и все большая часть знаний сосредоточивалась в структурах данных (таблицы, списки, абстрактные типы данных), т.е. увеличивалась роль декларативных знаний.

Декларативные знания – представляют собой информацию (данные) о конкретном случае, факты. Процедурные знания позволяют генерировать (активировать) декларативные знания. Управляющие знания – набор вари-антов (стратегий), определяющих альтернативные возможности в ходе ре-шения, основываются на методе выбора: какое из порождающих правил применяется при известном состоянии предметной области.

Приведем еще одну классификацию, в которой различают следую-щие типы знаний: понятийные, конструктивные, процедурные, фактогра-фические и метазнания.

Понятийные знания – набор понятий, которыми пользуются при ре-шении данной задачи. Этот тип знаний вырабатывается в фундаменталь-ных науках и теоретических разделах прикладных наук.

Конструктивные – это знания о наборах возможных структур объек-тов и взаимодействии между их частями. Получение этого типа знаний ха-рактерно для техники и большей части прикладных наук.

Процедурные знания – используемые в выбранной предметной об-ласти методы, алгоритмы и программы.

Фактографические знания – количественные и качественные харак-теристики объектов и явлений.

Метазнания – знания о порядке и правилах применения знаний. 2.4. Вопросы и задания

1. Определения данных, информации и знаний. 2. Назовите свойства данных, приближающие их к знаниям. 3. Выделите отличительные черты данных, информации и знаний.

20

4. Как определяются единицы измерения информации? 5. Назовите виды классификации знаний. 6. Назовите самое важное свойство, отличающее данные от знаний. 7. Перечислите свойства, отличающие данные от знаний. 8. Перечислите свойства, отличающие данные от информации. 9. Смысл – характеристика данных, знаний или информации?

10. В чем состоит свойство «активность» знаний? 11. Что общего в свойствах знаний: «связность» и «семантическая метрика»? 12. Что управляет процессом логического вывода: данные, знания или ин-

формация? 13. Что инициирует процесс логического вывода: данные, знания или ин-

формация? 14. При передаче от источника к приемнику по каналу связи возникают

данные, знания или информация? 15. На каком этапе трансформации знания организуются в виде формаль-

ной модели? 16. Знания какого вида управляют процессом вывода? 17. Какие знания являются описательными? 18. Какие знания интегрируют в себе действия, операции, процессы? 19. Перечислите виды знаний. 20. Покажите взаимосвязь различных аспектов знаний: структурно-

логического, декларативно-описательного и целевого.

21

3. МЕТОДЫ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

3.1. Модели представления знаний. Формальные и неформальные (семантические) модели Представление знаний – это множество соглашений по синтаксису и

семантике, согласно которым описываются объекты. Хорошее правило при проектировании представления знаний – это организация знаний в такой форме, которая позволяет осуществлять доступ к ним с помощью естест-венных и простых механизмов. «Чем проще, тем лучше» – правило, кото-рое нужно помнить при работе со знаниями.

Существуют два вида представления знаний: формальные модели и неформальные (семантические) модели.

В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придержи-ваются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Логический вывод в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим прави-лам. Вывод в неформальных системах во многом определяется самим ис-следователем, который и отвечает за его корректность.

Система искусственного интеллекта моделирует интеллектуальную деятельность человека и, в частности, – логику его рассуждений. В упро-щенной форме логические построения при этом сводятся к следующей схеме: из одной или нескольких посылок (которые считаются истинными) следует сделать «логически верное» заключение (вывод, следствие). Оче-

22

видно, для этого необходимо, чтобы и посылки, и заключение были пред-ставлены на понятном языке, адекватно отражающем предметную область, в которой проводится вывод. В обычной жизни это наш естественный язык общения, в математике, например, это язык формул. Наличие же языка предполагает, во-первых, наличие алфавита (словаря), отображающего в символьной форме весь набор базовых понятий, с которыми придется иметь дело и, во-вторых, набор синтаксических правил, на основе которых, пользуясь алфавитом, можно построить определенные выражения.

Логические выражения, построенные в данном языке, могут быть ис-тинными или ложными. Некоторые из этих выражений, являющиеся всегда истинными, объявляются аксиомами. Они составляют ту базовую систему посылок, исходя из которой и пользуясь определенными правилами выво-да, можно получить заключения в виде новых выражений, также являю-щихся истинными.

Если перечисленные условия выполняются, то говорят, что система удовлетворяет требованиям формальной теории. Ее так и называют фор-мальной системой (ФС). Система, построенная на основе формальной тео-рии, называется также аксиоматической системой.

Формальная теория должна удовлетворять следующему определе-нию: всякая формальная теория F = (A, V, W, R), определяющая некоторую аксиоматическую систему, характеризуется:

наличием алфавита (словаря) A, множеством синтаксических правил V, множеством аксиом, лежащих в основе теории W, множеством правил вывода R. Исчисление высказываний (ИВ) и исчисление предикатов (ИП) –

классический пример аксиоматических систем. Эти ФС хорошо исследо-ваны и имеют прекрасно разработанные модели логического вывода – главного механизма интеллектуальных систем. Поэтому все, что может и гарантирует каждая из этих систем, гарантируется и для прикладных ФС как моделей конкретных предметных областей. В частности, это гарантии непротиворечивости вывода, алгоритмической разрешимости (для исчис-ления высказываний) и полуразрешимости (для исчислений предикатов первого порядка).

ФС имеют и недостатки, которые заставляют искать иные формы представления. Главный недостаток – это «закрытость» ФС, их негибкость. Модификация и расширение здесь всегда связаны с перестройкой всей ФС,

23

что для практических систем сложно и трудоемко. В них очень сложно учитывать происходящие изменения. Поэтому ФС как модели представле-ния знаний используются в тех предметных областях, которые хорошо ло-кализуются и мало зависят от внешних факторов.

3.2. Теория фреймов Теория фреймов – это неформальная модель представления знаний в

вычислительных системах. Впервые предложена американским ученым М. Минским в 1972 г. как попытка построить модель человеческой памяти и объяснить феномены восприятия информации и понимания. Другая цель построения этой модели – это попытка сконструировать базу данных, со-держащую энциклопедические знания, в особо структурированной и упо-рядоченной форме. Термин «фрейм» был наиболее популярен в середине семидесятых годов, когда существовало много его толкований, отличных от интерпретации Минского. Минский разработал такую схему хранения знаний, в которой информация содержится в ячейках, называемых фрей-мами, объединенными в сеть, называемую системой фреймов. Фрейм объ-единяет в себе декларативную информацию о свойствах и структуре объ-екта, процедурную – операции и действия, реализующие реакции фрейма на внешние воздействия, и целевую составляющую, определяющую назна-чение фрейма и применимость его в той или иной ситуации. В системе все-гда существует активный фрейм, который в данный момент контролирует взаимодействие с внешней средой и отвечает за восприятие информации. Новый фрейм активизируется с наступлением новой ситуации и передачей ему управления от текущего.

Рассмотрим более глубокое определение фрейма. Есть некоторая ин-теллектуальная система (человек, компьютер, робот). При взаимодействии со средой в ее памяти формируется образ окружения, который состоит из узлов, соответствующих объектам реального мира, и отношений между ними. Например, пространственных: книга лежит на столе.

Ассоциативных: парилка веник. Временных: пес лежит на солнце пес встал пес подошел к ко-

нуре пес заглянул внутрь конуры. Система узлов и отношений, формирующихся в памяти вокруг неко-

торого центра, и есть фрейм. Каждый фрейм имеет уникальное имя и со-стоит из слотов, которые делятся на информационные, их значения описы-

24

вают объект или ситуацию реального мира, отображаемую фреймом, и служебные. С каждым фреймом ассоциирована некоторая дополнительная информация: указатель дочернего фрейма, пользователь фрейма, дата оп-ределения фрейма, дата модификации фрейма, комментарий и т. п. Слу-жебные слоты как раз и служат для ее хранения (рис. 2.)

Рис. 2. Структура данных фрейма

Слот имеет имя и хранит значение определенного типа: число, текст, логическая переменная, список, таблица, выражение, присоединенная про-цедура, указатель на другой фрейм (субфрейм). Со слотом также как и с фреймом связана некоторая дополнительная информация: маркер – про-стые логические условия, которые определяют ограничения на его значе-ния (например, маркер определяет, что значением терминала должен быть предмет заданной величины, либо элементарное действие, либо «указа-тель» на другой фрейм); сложные условия, устанавливающие связи между значениями нескольких терминальных слотов – они определяются выпол-нением присоединенных процедур, которые определяют действия, выпол-няемые при наступлении внутреннего или внешнего события – записи или чтения значения слота, переход по ссылке на другой фрейм или проверка условия задания т.д.

Как любой практически значимый подход, теория фреймов имеет ряд характерных особенностей, дающих ей преимущества перед другими мо-делями представления знаний. Их можно понимать как (свойства) фреймо-вой организации памяти. Можно выделить отличительные для теории фреймов принципы, перешедшие из нее впоследствии в другие теории:

• использование фреймами общих терминалов; • использование значений «по-умолчанию»;

Имя фрейма Слот 1 Значение слота 1 ……………………………….. Слот N Значение слота N

Структура слота

o Имя слота o Указатель наследования o Указатель типа данных o Значение слота o Демон

Служебные o Указатель предка o Указатель дочер-

них фреймов o Дата определения o Дата изменения o ……………

Информационные

25

• использование ожиданий и те, которые ранее разработаны в рамках других подходов или заимство-ваны из них: организация доступа к слотам с использованием присоеди-ненных процедур, организация вложенности (с определенной «фреймо-вой» спецификой), наследование свойств, использование декларации фреймов и фреймов-прототипов, механизм вывода.

Преимущества фреймовой организации состоят в экономии памяти за счет использования общих терминалов, а использование ассоциативного поиска при большом объеме знаний дает выигрыш в скорости.

Использование фреймами общих терминалов. Фрейм можно пред-ставлять себе в виде сети, состоящей из узлов и связей между ними. «Верхние уровни» фрейма четко определены, поскольку образованы таки-ми понятиями, которые всегда справедливы по отношению к предполагае-мой ситуации. На более низких уровнях имеется много особых вершин-терминалов, или «ячеек», которые должны быть заполнены характерными для текущей ситуации примерами или данными. У близких фреймов тер-миналы могут быть общими, то есть один участок памяти относится сразу к нескольким фреймам и изменения, происходящие в нем, сразу отражают-ся во всех фреймах (рис. 3). Таким образом, происходят значительные эко-номия памяти и увеличение скорости преобразований в системе.

Рис. 3. Уровни организации фрейма и терминальные слоты

Использование значений «по-умолчанию» и ожидания. Теория фрей-

мов во многом выигрывает благодаря возможности использования в ней ожиданий и различных предположений. Терминалы фрейма в обычном со-стоянии заполнены так называемыми «заданиями отсутствия» или «значе-ниями по-умолчанию», то есть сведениями, которые не обязательно при-сутствуют в конкретной ситуации, а известны, например, из прошлого опыта. Это позволяет без дополнительных операций и запросов выдвинуть гипотезы и ориентировочно спрогнозировать ненаблюдаемые в данный

Фрейм 1Фрейм 2

Терминалы

Верхние уровни

Общие терминалы

26

момент свойства характеристики и поведение объекта. Связь заданий от-сутствия со своими терминалами не является жесткой и неизменной, на определенном этапе они заменяются на значения, более подходящие к те-кущей ситуации. Этот процесс называется конкретизация.

Например, когда человек входит в комнату, то в его сознании из па-мяти появляются субфреймы-ожидания, о том, что собой представляет са-мая обычная комната. Когда человек вошел в комнату, происходит соотне-сение ожиданий с действительностью. Если соответствие найдено, то про-исходит заполнение переменных значений фрейма, то есть определяются местоположение окна, мебели, размеры комнаты и т.п. При перемещении по комнате тоже сначала появляются из памяти ожидания по поводу виде-ния предметов в комнате под другим углом, затем заполнение терминалов, если же увиденное не совпадает с ожиданием, происходит поиск более подходящего фрейма или создание нового.

Организация доступа к слотам с использованием присоединенных проце-дур. Присоединенная процедура (метод или служебная процедура) – подпро-грамма, которая хранится в слоте процедурного типа и запускается по сообще-нию, переданному из другого фрейма. Разновидность присоединенной проце-дуры – демон – программа, «привязанная» к слоту и автоматически запускаемая при выполнении некоторого условия обращения к нему. Существуют условия типа «если необходимо», «если добавить», «если очистить» и т. д.

В моделях представления знаний фреймами объединяются про-цедурные и декларативные знания, при этом демоны и присоединенные процедуры являются процедурными знаниями.

Организация вложенности (с определенной «фреймовой» специфи-кой). Фрейм может иметь слоты, значения которых – ссылки на другие фреймы. Таким образом, организована вложенность одних фреймов в дру-гие, которая позволяет создавать сети фреймов. Вложенные фреймы бы-вают сложными свойствами (например, шрифт для фрейма «надпись»), частями базового фрейма (например, фрейм «двигатель» и вложенный в него фрейм «масляный насос»), функциональными подсистемами (напри-мер, «система охлаждения» для «двигателя»).

Использование декларации фрейма. Фрейм-прототип и фрейм-экземпляр. Понятие декларация подразумевает в себе первоначальное объ-явление, определение исходной структуры. Фрейм представляет собой не-кую структуру данных, которая может быть представлена в памяти ЭВМ и является машинной моделью реального мира.

27

Декларация фрейма – это действие, при котором происходит опреде-ление структуры фрейма и заполнение терминалов характерными данны-ми, которые наиболее точно описывают все особенности некоторой ситуа-ции. Декларация фрейма проходит в два этапа: • определение структуры фрейма, т.е. выбор фрейма, который является

универсальным для класса решаемых задач (представляемых моделей), в результате получаем фрейм-прототип – это фрейм, у которого значе-ния слотов не определены;

• вторым этапом является заполнение терминалов или ячеек более «ниж-них уровней» данными, которые дополняют информацию, заложенную на «верхних уровнях».

При конкретизации фрейма-прототипа получаются фреймы-экземпляры. Любой фрейм имеет имя, код (номер) и набор экземпляров, каждый из которых однозначно идентифицируется кодом экземпляра. Уникальность конкретного экземпляра фрейма в пределах одного фрейма обеспечивается заданием списка ключевых терминальных понятий. На-пример, если список состоит из терминалов фамилия, имя, отчество, то в системе может существовать только один Иванов Иван Иванович.

Наследование и механизм вывода. В языке представления знаний фреймами отсутствует специальный механизм управления выводом как, например, в системах логического вывода, поэтому проектировщик дол-жен сам реализовать данный механизм. Во фреймовых системах исполь-зуются три способа управления выводом: с помощью присоединенных процедур, с использованием демонов и с помощью механизма наследова-ния. Последний способ – единственный основной механизм управления выводом, который присутствует во фреймовых системах. Он базируется на отношениях «абстрактное – конкретное» (или отношениях типа IS-A) и осуществляет определение значений слотов текущего фрейма, используя автоматический поиск соответствующих значений во фреймах верхнего уровня и вызовы присоединенных процедур служебного типа.

Механизм наследования в различных модификациях присутствует во всех фреймовых системах, а произвольный механизм вывода реализуется в конкретной базе знаний с помощью написания присоединенных процедур. Посредством объединения возможностей демона и служебной процедуры можно реализовать любой механизм управления выводом.

Система фреймов и сеть поиска информации. Группы семантически близких друг к другу фреймов объединяются в систему фреймов. Системы

28

фреймов связаны между собой сетью поиска информации. Если базовый фрейм системы нельзя приспособить к реальной ситуации, то есть если не уда-ется найти такие задания терминалов, которые удовлетворяют условиям соот-ветствующих маркеров, сеть поиска информации позволяет выбрать более подходящий для данной ситуации фрейм. Подобные структуры дают возмож-ность использовать в системах фреймов различные методы представления ин-формации, что имеет особое значение для разработки механизмов понимания.

Рассмотрим задачу поиска в сети фреймов: требуется найти образ объекта в памяти интеллектуальной системы. Это нужно, например, для того, чтобы определить неизвестные (в данный момент недоступные для восприятия) характеристики наблюдаемого объекта, например, «а сколько сидячих мест в автобусе, стоящем на остановке», «съедобный ли гриб»?

Начальные условия: известно (в отличии от задачи распознавания) к какому классу или фрейму-прототипу относится объект – поиск необходи-мо производить среди его экземпляров.

Принцип действия: осуществляется перебор и сравниваются термина-лы всех фреймов из области поиска и фрейма-образца до тех пор, пока не вы-полнится критерий поиска. Сравнение осуществляется присоединенной про-цедурой («демоном») текущего фрейма-экземпляра или фрейма-образца.

Преимущество фреймового поиска в скорости возникает за счет того, что общие терминалы фреймов сравниваются с атрибутами образца только один раз. Обработанный терминал маркируется:

• идентичен образцу; • не идентичен образцу. После нахождения подходящего фрейма осуществляется передача

ему управления. Вывод в сети фреймов более сложная процедура чем по-иск. Началом вывода служит момент поступления новой информации, так как она поступает непрерывно, то и вывод в реальной интеллектуальной системе (у человека) – процесс непрерывный. В некоторый момент време-ни в интеллектуальной системе активен какой-либо фрейм, он и будет точ-кой отсчета для вывода. Вывод состоит в последовательном изменении фреймовой системы под влиянием внешних воздействий:

• передаче активности другому фрейму; • изменении значений слотов (например, конкретизация значений

по-умолчанию); • изменении структуры системы (например, добавлении нового

фрейма).

29

Вывод необходим для согласования (уравновешивания, адаптации) внутреннего состояния интеллектуальной системы со средой. Вывод включает три момента:

Проверка на адекватность. Текущий активный, выбранный на основе ожиданий или предварительных данных фрейм проходит проверку на пра-вильность сделанного выбора. Перечень текущих целей используется для при-нятия решения о том, какие терминалы и какие условия следует учитывать при сопоставлении фрейма с действительностью. Адекватность фрейма наблюдае-мой ситуации показывает, что структура фрейма подходит для ее описания, но при этом значения терминалов не обязательно соответствуют реальным харак-теристикам. Если результат проверки отрицательный, то осуществляется даль-нейший поиск наиболее подходящего фрейма, а если положительный, то про-исходит конкретизация значений терминалов фрейма.

Конкретизация. Если проверка на адекватность определила, что найден подходящий фрейм, то этим фреймом запрашивается информация, необходи-мая для определения значений тех терминалов, которые не соответствуют ре-альной ситуации и не могут сохранять свои заранее установленные значения (значения по-умолчанию). Полученные данные (задания) должны согласовы-ваться с текущими условиями, задаваемыми маркерами терминала.

Управление. Если попытка задания значений терминалам не удается, то происходит трансформация, то есть выбранный базовый фрейм переда-ет управление соответствующему фрейму той же системы. Результатом трансформации становится заново сгенерированный фрейм системы, а его активизация происходит передачей управления от базового фрейма.

Система фреймов хранит фреймы с одинаковой структурой, но раз-ными значениями терминалов, например, множество состояний одного и того же объекта – это система. У фреймов системы общего много больше, чем различий, поэтому хранить все фреймы системы целиком нецелесооб-разно. В качестве основы системы фреймов выбирается базовый фрейм, в котором хранится вся структура и все значения слотов. Для других фрей-мов системы хранится информация об отличиях от базового фрейма. Пере-ход к некоторому фрейму системы происходит при помощи трансформа-ции – модификации базового фрейма с учетом хранимых отличий. Это действие изменяет значение слотов фрейма без запроса внешних данных. Трансформация выполняется присоединенной к фрейму процедурой, а хранится в памяти в виде подпрограммы, или в виде совокупности изме-няемых слотов, при этом присоединенная процедура должна быть способ-на распознавать и изменять значения слотов в базовом фрейме.

30

Для трансформации указывается имя активизируемого фрейма, ссылка на базовый фрейм и на его «демон», который осуществляет транс-формацию, то есть на само действие. Результатом трансформации стано-вится фрейм, сгенерированный на основе базового.

Выделяют два вида фреймов: фреймы-описания и ролевые фреймы. Например, фрейм-описание: [<программное обеспечение>, <программа 1С бухгалтерия, версия 7.5>, <программа 1С торговля, версия 7.5>, <правовая программа «Консультант +» проф.>] и ролевой фрейм: [<заявка на продажу>, <что, установка и покупка программы 1С торговля, версия 7.5>, <откуда, фирма ВМИ>, <куда, фирма «Лукойл»>, <кто, курьер Иванова>, <когда, 27 октября 2004г.>].

Во фрейме-описании в качестве имен слотов задан вид программного обеспечения, а значение слота характеризует версию и название продук-ции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов. Для данного при-мера представлены описания конкретных фреймов, которые являются фреймами – экземплярами.

Существует и более детальная классификация фреймов: • фреймы-структуры служат для обозначения объектов и понятий (кре-

дит, помещение, вексель, стол); • фреймы-роли определяют роль объекта в некоторой системе (менеджер,

кассир, клиент); • фреймы-сценарии – ролевые фреймы, описывающие стандартную по-

следовательность действий в стереотипной ситуации (банкротство, соб-рание акционеров, празднование именин). Сценарии организуют пове-дение, для них характерна ситуативная привязанность;

• фреймы-ситуации (тревога, авария, рабочий режим устройства) и др. Основные достоинства модели фреймов как модели представления

знаний – способность отражать концептуальную основу организации па-мяти человека, а также естественность, наглядность представления, мо-дульность. Теория фреймов служит основой языков представления знаний, таких как FRL (Frame Representation Language), KRL (Knowledge Representation Language) и ряда инструментальных систем FMS (Frame Modeling System), KEE, LOOPS. Отметим, кроме того, что концепция объ-ектно-ориентированного программирования может рассматриваться как реальное воплощение в традиционных языках программирования ряда приемов, близких фреймовой организации.

31

3.3. Семантические сети

Впервые такая модель была построена Фрегом для представления логи-ческих формул в виде деревьев, которые мало напоминали современные се-мантические сети. Затем подобие семантических сетей – графические записи – использовались в органической химии. В психологии были применены графы для представления наследственности, и далее эти научные изыскания оказали влияние на изучение тактики в шахматах. Первым ученым, применившим се-мантические сети в лингвистике, стал Теньер. Он использовал графическую запись для анализа грамматики зависимостей. В системах машинного перевода семантические сети были использованы в конце 50-х – начале 60-х гг. Первая такая система, которую создала Мастерман, включала в себя 100 примитивных концептов. С помощью этих концептов она описала словарь объемом 15000 единиц, в котором имелся механизм переноса характеристик с гипертипа на подтип. Первая система машинного перевода базировалась на сетях, которые представляли собой набор 56 различных отношений, среди которых падежные отношения, отношения подтипа, части и целого.

Семантической сетью называется структура данных, определяющая целостный образ некоторой системы в виде сети, узлы которой соответст-вуют понятиям и объектам, а дуги – отношениям между объектами. Изна-чально семантическая сеть была задумана как модель представления структуры долговременной памяти в психологии, но впоследствии стала одним из основных способов представления знаний в инженерии знании. Слово «семантика» определяется как значение, смысл слова, художествен-ного произведения, действия, обстоятельства и т. д., переданные с помо-щью каких-либо представлений, символов и выражений. Семантика – это наука, устанавливающая отношения между символами и объектами, кото-рые они обозначают, т.е. наука, определяющая смысл знаков.

В общем случае сетевые модели формально можно задать в виде H = <I, C1, C2, ..., Cn, Г>. Здесь I есть множество информационных единиц; C1, C2, ..., Cn – множество типов связей между информационными едини-цами. Отображение Г задает между информационными единицами, входя-щими в I, связи из заданного набора типов связей. Наиболее часто в семан-тических сетях используются следующие отношения:

• связи типа «часть – целое» «класс – подкласс», «элемент – мно-жество» и т.п.);

• функциональные связи (определяемые обычно глаголами «произ-водит», «влияет»...);

32

• количественные (больше, меньше, равно...); • пространственные (далеко от, близко от, за, под, над...); • временные (раньше, позже, в течение...); • атрибутивные связи (иметь свойство, иметь значение...); • логические связи (и, или, не) и др. В зависимости от типов связей, используемых в модели, различают

классифицирующие сети, функциональные сети, сценарии. В классифици-рующих сетях используются отношения структуризации. Такие сети по-зволяют в базах знаний вводить разные иерархические отношения между информационными единицами. Функциональные сети характеризуются наличием функциональных отношений. Их часто называют вычислитель-ными моделями, т.к. они позволяют описывать процедуры «вычислений» одних информационных единиц через другие. В сценариях используются каузальные отношения, а также отношения типов «средство – результат», «орудие – действие» и т.п. Если в сетевой модели допускаются связи раз-личного типа, то ее называют семантической сетью.

Существует несколько классификаций семантических сетей: по ко-личеству типов отношений их делят на однородные (с единственным ти-пом отношений) и неоднородные (с различными типами отношений); по типам отношений семантические сети бывают бинарные (в которых отно-шения связывают два объекта) и парные (в которых есть специальные от-ношения, связывающие более двух понятий).

Известны несколько топологий сетей. Ацикличный граф – это граф без циклов, имеющий ветви, которые расходятся и опять сходятся вместе, при этом узел графа может иметь несколько узлов-родителей. Такой тип графа называют путанным. Деревья – самый распространенный вид иерархии – граф с одной вершиной. Правила топологии для данного графа: вершина графа представляет собой один общий тип, каждый другой узел имеет лишь одного родителя. Решетка – в отличие от деревьев узлы в решетке могут иметь несколько узлов родителей. Однако здесь налагаются другие ограни-чения: любая пара типов Х и У как минимум должна иметь общий гипертип (родителя) и подтип (потомка). Вследствие этого ограничения решетка вы-глядит, как дерево, имеющее одну главную вершину, которая является ги-пертипом всех категорий, и другую вершину – подтип всех узлов.

Существует множество реализаций семантических сетей: реляцион-ные графы, TCL-модель Куиллиана, пропозиционные сети, графы с цен-тром в глаголе, иерархические сети. Различным модификациям семантиче-ских сетей присущ ряд сходств:

33

1. Узлы семантических сетей представляют собой концепты (понятия) предметов, событий, состояний.

2. Различные узлы одного концепта относятся к различным его значениям. 3. Дуги семантических сетей определяют отношения между узлами-

концептами (пометки над дугами указывают на тип отношения). 4. Отношения между концептами представляют собой временные, простран-

ственные, логические отношения, также лингвистические падежи, такие как агент, объект, реципиент, отношения между предложениями и другие.

5. Концепты организованы по уровням иерархии в соответствии со степе-нью обобщенности.

Среди многочисленных реализаций одной из классических моделей считается семантическая сеть Куиллиана. В качестве структурной модели долговременной памяти Куиллиан предложил модель понимания смысла слов, получившую название TLC-модели (Teachable Language Comprehender: доступный механизм понимания языка). В данной модели для описания структуры долговременной памяти была использована сете-вая структура как способ представления семантических отношений между концептами (словами). Данная модель имитирует естественное понимание и использование языка человеком. Поэтому основной ее идеей было опи-сание значений класса, к которому принадлежит объект, его прототипа и установление связи со словами, отображающими свойства объекта. В каче-стве примера на рис.4 показана простая семантическая сеть для представ-ления концептуального объекта «чайник». В этой сети определены опера-торы отношений, называемые классом, свойством и примером, для кото-рых описаны значения.

ЧАЙНИК

Емкость

Металлический, синий в цветочек, с носиком

Материал: металл, фарфор

класс

свойство

пример

Рис. 4. Образец семантической сети

34

В модели Куиллиана концептуальные объекты представлены ассоциативными сетями, состоящими из вершин показывающих концепты, и дуг, показывающих отношения между концептами. Например, в сети, показанной на рис. 4, с отношением «класс» ассоциируется значение «емкость», со свойством – «металлический», «фарфоровый», с примером – «металлический чайник», «синий в цветочек», «наличие носика». Подобная ассоциативная структура называется плоскостью, описываемые концепты объекта называются вершинами типа, а связанные с ними соответствующие отдельные слова (ассоциативные слова) – вершинами лексем. Вершины лексем определяют всевозможные сущности, имеющие место в реальном мире, например классы, свойства, примеры, время, место, средство, объекты и т. п. Преимущество лексем по сравнению с типами заключается в экономии пространства памяти ЭВМ. Это означает и факт предотвращения дублирования определения концептов.

В TLC-модели используется представление данных в форме «эле-мент» и «свойство».

Словарь Садовод ……….. человек ………..

Организация долговременной памяти

( садовод )* *

( человек )* * … *

( * * * ) ( * * )

выращивать фрукты и овощи

Рис. 5. Представление знаний в долговременной памяти для TLC-модели Куиллиана

На рис. 5 показаны эти отношения. Список свойств состоит из пар

«атрибут – значение». Элемент, представляющий понятие «садовод», имеет один список свойств, при этом атрибуты свойств и их значения декларируют предложение «фрукты и овощи». Далее свойство нижнего уровня имеет также атрибут, называемый «кем», значение которого связано с исходным элементом «садовод». В конечном итоге получается,

35

что это представление описывает контекст «садовод – это человек, который выращивает фрукты и овощи».

На рис. 6 изображен еще один пример семантической сети. В качест-ве вершин понятия: Человек, Иванов, Волга, Автомобиль, Вид транспорта, Двигатель.

Рис. 6. Пример семантической сети Поиск решения в базе знаний сводится к поиску фрагмента сети, со-

ответствующего поставленному вопросу. Предложение (вопрос) на естест-венном языке формализуется в виде фрагмента семантической сети. Его поиск проводится в сети по известным из вопроса значениям узлов. Затем по найденному в сети фрагменту определяют неизвестные узлы, и полу-ченный участок сети переводят на естественный язык (рис. 7).

Рис. 7. Поиск решения в семантической сети

36

Например, база знаний описывает экономические отношения пред-приятий и организаций города (рис. 8, а). Запрос «Чем владеет компания ”Рога и копыта”?» представляется в виде подсети (рис. 8, б). Задача меха-низма поиска – найти i экземпляр узла «владение», для которого атрибут «владелец» имеет значение «компания “Рога и копыта”?» и затем опреде-лить неизвестный атрибут «объект владения». Для более сложного запроса к данной сети: «Какие предприятия общественного питания принадлежат организациям со статусом ОАО?» кроме сопоставления частей сетевой структуры используется механизм наследования. Следует отметить, что описание семантическими сетями целесообразно использовать в моделях с разнообразными конфигурациями связей (ситуациями), а не там, где суще-ствует много экземпляров однотипных фрагментов, например, записи в базах данных.

Рис. 8. Пример поиска в базе знаний на основе семантической сети Другой способ вывода именуется перекрестным поиском. В этом

случае осуществляется поиск общих отношений между исходными кон-цептуальными объектами, а результатом становится фрагмент сети с цен-тром в узле, где пересекаются дуги, идущие от узлов запроса. Например, существует сеть, описывающая услуги коммерческих организаций физиче-ским лицам определенного региона. Вопрос к базе знаний «Какие отноше-ния между коммерческим банком (КБ) «Бакс» и Ивановым И. И.?» в фор-мализованном виде представлен на рис. 9. В примере происходит перебор отношений КБ «Бакс» с физическими лицами или отношений физического

37

лица Иванов И. И. с банками, находится общий узел «давать i» (выдача кредита) и строится соответствующий ответ: «Иванов И. И взял кредит в КБ ”Бакс”».

Рис. 9. Пример перекрестного поиска в семантической сети Семантические сети удобны для чтения и обработки компьютером, а

также достаточно мощны, чтобы представить семантику естественного языка. Первоначальное назначение семантических сетей – это синтаксиче-ский анализ языка. С 80-х гг. границы между сетями, фреймовыми струк-турами, линейными формами записи стали стираться. Знания, описанные с помощью одной модели, могут быть переведены в другую. Раньше основ-ным критерием выбора модели для описания решаемой задачи считалась выразительность, в настоящее время в качестве критериев используются такие как читаемость, эффективность, не искусственность и теоретическая элегантность, легкость введения в компьютер. Основное преимущество этой модели – она построена в соответствии с современными представле-ниями об организации долговременной памяти человека, ее недостаток – сложность поиска и вывода на семантической сети. Для реализации семан-тических сетей существуют специальные сетевые языки, например NET и др. Известны экспертные системы, использующие семантические сети в качестве языка представления знаний – PROSPECTOR, CASNBT, TORUS.

38

3.4. Системы, основанные на правилах В основе систем, использующих правила, лежат конструкции вида

«Если ПОСЫЛКА, то СЛЕДСТВИЕ», называемые правилами. В зависи-мости от того, что входит в ПОСЫЛКУ и СЛЕДСТВИЕ: логическая формула, высказывания, предикаты, лингвистические переменные, про-цедуры или функции; и от того в каком порядке правила выполняются – различают продукционные системы, системы, в основе которых лежат различного рода исчисления и программные продукты, использующие нечеткий вывод. Во всех случаях совокупность правил образует базу знаний.

Исчисление – формальная система, задаваемая четверкой <Т,В,А,Р>, где Т – множество базовых символов исчисления; В – син-таксические правила, с помощью которых из элементов Т порождаются другие элементы; А – множество априорно истинных элементов (аксиомы); Р – множество семантических правил (правил вывода), с помощью которых из одних элементов системы порождаются другие. Правило вывода – правило, с помощью которого из множества аксиом порождаются правильно построенные формулы, которые интерпрети-руются как истинные.

В искусственном интеллекте используются различные исчисле-ния: исчисление высказываний, исчисления предикатов, исчисление классов, исчисление отношений, многосортные и многозначные логи-ки и т.п.

В основе логического исчисления лежит понятие формальной систе-мы – системы, состоящей из множества базовых элементов, синтаксиче-ских правил, аксиом и правил вывода.

Исчисление высказываний – формальная система высказываний и отношений между ними, базовыми элементами которой являются выска-зывания – нерасчлененные предложения, относительно которых в каж-дый момент можно утверждать, что они либо абсолютно истинны, либо абсолютно ложны. Связи между высказываниями задаются логическими связками: "и", "или", "не", "если..., то" (отрицанием, дизъюнкцией, конъюнкцией, импликацией и др.). Исчисление высказываний непроти-воречиво, поскольку в нем не существует формулы A такой, что дока-зуемо и A, и «не A». Оно также является полным в том смысле, что

39

добавление любой недоказуемой формулы в качестве новой аксиомы должно приводить к противоречию (рис. 10).

Рис. 10. Свойства моделей в исчислении высказываний Под высказыванием обычно понимают всякое повествовательное

предложение, утверждающее что-либо о чем-либо, и при этом мы можем сказать, истинно оно или ложно в данных условиях места и времени. Ло-гическими значениями высказываний являются «истина» и «ложь». При-меры высказываний:

1. Цель коммерческой деятельности – получение прибыли. 2. Расходы по организации корпоративной вечеринки относятся к за-

тратам на производство. 3. ОАО «Траст» не юридическое лицо. 4. Ставка НДС установлена 0 %, 10 % и 18 %. 5. Если товар отгружен со склада, то оформляется накладная. Высказывания 1), 4), 5) истинны, а 2) и 3) – ложны. Предложение «Да здравствуют свобода!» не является высказывани-

ем. Высказывание, представляющее собой одно утверждение, принято на-зывать простым или элементарным. Высказывания, которые получаются из элементарных с помощью грамматических связок «не», «и», «или», «если …, то …», «тогда и только тогда», принято называть сложными или со-ставными. Так, высказывание 3) получается из простого высказывания «ОАО «Траст» не юридическое лицо» с помощью отрицания «не».

Формулы исчисления высказываний обозначаются заглавными бук-вами и представляют собой последовательности символов алфавита: пере-менных, обозначаемых малыми буквами латинского алфавита, символов

логических связок «∨», «∧», «¬», «→» и скобок. Определение формулы исчисления высказываний.

1. Всякая переменная x, y, z является формулой. 2. Если А и В – формулы , то ( ) ( ) ( ) АВАВАВА ,,, →∨∧ – тоже формулы. 3. Никакая другая строчка символов не является формулой.

1)2)

40

Практическое значение любого исчисления состоит в получении не-известных формул и значений переменных, в них стоящих, с помощью системы аксиом и правил вывода. Последовательность рассуждений, при-водящая от посылок к следствию с использованием аксиом и правил выво-да, называется логическим выводом.

В исчислении высказываний определено два правила вывода: а) пра-вило заключения (Modus ponens); б) правило подстановки (Modus tollens). Правило заключения формулируется следующим образом: «Если выведе-ны A и (A B), то B выводимо». Правомерность этого правила очевидна: если импликация и посылка истинны, то заключение в импликации может быть только истинным. Правило подстановки утверждает: если формула А выводима (доказуема) в исчислении высказываний, х – переменная, В – произвольная формула исчисления высказываний, то формула, полученная в результате замены в формуле А переменной х всюду, где она входит, формулой В, является также выводимой формулой. Это правило использу-ется в методе резолюций, который применяется при дедуктивном выводе.

Исчисление предикатов. В исчислении высказываний высказывания рассматриваются как нераздельные целые и только с точки зрения их ис-тинности или ложности.

Ни структура высказываний, ни, тем более, их содержание не затра-гиваются. В то же время на практике используются заключения, сущест-венным образом зависящие как от структуры, так и от содержания исполь-зуемых в них высказываний.

Например, в рассуждении «Всякий ромб – параллелограмм; АВСD – ромб; следовательно, АВСD – параллелограмм» посылки и заключение яв-ляются элементарными высказываниями логики высказываний и с точки зрения этой логики все три утверждения рассматриваются как неделимые, и их элементы нельзя скомбинировать в приведенное рассуждение.

В связи с этим возникает необходимость в расширении логики вы-сказываний, в построении такой логической системы, средствами которой можно было бы исследовать структуру тех высказываний, которые в ее рамках рассматриваются как элементарные. Такой логической системой является логика предикатов.

В исчислении предикатов наряду с формулами исчисления высказы-ваний используются формулы, в которые могут входить отношения (пре-дикаты), связывающие между собой группы элементов исчисления, и кванторы общности (∀) и существования (∃).

41

Логика предикатов расчленяет элементарное высказывание на субъ-ект (подлежащее) и предикат (сказуемое). Субъект – это то, о чем утвер-ждается в высказывании; предикат – это то, что утверждается о субъекте.

Например, в высказывании «7 – простое число», 7 – субъект, простое число – предикат. Это высказывание утверждает, что 7 обладает свойством «быть простым числом».

Рассмотрим основные положения логики предикатов. Пусть имеется некоторое множество объектов, называемых предмет-

ной областью. Знаки, обозначающие элементы этого множества, называют предметными константами, а знак, обозначающий произвольный элемент этого множества, – предметной переменной.

Выражение Р(х1, х2,,… хп),где xi, i=1,n – предметные переменные, а Р принимает значения 0 и 1, называется логической функцией или предика-том. Предикат, зависящий от п различных предметных переменных, назы-вается п -местным предикатом.

Если заменить все xi на у, где у – предметная константа или пере-менная, то получим элементарную формулу. Из элементарных формул с

помощью логических связок «∨» (или), «∧» (и), «¬» (отрицание), «→» (импликация) строят предикатные формулы – правильно построенные формулы (ППФ). Кроме логических связок в рассмотрение вводят кванто-ры общности «∀» и существования «∃».

Под интерпретацией предикатных формул понимают конкретизацию предметной области, соответствующей данной предикатной формуле, и установление соответствия между символами, входящими в предикат, и элементами (а также функциями и отношениями), определяемыми в дан-ной предметной области.

Результат вывода на предикатах – формулы, выводимые из аксиом с помощью правил вывода. Для организации логического вывода могут ис-пользоваться различные правила, в частности

Modus ponens, Modus tollens. Для решения конкретной задачи начальное состояние и доступные

операторы действий переводятся в формулы исчисления предикатов и до-бавляются к множеству аксиом. Целевое состояние также выражается формулой и рассматривается как теорема, которая должна быть выведена из аксиом с помощью механизма вывода. Последовательность дедукций определяет «план» того, как достигнуть цели из начального состояния.

42

Системы представления знаний на основе исчисления предикатов имеют ряд достоинств: они достаточно хорошо исследованы как формаль-ная система, их синтаксис и интерпретация хорошо определены. Сущест-вуют точные правила вывода, множество теорем системы, то есть резуль-таты операций над базой знаний также ясно определены.

Основной недостаток систем представления знаний на базе исчисле-ния предикатов состоит в их ограниченной выразительности, ибо сущест-вует большое число фактов, которое тяжело или даже невозможно выра-зить средствами исчисления предикатов. Поиск путей преодоления этого недостатка ведется в основном в двух направлениях:

1. Расширение и модификация логики предикатов. Модальная ло-гика позволяет представлять некоторые модальности, такие, как «необ-ходимость», «возможность» и др. Вероятная логика дает возможность определять вероятности истинности или ложности высказываний. Большие надежды возлагаются на многозначные и нечеткие логики, в которых оценка истинности высказываний может принимать дискрет-ные или непрерывные значения из интервала между «истиной» и «ло-жью». Эти логики могут быть использованы для представления неточ-ных или неопределенных знаний.

2. Разработка глобальных механизмов представления. Согласно этому направлению исследований системы, основанные на исчислении предикатов и связанный с ним формализм, применимы лишь для пред-ставления «локальных» знаний, т. е. небольших и четко ограниченных областей знаний. Эти знания должны быть объединены в глобальную схему, которая реализует связи между этими кластерами знаний.

В настоящее время аппарат исчисления предикатов в чистом виде используются редко, однако он послужил основой большинства языков логического представления знаний, в частности языка Пролог.

Продукционная система отличается от других систем, основанных на правилах тем, что порядок выполнения правил здесь несущественен. Этот порядок находится под управлением стратегии вывода – совокупно-сти правил, с помощью которых организуется выбор правил вывода в фор-мальных системах или выбор продукций в системе продукций при поиске решения. Наиболее известные стратегии в формальных логических систе-мах – это прямой вывод и обратный вывод. В системах продукций извест-но много стратегий: принцип «доски объявлений», учет наиболее длинного условия продукции, принцип «повестки дня» и т. п.

43

Продукционные системы, являющиеся подклассом систем, основан-ных на правилах, позволяют добавлять вновь приобретенное знание без реорганизации полной совокупности правил вывода.

Продукционные модели – это набор правил вида «условия – дейст-вие», где условиями являются утверждения о содержимом некой базы дан-ных (БД), а действия представляют собой процедуры, которые могут изме-нять содержимое БД. В продукционных системах можно выделить три ос-новные компоненты:

1. Неструктурированная или структурированная БД. 2. Некоторое число продукционных правил или просто продукций. 3. Интерпретатор, который последовательно определяет, какие про-

дукции могут быть активированы в зависимости от условий, в них содер-жащихся; выбирает одно из применимых в данной ситуации правил про-дукций; выполняет действие из выбранной процедуры.

Каждая продукция состоит из двух частей: • условий (антецедент); в этой части определяются некоторые условия,

которые должны выполняться в БД для того, чтобы были выполнены соответствующие действия;

• действий (консеквент); эта часть содержит описание действий, которые должны быть совершены над БД в случае выполнения соответствую-щих условий. В простейших продукционных системах они только опре-деляют, какие элементы следует добавить (или удалить) в БД. Действия продукций могут состоять из активных процедур, которые автоматиче-ски производят необходимые операции над содержимым БД. В после-дующих итерациях факты, добавленные в БД, могут активировать дру-гие продукции.

В общем виде под продукцией понимается следующее выражение: «(i); Q; Р; С; А=>В; N». Здесь (i) – имя (метка) продукции; Q – сфера применения, вычленяющая из предметной области неко-

торую ее часть, в которой знание, заключенное в продукции, имеет смысл; Р – предусловие, содержащее информацию об истинности данной

продукции, ее приоритетности и т. п., используемую в стратегиях управле-ния выводом при выборе данной продукции для исполнения;

С – условие применимости ядра продукции. Обычно Р представляет собой логическое выражение. Когда Р принимает значение «истина», ядро продукции активизируется. Если Р ложно, то ядро продукции не может

44

быть использовано. Например, если в продукции «Наличие денег. Если хо-чешь купить вещь x, то заплати в кассу ее стоимость и отдай чек продав-цу», условие применимости ядра продукции ложно, т. е. денег нет, то при-менить ядро продукции невозможно.

А=>В – ядро продукции (интерпретация ядра может быть различной, например: «Если А истинно, то В истинно», «Если А имеется в базе зна-ний, то В надо внести в базу знаний», «Если А текущая ситуация, то надо делать В» и т.п.);

N описывает постусловия продукции. Они актуализируются только в том случае, если ядро продукции реализовалось. Постусловия продукции описывают действия и процедуры, которые необходимо выполнить после реализации В. Например, после покупки товара в магазине необходимо в базе товаров уменьшить количество товаров.

Если в памяти системы хранится некоторый набор продукций, то они образуют систему продукций. Система продукций – это совокупность множе-ства продукций, выполнение которых задается с помощью стратегии управле-ния выводом. Стратегия определяется машиной вывода М = <M1, M2, M3 >, где М1 формирует набор продукций, для которых выполнены условия их при-менимости; М2 производит выбор из этого набора той, которая будет выпол-няться на данном шаге процесса, М3 вносит необходимые изменения в про-дукции, входящие в систему, на основании информации, которая содержалась в постусловии продукции, выполненной на данном шаге процесса.

В ряде интеллектуальных систем используются комбинации сетевых и продукционных моделей представления знаний. В таких моделях декла-ративные знания описываются в сетевом компоненте модели, а процедур-ные знания – в продукционном. В этом случае говорят о работе продукци-онной системы над семантической сетью.

Продукционные системы, в которых сначала анализируется антеце-дентная часть (условия), имеют условно-выводимую архитектуру.

Альтернативным типом архитектуры, которая достаточно часто ис-пользуется в экспертных системах, являются целе-выводимые (действие-выводимые или консеквент-выводимые) продукционные системы. В по-следнем случае цель должна быть достигнута дедуктивным выводом. Для этого исследуются консеквенты правил для нахождения такого правила, которое позволило бы достичь цели. Когда такое правило найдено, его ус-ловия проверяются на истинность. Если условия истинны, продукция ак-тивируется, иначе продолжается поиск подходящей продукции.

45

Продукционные системы используются для областей знаний, в кото-рых известен только некоторый набор независимых правил (эвристик), а не четкая теория, вполне завершенная и последовательная, и где, поэтому нет алгоритмов, прямо приводящих к цели.

Продукции наряду с фреймами – наиболее популярные средства пред-ставления знаний в системах искусственного интеллекта (ИИ). Продукции, с одной стороны, близки к логическим моделям, что позволяет организовы-вать на них эффективные процедуры вывода, а с другой стороны, более на-глядно отражают знания, чем классические логические модели. В них от-сутствуют жесткие ограничения, характерные для логических исчислений, что дает возможность изменять интерпретацию элементов продукции.

3.5. Нечеткие множества Математическая теория нечетких множеств (fuzzy sets) и нечеткая ло-

гика (fuzzy logic) – обобщения классической теории множеств и классичес-кой формальной логики. Прилагательное «fuzzy» переводится как нечеткий, размытый, ворсистый, пушистый. Данные понятия были впервые предло-жены американским ученым Лотфи Заде (Lotfi Zadeh) в 1965 г. Первый не-четкий контроллер для управления паровым двигателем был создан в 1975 г. В конце 80-х гг. Бартоломеем Коско была доказана теорема, которая стала отсчетом широкого практического применения нечетких вычислений. Сог-ласно ей любая математическая система может быть аппроксимирована си-стемой, основанной на нечеткой логике. Другими словами, с помощью есте-ственно-языковых высказываний-правил «Если – то», с последующей их формализацией средствами теории нечетких множеств можно сколько уго-дно точно отразить произвольную взаимосвязь «вход – выход».

Системы, основанные на нечетких множествах, внедрены в таких областях, как управление технологическими процессами, управление транспортом, медицинская и техническая диагностика, финансовый ме-неджмент, биржевое прогнозирование, распознавание образов.

В основе понятия нечеткого множества лежит представление о том, что составляющие множество элементы принадлежат к нему с различной «силой», которая оценивается степенью принадлежности – числом из диа-пазона [0, 1]. Функция принадлежности – это функция, позволяющая вы-числить степень принадлежности произвольного элемента к данному мно-жеству (рис. 11). Пусть Х – универсальное множество, тогда нечетким

46

множеством X~ на множестве Х называется совокупность пар вида ( ) }μ{~ xxX X= , где ( )xxμ – функция принадлежности, х – переменная базово-

го множества Х (например, множества действительных чисел).

Рис. 11. Функция принадлежности

Например, при определении нечеткого понятия «горячая вода» в ка-

честве x выступает шкала температуры в градусах Цельсия, изменяющаяся в интервале от 0 до 100 градусов. Нечеткое множество понятия «горячая

вода» представлено парами: X% ={0/0; 0/10; 0/20; 0,15/30; 0,30/40; 0,60/50; 0,80/60; 0,90/70; 1/80; 1/90; 1/100}. Вода с температурой 60 º С принадлежит к множеству «горячая вода» со степенью 0,8.

Функцию принадлежности интерпретируют следующим образом: величина ( )x xμ обозначает субъективную оценку степени принадлежности х

множеству X% , например, ( )x xμ =0,8 означает, что х на 80 % принадлежит X% . Например, утверждение «х приблизительно равно 3» может быть

представлено соответствующей функцией принадлежности ( рис. 12 ).

0,000,100,200,300,400,500,600,700,800,901,00

0,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00

Рис. 12. Функция принадлежности «х приблизительно равно 3»

47

К основным понятиям теории нечетких множеств относятся нечеткое число, нечеткая и лингвистическая переменная.

Нечетким числом называется нечеткое множество с кусочно-непрерывной функцией принадлежности, заданное на множестве действи-тельных чисел.

Нечеткую переменную определяют ее название, область определе-ния, функция принадлежности. Формальное описание нечеткой перемен-

ной представлено тройкой < L, D, X% > , где L – наименование нечеткой

переменной; D – область ее определения ; X% = ( ){ }x xμ – нечеткое множество на D. Нечеткие переменные могут быть значениями лингвисти-ческой переменной.

Лингвистическая переменная позволяет адекватно отразить прибли-зительное словесное описание предметов и явлений в том случае, когда точное детерминированное описание отсутствует. Например, при обучении вождению инструктор командует «возьми левее», а не «поверни руль на 30◦12″». «Возьми левее» – неопределенная категория, которая не может быть выражена средствами классической теории.

Для определения лингвистической переменной задаются имя, множе-ство возможных значений (терм–множество, термом называется любой элемент терм–множества), правила, с помощью которых из имеющихся элементов терм-множества, могут получаться новые, а также правила, согласно которым значения лингвистической переменной ставятся в соот-ветствие нечеткие множества. Формально это представляется так

< L, T, D, G , M >, где L – наименование лингвистической переменной;

T – множество значений лингвистической переменной (терм-множество), определенное на D;

G – грамматика, совокупность правил, позволяющая оперировать эле-ментами терм-множества Т , в частности генерировать новые осмысленные термы;

М – процедура, позволяющая установить соответствие между лингвис-тическим значением и нечетким множеством, то есть правила вычисления функции принадлежности нового значения, определенного G.

Пример. Рассмотрим переменную «температура в комнате», которая оценивается по шкале «холодно», «комфортно», «жарко». В этом примере лингвистической переменной является «температура в комнате», термами –

48

лингвистические оценки «холодно», «комфортно», «жарко», терм-множество – Т = {«холодно», «комфортно», «жарко»} с функциями принад-лежностями µ( u є U ) на универсальном множестве U = [10; 30] (рис. 13).

Рис. 13. Лингвистическая переменная «температура в комнате» Синтаксические правила G, порождающие новые термы с использо-

ванием квантификаторов «не», «очень» и «более-менее», семантические правила М, определяющие функции принадлежности новых значений, определенных в G, представлены в виде табл. 1.

Таблица 1

Квантификатор Функция принадлежности µ( u є U )

не t

очень t

более-менее t

Графики функций принадлежности термов «холодно», «не очень хо-

лодно», «комфортно», «более-менее комфортно», «жарко» и «очень жар-ко» лингвистической переменной «температура» показаны на рис. 13.

49

Операции над нечеткими множествами В рассматриваемой теории определяются три вида операций: теоре-

тико-множественные операции над нечеткими множествами, арифметиче-ские операции над нечеткими числами (нечеткая арифметика), логические операции (нечеткая логика).

В отличие от обычных множеств нечеткие теоретико-множественные операции могут быть определены не одним, а множеством методов, так как степень принадлежности может принимать значения из интервала [0, 1]. Ниже приведены классические определения нечетких теоретико-множественных операций.

Объединением нечетких множеств А и В на U (рис. 14) называют не-четкое множество вида

( ) ( )( ) ,A BU

AYB x x x= μ ∨ μ∫

где ( ) ( )( ) ( ) ( ){ }μ max , ,A B A Bx x x x x U∨ μ = μ μ ∈ . Знак интеграла здесь и для всех последующих операций обозначает

их выполнение над всеми элементами множеств А и В. Пересечением нечетких множеств А

и В из U (рис. 15, а)называют нечеткое множество вида

( ) ( )( ) ,A BU

AIB x x x= μ ∧ μ∫

где ( ) ( )( ) ( ) ( ){ }min , ,A B A Bx x x x x Uμ ∧ μ = μ μ ∈

а) б)

Рис. 15. Пересечение и дополнение нечетких множеств Дополнением или отрицанием (рис. 15,б) нечеткого множества А на-

зывают нечеткое множество вида ( )( )1 , .A

U

A x x x U= − μ ∈∫

Рис. 14. Объединение нечетких множеств

50

Концентрирование нечеткого множества А из U, осуществляющее ограничение числа элементов множества, определяют в виде (рис. 16,а)

( ) ( )( )2, .A

U

CON A x x x U= μ ∈∫

Растяжение нечеткого множества А из U, осуществляющее увели-чение числа элементов множества, определяют в виде (рис. 16,б)

( ) ( )( )0.5, A

U

DIL A x x x U= μ ∈∫

а) б)

Рис. 16. Концентрация и растяжение нечетких множеств

Включение. Пусть А и В – произвольные нечеткие множества из U. Говорят, что А включает в себя В ( )B A⊆ , если

( ) ( ), B Ax U x x∀ ∈ μ ≤ μ . Нечеткая арифметика В нечеткой арифметике имеются такие же операции, как в традици-

онной: сложение, вычитание, умножение, деление, возведение в степень и другие, но выполняются они над нечеткими числами.

Как и операции над нечеткими множествами операции над нечеткими числами могут быть реализованы несколькими способами, например, с ис-пользованием L-R аппроксимации или с помощью разложения на α-уровневые множества. Нечеткое число не имеет противоположного и обра-тного чисел, а арифметические операции умножения и сложения для нечет-ких чисел коммутативны, ассоциативны и в общем виде не дистрибутивны.

Рассмотрим операции для треугольных функций принадлежности на основе L-R аппроксимации. Функция принадлежности суммы также будет треугольной и представляться уравнением ( ) 0x a kxμ = + . (рис. 17). При этом ее границы и вершина вычисляются по формулам:

для сложения для вычитания х3* = х1* + х2*; х3* = х1* - х2*; хL3 = хL1 + хL2; хL3 = хL1 - хL2; хR3 = хR1 + хR2; хR3 = хR1 - хR2.

51

Для операций умножения (рис.18) и деления, предполагая сохраняе-мость треугольной функции принадлежности, выполняются соотношения: для умножения для деления

х3* = х1* · х2*; х3* = х1* / х2*; хL3 = хL1 · хL2; хL3 = хL1 / хL2; хR3 = хR1 · хR2; хR3 = хR1 / хR2,

а результирующие функции принадлежности имеют вид:

( )3 0 1x x a k xμ = + и ( )

3

10x

kx ax

μ = + соответственно.

1-е нечеткое число Сумма2-е нечеткое число

00,10,20,30,40,50,60,70,80,9

1µ

X

X1L X2L X3L X1R X2R X3R

X1* X2* X3*

Рис. 17. Сложение нечетких чисел L-R аппроксимации

1-е нечеткое число Произведение

2-е нечеткое число

00,10,20,30,40,50,60,70,80,9

1µ

X

X1L X2L

X3L

X1R X2R X3R

X1* X2* X3*

Рис. 18. Умножение нечетких чисел L-R аппроксимации

52

В общем случае для нечетких чисел с функцией принадлежности про-извольного вида арифметические операции осуществляются с помощью разложения на α-уровни, который состоит в том, что исходные числа раз-биваются с шагом h на уровни по оси µ, над значениями базовой перемен-ной х на соответствующем α-уровне выполняется арифметическая опера-ция, полученные на каждом уровне точки формируют функцию принадле-жности результата (рис. 19).

0

0,1

0,2

0,3

0,40,5

0,6

0,7

0,8

0,9

1

X

µ

X1α1 X2α1 X3α1

X1αi X2αi X3αi

Рис. 19. Сложение нечетких чисел с использованием α-уровней

Нечеткая логика В нечеткой логике значения истинности задаются термами лингвис-

тической переменной «истинность». Правила выполнения нечетких логи-ческих операций определяются с помощью принципа обобщения Заде.

Если y = f (x1, x2, … , xn) – функция от n независимых переменных и аргументы x1, x2, … , xn заданы нечеткими числами 1 2, , , nx x x…% % % , соответ-ственно, то значением функции 1 2 ( , , , )ny f x x x= …% % % % называется нечет-кое число y~ с функцией принадлежности:

**

* * *1 2

*

min(μ ( ))supμ ( ), ,..., ) 1,

sup( )

=

=

∈

%%

%

ix iy

n

i i

xyx x i n

x x

Принцип обобщения позволяет найти функцию принадлежности нечетко-го числа, соответствующего значения четкой функции от нечетких аргументов.

* * * *1 2

*

( , ,..., )sup( )

=∈ %

n

i i

y f x x xx x

*min (μ ( ))1,=

%i

xx ii n

53

Обозначим нечеткие логические переменные через Α~ и Β~ , а функ-ции принадлежности, задающие истинностные значения этих переменных через ( )uΑμ % и ( )uΒμ % , u є [0;1].

Нечеткие логические операции И (^), ИЛИ ( ), НЕ ( ) и импликация ( ) выполняются по таким правилам:

( ) m in ( ( ) , ( )) ;u u uΒΑ ∧ Β Αμ = μ μ% % %%

( ) m ax( ( ), ( ));u u uΒΑ ∨ Β Αμ = μ μ% % %%

( ) 1 ( ) ;u uΑ Αμ = − μ %

( ) m ax(1 ( ), ( )).u u uΒΑ⇒ Β Αμ = − μ μ% % %% Нечеткий логический вывод Как и в случае строгого логического вывода цель нечеткого – на ос-

нове сформированной базы правил и заданных значений входных пере-менных получить значения выходных параметров.

Нечетким логическим выводом (fuzzy logic inference) называется ап-проксимация зависимости каждой выходной линг-вистической переменной от входных переменных с использованием нечет-кой базы знаний и нечетких правил. Вывод называется нечетким, если база правил состоит из нечетких правил и/или входные переменные и выходные параметры заданы в виде нечетких чисел.

Нечеткая база знаний – это совокупность нечетких правил «Если – то», определяющих взаимосвязь между входами и выходами исследуемого объекта (рис. 20). Обобщенный формат нечетких правил такой:

Если посылка правила, то заключение правила.

Рис. 20. Аппроксимация системы нечеткими правилами

База правил

ЕСЛИ … ТО … ЕСЛИ … ТО … ЕСЛИ … ТО … ЕСЛИ … ТО … ЕСЛИ ... ТО ...

Х1

ХN

Y1

YM

54

Входные и выходные параметры системы рассматриваются как лин-гвистические переменные, а формализованная модель задается совокупно-стью высказываний следующего вида:

L1 : если <A1 > то <B1 >, L2 : если <A2 > то <B2 >, .................... Lk : если <Ak > то <Bk >,

где <Ai>, i=1,2,..,k – составные нечеткие высказывания, определенные на зна-чениях Х входных лингвистических переменных, а <Bi>, i = 1,2,..,k – высказы-вания, определенные на значениях Y выходных лингвистических переменных. Совокупность импликаций {L1, L2, ..., Lk} отражает функциональную взаимос-вязь входных и выходных переменных. Результатом нечеткого вывода являет-ся значение переменной y* из Y на основе заданных четких значений xk из X.

Например, в случае управления роботом введем две лингвистические переменные: ДИСТАНЦИЯ (расстояние до помехи) и НАПРАВЛЕНИЕ (угол между продольной осью робота и направлением на помеху).

Рассмотрим лингвистическую переменную ДИСТАНЦИЯ: ее значения-ми определим термы ДАЛЕКО, СРЕДНЯЯ ДИСТАНЦИЯ, БЛИЗКО и ОЧЕНЬ БЛИЗКО. Для лингвистической переменной необходимо определить числовые значения термов – переменная ДИСТАНЦИЯ может принимать любое значе-ние из диапазона от нуля до бесконечности. Каждому значению расстояния по-ставлено в соответствие число от нуля до единицы, которое определяет степень принадлежности данного расстояния (допустим 40 см) к тому или иному терму. Степень принадлежности определяется значением функции принадлежности µ(d), где d – расстояние до помехи. Расстоянию 40 см задана степень принадле-жности к терму ОЧЕНЬ БЛИЗКО равная 0,7 , а к терму БЛИЗКО – 0,3 (рис. 21).

Переменной НАПРАВЛЕНИЕ, которая может принимать значения в диапазоне от 0 до 360 градусов, заданы термы ЛЕВОЕ, ПРЯМО И ПРАВОЕ.

О ч ен ь б л и з к о б л и з к о с р е д н я я д ал е к о

Д и ст а н ц и я от р о б о т а д о п ом ехи

Д и с т а н ц и я = (о ч ен ь б л и зк о , б л и зк о , ср е д н я я , д а л ек о )

Л и н г в и ст и ч е с к а я п е р ем е н н а я Т ер м ы

µ

1 0 ,7

0 ,3 4 0 d , см

Рис. 21. Лингвистическая переменная ДИСТАНЦИЯ

55

В рассматриваемом примере выходные переменные – это УГОЛ ПОВОРОТА РУЛЯ. Он содержит термы: РЕЗКО ВЛЕВО, ВЛЕВО, ПРЯ-МО, ВПРАВО, РЕЗКО ВПРАВО. Связь между входом и выходом запоми-нается в таблице нечетких правил (рис. 22).

если ДИСТАНЦИЯ БЛИЗКАЯ И НАПРАВЛЕНИЕ ПРАВОЕ

то УГОЛ ПОВОРОТА РУЛЯ = РЕЗКО ВЛЕВО

Очень близко

близко средняя далеко

направление правое Резко

влево Резко влево

влево прямо

прямо Резко влево

влево влево Прямо

левое Резко вправо

Резко вправо

вправо прямо

если ДИСТАНЦИЯ ДАЛЕКО

то УГОЛ ПОВОРОТА РУЛЯ = ПРЯМО

Рис. 22. Таблица нечетких правил Каждая запись в данной таблице соответствует своему нечеткому

правилу, например: Если ДИСТАНЦИЯ БЛИЗКО и НАПРАВЛЕНИЕ ПРАВОЕ, тогда

УГОЛ ПОВОРОТА РУЛЯ = РЕЗКО ВЛЕВО. Количество правил может быть и меньше числа возможных сочета-

ний входных переменных, тогда таблица будет неполная. В общем случае процесс вывода представляется следующими этапами (рис. 23):

Рис. 23. Последовательность нечеткого вывода Фазификация входных переменных представляет собой процедуру

нахождения значений функций принадлежности, на основании заданных значений входных переменных. Например, для расстояния ДИСТАНЦИИ 40 см определяется степень принадлежности к терму БЛИЗКО, равная 0,3.

Фази-фикация

Приведение соста-вных условий пра-вил к простым

Свертка правил (операция имп-

ликации)

Объединение результатов импликаций

Дефази-фикация

56

Посылка правила – это выражение, в которое можно включать не-сколько нечетких переменных. На 2-м этапе происходит вычисление вы-ражения по правилам операций над нечеткими множествами.

Свертка – это нахождения степени истинности каждого из заключений, входящих в продукционные правила. Основу нечеткого логического вывода составляет композиционное правило Заде, соответствующая операция имплика-ции А В правил проводится согласно выбранному методу (формуле):

1. 2. 3. 4.

5.

6.

7.

8. Результаты импликаций агрегируются (композиция) по всем правилам

из базы знаний с получением ответа – нечеткого числа для каждой выводи-мой лингвистической переменной. Обычно используются операции объеди-нения множеств или суммы. В зависимости от цели это число используют в качестве ответа, либо проводят его дефазификацию, то есть преобразование в четкое число. Наиболее часто применяют следующие методы:

1) COG (Center Of Gravity) – «центр тяжести». Аналогом этой фор-мулы является нахождение центра тяжести плоской фигуры, ограниченной осями координат и графиком функции принадлежности;

2) MOM (Mean Of Maximums) – «центр максимумов». При использовании метода центра максимумов требуется найти среднее арифметическое элементов универсального множества, имеющих максимальные степени принадлежностей;

3) First Maximum – «первый максимум» — максимум функции при-надлежности с наименьшей абсциссой.

В зависимости от реализации отдельных этапов нечеткого вывода сущес-твует целый ряд стратегий: вывод Мамдани, Сугено, Ларсена, Цукамото и др.

На рис. 24 представлен наиболее распространенный способ логичес-кого вывода – механизма Мамдани, в нем используется минимаксная ком-позиция нечетких множеств.

57

Пусть необходимо управлять заслонкой для регулирования уровня воды. База знаний содержит три правила:

если РАСХОД ЗНАЧИТЕЛЬНЫЙ И УРОВЕНЬ НИЗКИЙ, то ЗАСЛОНКУ ОТКРЫТЬ;

если РАСХОД СРЕДНИЙ И УРОВЕНЬ СРЕДНИЙ, то ЗАСЛОНКУ ПРИОТКРЫТЬ;

если РАСХОД НЕБОЛЬШОЙ И УРОВЕНЬ ВЫСОКИЙ, то ЗАСЛОНКУ ЗАКРЫТЬ.

На входе системы расход воды х1, равный 10, и уровень воды х2, рав-ный 5. Для правил находится значения функций принадлежности µ( х1) и µ( х2): для 1-го правила µ(10)=0 и µ(5)=0, для 2-го правила µ(10)=1 и µ(5)=0,5 и для 3-го правила µ(10)=0,25 и µ(5)=0,5. Находится минимум из двух значений каждой пары, он определяет уровень «усечения» функции принадлежности заключения.

Рис. 24. Нечеткий вывод при регулировании уровня воды

x2 1

α

1

ТО ЕСЛИ

x2 1

μ(y)

α

1

ТО ЕСЛИ

x2

1

μ(y)

α

1

ЕСЛИ

μ*(y)

α

1

низкий

средний

высокий

открыть

приоткрыть

закрыть

Расход воды

Заслонка

μ(x1) 1

1

1 небольшой

средний

значительный

Уровень воды

И

И

ТО И

μ(y)

300

μ(x1)

μ(x1)

μ(x2)

μ(x2)

μ(x2)

510

x1

x1

x1

58

Над полученными для всех правил нечеткими множествами прово-дится операция объединения. Для объединения полученных усеченных функций, используется максимальная композиция нечетких множеств: µ*(y)= max (µi(y)), чем больше значение µ(х) в посылке, тем больший вклад вносит правило, таким образом вычисленное значение µ(х) определяет сте-пень влияния правила на конечный результат. Затем находится центр тяжес-ти. Управление состоит в том, что надо повернуть заслонку на угол 30 0 .

3.6. Объектно-ориентированный подход

Традиционно объектно-ориентированный подход не относят к пред-ставлению знаний, но в настоящее время он все больше получает распро-странение в интеллектуальных системах, а также представляет собой спо-соб восприятия и анализа внешнего мира наиболее близкий к человеческо-му мышлению. Объектно-ориентированный подход – метод для отождест-вления важных сущностей в задачах реального мира, для понимания и объяснения того, как они взаимодействуют между собой, он позволяет аб-страгировать в классы понятия рассматриваемой предметной области. Ос-новоположник объектно-ориентированного анализа Г. Буч под объектом понимает «нечто, имеющее четко определенные границы». В отличие от всех остальных моделей представления знаний в чистом виде объектный подход не содержит каких-либо процедур поиска или вывода на знаниях.

В заключение можно сказать, что все методы представления знаний, которые рассмотрены выше, кроме исчисления высказываний и предика-тов, относятся к неформальным моделям.

3.7. Вопросы и задания 1. Назовите признаки формальных систем. 2. Объясните суть неформальных моделей. 3. Какие два механизма обеспечивают вывод на знаниях во фреймах? 4. Какой механизм обеспечивает поиск в сети фреймов и какой – адапта-цию фрейма под текущую ситуацию?

5. Поясните особенности фреймовой организации памяти. Где хранится информация об общей структуре и общих свойствах набора фреймов?

6. Какое свойство фреймовой организации памяти позволяет предсказы-вать не воспринимаемые в данный момент характеристики объекта?

7. Когда появилась теория фреймов? Перечислите типы фреймов. 8. Какими значениями заполнены терминалы у фрейма-экземпляра? 9. Для чего нужна декларация фрейма?

59

10. В чем отличие трансформации от вывода в сети фреймов? 11. Покажите сходство и различие фреймовой организации памяти и моде-

ли на основе семантической сети. 12. Чем похожи и каково отличие фреймовой модели от объектной? 13. Раскройте понятие «семантическая сеть». 14. Виды отношений и классификация семантических сетей. 15. Как осуществляется поиск на семантической сети? 16. Как называется модель представления знаний, которая сочетает элемен-

ты логического вывода и семантических сетей? 17. Из каких частей состоит правило вывода? 18. Какие модели логического вывода вы знаете? 19. Чем отличается продукция от правила логического вывода? 20. Основные операции в исчисление высказываний и предикатов. 21. Что такое предикат? Логические связки и кванторы в исчислении вы-

сказываний и предикатов. 22. Структура и характерные черты продукционной системы. 23. Определение и пример продукции. Виды продукционных систем. 24. Как называется нечеткая характеристическая функция? 25. Какие операции выполняют над нечеткими числами? 26. Как можно интерпретировать функцию принадлежности? 27. В каком интервале лежит значение функции принадлежности? 28. Сравните нечеткую и лингвистическую переменные. Примеры. 29. В чем отличие операции умножения нечетких чисел с использованием

α-уровневых множеств и L-R аппроксимации? 30. Особенности операций над нечеткими множествами. 31. В чем состоит операция импликации? 32. Перечислите методы дефазификации. 33. Как правило нечеткого логического вывода, сформулированное на есте-

ственном языке, преобразуется в строгую математическую модель? 34. Как происходит выполнение правила нечеткого логического вывода? 35. Как происходит нечеткий вывод? 36. Назовите модели представления знаний и перечислите способности че-

ловека, которым они соответствуют. 37. Перечислите модели представления знаний, основанные на правилах. 38. Сравните исчисления высказываний и предикатов. Приведите примеры. 39. Перечислите различные виды исчислений. 40. В чем состоят правила вывода Modus ponens и Modus tollens? 41. Какие условия определяют суть объектно-ориентированного подхода? 42. В чем состоят преимущества объектного подхода?

60

4. БАЗЫ ЗНАНИЙ И ЭКСПЕРТНЫЕ СИСТЕМЫ

4.1. Организация баз знаний База знаний – модель предметной области, содержащая: формали-

зованные знания специалистов в виде наборов эвристических правил; метаправила, определяющие стратегию управления эвристическими правилами; сведения о структуре и содержании базы данных этой об-ласти.

База знаний в отличие от базы данных содержит количественные ха-рактеристики фактов и субъективные эвристические знания экспертов.

Модель предметной области (МПО) можно определить как МПО = понятийные знания + конструктивные знания.

Тогда база знаний (БЗ) определяется как БЗ = модель предметной области + процедурные знания + метазнания +

фактографические знания. 4.2. Определение и структура экспертной системы Современные экспертные системы используются для тиражирова-

ния опыта и знаний ведущих специалистов во многих сферах. Такие зна-ния существуют в двух видах – коллективный и личный опыт. Если большая часть знаний представлена в виде коллективного опыта (напри-мер, высшая математика), эта предметная область не нуждается в экс-пертных системах (рис. 25). Если в предметной области большая часть знаний – личный опыт специалистов высокого уровня (экспертов), если

61

эти знания по каким-либо причинам слабо структурированы, такая пред-метная область нуждается в экспертной системе.

Рис. 25. Предметная область, не пригодная и пригодная для создания экспертной системы

Экспертная система (ЭС) – это программный продукт, имитирующий

творческую деятельность или усиливающий интеллектуальные возможно-сти специалиста-эксперта. Экспертная система – это компьютерная про-грамма, которая моделирует рассуждения человека-эксперта в определен-ной области и использует для этого базу знаний, содержащую факты и правила об этой области, и процедуру логического вывода. ЭС представ-ляют собой человеко-машинные комплексы для решения слабо формали-зованных задач или задач, не имеющих алгоритмического решения.

Основной принцип ЭС состоит в выделении в алгоритме программы универсальной части (механизма логического вывода) и части, зависящей от предметной области (базы знаний). Идеологию ЭС можно выразить формулой: знание + вывод = система.

Наличие базы знаний и универсального интерпретатора делает прин-ципиально возможным создание новых экспертных систем путем разра-ботки новой базы знаний без изменения интерпретатора. Процесс разра-ботки экспертной системы сводится (при наличии механизма вывода) к разработке базы знаний. Такая технология получила название технологии «пустых оболочек», когда однажды разработанная экспертная система ис-пользуется в качестве оболочки для новых знаний.

В ЭС собственно знания отделены от алгоритмов, использующих эти знания. База знаний зависит от области применения, а механизм вывода независим от нее. Обобщенная структура экспертной системы представле-на на рис. 26.

62

Пользователь – специалист, для которого предназначена система. Обычно его квалификация недостаточно высока, и поэтому он нуждается в помощи и поддержке со стороны экспертной системы.

Рис. 26. Структура статической экспертной системы

Инженер по знаниям – специалист по искусственному интеллекту,

выступающий в роли посредника между экспертом и базой знаний. Сино-нимы: когнитолог, инженер-интерпретатор, аналитик.

Интерфейс пользователя – функция, реализующая диалог пользова-теля с экспертной системой.

База знаний – совокупность формализованных знаний предметной области, записанных в форме, понятной эксперту. Знания в БЗ хранятся в соответствии с моделью представления знаний: в виде правил «ЕС-ЛИ…ТО…» – логическая модель, в виде сети с вершинами понятиями и дугами отношениями – модель семантической сети, фреймы и т.д.

Механизм вывода – формально-логическая система, реализованная в виде программного модуля, позволяющая логически выводить необходи-мую информацию, исходя из размещенных в базе знаний. Моделирует ход рассуждения эксперта. Синонимы: дедуктивная машина, блок логического вывода, решатель.

Подсистема объяснений – программа, позволяющая пользователю по-лучить ответы на вопросы: «Как была получена та или иная рекомендация?» и «Почему система приняла такое решение?» Ответ на вопрос «Как?» – это трассировка всего процесса получения решения с указанием использован-ных фрагментов базы знаний, т.е. всех шагов цепи умозаключений. Ответ

База знаний

Интерфейс пользователя

Механизм вы-вода

Подсистема объяснений

Подсистема приобретения

знаний

База данных (рабо-чая память)

Внешняя среда

Пользователь Инженер по знаниям + Эксперт

63

на вопрос «Почему?» – ссылка на умозаключение, непосредственно пред-шествовавшее полученному решению, т.е. отход на один шаг назад.

Рабочая память хранит данные (база данных, фактов), которые ис-пользуются как исходные для начала вывода, в память заносятся промежу-точные и конечные результаты вычислений.

Подсистема приобретения знаний (редактор базы знаний) – про-грамма, предназначенная для создания и редактирования базы знаний.

ЭС, предназначенные для моделирования и работы с процессами, ко-торые происходят во времени, называются динамическими. По сравнению со статическими системами в них добавлены блок моделирования внешне-го мира и модуль взаимодействия с внешней средой.

Режимы работы ЭС. Процесс решения любой задачи разделяется на два этапа: построение модели и собственно решение. Первый этап индуктив-ный, второй – дедуктивный. На первом этапе обрабатываются данные много-численных наблюдений, и на основе полученных результатов строится неко-торое решающее правило. Второй этап предполагает применение описанного правила для решения. На первом этапе выявляются закономерности, прису-щие исследуемой области, и совокупность этих закономерностей служит мо-делью предметной области, которая в формализованном виде составляет ос-нову базы знаний. Таким образом, и экспертная система имеет два режима работы: режим приобретения знаний и режим решения задач.

4.3. Вывод и рассуждения в экспертных системах Механизм вывода устанавливает правила работы с используемой мо-

делью знаний и «знает», как использовать базу знаний для получения ра-зумно согласующихся заключений из информации, находящейся в ней. Механизм вывода работает согласно одной из моделей представления зна-ний: фреймовой, продукционной, логикой высказываний или логикой пре-дикатов, моделью семантических сетей, нечеткой логикой.

В экспертных системах, основанных на правилах, механизм вывода выбирает способ применения правил базы знаний, определяет, какие пра-вила вызвать, выполняет правила, определяет, когда найдено приемлемое решение и передает результаты программе интерфейса с пользователем. Процедуры применения правил в экспертных системах подчиняются раз-личным стратегиям. Наиболее часто применяются стратегии прямого или обратного вывода. Прямой вывод – это вывод, направляемый данными к целям. Обратный вывод – это вывод, направляемый целями к данным.

64

Прямой вывод. Правила просматриваются до тех пор, пока не будет найдено такое, у которого первый операнд (в левой части) соответствует информации, находящейся в рабочей области, затем правило выполняется. Процесс повторяется до тех пор, пока не будет достигнута цель или не бу-дет найдено следующее подходящее правило.

На рис. 27 показан процесс прямого вывода. В рабочую память через интерфейс вводятся пользователем значения исходных переменных. В базе знаний ищутся те правила, в условиях которых присутствуют переменные, имеющиеся в рабочей памяти. Выполняется применение правил с помо-щью механизма вывода, и результаты заносятся в рабочую память. Если применение хотя бы одного правила оказалось успешным, то снова осуще-ствляется поиск правил в базе знаний. Если достигнутое состояние рабо-чей памяти не позволяет применить ни одно правило базы знаний, то про-цесс вывода заканчивается и пользователю выдается информация, полу-ченная в результате применения правил.

Рис. 27. Алгоритм прямого вывода в экспертной системе

65

Системы с прямым логическим выводом просты в построении, ре-зультат работы в них – целый набор данных, но их эффективность не все-гда соответствует требованиям практических задач.

В системах обратного вывода (рис. 28) намечается перечень конечных целей – переменных, значения которых необходимо получить. Далее производится поиск правил, определяющих эти цели. Вычисляются значения всех переменных, входящих в условия правила. Если некоторые значения определить невозможно, то ищутся правила их определяющие, или значения переменных запрашиваются у пользователя. Процесс выполняется рекурсивно. Если все предпосылки известны – правило выполняется и задача решается.

Рис. 28. Алгоритм обратного вывода в экспертной системе

66

Если известны значения цели и их число невелико, то обратный вывод эффективен. Механизм обратного вывода используется в диагностических экспертных системах. Алгоритм функционирования экспертных систем обратного вывода представляется в следующем виде:

1. Задается набор целей – переменных, значение которых требуется определить с помощью экспертной системы. Список этих переменных через интерфейс вводится в рабочую память.

2. В базе знаний механизм вывода выделяет список правил, из кото-рых можно найти неизвестные переменные в рабочей памяти.

3. Из условий найденных правил выделяют остальные неизвестные переменные, и определяется, какие из них можно получить, применяя правила базы знаний.

4. Список целей дополняется переменными, найденными в п.3. 5. Переменные, значения которых неизвестны и не могут быть выве-

дены из базы правил, запрашиваются у пользователя. 6. Применяются правила базы знаний для достижения целей. 7. Если не все цели достигнуты (не удалось применить все правила,

определяющие интересующие нас переменные), производится переход к п.2, из списка целей исключаются найденные переменные.

8. По достижению всех первоначально поставленных целей пользо-вателю выводятся значения этих переменных. Логический вывод пре-кращается также, если нельзя достичь поставленных целей.

Используются также комбинированные стратегии – стратегии на ос-нове так называемой доски объявлений. Модель «доска объявлений» – это модель рассуждений, в которой наилучшим способом используются преи-мущества прямого и обратного вывода (рис. 29).

Знания, необходимые для решения задачи, делятся на независимые группы правил, называемых источниками знаний (KS – knowledge sources), которые работают под управлением планировщика (scheduler). Источники знаний располагают собственным набором правил и механизмом вывода, который у них может совпадать или различаться. Они получают информа-цию непосредственно из рабочей памяти доски объявлений: состояние за-дач (текущие значения переменных), цели, которые надо достигнуть и ре-шения – гипотезы, выдвинутые в качестве возможных способов достиже-ния целей. Источники знаний могут изменять данные на доске объявлений посредством планировщика. Они помещают информацию о потенциаль-ных действиях – записи активизации источников знаний (knowledge source

67

activation records), которые могут выполнить, в список выбора (agenda), откуда их извлекает планировщик.

Рис. 29. Модель «доска объявлений» в экспертной системе Планировщик определяет, какую заявку следует обработать следую-

щей, и выполняет ее, осуществляя те изменения на доске объявлений, ко-торые предписываются соответствующим источником знаний. В функции планировщика входит составление и обновление плана – способа, которым экспертная система будет искать решение задачи. Планировщик также определяет, когда остановить процесс вывода по сформированным для не-го критериям достижения цели. Таким образом, планировщик – ядро управления процессом вывода, отдельные этапы которого выполняются разными источниками знаний.

Доска объявлений может разделяться на несколько уровней описа-ния, каждый из которых соответствует определенной степени детализации. В этом случае данные в пределах отдельных уровней доски объявлений представляют иерархии объектов или графы. В современных системах мо-жет быть несколько досок объявлений.

Приобретение знаний в ЭС. Источниками знаний для ЭС служат статистические данные, литературные материалы, справочники, материалы экспериментов и исследований в проблемной области. Классическим ис-точником знаний является эксперт – профессионал в данной предметной области. Способы приобретения знаний:

68

1. Традиционный диалог с экспертами и изучение литературы. 2. Генерация знаний на основе статистического материала. 3. Эксперимент или построение экспертом индивидуальной модели

исследования, позволяющей организовать целенаправленный процесс исследования предметной области.

4.4. Классификация экспертных систем Класс «экспертные системы» объединяет несколько тысяч различ-

ных программных комплексов, которые можно классифицировать по раз-личным критериям, некоторые из них представлены на рис. 30.

Рис. 30. Классификация экспертных систем

Классификация экспертных систем по решаемой задаче Интерпретация данных. Это одна из традиционных задач для экс-

пертных систем. Под интерпретацией понимается определение смысла данных, результаты которого должны быть согласованными и корректны-ми (система обнаружения и идентификации различных типов океанских судов – SIAP; система определения основных свойств личности по резуль-татам психодиагностического тестирования в системах АВТАНТЕСТ и МИКРОЛЮШЕР и др.)

Экспертные системы

По используемой модели представле-

ния знаний

По связи с реальнымвременем

По задаче

• Интерпретация данных

• Диагностика

• Мониторинг

• Проектирование

• Прогнозирование

• Планирование

• Обучение

• Статические

• Квазидинамические

• Динамические

• Логические методы

• Продукционные модели

• Семантические сети

• Фреймы

• Объектно-

ориентированные языки • Нечеткая логика

69

Диагностика. Под диагностикой понимается обнаружение неисправ-ности в некоторой системе. Неисправность – это отклонение от нормы. Та-кая трактовка позволяет с единых теоретических позиций рассматривать и неисправность оборудования в технических системах, и заболевания жи-вых организмов, и всевозможные природные аномалии. Важна необходи-мость понимания функциональной структуры («анатомии») диагности-рующей системы (система диагностики и терапии сужения коронарных сосудов – ANGY; система диагностики ошибок в аппаратуре и математи-ческом обеспечении ЭВМ – система CRIB и др.).

Мониторинг. Основная задача мониторинга – непрерывная интер-претация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы. Главные проблемы – «пропуск» тревожной ситуации и инверсная задача «ложного» срабатыва-ния. Сложность этих проблем в размытости симптомов тревожных ситуа-ций и необходимость учета временного контекста (система контроля за ра-ботой электростанций СПРИНТ, система помощи диспетчерам атомного реактора – REACTOR; система контроля аварийных датчиков на химиче-ском заводе – FALCON и др.).

Проектирование. Проектирование состоит в подготовке специфика-ций на создание «объектов» с заранее определенными свойствами. Под спецификацией понимается весь набор необходимых документов: чертеж, пояснительная записка и т.д. Для организации эффективного проектирова-ния и, в еще большей степени, перепроектирования необходимо формиро-вать не только сами проектные решения, но и мотивы их принятия. Таким образом, в задачах проектирования связываются два основных процесса, выполняемых в рамках соответствующей экспертной системы: процесс вывода решения и процесс объяснения (система проектирования конфигу-раций ЭВМ VAX – 1/780 в системе XCON (или R1); система проектирова-ния БИС – CADHELP; система синтеза электрических цепей – SYN и др.)

Прогнозирование. Прогнозирующие системы логически выводят ве-роятные следствия из заданных ситуаций. В прогнозирующей системе ис-пользуется параметрическая динамическая модель, в которой значения па-раметров «подгоняются» под заданную ситуацию. Выводимые из этой мо-дели следствия составляют основу для прогнозов с вероятностными оцен-ками (предсказание погоды – система WILLARD; система оценки будуще-го урожая – PI.ANT; система прогноза в экономике – ЕСОN).

70

Планирование. Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции. В таких экспертных системах используются модели поведения реальных объектов с тем, чтобы логически вывести последствия плани-руемой деятельности (система планирования поведения робота – STRIPS; система планирования промышленных заказов – 1SIS; система планирова-ния эксперимента – MOLGEN и др.).

Обучение. Системы обучения диагностируют ошибки при изучении какой-либо дисциплины с помощью ЭВМ и подсказывают правильные ре-шения. Они аккумулируют знания о гипотетическом «ученике» и его ха-рактерных ошибках, затем в работе способны диагностировать слабости в знаниях обучаемых и находить средства для их ликвидации. Кроме того, они планируют акт общения в зависимости от успехов ученика с целью передачи знаний (обучение языку программирования Лисп в системе «Учитель Лиспа»; система PROUST – обучение языку Паскаль и др.). Классификация экспертных систем по связи с реальным временем

Статические экспертные системы разрабатываются в предметных областях, в которых база знаний и интерпретируемые данные не меняются во времени (система диагностики неисправностей в автомобиле).

Квазидинамические экспертные системы интерпретируют ситуа-цию, которая меняется с некоторым фиксированным интервалом времени (микробиологические экспертные системы, в которых снимаются лабора-торные измерения с технологического процесса один раз в 4 – 5 ч (напри-мер, производство лизина) и анализируется динамика полученных показа-телей по отношению к предыдущему измерению.

Динамические экспертные системы работают в сопряжении с датчи-ками объектов в режиме реального времени с непрерывной интерпретаци-ей поступаемых данных (системы управления гибкими производственны-ми комплексами, мониторинга в реанимационных палатах и т.д.).

Классификация по используемой модели представления знаний При формализации задачи строится формальное представление зако-

номерностей предметной области на основе выбранного языка или техно-логии представления знаний. На этом этапе используются:

• логические методы (исчисления предикатов I порядка и др.); • продукционные модели (с прямым и обратным выводом); • семантические сети и фреймы;

71

• объектно-ориентированные языки, основанные на иерархии клас-сов, объектов и др.

Существуют экспертные системы, сочетающие несколько механиз-мов обработки знаний.

4.5. Проектирование экспертной системы Разработка программных комплексов экспертных систем находится на

уровне скорее искусства, чем науки. В исследовательских условиях разраба-тывается несколько прототипных версий программ, прежде чем получится конечный продукт. Для этого используются специализированные языки ис-кусственного интеллекта и оболочки экспертных систем, ускоряющие про-цесс разработки. Часто создаются несколько прототипов, базирующихся на различных способах представления знаний, с последующим выбором наибо-лее удачного. Когда достигнута удовлетворительная работа прототипа, вся система реализуется на языке программирования, с целью улучшения ее ха-рактеристик – увеличения быстродействия, уменьшения занимаемой памяти, повышения эргономических параметров интерфейса. В коммерческих усло-виях такой подход слишком дорог. Процесс разработки промышленной экс-пертной системы делится на шесть этапов (рис. 31).

1

Постановка задачи 2 Разработка прототипа

3 Оценка прототипа

4 Доработка до промышленной версии

5 Стыковка с существующим ПО

6 Поддержка

Рис. 31. Этапы разработки экспертных систем

Каждый последующий этап разработки экспертной системы прино-

сит новые идеи, которые влияют на предыдущие решения и могут привес-ти к их переработке. В зависимости от требуемой гибкости системы, воз-можностей ее перенастройки, быстродействия, программной платформы, стадии разработки используют различные инструментальные средства по-строения экспертных систем:

72

• Традиционные языки программирования: СИ, Бейсик, Паскаль. • Языки искусственного интеллекта. Это, прежде всего Лисп (LISP) и

Пролог (Prolog) – наиболее распространенные языки, предназначенные для решения задач искусственного интеллекта. Есть и менее распро-страненные языки искусственного интеллекта, например РЕФАЛ, раз-работанный в России. Универсальность этих языков меньшая, нежели традиционных языков, но ее потерю языки искусственного интеллекта компенсируют богатыми возможностями по работе с символьными и логическими данными, что крайне важно для задач искусственного ин-теллекта. На основе языков искусственного интеллекта создаются спе-циализированные компьютеры (например, Лисп или Пролог-машины), предназначенные для решения задач искусственного интеллекта.

• Специальный программный инструментарий. Как правило, это библио-теки и надстройки над языком искусственного интеллекта Лисп: KEE (Knowledge Engineering Environment), FRL (Frame Representation Language), KRL (Knowledge Represantation Language), ARTS и др., по-зволяющие пользователям работать с заготовками экспертных систем на более высоком уровне, нежели это возможно в обычных языках ис-кусственного интеллекта.

• Оболочки экспертных систем. Под «оболочками» (shells) понимают «пустые» версии существующих экспертных систем, т.е. готовые экс-пертные системы без базы знаний. Примером такой оболочки может служить EMYCIN (Empty MYCIN – пустой MYC1N), которая представ-ляет собой незаполненную медицинскую экспертную систему MYCIN. Достоинство оболочек в том, что они вообще не требуют работы про-граммистов для создания готовой экспертной системы. Требуются только специалисты в предметной области для заполнения базы знаний.

Ценность использования ЭС проявляется в эффективном решении проблем, сложность которых превышает человеческие возможности, и для которых требуются экспертные знания нескольких областей; в сохранении коллективной памяти и в распространении экспертных знаний.

4.6. Вопросы и задания

1. Перечислите составляющие статической экспертной системы. 2. На каком этапе создается демо-версия экспертной системы? 3. На основе каких критериев оценивается экспертная система? 4. Перечислить типы задач, которые решают экспертные системы.

73

5. Когда применимы экспертные системы? 6. Когда не применимы экспертные системы? 7. Сформулируйте отличие СУБЗ от экспертных систем. 8. Определите назначение рабочей памяти в экспертной системе. 9. Кто закладывает знания в экспертную систему?

10. Перечислите источники знаний для экспертных систем. 11. Как работает механизм прямого вывода в экспертной системе? 12. Чем отличается прямой вывод в экспертной системе от обратного? 13. Когда целесообразно применять прямой, а когда обратный вывод? 14. Что происходит, когда в рабочую память экспертной системы помеща-

ется новый факт? 15. Механизм «доска объявлений» в экспертной системе. 16. По каким признакам классифицируют экспертные системы? 17. В какой момент начинается вывод в экспертной системе? 18. В чем отличие статической экспертной системы от динамической? 19. Какие этапы построения экспертной системы вы знаете? 20. Создать экспертную систему проще с помощью «пустой оболочки» эк-

спертной системы или языка искусственного интеллекта? Обоснуйте. 21. Когда экспертные системы разрабатывают с использованием традици-

онных языков программирования? 22. Чем диагностические экспертные системы отличаются от систем мони-

торинга? 23. Чем прогнозные экспертные системы отличаются от систем планирова-

ния? 24. В чем суть экспертных систем интерпретации данных? 25. Способы приобретения знаний в экспертных системах.

74

5. МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО МОДЕЛИРОВАНИЯ

5.1. Обзор методов извлечения знаний Поддержка принятия управленческих решений на основе накоплен-

ных данных может выполняться в трех базовых сферах. 1. Сфера детализированных данных. Это сфера действия большинства

систем, нацеленных на поиск информации. В большинстве случаев для решения возникающих здесь задач используются СУБД. Общеп-ризнанным стандартом языка манипулирования реляционными дан-ными является SQL.

2. Сфера агрегированных показателей. Комплексный взгляд на собран-ную в хранилище данных информацию, ее обобщение и агрегация, гиперкубическое представление и многомерный анализ – задачи сис-тем оперативной аналитической обработки данных (OLAP).

3. Сфера закономерностей. Интеллектуальная обработка производится методами интеллектуального анализа данных (Data Mining), главны-ми задачами которых являются поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые объясняют найденные аномалии и/или (с опреде-ленной вероятностью) прогнозируют развитие некоторых процессов. Структура информационно-аналитической системы, построенной на

основе хранилища данных, показана на рис. 32. Появление технологии Data MINING – технологии интеллектуально-

го анализа данных, связано с необходимостью аналитической обработки сверхбольших объемов информации, накапливаемой в хранилищах дан-

75

ных. Data MINING – это набор методов обнаружения нового, обоснованно-го, потенциально полезного знания в базах данных. Основное назначение технологии – поиск ранее неизвестных закономерностей. Системы Data MINING обрабатывают большие объемы информации и автоматически выявляют скрытые правила и закономерности, которые могут быть неоче-видными для человека.

Рис. 32. Структура информационно-аналитической системы

Методы Data MINING условно делят на два класса: проверка гипотез

(verification-driven DATA MINING) и поиск зависимостей, направленный на автоматическое выявление закономерностей, которым подчиняются данные информационного хранилища (discovery-driven DATA MINING).

Операции первого типа реализованы в системах обработки SQL-запросов, в многомерных СУБД, в программах статистического анализа. К операциям поиска зависимостей относятся прогнозное моделирование, анализ связей, сегментация данных и идентификация отклонений.

Прогнозное моделирование (методы индукции, нейронные сети) – са-мая распространенная технология. Основой для прогнозирования служит ис-торическая информация, хранящаяся в базе данных в виде временных рядов,

Хранилище данных

Сфера детализирован-ных данных

Сфера агрегированных показателей

Сфера закономерностей

Генераторы запросов, информационно -поисковые системы

Системы оперативной аналитической обработ-

ки данных (OLAP)

Системы интеллектуа-льного анализа данных

(ИАД)

Информационные системы руково-дителя (ИСР)

Сбор, очистка и согласование данных из внешних источников

Системы обработки данных

Витрины данных

СОД СОД

76

которые отражают динамику исследуемой системы в прошлом. Задача состо-ит в построении математической модели, адекватно описывающей эту дина-мику, и предсказании с ее помощью поведения системы в будущем.

Если цель прогнозного моделирования заключается в построении обобщенной модели данных, то в задачах анализа связей, наоборот, требу-ется найти специфические отношения между различными записями в базе данных. Классические алгоритмы выявления связей базируются на статис-тических методах корреляционного и регрессионного анализов.

Сегментация баз данных заключается в разбиении записей БД на не-сколько групп (сегментов, или коллекций) и проводится в качестве пред-варительного этапа с целью сузить пространство поиска. К подготовлен-ным группам данных применяются методы прогнозного моделирования или анализа связей. Сегментация проводится с использованием методов классификации и кластеризации.

Цель идентификации отклонений – выявить данные, которые не входят ни в один из имеющихся сегментов, и установить, являются они «шумом» или отражают неизвестные закономерности. Идентификация от-клонений часто выполняется в сочетании с сегментацией базы данных, ко-гда указанный сегмент считается нормой, а все остальные – отклонением от нее. Применяемые здесь алгоритмы аналогичны критериям проверки стати-стических гипотез или основываются на методах дисперсионного анализа.

Ключевое достоинство технологии Data Mining по сравнению с клас-сическими методами – возможность автоматического порождения гипо-тез о взаимосвязи между различными параметрами или элементами дан-ных. Еще одна важная особенность систем DATA MINING – возможность обработки многомерных запросов и поиска многомерных зависимостей. Уникальна также способность систем DATA MINING автоматически об-наруживать исключительные ситуации – то есть элементы данных, «выпа-дающие» из общих закономерностей. Существует несколько основных ти-пов закономерностей, выявляемых методами Data Mining:

временные закономерности находятся при анализе временных рядов (sequence-based analysis), строится математическая модель и находя-тся шаблоны, адекватно отражающие их динамику и с их помощью предсказывают поведение системы в будущем;

ассоциации (означает сходство, структурную близость) – наиболее об-щие закономерности, которые включают различные виды отношений, имеют место в том случае, если несколько событий как-либо связаны друг с другом;

77

закономерности размещения объектов в пространстве признаков выявляются с помощью классификации – отнесения объекта к одно-му из заранее определенных классов или выявление признаков, хара-ктеризующих группу, и кластеризации – группировки объектов, имеющих схожие характеристики;

регрессия – отношения между переменными, выраженные количест-венно в виде комбинации этих переменных. Регрессия используется для предсказания значения, которое принимает целевая (зависимая) переменная, вычисляемая на заданном наборе значений входных (не-зависимых) переменных. В простейшем случае для этого используют-ся стандартные статистические методы, такие как линейная регрессия;

последовательности – по-другому причинно-следственные законо-мерности, возникают, если существует цепочка последовательно связанных друг с другом событий. Среди всего многообразия методов и систем извлечения знаний вы-

деляют следующие классы: предметно-ориентированные аналитические системы, статические пакеты (SAS, STATGRAPICs, STATISTICA), ней-ронные сети (BrainMaker, NeuroShell), нечеткая логика, методы индукции правил, детерминационный анализ и поиск ассоциаций, системы рассуж-дений на основе аналогичных случаев (CBR case based reasoning systems), деревья решений (See 5/С 5.0, Clementine, SIPINA, IDIS, KnowledgeSeeker), эволюционное программирование (PolyAnalyst), генетические алгоритмы (GeneHunter), алгоритмы ограниченного перебора (WizWhy), системы для визуализации многомерных данных (DataMiner 3D).

Индукционные модели. Индукция в Data Mining – это процесс авто-матической генерации классификационной модели на основе тестовых (обучающих) данных, содержащихся в информационных хранилищах. Обучающие выборки представляют собой небольшие наборы данных, соо-тветствующие описаниям известных классов. Индуцированная модель вы-глядит как совокупность образцов, по которым идентифицируется класс. Созданную модель применяют для обнаружения классов среди некласси-фицированных записей. Существует два типа индукции: нейронная и сим-волическая. В основе первой лежат нейронные сети. Методы символичес-кой индукции сводятся к построению деревьев решений, ветви которых задаются при помощи логических формул.

Индукционные методы позволяют строить качественные модели да-же в том случае, когда обучающие данные неполны или сильно зашумле-

78

ны. Индукционные системы способны накапливать знания, а модели легко воспринимаются и позволяют просмотреть все шаги построения окончате-льной классификации.

Нечеткие когнитивные схемы (Fuzzy Cognitive Maps – FCM). Модель предметной области (будь то предвыборная ситуация, структура финансо-во-промышленной группы или план управления войсковыми соединения-ми) представляется в виде знакового ориентированного графа с обратными связями. В вершинах графа располагаются события либо ключевые элеме-нты ситуации, дуги отображают причинно-следственные связи между ни-ми. Параметры событий и степени их взаимного влияния могут выражать-ся как точными количественными параметрами, так и нечеткими качест-венными соотношениями. Это особенно важно при моделировании социа-льных и политических ситуаций, когда точные числовые характеристики недоступны и исследователи оперируют такими понятиями как «популяр-ность», «социальная напряженность» и т.п. Своим рождением FCM обяза-ны слиянию двух новых научных направлений – нечеткой логики («fuzzy logic») и системной динамики («system dynamics»).

Детерминационный анализ – анализ правил. Способы ставить и ре-шать задачи анализа правил похожи на те, которыми пользуется человек. Эти способы просты, интуитивно понятны и эффективны. Правила нужны, чтобы объяснять, предсказывать, управлять. Люди обнаруживают правила, замечая, как разные признаки появляются в сочетаниях друг с другом. Ес-ли при появлении признака A всегда или часто присутствует признак B, делают вывод о наличии правила «Если A, то B». Если при этом признак B не встречается без A (или такое бывает редко), правило считают полным. Так работает ДА-система. В ней этот простой алгоритм поиска правил реа-лизован в виде эффективной технологии анализа. Детерминационный ана-лиз объединяет математическую статистику и логику. Методология и обе-спечивающая математика разработаны российским ученым Сергеем Чес-ноковым. Основная идея в том, что правило можно найти по частотам сов-падений или несовпадений событий. Найденное правило называется «де-терминацией», а математическая теория таких правил носит название «де-терминационный анализ».

Поиск ассоциаций. Процесс поиска ассоциаций похож на детермина-ционный анализ и выглядит следующим образом. Имеется коллекция эле-ментов и набор записей, каждая из которых содержит элементы коллекции. Поиск ассоциаций заключается в выполнении некоторой операции с набо-

79

ром записей для определения степени «общности» между элементами кол-лекции. Выявленные зависимости выражаются посредством правил, на-пример: «89 % всех записей, в которые входят элементы A, B и С, включа-ют также элементы D и Е». Вероятность выполнения (истинности) правила называется доверительной (другое ее название – уровень значимости). Приведенное правило иногда формулируют иначе: «Элементы A, B и C на-ходятся на противоположной стороне ассоциации по отношению к элемен-там D и Е». В общем случае в процессе поиска может быть задействовано любое число элементов по обе стороны ассоциации. Поиск ассоциаций предполагает выявление корреляций в исходных данных и последующее интервальное оценивание для проверки соответствующей гипотезы.

Регрессионные методы. Линейные и нелинейные регрессионные ме-тоды широко известны и используются во многих статистических пакетах. В этих методах изначально задается форма регрессионной модели и прои-сходит поиск коэффициентов, обеспечивающих наибольшую точность предсказания значений целевой переменной.

Поиск зависимости целевых переменных от остальных ведется в фо-рме функций определенного вида. Например, в методе группового учета атрибутов (МГУА) зависимость ищут в форме полиномов. Полученная фо-рмула зависимости – полином поддается анализу и интерпретации. МГУА реализован в системе NeuroShell компании Ward Systems Group.

Предметно-ориентированные аналитические системы очень разно-образны, один из наиболее типичных классов – системы анализа финансо-вых рынков, построенные на основе технического анализа. Технический анализ представляет собой совокупность нескольких десятков методов прогноза динамики цен и оптимизации инвестиционного портфеля, осно-ванных на эмпирических моделях рынка. Эти методы бывают просты (как, например, вычисление трендового значения), а могут иметь достаточно сложную математическую основу – фрактальную математику или спектра-льный анализ. Требования статистической значимости выводимых моде-лей и возможность их интерпретации не имеют смысла, поскольку модели строятся не по данным, а представляют собой известные законы, прове-ренные опытом. Системы оперируют в терминах предметной области, по-нятных финансовым аналитикам, имеют специализированные средства для загрузки финансовых данных. На рынке имеется много программ этого класса: MetaStock (компания Equis International), SuperCharts (Omega Re-search), Candlestick Forecaster (IPTC), Wall Street Money (Market Arts).

80

Статистические пакеты. Основываются на классических методи-ках корреляционного, регрессионного, факторного анализов. Главный не-достаток систем этого класса – их трудно эффективно применять, не имея знаний в области статистики. Наряду с традиционными методами статис-тические пакеты включают элементы интеллектуального анализа – нечет-кую логику, нейронные сети и т.д. Примеры: SAS (компания SAS Institute), SPSS (SPSS) и Statgraphics (Statistical Graphics).

Генетические алгоритмы. Интеллектуальный анализ данных – не основная область применения генетических алгоритмов, которые предназ-начены для решения разнообразных комбинаторных задач и задач оптими-зации. В системах DATA MINING генетические алгоритмы используются для поиска зависимостей. Этот метод имитирует процесс естественного отбора в природе. С точки зрения анализа данных генетические алгоритмы не дают возможности проанализировать статистическую значимость полу-чаемого с их помощью решения, поэтому они рассматриваются как инст-румент научного исследования, а не как средство анализа данных для практического применения в экономике.

Нейронные сети. Это большой класс разнообразных систем, архите-ктура которых имитирует построение нервной ткани из нейронов. Такой подход высокоэффективен в задачах распознавания образов, однако, в фи-нансовых и экономических задачах его применение требует хорошего обо-снования. Нейросети, создаваемые в результате обучения на данных фина-нсовых рынков, – это сложные системы, включающие десятки нейронов и сотни связей между ними, количество степеней свободы создаваемой про-гностической модели (вес каждой связи между нейронами сети) часто пре-вышает число использовавшихся для обучения примеров, поэтому нейро-сеть может «научиться» даже на массиве сгенерированных случайных чи-сел и не давать обоснованного прогноза на будущее. «Непрозрачность» создаваемых моделей, связанная со сложностью нейросети, – еще один минус в финансовым прогнозировании.

Системы рассуждения на основе аналогичных случаев. Case-based reasoning (CBR) (рис. 33). Существует база фактов, сформированная на ос-нове опыта или данных наблюдений, и поставлена задача, которую необ-ходимо решить. База фактов описывает ситуацию и ставит ей в соответст-вие решение, которое было принято, когда она возникла. Задача состоит в том, чтобы по описанию текущей ситуации сделать правильное решение. Система SBR осуществляет поиск в своей базе фактов ситуации, аналогич-

81

ной текущей, выбирает соответствующее решение и считает его правиль-ным. База данных состоит из двух частей.

База фактов Ситуация Решение

1. Характеристики ситуации:

параметр 1 …………… параметр М

**********************

N. Характеристики ситуации:

параметр 1 …………… параметр М

Принятое решение 1 ********************** Принятое решение N

Задача

Описание ситуации Решение

Прибыль

Себестоимость Количество

?

Рис. 33. Процесс принятия решения в системах рассуждения на основе

аналогичных случаев Недостатки системы:

1. Вообще не создают каких-либо моделей или правил обобщающих предыдущий опыт.

2. Мера близости не вполне адекватный критерий во многих задачах. 3. При наличии нескольких ситуаций, близких к текущей, возникает за-

труднение в выборе решения. В качестве примеров систем рассуждения на основе аналогичных

случаев можно назвать Pattern Recognition Workbench и Kate tools. Деревья решений – один из наиболее популярных подходов решения

задач извлечения знаний. В этом методе создается иерархическая структу-ра классифицирующих правил типа <если…. то…..>, имеющая вид дерева. Для того чтобы решить, к какому классу отнести объект или ситуацию,

поиск Выбор решения

82

требуется ответить на вопросы, стоящие в узлах дерева. Если ответ поло-жительный, осуществляется переход к правому узлу следующего уровня, если нет, то к левому. Метод относится к задачам классификации (рис. 34).

Рис. 34. Работа системы, основанной на методе деревьев решений

Задача состоит в том, чтобы отнести объект к какому-либо классу (классы заранее известны).

Недостатки метода: деревья решений дают полезные результаты только в случае независимых признаков. В качестве примеров систем, основанных на методе деревьев решений можно привести системы SLL, Clementine, Sipina, Idis.

Эволюционное программирование. Задача метода состоит в поиске зави-симости целевой переменной от некоторых параметров. Гипотеза о виде зави-симости формулируется в виде программ на внутреннем языке программирова-ния, а процесс построения происходит как эволюция в мире программ (рис. 35).

Входные [ответ] параметры [База Фактов] [База Ответов] программа 1 точность программа 2 точность ………………………………………… программа N точность

Рис. 35. Работа системы эволюционного программирования

Объект (ситуация) Набор - свойств - (признаков) -

Вопрос 1-го уровня



Классы

Подать на вход системы

Зависимость ?

?

83

Процесс решения начинается с создания начальной популяции про-грамм, на основе которой путем комбинирования строится следующая по-пуляция. В результате получается некоторая совокупность программ, из которых выбираются лучшие, то есть те, которые достаточно точно выра-жают искомую зависимость (рис. 36). Программа играет роль зависимости и рассчитывает ответ по заданным входным параметрам. Результат, полу-ченный программой, сравнивается с образцом и рассчитывается точность. [База Фактов] [програм.] [расчет прогр.] [база ответов]

сравнение

точность

Рис. 36. Последовательность оценки конкурирующих программ В лучшие программы вносятся небольшие модификации и отбираются

среди построенных таким образом дочерних алгоритмов те, которые повыша-ют точность. Система выращивает несколько генетических линий программ, которые конкурируют между собой в точности выражения искомой зависимо-сти. Далее найденная зависимость с внутреннего языка системы переводится на понятный пользователю язык: математические формулы, таблицы.

Алгоритмы ограниченного перебора предназначены для поиска логи-ческих закономерностей в данных (рис. 37). Эти алгоритмы вычисляют час-тоты комбинаций – простых логических событий в подгруппах данных. По другому эти алгоритмы называются алгоритмами выявления ассоциаций. Параметры (переменные)

--- --- --- --- --- …………………….

Рис. 37. Исходные данные и результаты работы алгоритмов

ограниченного перебора Данные для этого метода представлены в виде реляционных таблиц, а

результат работы алгоритмов ограниченного перебора – правила вида {Ес-

База Данных или База Фактов

{Если… то} {Если… то} {Если… то} …………… {Если… то}

84

ли… то}, где «Если» – предпосылка, состоящая из комбинации переменных, «То» – следствие, значение которого является одним из факторов.

Задача алгоритма ограниченного перебора состоит в том, чтобы найти на-иболее существенные правила (логические зависимости) в базе данных. Правила по-другому называются ассоциации, и записываются так: Если А, то В. Частота появления каждого правила рассчитывается, как количество появления этого правила в базе данных и называется распространенность. Низкий уровень расп-ространенности говорит о том, что такая ассоциация несущественна. Перебор и поиск правил осуществляется для всех комбинаций переменных из базы данных.

Для определения важности каждого полученного правила необходи-мо получить величину, которая называется доверительность АВ. Эта вели-чина показывает, как часто перед появлением А появляется В, и рассчиты-вается, как отношения частоты появления А и В вместе к частоте появле-ния А. Например, если доверительность А к В равна 20 %, то это значит, что при покупке товара А товар В покупается в 5 случаях.

Еще одна характеристика ассоциаций – мощность – рассчитывается по формуле: М = Доверительность(А к В) / Распространенность В.

Чем больше мощность, тем сильнее влияние, которое оказывает поя-вление А на появление В. Характеристики ассоциаций (правил):

• доверительность; • распространенность; • мощность.

Характеристики алгоритма ограниченного перебора: • скорость; • эффективность нахождения ассоциаций.

После появления всех правил и расчета распространенности, довери-тельности и мощности для каждого из них, правила сортируются в порядке убывания соответствующих характеристик. Далее выбираются правила с наибольшим значением этих показателей (рис. 38).

Правила Распространенность Доверительность Мощность 1. --------- 2. --------- --------- N. ---------

--- --- --- ---

--- --- --- ---

--- --- --- ---

Рис. 38. Результаты работы алгоритма ограниченного перебора

85

В табл. 2 приводится оценка некоторых методов и систем по значи-мости, интерпретируемости и простоте использования моделей.

Таблица 2

Вид оценки Тех. анализ

Стат-пакеты

Нейро-сети CBR Деревья

решений Генетическиеалгоритмы МГУА Эволюционное

программирование

Значимость нет + + - - + - - - - + +

Интерпретиру-емость нет + - - - - - + + + - + +

Простота испо-льзования + + - - + + + - - + +

Прмечание. В табл. 2 приняты следующие обозначения: + – уровень выраженности оценки достаточный; ++ – уровень выраженности оценки высокий; - – уровень выраженности оценки низкий; - - – уровень выраженности оценки очень низкий; + - – уровень выраженности оценки зависит от конкретной реализа-ции пакета. Процесс интеллектуального анализа данных проходит в три этапа: Выбор данных. Для решения конкретной задачи нужны не все дан-

ные из информационного хранилища, необходимо выбрать то их подмно-жество, которое будет подвергнуто анализу, и упорядочить его, выполнив объединение таблиц, фильтрование записей и т.д.

Трансформация данных. После подготовки рабочих таблиц обычно проводится предварительная обработка данных, характер которой опреде-ляется методами, применяемыми в ходе анализа. Трансформация может заключаться в удалении зашумленных данных и дублирующих записей, преобразовании типов данных, добавлении новых атрибутов и др.

Анализ данных. Трансформированные данные последовательно обра-батываются по одной или нескольким методикам с целью извлечения тре-буемой информации или знаний.

Средства создания интеллектуальных приложений Программные продукты, поддерживающие методы анализа и про-

гнозирования, делятся на следующие группы: библиотеки подпрограмм; открытые системы, допускающие настройку параметров; исследовательс-кие программы, специализированные программы.

Существует большое количество библиотек подпрограмм, содержа-щих подпрограммы обработки матриц, подпрограмм, реализующих регре-

86

ссионные методы и т.д. Для создания приложений, включающих такие би-блиотеки, используют средства разработки приложений (например: Delphi, OWL, C Builder, SQL Windows и т.п.).

Открытые системы, допускающие настройку параметров, позволяют со-здавать некоторое подмножество пользовательских приложений, автоматизи-рующих в той или иной степени процесс принятия решений. Они характери-зуются набором методов интеллектуального анализа, сложностью освоения, способом ввода данных, используемыми средствами отображения результата.

Исследовательские программы, требуют от пользователя определен-ного уровня подготовки. Подобные программы обладают богатым набором различных методов обработки данных, но не ориентированы на создание специализированных пользовательских приложений. Их используют для выбора метода, эффективного для решения задачи, а также для тестирова-ния результатов, получаемых в результате работы «самодельных» програ-ммных продуктов.

Специализированные программы связаны с конкретной предметной областью, не позволяют добавлять собственные методы.

Применение и применимость Data Mining Системы Data Mining применяются в научных исследованиях и обра-

зовании, в производстве, здравоохранении и других областях. Широко те-хнология Data Mining используется в деловых приложениях. Примерами могут служить «Классификатор дебиторских счетов» (Internal Revenue Service), «Система повышения качества архивной финансовой информа-ции» (Lockheed), «Система верификации данных по курсам валют» (Reuters), «Прогнозирование невыплат в сделках с недвижимостью» (Leeds), «Система маркетинговых исследований» (Dickinson Direct и Reader's Digest Canada).

Опыт работы с методами интеллектуального анализа позволяет выде-лить типовые задачи и определить наиболее эффективные методы их реше-ния. Существующие системы Data Mining можно подразделить на исследова-тельские, ориентированные на специалистов и предназначенные для работы с новыми типами задач, прикладные, рассчитанные на непрограммирующих пользователей (аналитиков, менеджеров, технологов и т.д.) и решающие ти-повые задачи. Если в исследовательских системах Data Mining важно разноо-бразие доступных методов обработки данных и гибкость используемых средств, то в прикладных системах реализованы не методы, а типовые виды рассуждений (анализа), характерные для проблемной области.

87

5.2. Нейронные сети Нервная система и мозг человека состоят из нейронов, соединенных

между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раз-дражения от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями – все это реализовано в живом организме как пе-редача электрических импульсов между нейронами.

Биологический нейрон (рис. 39) имеет отростки нервных волокон двух типов – дендриты, по которым принимаются импульсы, и единствен-ный аксон, по которому нейрон может передавать импульс. Аксон контак-тирует с дендритами других нейронов через специальные образования – синапсы, которые влияют на силу импульса.

Рис. 39. Строение биологического нейрона

Можно считать, что при прохождении синапса сила импульса меня-

ется в определенное число раз, которое называют весом синапса. Импуль-сы, поступившие к нейрону одновременно по нескольким дендритам, сум-мируются. Если суммарный импульс превышает некоторый порог, нейрон возбуждается, формирует собственный импульс и передает его далее по аксону. Важно отметить, что веса синапсов могут изменяться со временем, а значит, меняется и поведение соответствующего нейрона.

Модель нервной системы человека основывается на понятиях искус-ственного нейрона и искусственной нейронной сети. Ядро используемых представлений – идея о том, что нейроны можно моделировать довольно простыми автоматами, а вся сложность мозга, гибкость его функциониро-

88

вания и другие важнейшие качества определяются связями между нейро-нами. Каждая связь представляется как простой элемент, служащий для передачи сигнала. Предельным выражением этой точки зрения может слу-жить лозунг: «Структура связей – все, свойства элементов – ничто».

Его следствием является ряд свойств таких систем: 1) однородность системы (элементы одинаковы и чрезвычайно про-

сты, сложность объекта определяется структурой связей); 2) надежные системы из ненадежных элементов: при разрушении

случайно выбранной части система сохраняет полезные свойства; выход из строя 10 % нервной системы человека не прерывает ее работы;

3) «аналоговый ренессанс» – использование простых аналоговых элементов; биологические нейронные системы являются аналоговыми сис-темами, информация поступает в сеть по большому количеству каналов и кодируется по пространственному принципу: вид информации определяет-ся номером нервного волокна, по которому она передается; амплитуда входного воздействия кодируется плотностью нервных импульсов.

Предполагается, что система связей достаточно богата по своим воз-можностям и достаточно избыточна, чтобы скомпенсировать бедность вы-бора элементов, их ненадежность, возможные разрушения части связей.

Модель нейрона. Активационная функция. Нейронная сеть Основу нейросети составляют относительно простые, в большинстве

случаев – однотипные, элементы (ячейки), имитирующие работу нейронов мозга. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть воз-

буждены или заторможены. Он обладает группой синапсов – однонаправленных входных связей, соединенных с выхода-ми других нейронов, а также имеет выходную связь, с кото-рой сигнал (возбуждения или торможения) поступает на си-напсы следующих нейронов. Общий вид нейрона приведен на рис.40. Каждый синапс ха-рактеризуется величиной си-ноптической связи или ее весом Рис. 40. Искусственный нейрон

89

wi, который по физическому смыслу эквивалентен электрической прово-димости. Текущее состояние нейрона определяется как взвешенная сумма

его входов: 1=

= ⋅∑n

i ii

s x w .

Выход нейрона есть функция его состояния: y = f(s). Нелинейная функция f называется активационной и может иметь

различный вид, как показано на рис. 41. Одна из наиболее распространен-ных – нелинейная функция с насыщением, так называемая логистическая

функция, или сигмоид (функция S-образного вида): .1

1)( xexf α−+

=

Рис. 41. Активационная функция: а – функция единичного скачка; б – линейный порог (гистерезис);

в – сигмоид-гиперболический тангенс; г – сигмоид-формула При уменьшении α сигмоид становится более пологим, в пределе

при α=0 вырождаясь в горизонтальную линию на уровне 0,5; при увели-чении α сигмоид приближается по внешнему виду к функции единичного скачка с порогом T в точке x=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Вместо сигмои-дальной функции широко применяется гиперболический тангенс, обла-дающий аналогичными свойствами:

ss

ss

k eeeesthS −+

−== )()(ϕ

а) б)

в) г)

.

90

Каждый нейрон получает сигналы от соседних нейронов по нервным волокнам. Эти сигналы могут быть возбуждающими или тормозящими. Их сумма составляет электрический потенциал внутри тела нейрона. Когда потенциал превышает некоторый порог, нейрон переходит в возбужденное состояние и посылает сигнал по выходному нервному волокну.

Искусственная нейронная сеть (ИНС, нейросеть) – это набор нейронов, соединенных между собой. Как правило, передаточные функции нейронов в сети фиксированы, а веса являются параметрами сети и могут изменяться. Не-которые входы нейронов помечены как внешние входы сети, а некоторые вы-ходы – как внешние выходы сети. Подавая любые числа на входы сети, мы получаем какой-то набор чисел на выходах сети. Таким образом, работа ней-росети состоит в преобразовании входного вектора в выходной, причем это преобразование задается весами сети.

На практике после решения об использовании технологии нейросе-тей для конкретной задачи формируется список входных переменных и выходных результатов, и подбираются данные для обучения, то есть осу-ществляется постановка задачи в соответствии с нейросетевой моделью (рис. 42). Подготовка отобранных данных – этап, который определяет эф-фективность обучения и дальнейшего использования нейросети. В зависи-мости от типа поставленной задачи (прогноз, классификация, распознава-ние и т.д.) осуществляется выбор архитектуры. Далее нейронная сеть обу-чается на подготовленных примерах. По результатам обучения и тестиро-вания определяется пригодность нейросети к использованию и показатели качества ее работы. Если результаты тестирования не удовлетворительны, то происходит повторная настройка сети: анализ входных и выходных па-раметров, изменение базы данных обучающих примеров, пересмотр архи-тектуры или параметров нейросети, коррекция параметров обучения. Про-цесс повторяется до тех пор, пока не будут получены удовлетворительные результаты тестирования или не сделан вывод о несостоятельности приме-нения данной технологии. Функционирование обученной нейросети за-ключается в предъявлении на ее входы набора параметров и получение рассчитанного нейросетью выходного значения, которое служит оконча-тельным ответом.

Особенность человеческого мозга состоит в том, что, однажды обу-чившись определенному процессу, он может верно действовать и в тех си-туациях, в которых он не бывал в процессе обучения. Так же и нейросеть, хорошо обученная, может с большой вероятностью правильно реагировать

91

на новые, не предъявленные ей ранее данные. Например, можно предло-жить сети классифицировать новое изображение буквы, написанное дру-гим почерком. Веса обученной сети хранят достаточно много информации о сходстве и различиях букв, поэтому можно рассчитывать на правильный ответ и для нового варианта.

Рис. 42. Решение задачи с использованием нейросетевых технологий Построение нейросетевой модели. Этот вопрос решается в два эта-

па: выбор типа (архитектуры) сети и подбор весов (обучение) сети. Архитектура нейросети определяет:

• какие нейроны будут использоваться (число входов, активационные функции);

• каким образом следует соединить их между собой (топология сети); • что взять в качестве входов и выходов сети; • алгоритм обучения и функционирования.

Для слоистых сетей дополнительно определяют: • число слоев; • количество и характеристики нейронов в каждом слое.

Придумывать нейросеть «с нуля» необязательно, существует несколь-ко десятков различных нейросетевых архитектур. Отдельные искусственные нейроны соединяются друг с другом различными методами. Это позволяет

Выбор типа сети Обучение сети Применение

Настройка весов сети

база фактов

Ответ

обученная сеть

данные

92

создавать разнообразные нейронные сети с различной архитектурой, прави-лами обучения и возможностями (рис. 43). С точки зрения топологии (архи-тектуры) можно выделить три основных типа нейронных сетей:

1. Полносвязные ИНС. 2. Слабосвязные ИНС. 3. Многослойные ИНС.

Рис. 43. Классификация искусственных нейронных сетей

Полносвязные ИНС (рис. 44). Отличительная особенность данной архи-

тектуры ИНС – наличие связей между всеми нейронами. В полносвязных се-тях каждый нейрон передает свой выходной сигнал остальным нейронам, в том числе и самому себе. Все входные сигналы подаются всем нейронам. Вы-ходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети. Они нашли свое применение при решении задач классификации и распознавания образов.

Рис. 44. Примеры полносвязных сетей

93

Слабосвязные ИНС. В слабосвязных нейронных сетях нейроны ра-сполагаются в узлах прямоугольной или гексагональной решетки. Каж-дый нейрон связан с четырьмя (окрестность фон Неймана), шестью (окрестность Галея) или восемью (окрестность Мура) своими соседями (рис. 45).

а) б) в)

Рис. 45. Слабосвязные сети: а) – окрестность фон Неймана; б) – окрестность Галея; в) – окрестность Мура

Многослойные ИНС. В многослойных нейронных сетях нейроны об-ъединяются в слои. Среди многослойных нейронных сетей выделяют сле-дующие типы.

1. Монотонные. Это частный случай слоистых сетей с дополнитель-ными условиями на связи и нейроны. Для нейронов монотонных сетей не-обходима монотонная зависимость выходного сигнала нейрона от параме-тров входных сигналов.

2. Сети без обратных связей. В таких сетях нейроны входного слоя получают входные сигналы, преобразуют их и передают нейронам пер-вого скрытого слоя, и так далее вплоть до выходного, который выдает сигналы для интерпретатора и пользователя. В сетях прямого распро-странения нейроны расположены слоями (слоистые сети). Большое рас-пространение получили сети, имеющие три слоя (входной, скрытый, вы-ходной).

Если не оговорено противное, то каждый выходной сигнал k-гo слоя подастся на вход всех нейронов (k+1)-гo слоя. Использование скрытых слоев позволяет ИНС осуществить нелинейные преобразования вход – выход любой сложности или извлекать из входных данных статистичес-

94

кие показатели высоких порядков. На рис. 46 изображена трехслойная прямонаправленная сеть с одним скрытым слоем.

Рис. 46. Многослойная прямонаправленная сеть

Частным случаем многослойных сетей прямого распространения си-

гнала, нашедшим широчайшее распространение, являются однослойные прямонаправленные сети. На рис. 47 изображена однослойная прямонап-равленная ИНС.

Рис. 47. Однослойная прямонаправленная сеть

95

3. Сети с обратными связями – рекуррентные сети (рис 48). Такие сети характеризуются наличием обратных связей и элементов временной задержки сигнала. В рекуррентных сетях в результате функционирования происходит модификация входных сигналов нейронов и динамическое изменение состояния сети, так как существуют нейроны, выходные сиг-налы которых – одновременно входные сигналы для этих же нейронов. Частный случай сетей с обратными связями – полносвязные сети, в кото-рых каждый нейрон передает свой выходной сигнал остальным нейронам, включая самого себя.

Наиболее простой случай рекуррентной сети – один слой нейронов, охваченный обратными связями. Одним из главных применений таких се-тей являются нейроэмуляторы динамических объектов, то есть нейросете-вые модели таких объектов.

Сети прямого распростране-ния – статические в том смысле, что на заданный вход они выраба-тывают ответ, не зависящий от предыдущего состояния сети. Ре-куррентные сети являются дина-мическими.

Среди рекуррентных сетей, в свою очередь, выделяют следую-щие.

• Слоисто-циклические, их слои замкнуты в кольцо: последний слой передает свои выходные сигналы первому; все слои равноправны и могут как получать входные сигналы, так и выдавать выходные.

• Слоисто-полносвязанные состоят из слоев, каждый из которых пред-ставляет собой полносвязную сеть, а сигналы передаются как от слоя к слою, так и внутри слоя; в каждом слое цикл работы распадается на три части: прием сигналов с предыдущего слоя, обмен сигналами внутри слоя, выработка выходного сигнала и передача к последую-щему слою.

• Полносвязанно-слоистые, по своей структуре аналогичные слоисто-полносвязанным, но функционирующие по-другому: в них не разде-ляются фазы обмена внутри слоя и передачи следующему, на каж-дом такте нейроны всех слоев принимают сигналы от нейронов как своего слоя, так и последующих.

Рис. 48. Структура рекуррентной сети

96

На следующем этапе следует обучить сеть, то есть подобрать такие значения ее весов, чтобы сеть работала нужным образом (рис. 49). Необу-ченная сеть подобна ребенку – ее можно научить чему угодно. В исполь-зуемых на практике нейросетях количество весов может составлять не-сколько десятков тысяч, поэтому обучение – действительно сложный про-цесс. Для многих архитектур разработаны специальные алгоритмы обуче-ния, которые позволяют настроить веса сети определенным образом. Наи-более популярный из этих алгоритмов – метод обратного распространения ошибки (Error Back Propagation), используемый для обучения перцептрона.

При обучении сети имеется некоторая база данных, содержащая примеры. Предъявляя пример на вход сети, мы получаем от нее некоторый ответ, не обязательно верный. Нам известен и верный (желаемый) ответ. Вычисляя разность между желаемым ответом и реальным ответом сети, мы получаем вектор ошибки. Алгоритм обратного распространения ошиб-ки – это набор формул, который позволяет по вектору ошибки вычислить требуемые поправки для весов сети. Одну и ту же букву (а также различ-ные изображения одной буквы) предъявляют сети много раз.

Рис. 49. Обучение нейросети После многократного предъявления примеров веса сети стабилизи-

руются, причем сеть дает правильные ответы на все (или почти все) при-меры из базы данных. В таком случае говорят, что «сеть выучила все при-

ошибка мала

База данных

Выбор примера

Функционирование сети

Подстройка весов сети

Сеть обу-чена

Расчет ошибки

ответ сети

ошибка велика

97

меры», «сеть обучена», или «сеть натренирована». В процессе обучения величина ошибки (сумма квадратов ошибок по всем выходам) постепенно уменьшается. Когда величина ошибки достигает нуля или приемлемого малого уровня, тренировку останавливают, а полученную сеть считают на-тренированной и готовой к применению на новых данных. Важно отметить, что вся информация, которую сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения сети напрямую зависит от количест-ва примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу. Так, например, бессмысленно исполь-зовать сеть для предсказания финансового кризиса, если в обучающей вы-борке кризисов не представлено. Считается, что для полноценной трениров-ки требуется хотя бы несколько десятков (а лучше сотен) примеров.

Обучение нейронной сети может вестись с учителем или без него. В первом случае сети предъявляются значения как входных, так и желатель-ных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синоптических связей.

Во втором случае выходы нейронной сети формируются самостоя-тельно, а веса изменяются по алгоритму, учитывающему только входные и производные от них сигналы. Обучающее множество состоит лишь из вхо-дных векторов. Алгоритм подстраивает веса сети так, чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Про-цесс обучения выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. При поступлении на вход обучаю-щего вектора сеть совершает несколько тактов, подстраивая веса так, что-бы стабилизировать выходы – процесс обучения на данном шаге продол-жается до тех пор, пока расстояние между значениями выходов на преды-дущем и текущем такте не уменьшится до приемлемо малой погрешности. Затем на вход подается следующий входной вектор и цикл повторяется. Функционирование нейросети осуществляется аналогично при условии, что веса нейронов не изменяются.

Общая постановка задачи нейросетевого моделирования предполага-ет ряд подходов: определение значения целевой переменной в зависимости от соответствующих значений параметров объектов-аналогов (предсказа-ние по аналогии), прогноз по данным нескольких предшествующих моме-нтов времени (прогнозирование по предистории), вычисление значения целевой переменной в зависимости от влияния различных факторов (рас-чет по факторам) и смешанное решение.

98

В настоящее время нейросетевая технология получила распростра-нение в специализированных пакетах: BrainMaker (первая нейросетевая программа, появившаяся в России), NeuroShell и NeuroWindows, NeuroSo-lutions, NeuroOffice (Российская разработка), а также как модули расшире-ния статистических пакетов и математического программного обеспечения (MathLab).

5.3. Генетические алгоритмы Генетический алгоритм – это простая модель эволюции в природе,

реализованная в виде компьютерной программы. В этом методе использу-ются аналоги механизмов генетического наследования, мутации и естест-венного отбора. Впервые алгоритм был предложен в 1975 г. Джоном Хол-ландом (John Holland) в Мичиганском университете. Он получил название «репродуктивный план Холланда» и лег в основу практически всех вари-антов генетических алгоритмов.

Постановка задачи, решаемой генетическим алгоритмом. Имеется несколько альтернативных решений (ситуаций, объектов). Их количество велико настолько, что методом перебора решать задачу нецелесообразно (рис. 50).

Несколько начальных ситуаций

Бесконечное множество возможных ситуаций

Набор лучших ситуаций

Р Р ГА Рис. 50. Решение задач с помощью генетического алгоритма

Решение (ситуация, объект) определяется набором параметров

(свойств, характеристик) – D(P1…Pn). В зависимости от их значений для каждого решения можно рассчитать меру качества (целевую функцию) –

99

M = M(P1…Pn). Задача состоит в том, чтобы на основе нескольких началь-ных решений [D1,…Dm] получить лучшее(ие) D* с точки зрения меры каче-ства, не прибегая к перебору всех возможных вариантов.

При построении процедуры поиска методом генетического алгорит-ма множество допустимых решений представляется в виде конечной попу-ляции особей. Каждая особь в популяции обладает мерой приспособленно-сти. Поиск оптимального решения описывается процессом моделируемой «эволюции», цель которого – нахождение особи, имеющей максимальную приспособленность, т.е. особи, соответствующей оптимальному набору управляемых параметров.

Каждая особь представлена в виде набора некоторого числа генов называемого хромосомой, их число соответствует размерности решае-мой задачи. Ген представляет собой один бит (0 или 1) или битовую строку. Допустим, что у объекта имеется 5 признаков (рис. 51), каждый закодирован геном длиной в 4 элемента. Тогда длина хромосомы будет 5·4=20 бит.

0010 1010 1001 0100 1101

Рис. 51. Пример хромосомы, состоящей из пяти генов

Каждая особь обладает определенным набором внешних признаков

или свойств объекта X – фенотипом, информацию об объекте на уровне хромосомного набора содержит генотип S. При этом каждый ген имеет свое отражение в фенотипе. Термин «фенотип» относится к внешним на-блюдаемым признакам и соответствует вектору в пространстве парамет-ров, а функционирование механизмов генетического алгоритма произво-дится на уровне генотипа.

Параметры x обычно кодируются бинарной строкой s. Для оптими-зации надо задать некоторую меру качества для каждой особи. На уровне фенотипа ей соответствует целевая функция f(x), на основе которой строи-тся функция пригодности или приспособленности μ(s), используемая при операциях с генотипом. Таким образом, каждое возможное решение s, имеющее соответствующую приспособленность μ(s), представляет реше-ние x. Соотношение понятий, используемых в генетических алгоритмах, приведено в табл. 3.

100

Таблица 3 Генотип Фенотип

Ген – один бит или двоичное число. Признак, характеристика, свойство – целое или вещественное число, символьная пере-

менная Хромосома – вектор (последовательность) из нулей и единиц. Каждая позиция – ген Индивид = генетический код = набор хро-

мосом Вариант решения задачи, оптимизируемого объекта или ситуации – набор параметров

Эпоха, поколение, популяция Набор различных решений задачи, каждый из которых оценивается значением целевой функции

Функция приспособленности, рассчитыва-ется для индивида и для поколения в целом

Целевая функция – функция от оптимизируе-мых параметров

В зависимости от сложности задачи решению может соответствовать

либо хромосома, состоящая из генов-признаков, либо набор хромосом – индивид. Понятие особи чаще всего используется как объединение фено-типических признаков и генотипа.

Генетические операторы. Работа генетического алгоритма основана на нескольких базовых операциях с генами и хромосомами – генетических операторах (рис. 52).

Скрещивание Мутация Инверсия

1

+

0

=

0 0

0 0

1

1 0 0 1 1 0 1

1 1 1 1 1 0 0

1 1 1 0 0 0 0

0 0 0 1 0 1 0

1 0 1 0 0 1 0

Рис. 52. Реализация основных генетических операторов Скрещивание (кроссовер, кроссинговер) – операция, состоящая в об-

мене хромосом-родителей генами, в результате которого получается хро-мосома (потомок), наследующая признаки обоих родителей. Бывает одно-точечный, двухточечный, многоточечный, равномерный кроссовер. При одноточечном кроссовере родительские хромосомы «разрываются» в од-

101

ной точке и соответствующие участки объединяются, образуя хромосому потомка. В двухточечной выбираются две точки разрыва, и родительские хромосомы обмениваются сегментом, который находится между двумя этими точками. В равномерном кроссовере каждый бит первого родителя наследуется первым потомком с заданной вероятностью; в противном слу-чае этот бит передается второму потомку.

Мутация – операция, при которой один или несколько генов в хро-мосоме случайным образом меняют свои значения. Количество особей, мутирующих в данном поколении, определяется параметром «вероятность мутации». С точки зрения оптимизации функций, мутация позволяет по-пасть в пределы локального или глобального экстремума, еще не охвачен-ного областью поиска. Инверсия изменяет порядок бит в хромосоме путем циклической перестановки.

Выбор родительской пары осуществляется по одному из известных алгоритмов, которые учитывают распределение приспособленности особей в поколении либо производят выбор случайным образом. Первый подход хорош тем, что делает процесс поиска более управляемым и предсказуе-мым. Скрещивание и выбор родительской пары происходят до выполнения некоторого условия, которое задается в качестве одного из параметров ал-горитма, в простом случае оно ограничивает число воспроизводимых по-томков фиксированным числом брачных пар.

Отбор (селекция) – операция, позволяющая улучшать генофонд по-пуляции за счет отбрасывания особей, имеющих меньшее значение функ-ции приспособленности, и сохранения для последующего размножения более приспособленных.

Принцип работы генетического алгоритма. В начале генерируется случайная популяция – несколько индивидуумов со случайным набором хромосом. Генетический алгоритм имитирует эволюцию этой популяции как циклический процесс скрещивания индивидуумов и смены поколений. Жизненный цикл популяции – это несколько случайных скрещиваний и мутаций, в результате которых к популяции добавляются новые индивиду-умы. После отбора к новой популяции опять применяются операции крос-совера и мутации, затем опять происходит отбор. Каждое следующее по-коление будет в среднем лучше предыдущего. Когда приспособленность индивидуумов перестает заметно увеличиваться, процесс останавливают и в качестве решения задачи оптимизации берут наилучшего из найденных индивидуумов.

102

Работа генетического алгоритма представляет собой итерационный процесс, который продолжается пока не выполнятся заданное число поко-лений или какой-либо иной критерий остановки (рис. 53).

Начальная популяция – это несколько особей, которые станут «пра-родителями» всех последующих поколений. Простой генетический алго-ритм генерирует начальную популяцию случайным образом. В другом случае она строится на основе реальных решений или как набор заранее известных «хороших» решений. Это определяет более быструю сходи-мость алгоритма.

На стадии воспроизводства реализуется размножение внутри попу-ляции. Для этого отбираются несколько пар особей, производится скрещи-вание между хромосомами в каждой паре, а полученные новые хромосомы помещаются в популяцию нового поколения.

Классическая схема предполагает ограничение численности потом-ков путем использования так называемой вероятности кроссовера Pс. Так-же используется фиксированное число брачных пар на каждом поколении, при этом каждая брачная пара «дает» двух потомков. Часто используется так называемая стратегия элитизма, при которой несколько лучших осо-бей переходят в следующее поколение без изменений, не участвуя в крос-совере и отборе.

После стадии воспроизводства выполняются операторы мутации – в нескольких случайно выбранных особях нового поколения изменяются не-которые гены, за счет чего в каждом следующем поколении возникают со-вершенно новые решения задачи.

Для особей нового поколения рассчитывается функция приспособ-ленности как среднее значение приспособленностей особей.

Модель отбора определяет, каким образом следует строить популя-цию следующего поколения: сколько и какие особи «выживают» и «уми-рают». Популяция следующего поколения в большинстве реализаций гене-тических алгоритмов содержит столько же особей, сколько начальная, сре-ди них есть как плохие, так и хорошие, но благодаря отбору приспособ-ленность в ней в среднем выше. Для всего поколения в целом рассчитыва-ется приспособленность поколения как среднее функций приспособленно- сти особей.

103

Генерацияначальнойпопуляции

МутацияРасчет

ФП особей ипоколений

Отбор Критерийостановки

Всех лискрестили

Скрещивание(Кроссовер)

Выборродительской

пары

Воспроизводство

Эволюция

Рис. 53. Схема работы генетического алгоритма

103

104

Эволюция ведет к тому, что число хороших решений будет возрас-тать. Процесс завершается при достижении критерия остановки: пройдено заданное число поколений, достигнуто установленное время. Чаще всего используют следующий критерий: для каждого поколения рассчитывается приспособленность (числовая оценка), эволюция прекращается, когда раз-ница между значениями приспособленности текущего поколения и преды-дущего достигнет заданной величины (ошибки): | Пt – Пt-1 | <= d. В качест-ве решения задачи оптимизации берут наилучшую из найденных особей или отбирают несколько лучших решений.

Процесс использования генетического алгоритма при решении задач Для решения задачи методом генетического алгоритма выбираются

оптимизируемые переменные (характеристики, свойства или параметры объекта, процесса, решения, признаки ситуации), строится модель и опре-деляется зависимость функции оценки от этих переменных. В простейшем случае модель объекта и функция оценки объединяются в целевую функ-цию – функцию от оптимизируемых переменных, для которой необходимо найти максимум или минимум (рис. 54).

Определениеоптимизируемыхпеременных

Построениеимитационноймодели или ЦФ

Формулировка задачи

Настройкапараметров ГА

Создание начальнойпопуляции

Эволюция Решение

Рис. 54. Использование генетического алгоритма при решении задач

Далее определяются правила представления оптимизируемых

параметров в виде генов, длина хромосомы и численность популяции и настраиваются параметры генетического алгоритма.

1. Параметры отбора: размер «популяции», процентное количество хромосом, попадающих в следующую популяцию в результате отбора (~0,9), стратегия отбора наиболее устойчивых генов.

105

2. Параметры мутации: вероятность обработки оператором мутации каждой конкретной хромосомы (0,001 – 0,01), тип операции локаль-ного изменения (мутации).

3. Параметры скрещивания: вероятность обработки оператором скрещива-ния каждой конкретной хромосомы (~0,9), тип оператора скрещивания.

4. Критерии останова вычислений: прекращается рост максимальной приспособленности в популяции, число поколений достигает задан-ного предела, ограничение на максимальное число эпох функциони-рования алгоритма.

5. Тип выбора родительской пары: случайный выбор родительской па-ры, селективный выбор, инбридинг и аутбридинг. При использовании генетических алгоритмов возникают еще две за-

дачи – это кодирование оптимизируемых параметров во внутреннее пред-ставление хромосомами и генами (бинарное, при котором чаще всего ис-пользуют код Грея, целочисленное или целочисленное с учетом порядка следования генов) и интерпретация результатов, полученных также в виде генов и хромосом. Символьные параметры предварительно преобразуют в числовой эквивалент. Используют следующие типы представления (коди-рования) диапазона значений каждого оптимизируемого параметра:

- тип Continuous предполагает кодирование диапазона переменной в двоичном виде (8, 16 или 32 разряда);

- тип Enumerated применяется в случае, когда важен порядок следо-вания значений переменной.

Насколько удачным окажется применение генетического алгоритма при решении той или иной задачи во многом определяется его удачной на-стройкой. Далее создается начальная популяция решений. Процесс эволю-ции «выращивает» поколение лучших решений, в зависимости от цели в качестве результата выбирают особь или группу особей с наибольшим значением целевой функции.

Применение генетического алгоритма (ГА). Наиболее популярное при-ложение генетических алгоритмов – задачи оптимизации, среди которых оп-тимизация многопараметрических функций и сложных функций с множест-вом экстремумов. Другие области использования генетических алгоритмов:

• моделирование развития в различных предметных областях, включая биологические (экология, иммунология и популяци-онная генетика), социальные (такие как экономика и политиче-ские системы) и когнитивные системы;

106

• использование их при проектировании нейронных сетей, соз-дании других вычислительных структур, например, автоматов или сетей сортировки, управлении роботами.

Среди всех методов оптимизации и поиска решения генетический алгоритм выделяется тем, что «эвристически» сужает пространство поиска и находит приемлемое решение при ограниченных вычислительных ресур-сах и времени, поэтому его использование целесообразно в задачах боль-шой размерности и многоэкстремальности оптимизируемых функций, при очень большом или бесконечном (непрерывном) множестве возможных вариантов, а также для моделей, в которых важен не только конечный ре-зультат, но и эволюционный процесс его получения. Результат работы ге-нетического алгоритма не всегда самое лучшее решение, но близкое к не-му. При настройке параметров метода находится компромисс между точ-ностью и скоростью получения результата, поэтому основное преимуще-ство генетического алгоритма – эффективность поиска, то есть оптималь-ное соотношение точности и скорости.

ГА позволяет накапливать удачные решения для систем, состоящих из относительно независимых частей (большинство современных сложных технических систем и все известные живые организмы), поэтому в этих задачах ГА на несколько порядков превосходит по быстроте другие виды поиска. В системах, которые сложно разбить на подсистемы, преимущест-ва обмена генетическим материалом сводятся к нулю.

На российском рынке получил распространение пакет GeneHunter – приложение, встраиваемое в Microsoft Excel, и программа Evolver.

5.4. Искусственная жизнь и клеточные автоматы В конце 80-х гг. сформировалось направление кибернетических исс-

ледований, названное искусственной жизнью (Artificial Life или ALife). Основной мотивацией исследований искусственной жизни служит жела-ние понять и смоделировать формальные принципы организации биологи-ческой жизни. Как сказал руководитель первой международной конферен-ции по искусственной жизни К.Лангтон (C.Langton), «основное предполо-жение искусственной жизни состоит в том, что “логическая форма” орга-низма может быть отделена от материальной основы его конструкции». «Организмы» в искусственной жизни – придуманные людьми объекты, живущие в мире компьютерных программ.

107

Artificial Life – это «компьютерное моделирование живых объектов». Artificial Life – это обобщающий метод построения динамических

моделей, базирующийся на совокупности разных наук – генетических ал-горитмах, теории автоматов, теории хаоса, кибернетике, системной дина-мике, нейросетях и др.

Artificial Life – теория управления сообществом роботов, решающих навигационные задачи путем адаптации к внешним условиям (определение для промышленности).

На практике к Artificial Life принято относить компьютерные моде-ли, обладающие рядом конкретных особенностей:

• центральная модель системы обладает способностью адапти-роваться к условиям внешнего мира, пополняя знания о нем путем взаимодействия с другими объектами и средой;

• компоненты системы, развиваясь в процессе эволюции, способны передавать свои характерные черты по наследству. Соответствен-но, присутствует механизм порождения новых поколений путем деления, скрещивания, дублирования существующих объектов;

• окружающий мир сводит к минимуму шансы на выживание и появление потомства у слабых и плохо приспособленных особей;

• присутствует механизм порождения новых форм (аналог мутаций в реальном мире), обычно содержащий элемент случайности.

Для решения задач методами Аrtificial Life (например, создание сложного устройства, разработка оптимальной стратегии поведения фир-мы на рынке и т.д.) строится динамическая модель среды, в которой пред-стоит существовать проектируемому объекту, в ней создается множество разновидностей объекта и запускается процесс эволюции, длящийся мно-жество поколений. Плохие реализации объекта отсеиваются, хорошие – скрещиваются, закрепляя в новых поколениях лучшие характеристики. Че-рез несколько циклов такая селекция приводит к «цивилизации» объектов, хорошо приспособленных к заданной модели среды.

Причины использования в ряде задач методов Artificial Life, а не классических методов теории управления, оптимизации и системного ана-лиза в том, что при анализе и проектировании сложных систем возникают вопросы, плохо решаемые традиционными методами.Cреди них:

• неполнота знаний о внешнем мире, непредсказуемость реаль-ных ситуаций – это требует наличия интеллектуальных адап-тивных систем, способных подстраиваться к изменению, не

108

только внешних факторов, но и к изменению «правил игры», законов существования и развития;

• большие размерности – сдерживающий фактор при решении многих задач. Сюда входят бесконечное множество возмож-ных вариантов развития системы, множество изменчивых внешних факторов, влияющих на поведение объектов, слож-ность структуры (и как следствие большое пространство со-стояний) моделируемой системы и т.д.

В 60-х гг. кибернетик и математик М. Л. Цетлин предложил и иссле-довал модели автоматов, способных адаптивно приспосабливаться к окру-жающей среде. Его работы инициировали научное направление, названное «коллективное поведение автоматов», которое стало предшественником моделей Artificial Life.

Формальная модель клеточного автомата. Клеточный автомат пред-ставляет собой некоторую абстрактную модель жизни. Основным его элемен-том является клетка – «кусочек» одномерного, двумерного или многомерного пространства, окруженный соседями. Клетка живет по заданным пространст-венным законам в синхронном времени, то есть в некоторые моменты времени изменяется ее состояние и одновременно изменяется состояние всех клеток модели. Количество состояний определяется параметрами модели и может быть бесконечно (классический пример – два состояния – жива (1) и мертва (0)). Совокупность клеток образует некоторый объект, так же существующий во времени и пространстве. При независимом функционировании клеточного автомата наблюдается появление устойчивых форм жизни (объектов с устой-чивой конфигурацией) и формирование у них различных стратегий поведения. Весь интерес теории в том, чтобы проектировать объекты с заданными свойст-вами и наблюдать за их эволюцией в созданной среде окружения.

Модель клеточного автомата дискретна в пространстве и во времени. Формализуем постановку задачи: пусть задано некоторое пространство и в его пределах топологический закон. Тогда для определения клеточного ав-томата определяют:

D – размерность пространства; S – число состояний (минимум 1, максимум зависит от решаемой за-

дачи); R – минимальная окрестность клетки: симметричная – 4 соседа (на

севере, юге, востоке и западе — окрестность Неймана), полная – 8 соседей, т. е. еще 4 клетки по диагоналям (окрестность Мура);

109

M – глубина памяти (предыдущие состояния); П – правило «жизни» клетки, определяемое как ее состояние в мо-

мент времени К+1 в зависимости от ее состояния и состояния клеток ми-нимальной окрестности в момент времени К.

Ограничение модели – это свойства границы поля. Законы поведения автоматов на границе поля задаются отдельными правилами. Другое огра-ничение на клеточные автоматы – это понятие синхронного времени: все состояния клеток-автоматов изменяются одновременно. Это фундамента-льное свойство отличает модель вычислений в клеточных автоматах от всех алгоритмов последовательного вычисления, положенных в основу со-временных компьютеров. Алгоритмы для клеточных автоматов строятся, исходя из предположения о том, что моделируемое явление или процесс можно представить как пространственную систему, состоящую из «физи-ческого» пространства, в котором располагаются отдельные «существа» и каждое из них «живет» по одним и тем же правилам – законам.

Особенности клеточных автоматов в том, что локальные изменения приводят к глобальным последствиям и свойственному этим автоматам параллелизму.

Простейшим клеточным автоматом называется автомат со следую-щими характеристиками; 1D, 1R, 2S, 1М. Состояние каждой клетки здесь зависит от ее предыдущего состояния и состояния двух ее соседей. Клето-чные автоматы, могут быть даже одномерными (1D).

Игра «Жизнь» представляет собой частный случай клеточного авто-мата. Здесь он работает в двумерном пространстве (2D), с радиусом 1 (1R – рассматриваются только соседи на расстоянии 1 клетки), с числом состоя-ний клетки,равным 2 (2S – пустая или с крестиком). Глубина памяти (пре-дыдущие состояния) в точности равна 1 (1М – рассматривается состояние только одного предшествующего поколения).

Игру «Жизнь» придумал в конце 60-х гг. американский математик Conway, и она сразу же оказалась весьма популярной, поскольку позволяет выполнять интересные исследования и получать удивительные и неожи-данные результаты. Возникающие в процессе игры ситуации очень похожи на реальные процессы, происходящие при зарождении, развитии и гибели колоний (популяций) живых организмов. По этой причине «Жизнь» отно-сят к категории моделирующих игр.

Существуют различные реализации игры: в одном случае каждую клетку поля окружают восемь соседних: четыре имеют с ней общие сторо-

110

ны, а четыре другие – общие вершины (так называемая окрестность Мура), в другом случае – четыре соседних (окрестность Неймана).

Действие игры происходит на некой плоскости, разделенной на кле-тки. Каждая клетка может находиться в двух состояниях – живом или мер-твом. На состояние клетки оказывают влияние состояния соседних клеток. Во времени эти состояния меняются дискретно в соответствии с некото-рыми правилами или генетическими законами конвея.

1.Правило выживания. Каждый организм, у которого имеются два или три соседних, выживает и переходит в следующее поколение.

2.Правило рождения. Если число организмов, с которым граничит пус-тая клетка, равно трем, то на ней происходит рождение нового организма.

3.Правило гибели. Каждый организм, который граничит более чем с тремя или менее чем с двумя, погибает от перенаселения или от одиночес-тва соответственно.

Гибель и рождение всех организмов происходит одновременно. Воз-никающие в игре ситуации очень похожи на реальные процессы, происхо-дящие при зарождении, развитии и гибели живых организмов.

Основная идея игры состоит в том, чтобы, начав с какого нибудь простого расположения живых клеток, проследить за эволюцией исходной позиции под действием упоминавшихся генетических законов Конвея, ко-торые управляют рождением, гибелью и выживанием клеток. Генетичес-кие законы Конвея удовлетворяют трем основным условиям:

1) не должно быть исходной конфигурации, для которой существует доказательство возможности неограниченного роста популяции;

2) должны существовать такие начальные конфигурации, которые заведомо обладают способностью беспредельно развиваться;

3) должны существовать простые начальные конфигурации, которые в течении значительного промежутка времени растут, претерпевают раз-нообразные изменения и заканчивают свою эволюцию одним из следую-щих трех способов:

а) полностью исчезают; б) переходят в устойчивую конфигурацию и перестают изме-няться; в) выходят на колебательный режим с определенным периодом.

Популяция клеток непрестанно претерпевает необычные изменения. Иногда колония клеток постепенно вымирает, однако произойти это может не сразу, а лишь после того, как сменится очень много поколений. В боль-

111

шинстве своем исходные конфигурации либо переходят в устойчивые и перестают изменяться, либо навсегда переходят в колебательный режим. При этом, конфигурации, не обладавшие в начале игры симметрией, обна-руживают тенденцию к переходу в симметричные формы. Обретенные свойства симметрии в процессе эволюции не утрачиваются, а симметрия конфигурации может лишь обогащаться.

Модель ПолиМир еще одна классическая разновидность клеточного автомата. Основные ее предположения состоят в следующем.

Имеется популяция агентов (искусственные организмы), которые имеют естественные потребности (Безопасность, Энергия, Размножение). Популяция агентов эволюционирует в простой среде, где растут лужайки травы (пища агентов). Агенты взаимодействуют между собой: агенты мо-гут скрещиваться и бороться друг с другом. Борьба может привести к ги-бели агента (погибший агент превращается в пищу и может быть съеден победителем). Скрещивание приводит к рождению новых агентов.

Каждая потребность характеризуется количественно мотивацией. Например, если энергетический ресурс агента мал, то есть потребность найти пищу (мотивация к нахождению пищи). Поведение агента управляе-тся от мотиваций. Если имеется определенная мотивация, то поведение агента меняется с тем, чтобы удовлетворить соответствующую потреб-ность. Такое поведение можно называть целенаправленным (есть цель дос-тигнуть определенную потребность).

В начале формируется исходная популяция агентов с разными уров-нями энергии, потребности в размножении и безопасности, и они начина-ют жить по установленным законам. В результате развития наблюдается формирование типовых стратегий поведения у выживающих особей: одни выживают за счет борьбы и победы над другими агентами (хищники), дру-гие – за счет уклонения от противоборства и поедания пищи (травоядные), третьи – за счет интенсивного размножения. Таким образом, цель рассмот-ренной модели – определить стратегии поведения, которые обеспечивают устойчивое существование организма в заданных условиях окружающей его среды. Прикладное значение подобные модели получают, когда в каче-стве агентов и среды выступают объекты и законы предметных областей, например, в экономике – это компании и организации, работающие в оп-ределенном секторе рынка, подчиняющиеся законодательству и гибким рыночным отношениям, взаимодействующие с госструктурами, разными контрагентами и между собой.

112

Применение моделей искусственной жизни и клеточных автоматов. Приведем список областей исследований методов «Искусственной жизни»:

• исследование динамики жизнеподобных структур в клеточных автоматах (К. Лангтон);

• эволюция двух конкурирующих популяций, одна из которых есть популяция программ, решающих прикладную задачу, а вторая – популяция задач, эволюционирующих в направлении усложнения задачи (Д. Хиллис (D.Hillis));

• эволюция и формирование «биоразнообразия» самовоспроизво-дящихся программ, живущих в виртуальных компьютерах (Т. Рей (T. Ray));

• анализ «биоразнообразия» самовоспроизводящихся программ на базе теории самоорганизованной критичности (К. Адами (C. Adami));

• компьютерная модель ПолиМир (Л. Ягер (L. Yaeger)); • эволюция кибернетических сущностей. Элементы Artificial Life используются в ситуационном моделирова-

нии и деловых играх для руководителей. Использование Artificial Life в компьютерной вирусологии рассматривает компьютерные вирусы как спе-цифическую разновидность искусственной жизни, способную к мутациям, размножению, инфицированию среды обитания и самосовершенствова-нию. С этой точки зрения антивирус обнаруживает не конкретные виды вирусов, а проявления новых форм компьютерной жизни – изменение дис-циплины обработки прерываний, нетипичное поведение известных про-грамм, незнакомый «почерк» общения программ с файловой системой и т.п. Моделирование катастроф, чрезвычайных ситуаций и военных конф-ликтов тоже область применения моделей Artificial Life.

С помощью клеточных автоматов восстанавливают поврежденные фотографии. Клеточные автоматы используются в области криптографии для получения новых алгоритмов шифрования информации. Поведение социальных групп также может описываться теорией клеточных автома-тов. Большую роль клеточные автоматы играют в экологическом модели-ровании и биологии (моделирование лесных пожаров, развития планктона, поведения муравьев и пчел). Немало работ посвящено использованию кле-точных автоматов в описании химических и физических процессов. Клето-чные автоматы – инструмент для программирования в области музыки, скульптуры и живописи.

113

5.5. Вопросы и задания 1. Назовите методы Data Mining, предназначенные для решения задач прогноза.

2. Назовите методы Data Mining, предназначенные для решения задач классификации.

3. Назовите методы Data Mining, предназначенные для решения задач оп-тимизации.

4. Какие ограничения накладываются на классификационные группы в методе деревьев?

5. Какой из методов Data Mining наиболее чувствителен к выбору меры схожести объектов или ситуаций, находящихся в базе данных?

6. Как называются системы, реализующие модели рынка? 7. Назовите источники знаний для методов Data Mining. 8. Имеется база данных большого объема. Записи образуют непересе-кающиеся группы. Всем записям группы соответствует одно решение. Требуется по заданной ситуации найти решение. Какой метод выбрать?

9. Существует бесконечное множество ситуаций (решений), каждую можно оценить. Вычисление оценки занимает много времени. Необхо-димо найти ситуацию, близкую к оптимальной по выбранному крите-рию оценки за ограниченное время. Какой метод Data Mining использо-вать?

10. Основное отличие ЭС от методов Data Mining при решении задач. 11. Основное отличие ЭС от методов Data Mining при получении знаний. 12. Основное отличие ЭС от методов Data Mining при интерпретации ре-

зультата. 13. Отличие источников знаний для ЭС и методов Data Mining. 14. При помощи какого инструментария создаются системы Data Mining?

* * *

15. Что такое нейросеть? 16. Расскажите про биологический и формальный нейрон. 17. В каком случае нейрон возбуждается? 18. В каком случае поведение формального нейрона меняется? 19. «Пример» для обучения нейросети, и из каких частей он состоит? 20. В чем отличие нейросети прямого распространения от рекуррентной

нейросети в процессе обучения?

114

21. В чем отличие нейросети прямого распространения от рекуррентной нейросети при остановке обучения?

22. В чем отличие обучающих данных для нейросети прямого распростра-нения и для рекуррентной нейросети?

23. Чем определяется преобразование входных сигналов сети в выходные? 24. Перечислите этапы построения и этапы использования нейросети. 25. Что в себя включает процесс обучения нейросети? 26. Как меняется структура сети при обучении? 27. Что определяет архитектура сети? 28. Расскажите про классификацию нейросетей. 29. Как называются сети, имеющие обратные связи? 30. Рекурентные сети – это сети, в которых сигнал … 31. В каких сетях каждый из нейронов связан со всеми остальными? 32. Как расположены нейроны в сетях прямого распространения? 33. Какие связи между нейронами в слоистых сетях? 34. В чем состоит процесс обучения с учителем? 35. В чем состоит процесс обучения без учителя? 36. При каком виде обучения нейросеть работает несколько тактов до ста-

билизации сигнала на ее выходе после предъявления примера. 37. Перечислите параметры управления обучением нейросети. 38. Свойства нейросети запоминать и обобщать. 39. Типы данных для обучения нейросети. 40. Критерии остановки обучения нейросети. 41. Когда целесообразно применять нейронные сети?

* * *

42. На каком этапе генетического алгоритма в нескольких случайно вы-

бранных особях нового поколения изменяются некоторые гены? 43. По какому принципу выбирается индивидуум для скрещивания? 44. Какие этапы включает в себя генетический алгоритм? 45. На сколько точные решения получаются в результате работы генетиче-

ского алгоритма и с чем это связано? 46. На основе какой функции строится функция приспособленности? 47. Приспособленность особи на фенотипическом уровне определяет … 48. Приспособленность особи на генотипическом уровне определяет … 49. Перечислите критерии остановки генетического алгоритма.

115

50. По какой причине необходимо останавливать генетический алгоритм? 51. В чем заключается принцип критерия остановки генетического алго-

ритма по ошибке? 52. Назовите 3 условия применимости генетического алгоритма для задач,

связанных с поиском оптимального решения. 53. Какие методы отбора в генетическом алгоритме вы знаете? 54. При каком методе отбора обязательно будут выживать лучший или

лучшие члены популяции? 55. В чем различие между одноточечным и двухточечным кроссовером? 56. Как называется численность популяции в терминологии генетического

алгоритма? 57. Назовите параметры скрещивания, которые настраиваются перед нача-

лом работы генетического алгоритма. 58. Как называется скрещивание в терминологии генетических алгорит-

мов? 59. В чем основное различие между целевой функции и функцией приспо-

собленности? 60. Какие типы задач решаются с помощью генетических алгоритмов?

* * *

61. В чем состоит основное предположение теории искусственной жизни? 62. По каким причинам методы Artificial Life в ряде случаев оказываются

более предпочтительными, чем классические методы теории управле-ния, оптимизации и системного анализа?

63. Какое свойство систем Artificial Life позволяет решать проблемы не-полноты знаний об окружающем мире и непредсказуемости реальных ситуаций?

64. Каким образом осуществляется селекция в моделях Artificial Life? 65. Какие два механизма Artificial Life приводят к появлению новых форм

и особей? 66. Как (в общих чертах) осуществляется решение реальных задач с помо-

щью Artificial Life? 67. Что означает понятие «синхронного времени» для клеточного автомата? 68. Что такое правило жизни клетки? 69. Что понимается под окрестностью Мура?

116

70. К какому типу моделей искусственной жизни относится игра «Жизнь»? 71. Каковы условия гибели клетки в модели «Жизнь»? 72. Чем управляется поведение агента в модели «ПолиМир»? 73. Приведите примеры стратегий модели «ПолиМир». 74. В чем состоит стратегия «ленивый каннибал» в модели «ПолиМир»? 75. Приведите примеры задач, решаемых методами Artificial Life. 76. Что понимается под окрестностью Неймана? 77. Каковы правила рождения клетки в модели «Жизнь»? 78. Каковы условия выживания клетки в модели «Жизнь»? 79. Каким образом система Artificial Life адаптируется к условиям внешне-

го мира и пополняет знания о нем? 80. Приведите примеры смежных с Artificial Life наук.

ЗАКЛЮЧЕНИЕ Экономические информационные системы интенсивно развиваются

в направлении их интеллектуализации, существенно изменяя всю техноло-гию принятия управленческих решений, начиная от формулирования про-блемы, фоматизации задачи, выработки стратегии, принятия и реализации решения. Интеллектуальный симбиоз человека-управленца и интеллекту-альной компьютерной системы выведет на новый уровень эффективности, адекватности и оперативности решений в процессе управления сложными экономическими системами.

Приведенные в учебном пособии основы теории искусственных ин-теллектуалтных информационных систем позволят студентам получить знания по основным направлениям теории искусственного интеллекта, ко-торые будут необходимы при разработке интеллектуальных информаци-онных систем.

117

СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ

1. Адаменко, А. Н. Логическое программирование и Visual Prolog / А. Н. Адаменко, А. М. Кучуков. – СПб. : БХВ-Петербург, 2003. – 992 с. – ISBN 5-94-157-156-9.

2. Генетические алгоритмы, искусственные нейронные сети и пробле-мы виртуальной реальности / Г. К. Вороновский [и др.]. – Харьков: Основа, 1997. – 112 с. – ISBN 5-7768-0293-8.

3. Гради, Буч. Объектно-ориентированный анализ и проектирование с примерами приложений на С++ : пер. с англ. / Буч Гради. – М.: Би-ном, СПб. : Невский диалект, 1999. – 560 с.

4. Дюк, В. Data Mining : учеб. курс / В. Дюк, А. Самойленко. – СПб. : Питер, 2001. – 368 с. : ил. – ISBN 5-318-00227-7.

5. Искусственный интеллект : справочник. В 3 кн. /под ред. Э. Попова, Д. Поспелова. – М. : Радио и связь, 1990.

6. Клименко, А. В. Основы естественного интеллекта. Рекуррентная теория самоорганизации. Версия 3 / А. В. Клименко. – Ростов н/Д. : Изд-во Рост. ун-та, 1994. – 304 с.

7. Логический подход к искусственному интеллекту: от классической логики к логическому программированию / А. Тей [и др.]. – М. : Мир, 1990. – 432 с.

8. Любарский, Ю. Я. Интеллектуальные информационные системы / Ю. Я. Любарский. – М. : Наука, 1990. – 232 с.

9. Медведев, В. С. Нейронные сети. Matlab 6 / В. С. Медведев, В. Г. По-темкин; под общ. ред. канд. техн. наук В. Г. Потемкина. – М. : Диа-лог-Мифи, 2002. – 496 с.

10. Минский, Марвин. Фреймы для представления знаний / Марвин Минский. – М. : Энергия, 1979. – 151 с.

11. Нейлор, К. Как построить свою экспертную систему : пеp. с англ. / К. Нейлор. – М. : Энергоатомиздат, 1991. – 286 с. : ил. – ISBN 5-283-02502-0;1-84058-071-5;0-470-20946-1.

12. Нейроинформатика / А. Н. Горбань [и др.]. – Новосибирск : Наука, Си-бир. отд-ние РАН, 1998. – 296 с.

13. Обработка нечеткой информации в системах принятия решений / А. Н. Борисов [и др.]. – М. : Радио и связь, 1989. – 302 с. : ил. – ISBN 5-256-00178-7.

14. Осуга, С. Обработка знаний : пеp. с япон. / С. Осуга. – М. : Миp, 1989. – 293 с. : ил. – ISBN 5-03-000638-9; 4-274-07321-1.

118

15. Попов, Э. В. Экспертные системы 90-х гг. Классификация, состоя-ние, проблемы, тенденции / Э. В. Попов / Новости искусственного ителлекта. – 1990. – № 2. – С. 84 – 101.

16. Представление и использование знаний : пер. с япон. / под ред. Х. Уэно, М. Исидзука. – М. : Мир, 1989. – 220 с.

17. Системы управления базами данных и знаний : справ. изд. / под ред. А. Н. Наумова. – М. : Финансы и статистика, 1991. – 324 с.

18. Тельнов, Ю. Ф. Интеллектуальные информационные системы в эко-номике / Моск. гос. ун-т экономики, статистики и информатики; Ю. Ф. Тельнов. – М. : Синтэг, 2002. – 316 с.

19. Толковый словарь по искусственному интеллекту / Авт.-сост.: А. Н. Аверкин, М. Г. Гаазе-Рапопорт, Д. А. Поспелов. – М. : Радио и связь, 1992. – 256 с.

20. Уинстон, П. Искусственный интеллект / П. Уинстон. – М. : Мир, 1980. – 520 с.

21. Уотерман, Д. Руководство по экспертным системам : пеp. с англ. / Д. Уотермен. – М. : Миp, 1989. – 388 с. : ил. – ISBN 5-03001119-6; 0-20108313-2.

22. Хейс-Рот, Ф. Построение экспертных систем / Ф. Хейс-Рот, Д. Уо-терман, Д. Ленат. – М. : Мир, 1987. – 430 с.

23. Шлеер, С. Объектно-ориентированный анализ: моделирование мира в состояниях : пер. с англ. / С. Шлеер, С. Меллор. – Киев : Диалекти-ка, 1993. – 240 с.

24. Яшин, А. М. Базы знаний и экспертные системы : учеб. пособие / А. М. Яшин. – М. : Мир, 1990. – 76 с.

25. Андрейчиков, А. В. Интеллектуальные информационные системы : учебник / А. В. Андрейчиков, О. Н. Андрейчикова. – М. : Финансы и статистика, 2004. – 424 с. – ISBN 5-279-02568.

26. Абдикеев, Н. М. Проектирование интеллектуальных информацион-ных систем в экономике : учебник / Н. М. Абдикеев. – М. : Экономи-ка, 2004. – 258 с. – ISBN 5-94692-847-3.

27. Ярушкина, Н. Г. Основы теории нечетких гибридных систем : учеб. пособие / Н. Г. Ярушкина. – М. : Финансы и статистика, 2004. – 302 с. – ISBN 5-279-02776-6.

28. Гаврилова, Т. А. Базы знаний интеллектуальных систем / Т. А. Гаври-лова, В. Ф. Хорошевский. – СПб. : Питер, 2001. – 384 с. – ISBN 5-272-00071-4.

119

ОГЛАВЛЕНИЕ

ВВЕДЕНИ...........................................................................................................3 1. ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ: ОБЩИЕ СВЕДЕНИЯ.........................................................................................5

1.1. История развития интеллектуальных систем ...................................5 1.2. Основные понятия искусственного интеллекта и определение интеллектуальной информационной системы ...............7 1.3. Направления развития интеллектуальных систем .........................9 1.4. Классификация интеллектуальных систем .................................11 1.5. Вопросы и задания.............................................................................12

2. ИНФОРМАЦИЯ, ДАННЫЕ И ЗНАНИЯ ...........................................14 2.1. Понятие об информации, данных и знаниях .................................14 2.2. Свойства, отличающие данные от знаний .................................16 2.3. Классификация знаний ...............................................................18 2.4. Вопросы и задания..............................................................................19

3. МЕТОДЫ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ...........................................21 3.1. Модели представления знаний. Формальные и неформальные (семантические) модели ...........................................21 3.2. Теория фреймов .........................................................................23 3.3. Семантические сети .........................................................................31 3.4. Системы, основанные на правилах ...........................................38 3.5. Нечеткие множества .........................................................................45 3.6. Объектно-ориентированный подход ...........................................58 3.7. Вопросы и задания..............................................................................58

4. БАЗЫ ЗНАНИЙ И ЭКСПЕРТНЫЕ СИСТЕМЫ .................................60 4.1. Организация баз знаний ...............................................................60 4.2. Определение и структура экспертной системы .......................60 4.3. Вывод и рассуждения в экспертных системах .......................63 4.4. Классификация экспертных систем ...........................................68 4.5. Проектирование экспертной системы ...........................................71 4.6. Вопросы и задания..............................................................................72

5. МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО МОДЕЛИРОВАНИЯ ............74 5.1. Обзор методов извлечения знаний ...........................................74 5.2. Нейронные сети .........................................................................86 5.3. Генетические алгоритмы ...............................................................98 5.4. Искусственная жизнь и клеточные автоматы ...............................106 5.5. Вопросы и задания............................................................................113

ЗАКЛЮЧЕНИЕ..............................................................................................116 СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ ...............................117

120

Учебное издание

ВАСИЛЬЕВ Дмитрий Николаевич ЧЕРНОВ Владимир Георгиевич

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Основы теории построения

Учебное пособие

Подписано в печать 15.09.08. Формат 60×84/16. Усл. печ. л. 6,97. Тираж 200 экз.

Заказ Издательство

Владимирского государственного университета.

600000, Владимир, ул. Горького, 87.

Documents

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫe.lib.vlsu.ru/bitstream/123456789/1162/3/01066.pdf · вом широко распространены