<<
>>

4.2.2. Классификация методов представления знаний

Для того чтобы манипулировать всевозможными зна­ниями из реального мира с помощью компьютера, необходи­мо осуществить их моделирование.

При проектировании модели представления знаний сле­дует учесть два требования:

♦ однородность представления;

♦ простота понимания.

Выполнение этих требований позволяет упростить меха­низм логического вывода и процессы приобретения знаний и управления ими, однако, как правило, создателям интеллек­туальной системы приходится идти на некоторый компромисс в стремлении обеспечить одинаковое понимание знаний и экспертами, и инженерами знаний, и пользователями.

Классификация методов моделирования знаний с точки зрения подхода к их представлению в ЭВМ показана на рис. 4.2.3.

Дадим общую характеристику основных методов пред­ставления знаний с помощью моделей, основанных на эврис­тическом подходе.

Рис.

4.2.3. Классификация моделей представления знаний

1. Представление знаний тройкой "объект — атрибут — значение" — один из первых методов моделирования знаний. Как правило, используется для представления фактических знаний в простейших системах. Примеры:

Объект Атрибут Значение
Студент Успеваемость Отличник
Дом Цвет Белый
Пациент Температура Нормальная

Очевидно, что для моделирования знаний даже об одном объекте (например, о "студенте" или "доме") из предметной области необходимо хранить значительное число "троек".

2. Продукционная модель (модель правил; модель про­дукций — от англ. production — изготовление, выработка). В настоящее время наиболее проработанная и распространен­ная модель представления знаний, в частности — в эксперт­ных системах.

Модель предусматривает разработку системы продукци­онных правил (правил продукций), имеющих вид:

ЕСЛИ А, И А, И ... А , ТО В, ИЛИ В, ИЛИ...ИЛИ В ,

1 2 п' 1 2 т'

где А.иВ. — некоторые высказывания, к которым примене­ны логические операции И и ИЛИ. Если высказывания в ле­вой части правила (ее часто называют антецедент — усло­вие, причина) истинно, истинно и высказывание в правой части (консеквент — следствие).

Полнота базы знаний (базы правил) определяет возмож­ности системы по удовлетворению потребностей пользовате­лей. Логический вывод в продукционных системах основан на построении прямой и обратной цепочек заключений, образу­емых в результате последовательного просмотра левых и правых частей соответствующих правил, вплоть до получе­ния окончательного заключения.

Пусть в некоторой области памяти хранятся следующие правила (суждения):

♦ правило 1 — ЕСЛИ в стране происходит падение кур­са национальной валюты;

ТО материальное положение населения ухудшается;

♦ правило 2 — ЕСЛИ объемы производства в стране па­дают;

ТО курс национальной валюты снижается;

♦ правило 3 — ЕСЛИ материальное положение населе­ния ухудшается;

ТО уровень смертности в стране возрастает.

Если на вход системы поступит новый факт "В стране высокий уровень падения объемов производства", то из пра­вил можно построить цепочку рассуждений и сформулиро­вать два заключения:

факт 1 — правило 2 — правило 1 — заключение 1 — правило 3 — заключение 2,

где заключение 1 (промежуточный вывод) — "Материальное положение населения ухудшается"; заключение 2 (окончатель­ный вывод) — "В стране возрастает уровень смертности".

Отметим, что в современных экспертных системах в базе знаний могут храниться тысячи правил, а коммерческая сто­имость одного невыводимого (нового, дополнительного) пра­вила весьма высока.

Главными достоинствами продукционных систем являются простота пополнения и изъятия правил; простота реализации механизма логического вывода и наглядность объяснений ре­зультатов работы системы.

Основной недостаток подобных систем — трудность обес­печения непротиворечивости правил При их большом числе, что требует создания специальных правил (так называемых метаправил) разрешения возникающих в ходе логического вывода противоречий. Кроме того, время формирования ито­гового заключения может быть достаточно большим.

3. Фреймовая модель. Сравнительно новая модель пред­ставления знаний. Само понятие "фрейм" (англ. frame — рама, рамка, скелет, сгусток, сруб и т. д.) было введено в 1975 г. Марком Минским (М. Minsky, США).

Фрейм — это минимальная структура информации, не­обходимая для представления знаний о стереотипных клас­сах объектов, явлений, ситуаций, процессов и др. С помощью фреймов можно моделировать знания о самых разнообраз­ных объектах интересующей исследователя предметной об­ласти — важно лишь, чтобы эти объекты составляли класс концептуальных (повторяющихся: стереотипных) объектов, процессов и т. п. Примерами стереотипных жизненных ситуа­ций могут служить собрание, совещание; сдача экзамена или зачета; защита курсовой работы и др. Примеры стереотип­ных бытовых ситуаций: отъезд в отпуск; встреча гостей; вы­бор телевизора; ремонт и др. Примеры стереотипных поня­тий: алгоритм; действие; методика и др. На рис. 4.2.4 пред­ставлен фрейм технологической операции "соединять" [21].

Данный фрейм описывает ситуацию "Субъект X соеди­няет объект У с объектом Z способом W". На рисунке обо­значены:

♦ вершины X, Y, Z, W — слоты (англ. slot — прорез; щель; пустота — составляющие фрейма);

♦ дуги — отношения;

♦ Бх, Бу, Бг, — так называемые шанции — области возможных значений соответствующих слотов.

Наполняя слоты конкретным содержанием, можно полу­чить фрейм конкретной ситуации, например: "Радиомонтажник соединяет микросхему с конденсатором способом пайки".

Запол­нение слотов шанциями называют активизацией фрейма.

С помощью фреймов можно моделировать как процедур­ные, так и декларативные знания. На рис. 4.2.4 представлен пример представления процедурных знаний.

На рис. 4.2.5 приведен пример фрейма "технологическая операция", иллюстрирующий представление декларативных знаний для решения задачи проектирования технологическо­го процесса.

По содержательному смыслу фрейма выделяют [21]:

♦ фреймы-понятия;

♦ фреймы-меню;

♦ фреймы с иерархически вложенной структурой.

Фрейм-понятие — это фрейм типа И. Например, фрейм

02

-*»- "объект" —"субъект" • ► "посредством чего?"

оу

Эх

Рис. 4.2.4. Фрейм ситуации "соединять

"операция" содержит объединенные связкой И имена слотов

что делать , что это дает , как делать , кто делает , "где делать" и т. д., а фрейм "предмет" — слоты с именами "назначение", "форма", "вес", "цвет" и т. д.

Фрейм-меню — это фрейм типа ИЛИ. Он служит для организации процедурных знаний с помощью оператора "выб­рать". Например, фрейм "что делать" может состоять из объе­диненных связкой ИЛИ слотов "решить уравнение", "подста­вить данные", "уточнить задачу" и т. д., причем каждый из этих слотов может иметь несколько значений.

Шанции слотов

Фрейм с иерархически вложенной структурой предпола­гает, что в нем в качестве значений слотов можно использо­вать имена других фреймов, слотов и т. д., т. е. использовать иерархическую структуру, в которой комбинируются другие виды фреймов (в итоге получают так называемые фреймы- сценарии).

Технологическая операция

Имя операции

Состав операции

Требуемое оборудование

Требуемые материалы

Имя последующей операции

Рис. 4.2.5. Фрейм понятия "технологическая операция"

Значения слотов могут содержать ссылки на так называ­емые присоединенные процедуры. Различают два вида при­соединенных процедур:

♦ процедуры-де/момы;

♦ процедуры-слуги.

Процедуры-Зежомы присоединяются к слоту и активизи­руются при изменении информации в этом слоте (выполняют вспомогательные операции — например, автоматически кор­ректируют информацию во всех других структурах, где ис­пользуется значение данного слота) — см. рис. 4.2.6.

Процедуры-слуги активизируются при выполнении неко­торых условий относительно содержимого слотов (часто по запросу). Данные процедуры определяются пользователем при создании фрейма. Например, во фрейме "Учебная аудито­рия" можно предусмотреть слоты "длина" и "ширина", а по их значениям вычислять значение слота "площадь".

Процедуры-демоны
1 Процедура "Если — добавлено" (IF — ADDED) Выполняется, когда новая информация помещается в слот
2 Процедура "Если — удалено" (IF — REMOVED) Выполняется, когда информация удаляется из слота
3 Процедура "Если — нужно" (IF—NEEDED) Выполняется, когда запрашивается информация из пустого слота

Рис. 4.2.6. Типы присоединенных процедур

Фреймы позволяют использовать многие свойства зна­ний и достаточно широко употребляются. Их достоинства и недостатки схожи с достоинствами и недостатками семанти­ческих сетей, которые будут рассмотрены ниже.

4. Модель семантической сети (модель Куилиана).

Семантическая сеть — это направленный граф с поиме­нованными вершинами и дугами, причем узлы обозначают конкретные объекты, а дуги — отношения между ними [21]. Как следует из определения, данная модель представления знаний является более общей по отношению к фреймовой модели (иными словами, фреймовая модель — частный слу­чай семантической сети). Семантическую сеть можно постро­ить для любой предметной области и для самых разнообраз­ных объектов и отношений.

В семантических сетях используют три типа вершин:

♦ вершины-понятия (обычно это существительные);

♦ вершины-события (обычно это глаголы);

♦ вершины-свойства (прилагательные, наречия, опреде­ления).

Дуги сети (семантические отношения) делят на четыре класса:

♦ лингвистические (падежные, глагольные, атрибутив­ные);

♦ логические (И, ИЛИ, НЕ);

♦ теоретико-множественные (множество — подмноже­ство, отношения целого и части, родовидовые отно­шения);

♦ квантифицированные (определяемые кванторами об­щности V и существования 3).

(Напомним, что кванторы — это логические операто­ры, переводящие одну высказывательную форму в другую и позволяющие указывать объем тех значений предметных пе­ременных, для которых данная высказывательная форма ис­тинна.)

Приведем два примера.

На рис 4.2.7 представлена семантическая сеть для пред­ложения (ситуации) "Студент Табуреткин добросовестно изу­чает новый план счетов на 2002 год перед сдачей экзамена по дисциплине "Бухгалтерский учет".

Рис. 4.2.7. Семантическая сеть для предложения (ситуации)

Рисунок 4.2.8 содержит фрагмент семантической сети для понятия "автомобиль" (обозначения: 1Б-А — есть, является; НАБ-РАИТ — имеет часть). Из приведенных примеров по­нятно, почему многие специалисты по искусственному ин­теллекту считают фрейм частным случаем семантической сети со строго структурированными знаниями.

Рис. 4.2.8. Фрагмент семантической сети понятия "автомобиль"

Основное достоинство методов моделирования знаний с помощью семантических сетей и фреймов — универсальность, удобство представления как декларативных, так и процеду­ра льных знаний. Имеют место и два недостатка:

♦ громоздкость, сложность построения и изменения;

♦ потребность в разнообразных процедурах обработ­ки, связанная с разнообразием типов дуг и вершин.

В рамках реализации теоретического подхода применя­ют логические модели, прежде всего использующие пред­ставления знаний в системе логики предикатов. Преимуще­ства такого подхода очевидны: единственность теоретическо­го обоснования и возможность реализации системы путем введения формально точных определений и правил получе­ния выводов. Однако в полной мере претворить в жизнь дан­ный подход даже для "простых" задач оказалось весьма слож­но. Поэтому появились попытки перейти от формальной ло­гики к так называемой человеческой логике (модальной логи­ке, многозначной логике и др.), модели которой в большей или меньшей степени учитывают "человеческий фактор", т. е. являются в определенном смысле компромиссными "в плане использования и теоретического, и эвристического подходов.

Очень коротко остановимся на ставшей классической пре­дикатной модели представления знаний. Первые попытки ис­пользовать такую модель относятся к 50-м гг. прошлого века. Дадим несколько определений.

Пусть имеется некоторое множество объектов, называ­емое предметной областью. Выражение P(xv х2,...,хп), где x{(i — 1,..,п) — так называемая предметная переменная, а Р принимает значения 0 или 1, называется логической функци­ей или предикатом.

Предикат P(xvx2,...,xn) задает отношение между элемен­тами xv х2,...,хп и обозначает высказывание, что "xv х2,...,хп находятся между собой в отношении Р". Например, если А — множество целых чисел, а Р(а) — высказывание "а — поло­жительное число", то Р(а) = 1 при а > 0 и Р(о) = 0 при о < 0.

Из подобного рода элементарных высказываний с помо­щью логических связок образуют более сложные высказыва­ния, которые могут принимать те же значения — "истина" и "ложь". В качестве связок используются конъюнкция, дизъ­юнкция, импликация, отрицание, эквивалентность.

Предикат от п переменных называют п-местным.

Одноместные (унарные) предикаты отражают свойства определенного объекта или класса объектов. Многоместные предикаты позволяют записывать отношения, которые су­ществуют между группой элементов.

Если а — тоже предикат, то Р(а) — предикат 2-го по­рядка, и т. д. до n-го порядка.

Приведем примеры различных предикатов.

1. Унарный предикат (высказывание) "Река впадает в Каспийское море" имеет значение 1, если "Река" = "Волга", и значение 0, если "Река" = "Днепр".

2. Двухместный предикат "х{ не меньше х2" может иметь значение 1 или 0 в зависимости от значений и хг Если зна­чение предиката тождественно равно 1 при любых значени­ях предметных переменных, он называется тавтологией.

В аппарат исчисления предикатов входят также симво­лы функций (обычно обозначаемые латинскими буквами /, g, h ит. д.), задаваемых на множестве предметных перемен­ных, и кванторы общности V и существования 3.

3. Представление с помощью предиката знаний, заклю­ченных в теореме Пифагора: P{g[f(x), /(у)], f(z)}, где преди­кат Р — "быть равным", функция д(х, у) = х + у; функция /(х) = х2.

Иногда используется такая форма записи:

РАВНЫ [СУММА (КВАДРАТ (х), КВАДРАТ (у)), КВАД­РАТ (2)].

Предикат Р равен 1, если х, у, z — соответственно дли­ны катетов и гипотенузы прямоугольного треугольника.

Как уже отмечалось, предикаты удобны для описания декларативных знаний (фактов, событий и т. п.). Их главные достоинства — возможность реализации строгого вывода знаний (исчисления предикатов) и сравнительная компакт­ность модели. К сожалению, предикаты мало пригодны для записи процедуральных знаний. Кроме того, опыт показал, что человеческое знание по своей структуре много сложнее структуры языков предикатного типа, поэтому требуются спе­циальные навыки "подгонки" структуры реального знания под структуру модели (как правило, значительно обедняю­щей исходные знания).

<< | >>
Источник: Балдин К. В., Уткин В. Б.. Информационные системы в экономике: Учебник. — 5-е изд. — М.: Издательско-торго- вая корпорация «Дашков и К0», — 395 с.. 2008

Еще по теме 4.2.2. Классификация методов представления знаний:

  1. 4.2. Методы представления знаний
  2. 7.2. МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  3. 7.3.3. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ПРОЦЕССА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  4. 83. ВИДЫ ПРЕДСТАВЛЕНИЙ. КЛАССИФИКАЦИЯ ПРЕДСТАВЛЕНИЙ ПО СТЕПЕНИ ОБОБЩЕННОСТИ
  5. ИНФОРМАЦИОННЫЙ ПРОЦЕСС ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  6. Глава 7. ИНФОРМАЦИОННЫЙ ПРОЦЕСС ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  7. 7.3.2. МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ
  8. 3.3. Методы получения знаний о личности
  9. 8. Методы и источники получения знаний о деятельности экономического субъекта
  10. 81. ВИДЫ ПРЕДСТАВЛЕНИЙ. ЗРИТЕЛЬНОЕ И СЛУХОВОЕ ПРЕДСТАВЛЕНИЕ