<<
>>

7.3.2. МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ

Рассматривая методы приобретения знаний, будем использо­вать следующие термины: извлечение, получение, формирование, приобретение знаний и обучение БЗ. Определим сущность ука­занных терминов.
Под извлечением знаний будем понимать про­цесс приобретения материализованных знаний из текстологичес­ких источников информации с помощью некоторой ти методов и процедур, позволяющих переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ. Получение знаний — это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основанный на использова- 1нии непосредственно им самим или инженером по знаниям соот­ветствующих приемов, процедур, методов и инструментальных средств.

Формирование знаний — это процесс автоматического приоб­ретения (порождения) системой искусственного интеллекта или инструментальным средством нового, и полезного знания из ис­ходной и текущей информации, которое в явном виде не форми­руют эксперты, в целях освоения новых процедур решения при­кладных задач на основе использования различных моделей ма­шинного обучения.

Под приобретением знаний будем понимать процесс, основанный на переносе знаний из различных источни­ков в базу знаний путем использования различных методов, мо­делей, алгоритмов и инструментальных средств.

Понятие получение знаний соотносится с понятиями извлече­ние, приобретение, формирование знаний как часть — целое.

Обучение базы знаний — это процесс ввода (переноса) приоб­ретенных знаний в СИИ на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин обучение рассматривается как свойство базы данных, как совокупность методов, приемов и процедур ввода знаний в БЗ и как процесс переноса знаний в СИИ.

Большинство методов извлечения и получения знаний осно­вано на прямом диалоге с экспертом.

Методы извлечения знаний. Они состоят из текстологических методов и методов автоматической обработки текстов.

Текстологические методы предназначены для получения ин­женером по знаниям знаний из материализованных источников, в качестве которых выступают монографии, учебники, статьи, методики, инструкции и другие носители профессиональных зна­ний. Текстологические методы, несмотря на их простоту и три­виальность, являются наименее разработанными. Эти методы основываются не только на выявлении и понимании смысла тек­ста, но и на выделении базовых понятий и отношений, т. е. фор­мировании семантической (понятийной) структуры ПрО.

Процесс понимания является сложным и неформализуемым, на него существенно влияют когнитивный стиль инженера по знаниям и его интеллектуальные характеристики, В инженерии знаний разработана методика анализа текстов в целях извлече­ния и структурирования знаний. Методика предусматривает ов­ладение инженером по знаниям микроструктурой текста, вычле­нение им ключевых слов (компрессия или сжатие текста) и после­дующее формирование поля знаний.

Сжатие текста служит методологической основой для исполь­зования текстологических процедур извлечения знаний. Тексто­логические методы самые трудоемкие, они применяются, как пра­вило, на начальном этапе создания СИИ.

Существенное развитие получили методы извлечения знаний при использовании современных информационных технологий, в частности гипертекстовой технологии.

Гипертекст — это организация нелинейной последователь­ности записи и чтения информации, объединенной на основе ас­социативной связи. Синтез этой концепции и полиморфизма при­водит к новой концепции в рамках которой между информацией, представленной в различной форме (текстовой, графической и других), организуются ассоциативные связи.

Эти новые концепции работы со знаниями создают предпо­сылки для решения проблемы эффективности процесса приобре­тения знаний. Усилия исследователей в области инженерии зна­ний направлены на создание формальных методов извлечения знаний.

К их числу можно отнести метод автоматической обра­ботки текстов на основе статистической обработки семантичес­ких единиц. Метод и программные средства автоматизирован­ного извлечения знаний из текстов базируются на формальных процедурах обнаружения в текстах семантических единиц различ­ной выраженности.

Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные меха­низмы определения частотных характеристик терминов. Задача извлечения знаний решается в два этапа: сначала формируется терминологическая сеть (поле знаний), а затем определяется ас­социативная близость терминов на основе статистически опре­деленной меры ассоциации. Достоинство рассмотренного мето­да состоит в автоматическом выявлении значимых слов и связей с учетом статистической информации о гипертексте в целом.

Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ. Однако результаты исследований позво­ляют надеяться на создание эффективных методов и систем искусст­венного интеллекта, позволяющих снизить трудозатраты при из­влечении знаний на начальном этапе синтеза баз знаний СИИ.

Методы получения экспертных знаний. К ним относятся, на­пример, коммуникативные методы (пассивные и активные), ос­нованные на прямом диалоге экспертов и инженеров по знаниям как без использования СИИ, так и с применением СИИ (техно­логии окон, меню).

Коммуникативные методы получения знаний рассматривают - ся как разновидности интервьюирования. Основные особеннос­ти коммуникативных методов:

1. Не имеют формального определения и носят качественный характер. Полученные с их помощью знания несут отпечаток са­монаблюдений эксперта и субъективную интерпретацию инже­нера по знаниям.

2. Требуют словесного выражения экспертом своих знаний, что является непростой задачей. Неточность и неадекватность словесных описаний мыслительных процессов и применяемых эвристических приемов, используемых при решении задач, ведут к серьезным последствиям.

3. Сложность выражения процедурных знаний при их словес­ном описании.

4. Крайняя сложность явного описания знаний, которые яв­ляются результатом компиляции и автоматизма процессов мыш­ления, а также интуиции эксперта. В психологии доказано, что интуиция на самом деле является способностью распознавать образы. Однако словесное описание способности к распознава­нию образов дать крайне трудно.

5. Трудоемкость организации и неэффективность взаимодействия инженера по знаниям и эксперта. На них приходятся большие ин-

10-1909 теллектуальные нагрузки, связанные с вербализацией знаний, уп­равлением процессом коммуникации и необходимостью освоения, анализа и документирования больших объемов новых знаний.

Коммуникативные методы получения знаний отличаются сво­ей низкой эффективностью. Так, при непосредственном взаимо­действии инженера по знаниям и эксперта теряется до 76% ин­формации.

Один из путей совершенствования процесса приобретения знаний состоит в разработке позволяющих передать

часть функций, выполняемых инженером по знаниям, самому эк­сперту или СИИ.

Методы формирования знаний. Трудности извлечения знаний из текстовых источников и получения их от экспертов стимули­ровали развитие методов формирования знаний, известных, как методы машинного обучения.

Для развитых СИИ способность обучаться, т.е. самостоятель­но формировать новые знания на основе текущих знаний, соб­ственного опыта решения прикладных задач, является их суще­ственной характеристикой. Методы формирования знаний лежат в основе автоматических систем приобретения знаний.

Автоматические системы формирования знаний более предпоч­тительны, так как при этом уменьшается вероятность ошибок в приобретаемых знаниях и снижается время их приобретения.

Главный вопрос, на который должны ответить методы фор­мирования знаний, состоит в следующем: как от частного (при­мера) перейти к общему (обобщениям)?

Базисом всех методов формирования знаний является индук­ция, которая лежит в основе получения общих выводов из сово­купности частных утверждений.

<< | >>
Источник: Т.П. Барановская, В.И. Лойко, М.И. Семенов, А.И. Трубилин. Информационные системы и технологии в экономике: Учебник. - 2-е изд., доп. и перераб. Под ред. В.И. Лойко. - М.: Финансы и статистика, - 416 с: ил.. 2005

Еще по теме 7.3.2. МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ:

  1. 7.3. ПРИОБРЕТЕНИЕ И ФОРМАЛИЗАЦИЯ ЗНАНИЙ 7.3.1. ЭЛЕМЕНТЫ ТЕХНОЛОГИИ ПРИОБРЕТЕНИЯ ЗНАНИЙ
  2. 4.2.2. Классификация методов представления знаний
  3. 3.3. Методы получения знаний о личности
  4. 4.2. Методы представления знаний
  5. 8. Методы и источники получения знаний о деятельности экономического субъекта
  6. 4.6.3. Заполнение раздела II "Расчет расходов на приобретение (сооружение, изготовление) основных средств и приобретение (создание самим налогоплательщиком) нематериальных активов, учитываемых при исчислении налоговой базы по налогу"
  7. Порядок заполнения раздела II "Расчет расходов на приобретение (сооружение, изготовление) основных средств и на приобретение (создание самим налогоплательщиком) нематериальных активов, учитываемых при исчислении налоговой базы по налогу за отчетный (налоговый) период"
  8. РАСХОДЫ ПО ОПЛАТЕ СТОИМОСТИ ТОВАРОВ, ПРИОБРЕТЕННЫХ ДЛЯ ДАЛЬНЕЙШЕЙ РЕАЛИЗАЦИИ Стоимость приобретенных товаров
  9. 3.3.3 Передача знаний
  10. 7.3.3. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ПРОЦЕССА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  11. 7.2. МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  12. 87. ОБЩАЯ МЕТОДИКА ФОРМИРОВАНИЯ ЗНАНИЙ
  13. 39. ПРИМЕНЕНИЕ ЗНАНИЙ, УМЕНИЙ И НАВЫКОВ
  14. ИНФОРМАЦИОННЫЙ ПРОЦЕСС ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
  15. 7.1. СВОЙСТВА И ТИПЫ ЗНАНИЙ