2.1.2. Описательная модель предметной области

Процесс проектирования БД является весьма сложным. По сути, он заключается в определении перечня данных, хранимых на физических носителях (магнитных дисках и лен­тах), которые достаточно полно отражают информационные потребности потенциальных пользователей в конкретной ПО.
Проектирование БД начинается с анализа предметной облас­ти и возможных запросов пользователей. В результате этого анализа определяется перечень данных и связей между ними, которые адекватно — с точки зрения будущих потребите­лей — отражают ПО. Завершается проектирование БД опре­делением форм и способов хранения необходимых данных на физическом уровне.

Весь процесс проектирования БД можно разбить на ряд взаимосвязанных этапов, каждый из которых обладает свои­ми особенностями и методами проведения. На рис. 2.1.3 пред­ставлены типовые этапы.

На этапе инфологического (информационно-логическо­го) проектирования осуществляется построение семантичес-

.Рис. 2.1.3. Этапы проектирования БД


кой модели, описывающей сведения из предметной области, которые могут заинтересовать пользователей БД. Семанти­ческая модель (semantic model) — представление совокуп­ности о ПО понятий... в виде графа, в вершинах которого расположены понятия, в терминальных вершинах — эле­ментарные понятия, а дуги представляют отношения меж­ду понятиями.

Сначала из объективной реальности выделяется ПО, т. е. очерчиваются ее границы. Логический анализ выделенной ПО и потенциальных запросов пользователей завершается пост­роением инфологической модели ПО — перечня сведений об объектах ПО, которые необходимо хранить в БД и связях между ними.

Анализ информационных потребностей потенциальных пользователей имеет два аспекта:

♦ определение собственно сведений об объектах ПО\

♦ анализ возможных запросов к БД и требований по опе­ративности их выполнения.

Анализ возможных запросов к БД позволяет уточнить связи между сведениями, которые необходимо хранить. Пусть, например, в БД по учебному процессу института хра­нятся сведения об учебных группах, читаемых курсах и ка­федрах, а также связи "учебные группы—читаемые курсы" и "читаемые курсы—кафедры". Тогда запрос о том, прово­дит ли некоторая кафедра занятия в конкретной учебной груп­пе может быть выполнен только путем перебора всех читае­мых в данной группе курсов.

Хранение большого числа связей усложняет БД и при­водит к увеличению потребной памяти ЭВМ, но часто суще­ственно ускоряет поиск нужной информации. Поэтому разра­ботчику БД (АБД) приходится принимать компромиссное ре­шение, причем процесс определения перечня хранимых свя­зей, как правило, имеет итерационный характер.

Датологическое проектирование подразделяется на ло­гическое (построение концептуальной модели данных) и фи­зическое (построение физической модели) проектирование.

Главной задачей логического проектирования (ЛП) БД является представление выделенных на предыдущем этапе сведений в виде данных в форматах, поддерживаемых выб­ранной СУБД.

Задача физического проектирования (ФП) — выбор спо­соба хранения данных на физических носителях и методов доступа к ним с использованием возможностей, предоставля­емых СУБД.

Мифологическая модель "сущность—связь" (entity — relationship model; ER-model) П. Чена (P. Chen) представляет собой описательную (неформальную) модель ПО, семанти­чески определяющую в ней сущности и связи [44].

Относительная простота и наглядность описания ПО по­зволяет использовать ее в процессе диалога с потенциальны­ми пользователями с самого начала инфологического проек­тирования. Построение инфологической модели П. Чена, как и любой другой модели, является творческим процессом, по­этому единой методики ее создания нет. Однако при любом подходе к построению модели используют три основных кон­структивных элемента:

♦ сущность;

♦ атрибут;

♦ связь.

Сущность — это собирательное понятие некоторого по­вторяющегося объекта, процесса или явления окружающего мира, о котором необходимо хранить информацию в системе. Сущность может определять как материальные (например, "студент", "грузовой автомобиль" и т. п.), так и нематериаль­ные объекты (например, "экзамен", "проверка" и т. п.). Глав­ной особенностью сущности является то, что вокруг нее со­средоточен сбор информации в конкретной ПО. Тип сущности определяет набор однородных объектов, а экземпляр сущно­сти — конкретный объект в наборе. Каждая сущность в модели Чена именуется. Для идентификации конкретного эк­земпляра сущности и его описания используется один или несколько атрибутов.

Атрибут — это поименованная характеристика сущно­сти, которая принимает значения из некоторого множества значений [46]. Например, у сущности "студент" могут быть атрибуты "фамилия", "имя", "отчество", "дата рождения", "средний балл за время обучения" и т. п.

Связи в инфологической модели выступают в качестве средства, с помощью которого представляются отношения между сущностями, имеющими место в ПО. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями) и, в общем случае, п-арные (между п сущностями) связи. Например, сущности "отец", "мать" и "ребенок" могут находиться в трехарном отношении "семья" ("является членом семьи").

Связи должны быть поименованы; между двумя типами сущностей могут существовать несколько связей.

Наиболее распространены бинарные связи. Учитывая, что любую п-арную связь можно представить в виде нескольких бинарных, подробнее остановимся именно на таких связях между двумя типами сущностей, устанавливающими соот­ветствие между множествами экземпляров сущностей.

Различают четыре типа связей:

♦ связь один к одному (1:1);

♦ связь один ко многим (1:М);

♦ связь многие к одному (М:1);

♦ связь многие ко многим (М:Ы).

Связь один к одному определяет такой тип связи между типами сущностей А и В, при которой каждому экземпляру сущности А соответствует один и только один экземпляр сущ­ности В, и наоборот. Таким образом, имея некоторый экземп­ляр сущности А, можно однозначно идентифицировать со­ответствующий ему экземпляр сущности В, а по экземпляру сущности В — экземпляр сущности А. Например, связь типа 1:1 "имеет" может быть определена между сущностями "ав­томобиль" и "двигатель", так как на конкретном автомобиле может быть установлен только один двигатель, и этот двига­тель, естественно, нельзя установить сразу на несколько ав­томобилей.

Связь один ко многим определяет такой тип связи между типами сущностей А и В, для которой одному экземпляру сущности А может соответствовать 0, 1 или несколько экзем­пляров сущности В, но каждому экземпляру сущности В со­ответствует один экземпляр сущности А. При этом однознач­но идентифицировать можно только экземпляр сущности А по экземпляру сущности В. Примером связи типа 1:М явля­ется связь "учится" между сущностями "учебная группа" и "студент". Для такой связи, зная конкретного студента, можно однозначно идентифицировать учебную группу, в которой он учится, или, зная учебную группу, можно определить всех обучающихся в ней студентов.

Связь многие к одному по сути эквивалентна связи один ко многим. Различие заключается лишь в том, с точки зре­ния какой сущности (А или В) данная связь рассматривается.

Связь многие ко многим определяет такой тип связи меж­ду типами сущностей А и В, при котором каждому экземп­ляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, и наоборот. При такой связи, зная экземпляр одной сущности, можно указать все экземпля­ры другой сущности, относящиеся к исходному, т. е. иден­тификация сущностей не уникальна в обоих направлениях. В качестве примера такой связи можно рассмотреть связь "изучает" между сущностями "учебная дисциплина" и "учеб­ная группа".

Реально все связи являются двунаправленными, т. е., зная экземпляр одной из сущностей, можно идентифицировать (однозначно или многозначно) экземпляр (экземпляры) дру­гой сущности. В некоторых случаях целесообразно рассмат­ривать лишь однонаправленные связи между сущностями в целях экономии ресурсов ЭВМ. Возможность введения таких связей полностью определяется информационными потребно­стями пользователей. Различают простую и многозначную однонаправленные связи, которые являются аналогами свя­зей типа 1:1 и 1:М с учетом направления идентификации. Так, для простой однонаправленной связи "староста" ("является старостой") между сущностями "учебная группа" и "студент" можно, зная учебную группу, однозначно определить ее ста­росту, но, зная конкретного студента, нельзя сказать, явля­ется ли он старостой учебной группы. Примером многознач­ной однонаправленной связи служит связь между сущностя­ми "пациент" и "болезнь", для которой можно для каждого пациента указать его болезни, но нельзя выявить всех обла­дателей конкретного заболевания.

Введение однонаправленных связей означает, что в ре­зультате анализа потенциальных запросов потребителей ус­тановлено, что потребности в информации, аналогичной при­веденной в двух последних примерах, у пользователей не будет (и они не будут формулировать соответствующие зап­росы к БД).

Графически типы сущностей, атрибуты и связи принято изображать прямоугольниками, овалами и ромбами соответ­ственно. На рис. 2.1.4 представлены примеры связей различ­ных типов; на рис. 2.1.5 и 2.1.6 — фрагменты инфологических моделей "военнослужащие" (без указания атрибутов) и "учеб­ный процесс факультета".

Несмотря на то, что построение инфологической модели есть процесс творческий, можно указать два основополагаю­щих правила, которыми следует пользоваться всем проекти­ровщикам БД [15,44]:

♦ при построении модели должны использоваться толь­ко три типа конструктивных элементов: сущность, атрибут, связь;

♦ каждый компонент информации должен моделировать­ся только одним из приведенных выше конструктив­ных элементов для исключения избыточности и про­тиворечивости описания.

Двунаправленные связи


Однонаправленная связь

Рис. 2.1.4. Примеры связей между сущностями


Моделирование ПО начинают с выбора сущностей, не­обходимых для ее описания. Каждая сущность должна соот­ветствовать некоторому объекту (или группе объектов) ПО, о котором в системе будет накапливаться информация. Су­ществует проблема выбора конструктивного элемента для мо­делирования той или иной "порции" информации, что суще­ственно затрудняет процесс построения модели.

Так, информация о том, что некоторый студент входит в состав учебной группы (УГ) можно в модели представить:

♦ как связь "входит в состав" для сущностей "студент" и "УГ";

♦ как атрибут "имеет в составе "студента" сущности "УГ";

♦ как сущность "состав УГ".

В этих случаях приходится рассматривать несколько ва­риантов и с учетом информационных потребностей пользова­телей разбивать ПО на такие фрагменты, которые с их точ­ки зрения представляют самостоятельный интерес.

Рис. 2.1.5. Фрагмент ЕЫ-модели "Военнослужащие"


При моделировании ПО следует обращать внимание на существующий в ней документооборот. Именно документы, циркулирующие в ПО, должны являться основой для форму­лирования сущностей. Это связано с двумя обстоятельствами: ♦ эти документы, как правило, достаточно полно отра­жают информацию, которую необходимо хранить в БД, причем в виде конкретных данных;

♦ создаваемая информационная система должна предос­тавлять пользователям привычную для них информа­цию в привычном виде, что в последующем существен­но облегчит ввод БД в эксплуатацию.

Учащийся

№ факультета)

1
Слушатель
(^^Ф. И. (Дата рождения) в.^^)

Рис. 2.1.6. Фрагмент Е11-модели "Учебный процесс факультета"

При описании атрибутов сущности необходимо выбрать ряд атрибутов, позволяющих однозначно идентифицировать экземпляр сущности. Совокупность идентифицирующих ат­рибутов называют ключом.

Помимо идентифицирующих используются и описатель­ные атрибуты, предназначенные для более полного опре­деления сущностей. Число атрибутов (их тип) определяется единственным образом — на основе анализа возможных зап­росов пользователей. Существует ряд рекомендаций по "ра­боте с атрибутами" [15, 44], например, по исключению по­вторяющихся групп атрибутов (см. рис. 2.1.7). Все они направ­лены на улучшение качества инфологической модели.

При определении связей между сущностями следует из­бегать связей типа М:Ы, так как они приводят к существен­ным затратам ресурсов ЭВМ. Устранение таких связей пре­дусматривает введение других (дополнительных) элементов — сущностей и связей. На рис. 2.1.8 приведен пример исключе­ния связи многие ко многим.

Рис. 2.1.7. Пример исключения повторяющейся группы атрибутов


В заключение приведем типовую последовательность ра­бот (действий) по построению инфологической модели:

♦ выделение в ПО сущностей;

♦ введение множества атрибутов для каждой сущности и выделение из них ключевых;

♦ исключение множества повторяющихся атрибутов (при необходимости);

♦ формирование связей между сущностями;

♦ исключение связей типа М:Ы (при необходимости);

♦ преобразование связей в однонаправленные (по возмож­ности).

Помимо модели Чена существуют и другие инфологи- ческие модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструк­тивные элементы и соглашения по их использованию для представления в БД информации о ПО. Иными словами, пер­вый этап построения БД всегда связан с моделированием пред­метной области.

Переход


Рис. 2.1.8. Пример исключения связи типа М:Ы


<< | >>
Источник: Балдин К. В., Уткин В. Б.. Информационные системы в экономике: Учебник. — 5-е изд. — М.: Издательско-торго- вая корпорация «Дашков и К0», — 395 с.. 2008

Еще по теме 2.1.2. Описательная модель предметной области:

  1. ПРЕДМЕТНЫЕ ОБЛАСТИ СОЦИОЛИНГВИСТИКИ
  2. 4. Предметная область проведения проверок
  3. Описательное исследование
  4. 5.1. ДИЗАЙНЫ ОПИСАТЕЛЬНЫХ ИССЛЕДОВАНИЙ
  5. Определение предмета социологии и содержания предметных зон
  6. Предметный указатель
  7. V Эквиваленты наказания. — Примеры из области экономической, политической, научной, административной, религиозной, семейной и из области воспитания. Алкоголизм. Бродяжничество. Беспризорные дети.
  8. § 2. Предметные зоны социологии
  9. 5. ОПИСАТЕЛЬНЫЕ ИССЛЕДОВАНИЯ
  10. A. Описательные определения
  11. Глава 4. ПРЕДМЕТНАЯ СФЕРА СОЦИОЛОГИИ УПРАВЛЕНИЯ
  12. 5.5. ПОТЕНЦИАЛЬНЫЕ ИСТОЧНИКИ ОШИБОК В ОПИСАТЕЛЬНЫХ ИССЛЕДОВАНИЯХ
  13. 75. КОНВЕРСИВЫ. ОПИСАТЕЛЬНЫЕ ПРЕДИКАТЫ (АДЪЕКТИВНО– И ГЛАГОЛЬНО-ИМЕННЫЕ ПЕРИФРАЗЫ)
  14. 5.2. ОБЩАЯ ХАРАКТЕРИСТИКА МЕТОДОВПРОВЕДЕНИЯ ОПИСАТЕЛЬНЫХ ИССЛЕДОВАНИЙ.КОЛИЧЕСТВЕННЫЕ МЕТОДЫ ИССЛЕДОВАНИЙ
  15. Взаимосвязь моделей АБ-АБ и 1Б-ЬМ. Основные переменные и уравнения модели 1Б-1*М. Вывод кривых /5 и ЬМ. Наклон и сдвиг кривых 1Б и ЬМ. Равновесие в модели 1Б-ЬМ
  16. 6.2. Программные системы автоматизации с моделямипредметной области