Надежда Георгиевна Поврозник - Исторические информационные системы: теория и практика стр 19.

Шрифт
Фон

Наряду с реляционной моделью данных, в том числе для информационных систем, используются иерархическая и сетевая модели, которые значительно менее распространены. Кроме того, развиваются постреляционные модели объектно-ориентированные, объектно-реляционные базы данных и др.

Реляционные модели наиболее эффективны при создании проблемно-ориентированных систем, а также исторических информационных систем на основе структурированных и массовых источников. При наличии естественной однотипной структуры у массива источников каждый из них становится экземпляром основного отношения (таблицы) базы данных, структурные элементы образуют атрибуты отношения. Если массив источников имеет естественную иерархию, то ее уровни образуют набор отношений, связанных между собой (например, периодические издания, выпуски этих изданий и отдельные публикации). В качестве дополнительных (справочных) отношений могут использоваться различные элементы метаописаний источников: автор, место хранения, место издания, рубрикация, типология и др.

При проблемно-ориентированном подходе к созданию информационной системы типичными отношениями модели являются: персона, источник, организация, публикация и событие. Более подробно они были рассмотрены выше.

Реляционные базы данных имеют ряд ограничений, в основном связанных с жесткой структурой модели. Так, все строки (записи) должны иметь единый набор атрибутов, модель строго определена заранее. Нормализация модели зачастую порождает сложную структуру с дополнительными таблицами и связями. Ограничения реляционной модели при создании историко-ориентированных информационных систем обусловлены как указанными строгими требованиями этой модели, так и спецификой исторических данных, в частности преобладанием слабоструктурированных, неунифицированных данных со сложными внутренними связями [Schreibman, Siemens, Unsworth, 2008].

К наиболее типичным проблемам исторических реляционных баз данных относятся следующие.

Реляционная модель навязывает структуру данных на ранней стадии исследования, что в большинстве случаев неуместно для истории. В результате мы вынуждены данные адаптировать к структуре, а не структуру к данным, что было бы более логичным. Исторические источники не всегда легко укладываются в реляционный формат связанных двусторонних таблиц, а внутренние связи и отношения между элементами не всегда прозрачны [Harvey, Press, 1996].

К наиболее типичным проблемам исторических реляционных баз данных относятся следующие.

Реляционная модель навязывает структуру данных на ранней стадии исследования, что в большинстве случаев неуместно для истории. В результате мы вынуждены данные адаптировать к структуре, а не структуру к данным, что было бы более логичным. Исторические источники не всегда легко укладываются в реляционный формат связанных двусторонних таблиц, а внутренние связи и отношения между элементами не всегда прозрачны [Harvey, Press, 1996].

Реляционные СУБД не ориентированы на работу с большими массивами текстов, рисунками, аудио- и видеоисточниками. Поскольку большинство исторических источников являются нарративными и представлены слабоструктурированными текстами, использование реляционной модели потребует либо искусственного расщепления, фрагментации источника, либо использования «слабой» модели с небольшим набором атрибутов, главным (или даже единственным) из которых будет текст источников. Даже если выбранная СУБД поддерживает возможность хранения в ячейке таблицы текстов большого объема, это не является эффективным. Фрагментация источника, его метаописание или выборочное извлечение частей текста вместо хранения его целиком вносят элемент субъективизма и могут затруднять повторное использование источниковой базы. Другая проблема текста изменяемые правила орфографии и грамматики, ошибки и опечатки в источниках.

Даже в случае использования структурированных источников проблемой являются неунифицированные, значительно отличающиеся по объему и формату записи данных. Историкам сложно иметь дело с полями фиксированной длины, при этом значения полей часто вообще отсутствуют либо поля имеют множественные значения. Например, в пределах одной метрической книги могли использоваться разные способы записи даты рождения и разная степень детализации информации о родителях.

Распространенной проблемой реляционных исторических баз данных является работа с датами. Это связано с использованием даже в пределах одного источника разных хронологических систем, традиций записи дат, религиозных календарей, а также с неполнотой данных. Для разных событий в пределах одной базы данных может быть известна точность до века, года, месяца, дня или часа. Причиной тому может быть как неполнота исторических данных, так и специфика разных типов процессов и явлений. Так, дата начала экономического кризиса редко может быть определена с точностью до дня, для других же событий даже дневная точность будет недостаточной. Особенно остро это ощущается при создании ресурсов на основе больших хронологических периодов и при объединении в одной базе разнотипных событий. Решения этой проблемы существуют, но все они имеют недостатки необходимо либо отказаться от точности, либо вводить для каждой даты несколько полей, порождая содержательную избыточность данных.

Ваша оценка очень важна

0
Шрифт
Фон

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Если нет возможности читать онлайн, скачайте книгу файлом для электронной книжки и читайте офлайн.

fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf mobi.prc epub ios.epub fb3