litceysel.ru
добавить свой файл
1 2 ... 5 6
Объектно-ориентированные базы данных - основные концепции,


организация и управление: краткий обзор


1. Введение


Направление объектно-ориентированных баз данных (ООБД)

возникло сравнительно давно. Публикации появлялись уже в

середине 1980-х (например, [96]). Однако наиболее активно это

направление развивается в последние годы. С каждым годом

увеличивается число публикаций и реализованных коммерческих и

экспериментальных систем.


Возникновение направления ООБД определяется прежде всего

потребностями практики: необходимостью разработки сложных

информационных прикладных систем, для которых технология

предшествующих систем БД не была вполне удовлетворительной.


Конечно, ООБД возникли не на пустом месте. Соответствующий

базис обеспечивают как предыдущие работы в области БД, так и

давно развивающиеся направления языков программирования с

абстрактными типами данных и объектно-ориентированных языков

программирования.


Что касается связи с предыдущими работами в области БД, то на

наш взгляд наиболее сильное влияние на работы в области ООБД

оказывают проработки реляционных СУБД и следующее

хронолигически за ними семейство БД, в которых поддерживается

управление сложными объектами [52-56]. Кроме того,

исключительное влияние на идеи и концепции ООБД и, как

кажется, всего объектно-ориентированного подхода оказал подход

к семантическому моделированию данных (например, [57-59], хотя

общее число публикаций по семантическому моделированию

поистине безгранично). Достаточное влияние оказывают также

развивающиеся параллельно с ООБД направления дедуктивных и

активных БД [10, 42, 82, 84].


Среди языков и систем программирования наибольшее первичное

влияние на ООБД оказал Smalltalk [34, 36]. Этот язык сам по


себе не является полностью поинерским, хотя в нем была введена

новая терминология, являющаяся теперь наиболее

распространенной в объектно-ориентированном программировании.

На самом деле, Smalltalk основан на ряде ранее выдвинутых

концепций. Хороший обзор идей и подходов

объектно-ориентированного программирования представлен,

например, в [3].


Большое число работ не означает, что все проблемы ООБД

полностью решены. Как отмечается в Манифесте группы ведущих

ученых, занимающихся ООБД, [8] современная ситуация с ООБД

напоминает ситуацию с реляционными системами середины 1970-х.

При наличии большого количества экспериментальных проектов (и

даже коммерческих систем) отсутствует общепринятая

объектно-ориентированная модель данных, и не потому, что нет

ни одной разработанной полной модели, а по причине отсутствия

общего согласия о принятии какой-либо модели. На самом деле,

имеются и более конкретные проблемы (например, [5, 7]),

связанные с разработкой декларативных языков запросов,

выполнением и оптимизацией запросов, формулированием и

поддержанием ограничений целостности, синхронизацией доступа и

управлением транзакциями и т.д.


Тематика ООБД очень широка, объем настоящего обзора не

позволяет рассмотреть все вопросы. Тем не менее, мы

постараемся в систематической манере проанализировать наиболее

важные аспекты ООБД (критерии отбора тем и источников

полностью субъективны). Обзор построен по следующему плану:

Первый раздел - настоящее введение. Во втором разделе

излагаются основные понятия объектно-ориентированного подхода

и их специфическое преломление в контексте ООБД. В третьем

разделе рассматриваются основные понятия


объектно-ориентированного моделирования данных. Четвертый

раздел посвящен языкам программирования и языкам запросов

ООБД. В пятом разделе кратко обозреваются характерные

представители объектно-ориентированных СУБД - ORION и O2.

Шестой раздел посвящается проблематике выполнения и

оптимизации запросов к ООБД. В седьмом разделе рассматриваются

вопросы синхронизации доступа и управления транзакциями в

ООБД. Восьмой раздел касается связи ООБД и дедуктивных и

активных БД. Наконец, девятый раздел - краткое заключение.


2. Общие понятия объектно-ориентированного подхода и их

преломление в ООБД


В наиболее общей и классической постановке [11]

объектно-ориентированный подход базируется на концепциях:


- объекта и идентификатора объекта;


- атрибутов и методов;


- классов;


- иерархии и наследования классов.


Любая сущность реального мира в объектно-ориентированных

языках и системах моделируется в виде объекта. Любой объект

при своем создании получает генерируемый системой уникальный

идентификатор, который связан с объектом во все время его

существования и не меняется при изменении состояния объекта.


Каждый объект имеет состояние и поведение. Состояние объекта -

набор значений его атрибутов. Поведение объекта - набор

методов (программный код), оперирующих над состоянием объекта.

Значение атрибута объекта - это тоже некоторый объект или

множество объектов. Состояние и поведение объекта

инкапсулированы в объекте; взаимодействие между объектами

производится на основе передачи сообщений и выполнении

соответствующих методов.


Множество объектов с одним и тем же набором атрибутов и

методов образует класс объектов. Объект должен принадлежать

только одному классу (если не учитывать возможности

наследования, см. следующий абзац). Допускается наличие

примитивных предопределенных классов, объекты-экземляры

которых не имеют атрибутов: целые, строки и т.д. Класс,

объекты которого могут служить значениями атрибута объектов

другого класса, называется доменом этого атрибута.


Допускается порождение нового класса на основе уже

существующего класса - наследование. В этом случае новый

класс, называемый подклассом существующего класса

(суперкласса) наследует все атрибуты и методы суперкласса. В

подклассе, кроме того, могут быть определены дополнительные

атрибуты и методы. Различаются случаи простого и

множественного наследования. В первом случае подкласс может

определяться только на основе одного суперкласса, во втором

случае суперклассов может быть несколько. Если в языке или

системе поддерживается единичное наследование классов, набор

классов образует древовидную иерархию. При поддержании

множественного наследования классы связаны в ориентированный

граф с корнем, называемый решеткой классов. Объект подкласса

считается принадлежащим любому суперклассу этого класса.


Одной из более поздних идей объектно-ориентированного подхода

является идея возможного переопределения атрибутов и методов

суперкласса в подклассе (перегрузки методов). Эта возможность

увеличивает гибкость, но порождает дополнительную проблему:

при комплиляции объектно-ориентированной программы могут быть

неизвестны структура и программный код методов объекта, хотя

его класс (в общем случае - суперкласс) известен. Для

разрешения этой проблемы применяется так называемый метод


позднего связывания, означающий, по сути дела,

интерпретационный режим выполнения программы с распознаванием

деталей реализации объекта во время выполнения посылки

сообщения к нему. Введение некоторых ограничений на способ

определения подклассов позволяет добиться эффективной

реализации без потребностей в интерпретации [97].


Как видно, при таком наборе базовых понятий, если не принимать

во внимание возможности наследования классов и соответствующие

проблемы, объектно-ориентированный подход очень близок к

подходу языков программирования с абстрактными (или

произвольными) типами данных [77].


С другой стороны, если абстрагироваться от поведенческого

аспекта объектов, объектно-ориентированный подход весьма

близок к подходу семантического моделирования данных [58]

(даже и по терминологии). Фундаментальные абстракции, лежащие

в основе семантических моделей, неявно используются и в

объектно-ориентированном подходе. На абстракции агрегации

основывается построение сложных объектов, значениями атрибутов

которых могут быть другие объекты. Абстракция группирования -

основа формирования классов объектов. На абстракциях

специализации/обобщения основано построение иерархии или

решетки классов.


Видимо, наиболее важным новым качеством ООБД, которое

позволяет достичь объектно-ориентированный подход, является

поведенческий аспект объектов. В прикладных информационных

системах, основывавшихся на БД с традиционной организацией

(вплоть до тех, которые базировались на семантических моделях

данных), существовал принципиальный разрыв между структурной и

поведенческой частями. Структурная часть системы

поддерживалась всем аппаратом БД, ее можно было моделировать,


верифицировать и т.д., а поведенческая часть создавалась

изолированно. В частности, отсутвовали формальный аппарат и

системная поддержка совместного моделирования и гарантирования

согласованности этих структурной (статической) и поведенческой

(динамической) частей. В среде ООБД проектирование, разработка

и сопровождение прикладной системы становится процессом, в

котором интегрируются структурный и поведенческий аспекты.

Конечно, для этого нужны специальные языки, позволяющие

определять объекты и создавать на их основе прикладную систему

[70].


Специфика применения объектно-ориентированного подхода для

организации и управления БД потребовала уточненного толкования

классических концепций и некоторого их расширения [6]. Это

определяется потребностями долговременного хранения объектов

во внешней памяти, ассоциативного доступа к объектам,

обеспечения согласованного состояния ООБД в условиях

мультидоступа и тому подобных возможностей, свойственных базам

данных [8]. В [6] выделяются три аспекта, отсутствующие в

традиционной парадигме, но требующиеся в ООБД.


Первый аспект касается потребности в средствах спецификации

знаний при определении класса (ограничений целостности, правил

дедукции и т.п.) Второй аспект - потребность в механизме

определения разного рода семантических связей между объектами

вообще говоря разных классов. Фактически это означает

требование полного распространения на ООБД средств

семантического моделирования данных. Потребность в

использовании абстракции ассоциирования отмечается и в связи с

использовании ООБД в сфере автоматизированного проектирования

и инженерии [66]. Наконец, третий аспект связан с пересмотром


понятия класса. В контексте ООБД оказывается более удобным

рассматривать класс как множество объектов данного типа, т.е.

одновременно поддерживать понятия и типа и класса объектов.


Как мы отмечали во введении, в сообществе исследователей ООБД

и разработчиков систем отсутствует полное согласие, но в

большинстве практических работ используется некоторое

расширение объектно-ориентированного подхода.


3. Объектно-ориентированные модели данных


Первой формализованной и общепризнанной моделью данных была

реляционная модель Кодда [98]. В этой модели, как и во всех

следующих, выделялись три аспекта - структурный, целостный и

манипуляционный. Структуры данных в реляционной модели

основываются на плоских нормализованных отношениях,

ограничения целостности выражаются с помощью средств логики

первого порядка и, наконец, манипулирование данными

осуществляется на основе реляционной алгебры или равносильного

ей реляционного исчисления. Как отмечают многие исследователи,

своим успехом реляционная модель данных во многом обязана

тому, что опиралась на строгий математический аппарат теории

множеств, отношений и логики первого порядка. Разработчики

любой конкретной реляционной системы считали своим долгом

показать соответствие своей конкретной модели данных общей

реляционной модели, которая выступала в качестве меры

"реляционности" системы.


Основные трудности объектно-ориентированного моделирования

данных проистекают из того, что такого развитого

математичекого аппарата, на который могла бы опираться общая

объектно-ориентированная модель данных, не существует. В

большой степени поэтому до сих пор нет базовой

объектно-ориентированной модели. С другой стороны, в [63] со


ссылкой на недоступную нам работу Майера [99] утверждается,

что общая объектно-ориентированная модель данных в

классическом смысле и не может быть определена по причине

непригодности классического понятия модели данных к парадигме

объектной ориентированности.


Не приводя доводов в пользу этого утверждения Майера, но и не

оспаривая его, Беери [63] предлагает в общих чертах формальную

основу ООБД, далеко не полную и не являющуюся моделью данных в

традиционном смысле, но позволяющую исследователям и

разработчикам систем ООБД по крайней мере говорить на одном

языке (если, конечно, предложения Беери будут развиты и

получат поддержку). Независимо от дальнейшей судьбы этих

предложений мы считаем полезным кратко их пересказать.


Во-первых, следуя практике многих ООБД, предлагается выделить

два уровня моделирования объектов: нижний (структурный) и

верхний (поведенческий). На структурном уровне поддерживаются

сложные объекты, их идентификация и разновидности связи "isa".

База данных - это набор элементов данных, связанных

отношениями "входит в класс" или "является атрибутом". Таким

образом, БД может рассматриваться как ориентированный граф.

Важным моментом является поддержание наряду с понятием объекта

понятия значения (позже мы увидим, как много на этом построено

в одной из успешных объектно-ориентированных СУБД O2 [29]).


Важным аспектом является четкое разделение схемы БД и самой

БД. В качестве первичных концепций схемного уровня ООБД

выступают типы и классы. Отмечается, что во всех системах,

использующих только одно понятие (либо тип, либо класс) это

понятие неизбежно перегружено: тип предполагает наличие

некоторого множества значений, определяемого структурой данных

этого типа; класс также предполагает наличие множества

объектов, но это множество определяется пользователем. Таким


следующая страница >>