litceysel.ru
добавить свой файл
1



В.А. Дмитриева, Ю.А. Святец

ТЕХНОЛОГИИ БАЗ ДАННЫХ В ИСТОРИЧЕСКИХ ИССЛЕДОВАНИЯХ: ТВОРЧЕСТВО БЕЗ РАСЧЕТА НА БУДУЩЕЕ?


39. Врата выбирают входящего. Не человек.

Хорхе Луис Борхес.
Фрагменты апокрифического Евангелия


// Круг идей: традиции и тенденции исторической информатики. Труды IV конференции АИК / Ред. Л.И. Бородкин и И.Ф. Юшин. М., 1997. 352 с. Сайт Ассоциация "История и компьютер" URL: http://kleio.asu.ru/aik/krug/4/3.shtml (дата обращения, –7.03.10)


Существо вопроса


Технологии баз данных (далее - БД) ныне представляют достаточно большой интерес для сообщества историков, чьи исследования выполняются с применением компьютерных технологий. Четыре конференции Ассоциации "История и компьютер" подтверждают этот тезис1. Об этом же свидетельствует выход в свет специальных книг (монографий и сборников), посвященных обобщению опыта создания и использования БД2 в области исторических исследований. Однако растущий опыт создания исторических БД сопровождается нарастающим беспокойством части компьютерного сообщества историков, что их детища впоследствии оказываются никем не востребоваными, кроме как их создателями. Иными словами, существует проблема "вторичного" (мы бы сказали повторного, многоразового, многопользовательского) использования (а точнее не использования) их другими историками, которая может превратить технологии БД в исторических исследованиях словами А. Камю в "творчество без расчета на будущее"3 .

Целью данной работы является исследование вопросов и выявление причин существования проблемы многократного неиспользования баз данных в исторических исследованиях.

Все причины отсутствия "культуры вторичного использования" БД4 , по нашему мнению, можно разделить на такие категории: исторические, методологические, технологические и экономико-правовые.



"Откуда есть пошла..." база данных

(Исторические причины)


Создатели исторических БД не могут отрицать того факта, что это явление привнесено в их жизнь извне со своими традициями и комплексами, которые породили больше проблем для историков, чем помогли последним избавиться от ощущения неполноценности и дискомфорта по данному поводу. Приобщение истории к созданию и использованию БД в данном случае выглядит подобным вживлению искусственного органа в уже сформировавшийся организм, и неизвестно, воспримет ли он его или отторгнет. Причиной тому является тот исторический факт, что БД своим появлением обязаны кибернетике - науке об управлении сложными динамическими системами. Независимо от того, техническая это система или экономическая, БД обеспечивает динамическое отображение информации (данных) о состоянии системы (значений ее параметров) и проверку ее по определенным критериям в автоматизированной системе управления. Постоянные изменения во времени, которые присущи таким БД, поддерживают информацию в виде потоков и не преследуют цели "откладывания информации на всякий случай и заготовления ее впрок"5. Таким образом, цели создания БД и исторических исследований, на первый взгляд, явно не совпадают.

Точно также обстояло дело с историческими источниками, или, точнее, с информацией, которая зафиксировалась на материальных объектах в результате целенаправленной деятельности людей. Материальный носитель и способ кодирования информации стали определяющими признаками типа исторического источника6.

Совсем небольшая часть исторических источников создавалась специально, чтобы зафиксировать и сохранить для потомков события прошлого (современного создателям источников). Большая же часть (подобно подводной части айсберга) документов, хранящих в себе информацию о событиях прошлого, создавались людьми в процессе их целенаправленной деятельности, для фиксации информации, необходимой для принятия решения в сложившихся условиях. Объективно большая часть из них, подобно информации в БД для управляющих систем, сразу же (по принятии решения) уничтожалась или видоизменялась. И лишь небольшая часть этого объема информации "откладывалась впрок" в архивах и библиотеках, что определялось экономическим потенциалом общества (возможностями тратиться на бумагу, содержать бюрократический аппарат, тиражировать информацию и т.п.).


Документы, хранящие эту информацию, попадая в поле зрения исследователя-историка, проходя предварительно синтаксический, семантический и прагматический фильтры, становятся историческими источниками, носителями информации о прошлом. Историк использует информацию, зафиксированную в источнике, полностью (генеральная совокупность), либо частично (выборочно). Двойственная природа информации в нем (наличие информации выраженной, воспринимаемой и скрытой, связанной, структурной) порождает необходимость применения соответственно описательных и формальных методов анализа. Формальные методы требуют определенной организации информации, ее структурирования, которое воплощается в виде базы данных. А это в свою очередь сужает круг интересующихся формализованной информацией исследователей, поскольку исторический источник оказывается информационно богаче, нежели база данных. С другой стороны, пока еще не каждый историк владеет компьютерными технологиями, в частности технологиями БД, хотя бы на уровне поиска и использования релевантной информации. Последнее требует создания достаточно хорошего программного обеспечения БД, т.е. дружественного интерфейса, обеспечивающего навигацию по БД, а также развитие возможностей анализа содержащейся в ней информации. Тем самым возникают проблемы технологического порядка.


"Чудище обло огромно, озорно, стозевно и лаяй"
(Технологические причины)



Создание БД в исторических исследованиях преследует цель, отличную от той, достижение которой и породило в 1962 г. само ее название и существование (информационное обеспечение процеса автоматического управления сложными динамическими процессами).

Какова же цель создания БД в исторических исследованиях? Является ли создание БД объективной необходимостью или данью моде?

Очевидно, что ответ на эти вопросы зависит от обстоятельств, в которых БД создается. С одной стороны, большинство исторических баз данных создавалось в ходе решения конкретно-исторических проблем (проблемно-ориентированные БД). Цель и задачи исследования в данном случае являются определяющими при выборе и разработке модели БД, которые и обусловливают информационную ограниченность последних существом проблемы. Поэтому целью создания проблемно-ориентированных баз данных является информационное обеспечение решения конкретно- исторических задач (проблем). С другой стороны, часть исторических баз данных создавалась с целью сохранения (продления существования) информации из исторического источника в электронной (более надежной и долговечной) форме. Создание таких БД ориентировано на анонимного пользователя, т.е. на решение широкого класса задач (проблем). В таком случае очень ценным является сбережение информации из исторического источника в БД в полном (точнее в максимально возможном) объеме. При этом представление информации в БД должно быть не хуже, чем в историческом источнике и удобным для компьютерного анализа. Такой подход к созданию БД, достаточно удачно поименованный д-ром Манфредом Таллером как "источнико-ориентированный", представляется более удачным и приемлемым нежели первый (проблемно- ориентированный) для разрешения задачи многопользовательского и многократного обращения к ним. Тем более, что современные компьютерные технологии представляют достаточно широкие возможности для этого: от систем хранения структурированных источников с развитым интерфейсом (например, CenSys д-ра Яна Олдерволла, SOCRATES д-ра Лена Брере, KLEIO д-ра Манфреда Таллера)7 до баз данных на основе свободного текста (SGML, HTML, TACT)8; от кодирования цифровой информации (статистики) до хранения изображений источников и картографических систем9 .



Насколько представление исторической информации в БД удобно для рядового историка?

Преимущества электронных носителей информации (долговечность, надежность, емкость хранения последней) перед другими материальными носителями открывают перед историком достаточно широкие перспективы работы. В особенности это касается рутинных операций по поиску релевантной информации, транслитерации и декодированию ее, реконструкции утраченных фрагментов и т.п. Поэтому качество и форма представления информации в БД могут быть определяющими при обращении к ней других пользователей. Адекватное отражение исторического источника в электронной форме в идеале, с одной стороны, должно быть столь же многомерным сколь и сам источник, а, с другой стороны, - предполагать возможность и удобство компьютерного его анализа. Однако, как, например, создать БД, пригодную для изучения содержания источника (манускрипта) и в то же время - для анализа филиграней (водяных знаков) бумаги, на которой они написаны. Названные два аспекта представляются нам тесно взаимосвязанными, а иначе затраты времени на создание БД не могут быть оправданными. Разработчик БД, пусть даже и проблемно-ориентированной, заинтересованный в последующем многопользовательском обращении к ней, по нашему мнению, просто обязан побеспокоиться о своих последователях. К этому можно приблизиться не только представлением информации в БД наиболее полно, но и подготовкой сопроводительной документации (как на электронном, так и на бумажном носителях).

Насколько широк круг методов анализа, которые позволяет применить созданная БД?

Данный вопрос тесно связан с предыдущими двумя и зависит как от цели создания БД, так и от профессионализма ее создателя. Большая часть историков не являются программистами, а поэтому вынуждены пользоваться либо стандартным программным обеспечением анализа информации, содержащейся в БД, либо ограничиваться сервисом СУБД. Безусловно, создать универсальное программное обеспечение практически невозможно, ибо методы развиваются и совершенствуются, меняются интересы и задачи, решаемые историками. Но даже источнико-ориентированные системы требуют определенного уровня подготовки историка в области компьютерных технологий, что, как нам кажется, во многом зависит от воли и желания самого исследователя. В идеале же решение новых исторических задач на существующих и ранее уже использованных БД возможно лишь как результат симбиоза профессионала-историка и профессионала-программиста. Хотя, конечно, сегодня уже существуют системы-конверторы файлов из одного формата хранения (скажем графического, текстуального, базы данных и т.п.) в другой, что облегчает возможность работы с информацией в БД. Однако, опытные исследователи знают, что на практике существуют достаточно определенные ограничения на такие преобразования как технологического порядка, так и ресурсного (в том числе и экономического). Поэтому обычно приходиться довольствоваться малым (минимальной инсталляцией, ограниченной редакцией программного обеспечения) и ограничивать себя в запросах к стандартному программному обеспечению. Тут, несомненно, возрастает роль оригинальных, адаптированных к потребностям конкретного исследования программных продуктов, работающих (точнее обслуживающих) базы данных историков.


Какова легитимность БД в историческом исследованиии?

Создание БД в ходе конкретно-исторического исследования оправдано и не вызывает возражений в сообществе "компьютеризованных" историков, поскольку в таком исследовании есть "первоисточник" информации - документ, зафиксированный на бумажном или другом материальном носителе, а БД является лишь вторичной, вспомогательной, удобной формой работы с информацией. Каждый такой документ обычно (практически всегда) имеет библиографическое, архивное либо музейное описание (выходные данные), обеспечивающее другому исследователю возможность получения воспроизводимого результата. Тем самым конституируется само существование и в определенной степени достоверность и подлинность зафиксированной в документе информации (исторические факты).

С базой данных, при "вторичном" ее использовании в исследовании, дело обстоит не совсем понятным и не вполне определенным образом: как подавать выходные данные для ссылки на БД в публикациях результатов исследований, как проверять достоверность, подлинность, аутентичность информации, содержащейся в БД, и на сколько ей вообще возможно доверять, достаточно ли этой информации для решения конкретно- исторической задачи, достаточно ли полно (исчерпывающе) БД зафиксировала в себе информацию касательно данной проблемы и т.п.? Эти вопросы возникают еще и потому, что в основу БД могли быть положены несколько разных источников с различным уровнем достоверности, репрезентативности, агрегирования информации. Названный аспект пока еще не нашел своего отражения в теоретических исследованиях источниковедов, поскольку отрасль электронных (машиночитаемых) источников исторической информации еще только делает первые шаги. Но уже сегодня, наверное, есть необходимость начать договариваться о "правилах игры". Тем более, что "вторичное" использование БД не исключает возможности формирования новой БД на основе ранее созданных, которая становится динамической информационной моделью уже не столько исторического источника, сколько предметной области исторического исследования10.


Насколько хорошо историки информированы о существующих БД?

Этот вопрос граничит с экономическими причинами рассматриваемой проблемы, ибо оповещение (буквально реклама) о существующих БД имеет немаловажное значение в деле их распространения среди ииследователей. Решение его предполагает проведение определенных организационных мероприятий (выставок, презентаций и т.п.) и финансовых затрат на рекламу (буклеты, бюллетени, публикации статей в изданиях, доступных широкому кругу историков и т.п.). Возможно, выходом из этой ситуации могла бы быть активизация деятельности Консорциума по базам и банкам данных при Ассоциации "История и компьютер", как института, одной из задач которого была деятельность по накоплению, рекламе и распространению БД, создаваемых и созданных членами Ассоциации.

Как много БД на сегодня существует?

Наверное самое парадоксальное заключается в том, что созданных исторических БД сегодня не так уж и много, чтобы об этом нельзя было поинформировать историков11. Во всяком случае исторических источников на традиционных (неэлектронных) носителях гораздо больше (наверное, в сотни, тысячи и более раз), чем БД. По-видимому, БД лишь тогда займут надлежащее место в исследовательском аппарате историков (станут равноправными носителями информации), когда их количество достигнет некоторой критической массы.

На сколько широкий круг историков могут интересовать существующие БД?

Подобно тому как книги (монографии, археографические издания и т.п.) или, что чаще бывает, архивные документы порою достаточно долгое время не находят своего читателя (исследователя), созданные базы данных по определенным проблемам могут интересовать ограниченное количество исследователей (пользователей) либо вообще могут находиться за пределами их интересов. Данная ситуация может меняться со временем в связи с развитием общества, наступлением определенных событий, появлением модных (конъюнктурных) исследований и т.п.



"Сколько стоит дом построить?"

(Экономико-правовые причины)


Использование существующих БД, не только исторических, предполагает реализацию авторских прав их создателей и решение вопросов технического обеспечения доступа к ним, т.е. решения экономико- правовых вопросов.

Сколько стоит организовать доступ к БД?

Организация многократного многопользовательского доступа к БД предполагает определенные материальные затраты , на которые не всегда может решиться отдельный исследователь. Прежде всего речь идет об оборудовании, которое при достаточно высоком темпе падения цен на электронику все же остается слишком высокой для рядового историка. Приобретение же баз данных, распространяемых на CD-ROM или через Internet, регулируется авторским правом через цену этого продукта. Много ли исторических факультетов, архивов, библиотек бывшего СССР могут похвастаться наличием компьютерного класса с современным оборудованием и выходом в международную компьютерную сеть? Наверное нет. Выходом из этой ситуации должно быть создание компьютерных центров (локальных сетей) связанных посредством Internet, которые бы обеспечивали многопользовательский доступ к БД, подобно доступу к книгам в библиотеках, к делам в архивах, экспонатам в музеях. А это проблема чисто экономическая, зависящая от многих факторов, в том числе и от проводимых государством образовательной и культурной программ.

Насколько свободен доступ к БД?

Свобода и условия доступа к БД имеют важнейшее значение для решения проблемы многократной и многопользовательской работы с ними.

Существующие в мире БД (и вообще машиночитаемые документы), равно как и традиционные носители информации, могут быть открытыми (свободно распространяемыми), секретными (защищенными от несанкционированного доступа), а также коммерческими (предоставляемыми на определенных условиях, чаще всего денежных). При этом историки могут обращаться к базам данных как предназначенным специально для них, так и к базам, которые являются результатом деятельности в области компьютерных технологий информационной сферы современного общества. Скажем, в Скандинавских странах существуют базы данных, фиксирующие демографические данные о населении этих стран (регистрация рождений, смертей, браков, разводов), которые историки могут использовать в демографических, социальных, этно-культурных и других исследованиях.


Проблема доступа к БД имеет также и дидактический аспект. Культуру повторного обращения к БД необходимо формировать. Если создание комплекса технических средств компьютерных классов - это вопрос, несомненно, ближайшего будущего и проблема экономического характера, то изменение сознания историка, предполагающее организацию его исследования с позиций современных информационных технологий, формирование культуры его исследования в информационном сообществе себе подобных посредством компьютерных коммуникаций представляется нам процессом гораздо длительным и более трудоемким. Ведь и поныне очень часто сталкиваешься с полным непониманием и недоумением, возникающим и у коллег-"технарей" и у коллег-"гуманитариев" (у первых от "самоуверенности", у вторых - от "незнания") при словах "история" и "компьютер", стоящих рядом, а следствием этого, как правило, является остаточный принцип финансирования технических нужд исторических (и вообще гуманитарных) факультетов, снабжение их по принципу "на тебе Боже, что мне не гоже". А с другой стороны, историк, владеющий компьютерными технологиями, вовсе не нуждается в убеждении его о пользе БД. Для него важно, чтобы существовала БД, отвечающая его профессиональным интересам, и был обеспечен достаточно удобный доступ к ней.


"Камо грядеши ?"

(Выводы)


Проблема формирования культуры повторного обращения БД в исторических исследованиях носит, по-видимому, временный характер, поскольку сам процесс создания и накопления их еще не стал массовым и не достиг критической массы, когда их количество могло бы перерасти в новое качество, т.е. не сформировались условия, в которых историк не мог бы мыслить свое исследование без опоры на ранее созданную БД.

Перспективы решения такой проблемы зависят от внешних и внутренних (внутринаучных) факторов. Среди внешних факторов следует назвать политико-экономическое состояние (стабильность) государства. Пока им не будет осознан тот факт, что уровень развития современного общества определяется уже не столько энергетическими приоритетами и ценностями, сколько интеллектуальным потенциалом и обеспечивающим его уровнем развития информационных технологий, очень сложно будет сдвинуться с мертвой точки. Внутренние же факторы достаточно тесно взаимосвязаны с внешними, ибо формирование культуры повторного обращения к БД историками требует смены ценностей в самой исторической науке, которая объективно была и остается наукой, сильно подверженной политической конъюнктуре и используемой для формирования идеологической оболочки государства и имиджей политических лидеров.


Авторы работы будут признательны коллегам за участие в обсуждении выше изложенных положений, а также за возможные отзывы и мнения по данному поводу.





1 См.: Круг идей: новое в исторической информатике. Тр. 1-й конф. Ассоциации "История и компьютер" / Отв. ред.: Л.И. Бородкин, В.С. Тяжельникова. М., 1994; Круг идей: развитие исторической информатики. Тр. 2-й конф. Ассоциации "История и компьютер" / Отв. ред.: Л.И. Бородкин, В.С. Тяжельникова. М., 1995; Круг идей: модели и технологии исторической информатики. Тр. 3-й конф. Ассоциации "История и компьютер" / отв. ред.: Л.И. Бородкин, В.С. Тяжель-никова. М., 1996; Информационный бюллетень Ассоциации "История и компьютер". 1996 г. № 17, март.: Специальный выпуск бюллетеня. Тезисы докладов и сообщений IV конференции Ассоциации "История и компьютер". Звенигород, 15-17 марта 1996 г. М., 1996.

2 Гарскова И.М. Базы и банки данных в исторических исследованиях. Gцttingen, 1994; Базы данных в археологии. М., 1995.



3 Камю А. Бунтующий человек. Философия. Политика. Искусство: Пер. с фр. М., 1990. С. 86.

4 Гарскова И.М. Базы и банки данных... С. 6; Она же. Некоторые тенденции и проблемы технологии баз данных в исторических исследованиях // Круг идей: развитие исторической информатики... С. 14.

5 Воробьев Г.Г. Твоя информационная культура. М., 1988. С. 143.

6 Пушкарев Л.Н. Классификация русских письменных исторических источников по отечественной истории. М., 1975. С. 191-206; Шмидт С.О. Источниковедение в кругу других научных дисциплин и вопросы классификации источников (Постановка вопроса) // Актуальные вопросы источниковедения и специальных исторических дисциплин. М., 1983. С. 10-11.




7 Гарскова И.М. Базы и банки данных... ; Леверманн В. Технология разработки баз данных и источнико- ориентированная обработка данных // Круг идей: новое в исторической информатике... С. 15-23; Таллер М. Что такое "источнико-ориентированная обработка данных"; что такое "историческая информатика"? // История и компьютер. Новые информационные технологии в исторических исследованиях и образовании / Отв. ред.: Л.И. Бородкин, В. Леверманн. St. Katharinen, 1993. С. 5-18; Леверманн В. Данные и знания в исторических базах данных // Там же. С. 19-33; Брере Л. Реляционные базы данных и свободный текст: Contradictio in terminis? // Там же. С. 35-46; Олдерволл Я. WinCens или новая система для работы с материалами переписей // Там же. С. 47-60; Thaller M. Source Oriented Data Processing and Quantification: Distrusful Brothers // Statistics for Historians: Standard Packages and Specific Historical Software / L. Borodkin, M. Thaller, J. Turner (eds.). St. Katharinen, 1995. P. 125-144.

8 Петров А.И. Компьютерный анализ текста. Историография метода // Круг идей: модели и технологии... С. 255-277; Гарскова И.М. Анализ структурированных историческиих источников: перспективное направление исторической информатики // Информационный бюллетень Комиссии по применению математических методов и ЭВМ в исторических исследованиях при Отделении истории РАН. 1992 г. N 6, ноябрь. М., 1992. С. 50-60; Burnard L. The Text Encoding Initiative: Towards an Extensible Standard for the Encoding of Texts // Electronic Information Resources and Historians: European Perspectives / S. Ross, E. Higgs (eds.). St. Katharinen, 1993. P. 105-118.

9 Яриц Г. Образ как исторический источник или "схватывание" контекста // Информационный бюллетень Комиссии по применению математических методов и ЭВМ в исторических исследованиях при Отделении истории РАН и Ассоциации "История и компьютер". 1993. № 8, март. М., 1993. С. 68-74; Владимиров В.Н., Колдаков И.Г., Силина И.Г. К созданию компьютерного атласа истории России начала ХХ в. // Источник. Метод. Компьютер: Сборник научных трудов / Отв. ред.: В.Н. Владимиров, С.В. Цыб. Барнаул, 1996. С. 214-222; Владимиров В.Н. История, карта, компьютер... О возможностях исторического компьютерного картографирования // Круг идей: модели и технологии... С. 297-305; Пиотух Н.В. О возможностях компьютерного картографирования при работе с данными писцовых книг начала XVII в. и материалами генерального межевания второй половины XVIII в. // Там же. С. 306-327.




10 Святец Ю.А. База данных как динамическая информационная модель предметной области исторического исследования // Информационный бюллетень Ассоциации "История и компьютер". 1996. № 17... С. 71-73.

11 A Guide to Historical Datafiles Held in Machine-Readable Form / Compiled by K. Schurer and S.J. Anderson with the assistance of J.A. Duncan. Association for History and Computing. Cambridge, 1992.