Вы здесь

Решение проблем научно-справочного аппарата с помощью компьютеризации (на примере Российского государственного архива кинофотодокументов)

Выступление  начальника отдела НСА РГАКФД В.Н. Баталина на 8-й ежегодной международной конференции «Информация для всех: культура и технологии Информационного общества» EVA 2005.

с 28 ноября 2005 по 2 декабря 2005 г.г. Москва

Необходимость разработки и внедрения в РГАКФД архивных компьютерных технологий изначально была обусловлена как стремлением повысить информационный потенциал, так и стремлением решить некоторые организационные и кадровые проблемы.

Специфика кинофотодокументов как исторических источников обусловила тот факт, что основным инструментом для оперативного поиска информации по ним являются каталоги. Прежде всего, это систематические и именные каталоги, а также различные указатели, позволяющие осуществлять многоаспектный поиск информации на уровне сюжета внутри отдельно взятой ед. хранения кинодокумента и на уровне каждой хранящейся в архиве ед.хранения фотодокументов. На сегодняшний день эти каталоги насчитывают 620.000 карточек в кинокаталогах и около 970.000 карточек в фотокаталогах. Этот массив ежегодно пополняется, в среднем, 18.000 новых карточек, которые, предварительно, надо составить, проиндексировать, напечатать, проверить правильность их составления, при необходимости внести исправления, для карточек для фотокаталогов изготовить в лаборатории контрольные фотоотпечатки и наклеить их на каталожные карточки. И только потом включить эти карточки в соответствующие каталоги. Т.е., каталогизация – дело трудное и затратное во всех отношениях. Следует при этом отметить, что за, приблизительно, 75 лет формирования каталогов этой работой занимались сотрудники разной, порой недостаточной, квалификации, требования и методика неоднократно менялись. Трижды за эти годы менялись схемы индексации, в соответствии с которыми осуществляется организация каталожного массива внутри каталогов. Конечно, все это не могло не сказаться на качестве каталогов, хотя, в целом, наши каталоги удовлетворяют потребности пользователей в архивной информации. В то же время, анализ запросов работающих в архиве заказчиков показал, что меняется их содержание в сторону большей детализации. Заказчиков стали интересовать вопросы, на которые каталоги, в силу заложенных в них принципов организации, ответить уже не могут. Выход из сложившейся ситуации напрашивался сам собой - внедрение автоматизированных архивных технологий, способных не только поднять на качественно иной уровень предоставление любым возможным пользователям информации о составе и содержании архивных кинофотодокументов, но и по-новому организовать работу с ними в рамках архива в целом. Изначально рассматривалась возможность разработки и внедрения, если можно так выразиться, «сквозных» компьютерных технологий, позволяющих в рамках единой для каждого вида архивных документов (в нашем случае - кинодокументов и фотодокументов) программной среды осуществлять поэтапное их описание (в рамках компетенции разных отделов и лабораторий).

Например, с помощью автоматизированных архивных технологий предполагалось ускорить процесс описания кинофотодокументов с момента их поступления на хранения в архив - исключив дублирование в их описании в процессе комплектования, принятия на архивный учет и последующего создания научно-справочного аппарата к ним. С учетом технических особенностей кинофотодокументов важной задачей является и правильный учет и порядок проведения реставрационно-профилактических работ с ними.

Параллельно решалась проблема создания вторых (страховых) экземпляров нескольких сотен книг учета и описания кинодокументов и фотодокументов. С 1991 г. в архиве началась разработка и внедрение АИПС по составу и содержанию фотодокументов, при этом параллельно продолжалось ведение традиционных карточных каталогов.

В качестве основы базы данных фотодокументов была выбрана программа 4th Dimension Runtime 2.1, предназначенная для работы на персональных компьютерах класса Apple Macintoch. Выбор фотодокументов, а не кинодокументов для компьютеризации был обусловлен тем, что фотоизображения легче (и дешевле) оцифровать и разместить в базе данных, чем изображения на кинопленке. Поэтому уже с 1995 года мы снабжали описания фотодокументов в базе данных оцифрованными изображениями, и к началу 2003 года мы имели уже базу данных о составе и содержании 55000 фотодокументов и 12000 изображений к ним. Подробнее о этой программе мы говорить не будем, т.к. в 2004 г. эта база данных была конвертирована в другую (об этом ниже).

Конечно, наибольший интерес у исследователей, а также в деятельности самого архива, занимают кинодокументы. Но отсутствие технических средств и денег не давало возможности подступиться к проблеме создания электронной версии кинокаталога. Катализатором начала этой работы стало получение архивом в 1997 г. гранта от Института «Открытое общество» (фонд Сороса), после чего РГАКФД и американская компания «Абамедиа» приступили к созданию электронной версии кинокаталога. Оригинальное программное обеспечение было разработано российской компанией «Киком».

Описание кинодокументов осуществлялось для базы данных на основе описания содержания кинодокументов в монтажных листах, при этом, почти в самом начале проекта, пришлось отказаться от идеи снабжения каждой аннотации кинодокументов 3-4 «стоп-кадрами». Это обусловлено было как техническими сложностями, так и тем фактом, что такое количество «стоп-кадров» не давало полного и правильного представления о составе и содержании даже одной 10-ти минутной коробки кинопленки. «Стоп-кадрами» была снабжена только «пилотная» версия Базы данных, объединяющая кинодокументы 1937г. выпуска. На сегодняшний день описания всех хранящихся в архиве кинодокументов (это около 40000 наименований) включены в базу данных и доступны пользователям архивной информации как в читальном зале архива, так и в Интернете. Существует также неполная версия на английском языке. Конечно, это очень удобно для тех, кто ищет интересующие его кинокадры, и кому не всегда удобно для этого приезжать в архив.

Помимо поисковых возможностей, база данных позволила решить серьезную для архивистов проблему - создание вторых (страховых) копий книг учета и описания.

Но в этой базе данных заложены и серьезные недостатки, которые не всегда, к сожалению возможно исправить.

Когда был получен грант для проведение работ по созданию электронной версии кинокаталога, то, естественно, были определены сроки, в течение которых необходимо было выполнить оговоренные грантом объемы описаний кинодокументов. Естественное желание быстрее воплотить в жизнь долгожданный проект, а также желание быстрее «освоить» выделенные деньги привели к тому, что к выполнению работ по описанию съемок кинодокументов были привлечены не только архивисты, но и сторонние люди, в большинстве своем студенты. Это было ошибкой, которая привела к тому, что большое количество описаний вызывает сейчас законную критику со стороны всех, кто обращается к базе данных. Конечно, редактирование описаний проводилось как в период работ по гранту, так осуществляется и сейчас, уже в плановом порядке, но база данных велика, постоянно пополняется новыми описаниями, и работа по редактированию ранее введенных описаний займет еще немало времени и сил.

Это же желание быстрее описать весь массив хранящихся в архиве кинодокументов послужило причиной принятия, наперекор возражениям архивных специалистов, волевого решения, определяющего методику, по которой на кинодокумент составлялась обобщенная аннотация, в не зависимости от количества частей (коробок) в каждой единице учета кинодокумента. Не сразу удалось добиться отмены подобной методики, хоть и значительно ускоряющий описание кинодокументов, но приводящей к тому, исследователи, найдя необходимую информацию в базе данных, вынуждены заказывать из архивного хранилища все части (коробки) кинодокумента, или же предварительно просматривать монтажные листы с описями съемок этого кинодокумента. В любом случае - это или дополнительная работа для сотрудников архивохранилищ по подбору и доставке кинодокументов, или непроизводительная трата времени заказчика. Естественно, такие описания вызывают справедливые нарекания со стороны заказчиков, поэтому перед специалистами архива стоит теперь задача по повторному описанию этого, к сожалению, немалого массива ранее уже описанных кинодокументов.

В перспективе, необходимо будет включать в базу данных не аннотации, а текст монтажных листов целиком и снабжать эти полнотекстовые описания оцифрованными изображениями кинодокументов, но это, пока, слишком дорого для нас. Хотя, с учетом особенностей носителя, подобная перспектива вполне реальна для видеодокументов.

Опыт эксплуатации в течение уже нескольких лет электронной версии кинокаталога дает основание сделать следующие выводы о достоинствах и недостатках этой оригинальной программы, разработанной российской фирмой «Киком».

К достоинствам ее можно отнести небольшие размеры (около 12 мб программного обеспечения), «дружественный» интерфейс, простоту работы с ней как для архивистов, работающих по описанию кинодокументов, так и для пользователей архивной информации.

В то же время, эта простота осложняет работу по поиску необходимой информации в том случае, если запрос изначально не может быть конкретизирован и требуется предварительная тематическая выборка описаний. Такая возможность в базе данных есть - при описании кинодокумента в соответствующей графе делается запись (при необходимости - не одна) о тематической принадлежности киносъемок. Терминология тем разработана на основе «Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР» (М., 1978), но представляет собой значительно более сжатый, обобщенный перечень тем без индексов. Тематическая принадлежность съемок (вне зависимости от их количества) заполняется архивистом в одной графе. Разные темы разделяются точками. В эту же графу, при необходимости, заносятся ключевые слова, характеризующие понятия, не нашедших отражения в тексте аннотации. Поиск возможен как отдельно по графам «Название», «Ключевые слова», «Аннотация», так и по запросу в графе редактора поиска, объединяющей эти три графы. Это достаточно удобно и эффективно, но предполагает, в случае необходимости тематической выборки, знания формулировок тем. В читальном зале сотрудник архива может подсказать заказчику, как сформулировать необходимый тематический запрос. У пользователя архивной информации, работающего по ее поиску в Интернете, такой возможности нет. Поэтому нет ничего удивительного в том, что, как показывает практика, большинство работающих с этой базой данных не могут правильно сформулировать тематический запрос и предпочитают осуществлять простой контекстный поиск.

Архитектура базы данных не предполагает жестко организованных справочников тем, персоналий, географических названий, ключевых слов, которые можно было бы самостоятельно пополнять и редактировать. Возможность только поединичного редактирования текста описаний не является оптимальным решением проблемы - и при редактуре можно пропустить ошибки в написании фамилий, терминов и географических названий, что, в свою очередь, может сказаться на результатах поиска необходимой информации.

Эти недостатки мы постарались исключить при работе по созданию электронной версии фотокаталога.

Как уже говорилось выше, с 1991г. в архиве велась работа по созданию и ведению АИПС о составе и содержания фотодокументов, при этом параллельно продолжалось ведение традиционных карточных каталогов.

Со временем перед архивом возникла дилемма - продолжать вести базу данных фотодокументов на компьютерах класса Apple Macintoch, обновлять их парк, покупать новую версию программы, или же унифицировать в пределах архива весь компьютерный парк на основе компьютеров класса IBM, а базу данных конвертировать в новую программу.

Архив решил выбрать второй путь развития и в 2003г. при финансовой поддержке фонда Форда РГАКФД и С.-Петербургская фирма «Альт-Софт» заключили договор о разработке и внедрении новой базы данных фотодокументов. Помимо разработки программно-информационного комплекса ИКАР (на основе СУБД Oracle), «Альт-Софт» бралась осуществить конвертацию текстовых описаний и изображений каталога фотодокументов из существующей базы данных Macintosh в ИКАР, при этом должна была осуществиться привязка к тематическому рубрикатору, справочнику персоналий, другим информационно-справочным ресурсам, что и было с успехом выполнено.

Изначально, программа разрабатывалась с таким расчетом, чтобы исключить дублирующие операции в описании фотодокументов на протяжении всего пути прохождения их в архиве с момента их отбора на хранение в процессе комплектования, присвоения им учетных данных, описания в учетных книгах, каталогизации и ведения базы данных технического состояния в целях их технического контроля и сроков проведения реставрационно-профилактических мероприятий.

Программно-информационный комплекс ИКАР позволил по новому организовать работу с фотодокументами: в отделе комплектования описываются в базе данных содержания фотодокументов, место и даты их съемок, источник комплектования и авторство, на основе этих описаний программа формирует и распечатывает акты приема-передачи, протоколы Экспертно-проверочной комиссии. Далее в отделе обеспечения сохранности эти описания редактируются, им присваиваются архивные учетные номера и распечатываются (в двух экземплярах) книги учета и описания. На заключительном этапе в отделе научно-справочного аппарата описания фотодокументов пополняются данными тематического свойства (рубриками и подрубриками), а также данными для именного справочника. После этого, на принтере распечатываются каталожные карточки для систематического и именного каталогов. Параллельно, отдел технического контроля пополняет базу данными технического состояния, позволяющими контролировать порядок и сроки проведения реставрационно-профилактических мероприятий.

Такова теперь схема прохождения фотодокументов от момента приема их на государственное хранение до их размещения в архивохранилище и их описания не только в базе данных, но и в каталогах.

Наличие локальной сети позволяет все эти операции осуществлять оперативно, с возможной информативной полнотой и надлежащим качеством. Хотелось бы остановиться на некоторых характеристиках программно-информационного комплекса ИКАР в тех рамках, которые касаются компетенции отдела научно-справочного аппарата, который, как отмечалось выше, теперь только пополняет описания фотодокументов данными тематического свойства (рубриками и подрубриками), а также данными для именного справочника и распечатывает формируюмые программой каталожные карточки для систематического и именного каталогов.

Но это не значит, что у отдела стало меньше работы - она стало несколько другой. Если отпала необходимость в составлении аннотации на фотодокумент, заполнении его учетных данных, то сохранилась обязанность его индексации в соответствии со «Схемой единой классификации документной информации в систематических каталогах государственных архивов СССР» (М., 1978) и добавилась необходимость формирования в базе данных справочника персоналий. Отдел также осуществляет редактирование данных во всех справочниках базы данных.

Выше уже говорилось о методике ведения базы данных о составе и содержании кинодокументов: помимо учетных данных в этой базе данных заполняется графа «Аннотация», содержащая описание содержания киносъемок, и графа «Ключевые слова», в которой печатаются термины тематической принадлежности съемок, а также ключевые слова, дополняющие возможности контекстного поиска по тексту «Аннотации».

В базе данных ИКАР информация о содержании фотодокументов пополняется с помощью системы справочников, которые дают возможность в процессе работы выбирать необходимую информацию из ранее сформированных списков, и, при необходимости, пополнять и редактировать их.

Прежде всего, речь идет о графах «Рубрики, индексы» и «Темы», которые дают возможность на основе «Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР» осуществить тематическую принадлежность содержания фотодокументов (количество рубрик и тем не ограничено). По «умолчанию» в этих справочниках уже занесены индексы, наименование рубрик и подрубрик, поэтому при описании фотодокумента необходимо только грамотно выбрать из предлагаемого списка нужные. При распечатке каталожных карточек, эти данные будут напечатаны в виде привычных архивистам буквенно-цифровых индексов и наименованиями рубрик и подрубрик в соответствии со «Схемой единой классификации…». В настоящее время в архивной отрасли готовится новый «Единый классификатор документной информации Архивного фонда России (Отделы. Подотделы. Разделы. Подразделы)» - (ЕКДИ), в котором уже нет буквенно-цифровых индексов, а только цифровые, и который ориентирован для «эффективного поиска и использования документов АФ РФ, внедрения автоматизированных архивных технологий, информатизации архивной отрасли, формирования единого архивного информационного пространства». В случае его принятия, не составит большого труда заменить в справочнике нашей базы данных фотодокументов термины одного классификатора на новые. При этом, видимо, придется применять «Единый классификатор документной информации…» (ЕКДИ) в обобщенном (из-за его размеров - несколько сот страниц) варианте.

Но если справочник «Рубрики, индексы» четко структурирован и только изредка, при необходимости, пополняется новыми индексамы и понятиями, то справочник «Персоны» уже, на сегодняшний день, содержит около 16.000 фамилий и имен (на 90200 описаний фотодокументов). В архиве ранее существовал перечень признаков, в соответствии с которыми на те или иные персоналии составлялись или нет каталожные карточки для именных каталогов (как для кинокаталога, так и для фотокаталога). Опыт показывает, что это приводит к потере информации, т.к. не всегда есть возможность объективно оценить на данный момент историческую значимость того или иного лица. Поэтому было принято решение, в соответствии с которым все имеющиеся в распоряжении архивиста фамилии заносятся в именной справочник. При этом в справочник «Персоны» заносятся следующие данные: фамилия, имя, отчество, годы жизни, биография, псевдоним (при необходимости), страна (для иностранных граждан). Имя и отчество, желательно, писать полностью, так как существует большое количество однофамильцев - например, в РГАКФД есть описания полных однофамильцев - Героев Советского Союза!

Биографическими данными не следует «увлекаться», так как именная каталожная карточка, формируемая программой для распечатки, включает данные этой графы справочника в текст (т.е., чем больше текст биографических данных. Тем меньше остается места для иной информации на бланке каталожной карточки) - достаточно основных понятий, характеризующих статут персоны, а конкретные данные биографии на момент съемки лучше включать в текст аннотации. Но заполнять данные биографии следует в любом случае, чтобы потом в справочнике отличить «Иванова - рабочего» от «Иванова – колхозника».

Программа базы данных организована так, что, в соответствии с архивными требованиями, распечатывает именные карточки на иностранных граждан, в «шапке» которых представлено наименование государства, гражданами которого они являются.

Подобная методика описания персоналий, конечно, требует, в отличие от традиционных технологий, больших трудовых затрат, но зато значительно повышает информативные возможности базы данных.

Схожая методика пополнения, впрочем более простая, характерна для ведения и других справочников: источник поступления, авторы съемки, страна съемки, место съемки, авторы съемки. Некоторыми отличиями обладает справочник «Место съемки», в котором географические понятия структурируются по принципу от «крупного к мелкому» и где группами являются наименования областей, национальных объединений в рамках страны, а внутри групп - географические понятия в последовательности «район», «город», «село» или «деревня» (или иное).

Важным достоинством справочников в программно-информационном комплексе ИКАР является возможность их самостоятельного, вне описаний фотодокументов, просмотра и редактирования, с целью исключения ошибок, повторов и т.п. Особенно это важно в отношении справочников «Персоны» и «Место съемки». Подобная работа должна изначально планироваться и регулярно осуществляться по всему комплексу справочников.

Удобным также представляется и возможность поиска необходимой информации не только с помощью «Редактора поиска» базы данных, но и с помощью самостоятельных «Редакторов поиска» в каждом из справочников. Особенно это удобно при поиске необходимой персоны, т.к. справочник персон дает возможность просмотра списка фамилий целиком на предмет поиска подобия или отличия в написании тех или иных фамилий.

Подводя итог 15-летнего опыта эксплуатации различных баз данных, можно сделать следующие выводы: 

1) важна роль заказчика программного обеспечения в процессе разработки технического задания и в начальный период опытной эксплуатации - желателен опыт работы с базами данных, чтобы предметно обосновывать требования к программистам, программы должны быть не только надежными и быстрыми, но и функционально удобными для сотрудников, работающими с ними; 

2) необходим комплексный подход к решению проблем - программное обеспечение должно разрабатываться не только для облегчения текущей работы, но и с прицелом «на перспективу», а также должно в процессе эксплуатации иметь возможность корректироваться; 

3) информация баз данных должна регулярно редактироваться, технологичности этой работы должно уделяться при разработке технического задания программы не меньше внимания, чем технологии ввода информации. В нашем случае, представляется, что система справочников в программно-информационном комплексе ИКАР и их форма оптимальна на обозримую перспективу; 

4) с внедрением компьютерных технологий значительно повысились информационные возможности архива (в том числе, с помощью размещения в Интернете). В то же время, с учетом того, что продолжается ведение традиционных карточных каталогов, не произошло существенного снижения трудовых и материальных затрат (в нашем случае - при описании фотодокументов), или же они даже существенно повысились при описании кинодокументов. С учетом малых людских и финансовых средств архива подобная ситуация только усугубляет ситуацию с темпами обработки поступающих на хранение в архив документов. Выход из этой ситуации – отказ от практики параллельного ведения компьютерных баз данных и традиционных карточных каталогов.
 

Баталин Виктор Николаевич, начальник отдела
Российский государственный архив кинофотодокументов