15.04.2013

Объединенная база данных "Мемориал" с момента своего появления стала для поисковиков альфой и омегой. То, что раньше приходилось неимоверными усилиями добывать из Центрального архива Минобороны РФ (ЦАМО) и других архивов, стало общедоступным. Оригинальные донесения о потерях, карточки военнопленных, документы госпиталей и пр. вскрыли колоссальный пласт информации о погибших. А что означает эта работа для их родственников вообще трудно передать словами. "Мемориал" открыл поистине огромные возможности для поиска сведений порой не просто о месте гибели человека, но и о его пути на войне. Помогает в этом и параллельный проект "Подвиг народа", где выкладываются наградные листы с описанием подвига. Разработчик ОБД Виктор Тумаркин рассказал нам о возможностях базы данных, дезинформации в документах, а также о том, может ли содержимое архивов поставить, наконец, точку в спорах о количестве потерь Красной армии в Великой Отечественной войне.

Виктор Тумаркин. Фото Катерины Порохняк- Виктор Иосифович, какой была первопричина появления ОБД "Мемориал", чистое человеколюбие Минобороны России, желание открыть доступ к архивам?

- Было соответствующее распоряжение, а потом и указ президента. Но идея создания банка данных выросла из локальной задачи по автоматизации учета паспортов захоронений. А потом это переросло в иное качество - учесть вместе с ними весь массив документов, хранящихся в наших архивах. Первая же попытка совместить паспорта захоронений с документами о потерях, сделанная нами, убедила в эффективности такого метода. В ЦАМО нашли донесение: апрель 1945 года, наступление на какой-то немецкий город, 34 человека в донесении числятся убитыми и похороненными, а 28 пропали без вести. А в паспорте захоронения, по порядку, с немножко измененными фамилиями, были обозначены все. Просто одна воинская часть солдат потеряла, другая нашла и похоронила. На одном простом примере стал виден эффект создания системы. Где-то 15 сентября 2006 года генералу Владимиру Исакову, который возглавлял тыл, показали работу, и он оценил необходимость создания этого ресурса. А к концу года было уже 1,5 млн. записей. Их мы сделали за счет взносов коммерческих организаций, и если бы не было этих полутора миллионов, не было бы и остального ОБД. В 2007 году пошло государственное финансирование и нам была поставлена задача загрузить уже 20 млн. записей. Это было ужасно, но деваться некуда, справились.

- Как это у вас получилось, за счет автоматизации процесса?

- Технология основывалась на том, что все документы сканируются, а потом по их образу вся информация вводится руками, никакого автоматического распознавания. Для этого были образованы два стационарных цеха, где установлены высокопрофессиональные сканеры, в том числе бесконтактные. Кое-что сканировали непосредственно в архивах. Дополнительно работают пять цехов по ретроконверсии в разных городах, плюс пять тысяч "надомников". Это люди, которые через интернет получают кусочки изображений с той информацией, которую им надо ввести. Один и тот же документ обрабатывает несколько операторов, чтобы заполнить все поля, которые необходимо. Обязательная проверка и двойной ввод: если совпадает - идет дальше, если нет - третий смотрит, кто из двух операторов ошибся. Плюс отдельные стадии проверки, плюс обязательная проверка в технологическом департаменте. Тем не менее, иногда ошибки возникают. Иногда хватаешься за голову: как при такой степени контроля вы могли внести вот такое?! Говорят: ну как, операторы ввели по-разному, а тот, кто проверял - нажал не на ту кнопку. Но есть и объективные вещи, безобразные почерки, которые можно разобрать совершенно по-разному. При таких объемах отсутствие ошибок невозможно.

- Можно ли сказать, сколько процентов документов уже обработано в российских архивах? И можно ли сегодня уже говорить о каком-то общем результате?

- В процентах, наверное, никто не сможет сказать. По ЦАМО, допустим, фонды по безвозвратным потерям обработаны полностью, это немножко более 250 тысяч донесений. Но еще часть, процентов 15 разбросано по разным фондам, и их надо каким-то образом находить. Кроме того, архивов много. Есть еще ведомственные архивы, например, архив НКВД, это свои трудности. Скажем, пограничников нам отдали только частично. Немецкие "Саксонские мемориалы" получили информацию из архивов КГБ Украины и Беларуси, но нам не отдают. Документы о военнопленных у нас в базе - это часть, что-то держит у себя ФСБ.
Но в целом на сегодня в ОБД доступно 14,5 миллионов образов документов и около 31 миллиона записей из 38 тысяч архивных дел и картотек. И 42 тысячи паспортов воинских захоронений. Это не считая Книг Памяти. И то, что они совместились в одном массиве, дает потрясающий эффект. Ведь главная задача - предоставление людям возможности осуществлять самостоятельный поиск информации о своих родных, проводить свой собственный анализ. Работники архива не занимаются исследованиями. Они по своей картотеке проверяют, есть ли по данным, которые им присылают, информация или она отсутствует. У них гора этих писем. Сейчас люди находят своих родственников с искажениями фамилий, и понимают, почему им ответили, что данных нет. Вот на днях получили письмо: 60 лет искали, не могли найти, а на вашем сайте за 20 минут нашли. Но на самом деле для достижения такого эффекта понадобилась очень большая организационная и техническая работа.

- А реально ли с помощью банка данных поставить финальную точку и прекратить споры о количестве потерь Красной армии в войне?

- Безусловно, анализ банка данных в этом сможет помочь. Поставить финальную точку - не думаю. По той простой причине, что по 1941 году донесений о потерях очень мало, всего 40 томов. В то время как на 1942 или 1943 год томов больше тысячи. Есть много повторов в разных документах, притом встречаются такие, что непонятно, речь об одном человеке или о разных. Я должен поспорить с Игорем Ивлевым (историком, автором ресурса Солдат.ru – ред.), который говорит, что у нас 10% повторов. Их больше. Где-то на человека одна запись, где-то три, на генерала Карбышева, к примеру, четыре.
В массиве донесений ВМФ порядка 450 тысяч записей, хотя имеется картотека, в которой порядка 150 тысяч записей. И в Военно-морском флоте на самом деле учет был очень хороший. Но на самом деле, для разных массивов этот показатель разный. И повторения мы допускаем сознательно, это необходимо потому, что в одном документе может быть информация, которая отсутствует в другом. Можно установить судьбы отдельных, конкретных людей. Ради этого стоит делать повторы.
В некоторых документах есть существенная дезинформация. Скажем, послевоенные результаты подворовых опросов. Мы обязаны в качестве даты выбытия обозначать ту дату, которую обозначил военком. А как он это делал? Насколько я понимаю, добавлялось примерно месяца три к дате последнего известия. И это обозначалось как дата пропажи. А если человек жил на оккупированной территории, эти три месяца добавлялись к дате ее освобождения. Вот и получается, что последнее известие о человеке в 1941 году, а военком пишет: "Считать пропавшим без вести в марте 1944 года". Бывает так, что появляются записи на живых, причем, иногда их имена есть даже в паспорте захоронения.

- Одно время были закрыты записи на дезертиров, осужденных, предателей и прочих, сейчас они доступны? И почему закрывались?

- Был момент, что у какого-то губернатора родственник был осужден, у кого-то еще подобные моменты вскрылись, и встал вопрос, а можно ли такие вещи публиковать? Надо, мол, это закрыть. У нас не было возможности закрывать по одной записи, и мы вынуждены были закрывать листами. В результате оказались "закрытыми" другие люди, оказавшиеся на том же листе. Поднялся большой шум, писали президенту, премьер-министру, и т.д. В результате правовое управление Минобороны сочло, что публиковать все это можно, и мы снова их открыли. Сейчас записи все доступны, но мы модифицировали поля "Причины выбытия" на "иные". Сюда же относятся самоубийства, но иногда, к сожалению, по ошибке попадают и боевые причины.

- Я встречал такие экзотические причины смерти, как "напились технического спирта".

- Вы знаете, это не экзотические причины. К сожалению, они достаточно распространенные, вплоть до того, что немцы сознательно оставляли цистерны с метиловым спиртом при отступлении. Конечно, страшно читать, что целый взвод погиб от отравления, но такое случалось. И они были не только среди наших военнослужащих. Я видел страшный документ из ГАРФа (Государственный архив РФ. – ред.), когда в лагере перемещенных лиц, после освобождения, в английской зоне оккупации, тоже где-то раздобыли спирт и большое количество людей умерло.

- Чего не хватает в ОБД? И как быть с теми документами, которые находятся в Украине? Ведь фактически, все документы военного периода – один массив и относятся к одной армии. Но страны у нас теперь разные и ОБД - российский проект.

- Проект-то российский, но затрагивает страны всего бывшего СССР. И понимая это, мы даже делали выборки по месту призыва и передавали руководству всех стран. По Украине получилось 2 млн. 600 тысяч записей и это то, что можно отнести к героическим потерям. А не хватает многого. В первую очередь, паспортов захоронений, документов военкоматов, прежде всего, похоронок. Третье - документы о военнопленных. Они не централизованного хранения, находятся в самых разных архивах по всему миру. Пытаемся добывать. Нет у нас Книг Памяти, мы с удовольствием их возьмем у вашего проекта, если дадите. И я полагаю, безотносительно к тем базам, которые создаются в республиках, было бы полезным сконцентрировать в ОБД все данные как в неком едином месте. Если бы Украина могла заняться выявлением документов в своих архивах, дальше можно действовать по-разному. Где массивы большие, мы можем со своими сканерами приезжать и сканировать, если будут соответствующие договоренности.

- Чтобы пополнять единую базу нужно волевое решение на высшем уровне, провести ревизию и приступить к обработке?

- Конечно, только желание двух сторон. Мы исполнители, мы не решаем, что загружать, что нет. Мы можем только предложить. Но нам уже известно какой огромный эффект это принесло и продолжает приносить.

Дмитрий Заборин,

координатор проекта "Электронная Книга Памяти Украины" для "The Kiev Times"