«Пишу тебе». Исследователю

О корпусе

«Пишу тебе» — это цифровой корпус дореволюционных, советских и современных почтовых открыток.

Почтовая открытка — это мультимодальный источник, объединяющий в себе текстовый и визуальный отпечаток своего времени. По почтовым открыткам можно изучать и визуальную, и текстовую культуру, в открытках отражается история страны, переплетенная с ее повседневностью и с личными историями отдельных семей. Почтовая открытка — один из первых объектов культуры, получивших машинное тиражирование.

«Пишу тебе» приглашает исследователей из различных областей науки использовать корпус в своих исследованиях и предоставит полный доступ к материалам нашего корпуса.

Состав корпуса

На настоящий момент в корпусе почти 33000 открыток, количество открыток увеличивается каждый день. Большинство открыток написано на русском языке, остальные — на более 30 иностранных языках. Самая ранняя почтовая открытка в корпусе была отправлена в 1881 году, самая поздняя — в 2023 году.

Корпус пополняется из общедоступных источников, семейных архивов, частных и музейных коллекций.

Как исследовать

  1. Поиск на сайте проекта «Пишу тебе»: https://pishutebe.ru/ 

Прокрутить страницу вниз до поля поиска.

Преимущества: наглядность и интуитивная понятность поиска.

Особенности: ручная обработка, времязатратно, чувствительность поиска, невозможность массовой выгрузки результата.

  1. Корпус открыток. Более детальная информация располагается в информационной базе данных почтовых открыток «Пишу тебе», размещенной в Google Таблицах. 

Преимущества: многофункциональность, полнота и структурированность корпуса, детальный и многофакторный поиск, выгрузка и анализ данных.

Особенности: необходимо ознакомиться с инструкциями и разобраться в структуре корпуса.

Детальное описание корпуса размещено ниже.

Как получить доступ

Получить доступ к корпусу можно, заполнив форму: https://forms.gle/DSe3q51P6q4y23uU9 

Отправляя запрос, Вы соглашаетесь с Пользовательским соглашением 

Успешного исследования!

Как ссылаться

При использовании материалов проекта «Пишу тебе» и результатов их обработки в публикациях обязательно указание ссылки на проект в одном из двух форматов:
1) Исследование проведено на материале проекта «Пишу тебе»:
Использованы данные Цифрового корпуса почтовых открыток «Пишу тебе». URL: https://pishutebe.ru/
2) При ссылке на конкретную открытку указывается номер открытки, например:
Открытка № 102012 // Цифровой корпус почтовых открыток «Пишу тебе». URL: https://pishutebe.ru/card/102012/

Научные исследования на основе корпуса

Здесь будет список научных публикаций, при подготовке которых использовались материалы корпуса «Пишу тебе». Если Ваше исследование выполнено на основе цифрового корпуса почтовых открыток «Пишу тебе», для включения в список сообщите нам выходные данные по электронной почте: [email protected]

  1. Голуб А.Л. Автоматизация наполнения и обеспечения качества электронной базы почтовых открыток: выпускная квалификационная работа / Голуб Анна Леонидовна; Нац. иссл. ун-т ИТМО. – СПб., 2023. – 46 с.
  2. Жаров Д.О., Хусяинов Т.М. Реконструкция социальной реальности жителей малых городов на рубеже XIX-XX веков посредством корпуса почтовых открыток «Пишу тебе» // Сборник докладов, представленных на конференцию «Маргиналии-2023» в Арзамасе (22-24 сент.). М., 2023. С. 146-148. [Электронный ресурс] URL: https://ruslang.ru/sites/default/files/2023-10/marginalii2023_tezisy_fin.pdf
  3. Пермякова П.В., Хусяинов Т.М. Почтовая коммуникация и повседневность дачников начала XX века в Куоккала (на материалах проекта «Пишу тебе») // Почтовая корреспонденция как документальный источник для краеведческих исследований : сборник методических материалов XIV научно-практического семинара по истории почты, филателии и филокартии / науч. ред. Л.Н. Бакаютова. СПб. : ЦМС им. А.С. Попова, 2023. С. 350-355.

Детальное описание корпуса

Описание состоит из трех частей:

  1. источники формирования корпуса и репрезентативность;
  2. структура корпуса и особенности фиксации данных;
  3. примеры использования корпуса в исследовательских целях.

Источники формирования корпуса

Базовая единица корпуса, с которой начинается база данных, — это почтовая открытка, представленная в базе в виде отсканированных изображений или фотографий лицевой и оборотной стороны.

Мы выделяем три основных источника открыток:

  1. Частные коллекции 
  2. Музейные коллекции (Детский музей открытки Санкт-Петербурга, Еврейский музей и центр толерантности в Москве, Саткинский краеведческий музей, Музей открыток «Домик смотрителя Высокого моста» в Калининграде)
  3. Открытые источники в Интернете. 

Наибольшее количество открыток в базе поступило из открытых источников в Интернете и музейных коллекций. 

Репрезентативность

К корпусу «Пишу тебе» не применимы критерии строгой статистической репрезентативности. Если представить, что существует модель генеральной совокупности всех открыток, выпущенных в России в XX в., то база «Пишу тебе» не претендует и не может претендовать на репрезентативное отражение этой совокупности. В то же время мы склонны считать, что подобная репрезентативная выборка едва ли возможна в принципе, так как, во-первых, нет реальных, точно установленных данных по всем когда-либо выпущенным открыткам, во-вторых, даже в теории составление выборки открыток представляется проблематичным из-за крайне большого объема потенциальной генеральной совокупности (миллионы открыток). 

В связи с этими ограничениями, мы рассматриваем наш корпус не как отражение некой предзаданной совокупности данных, а как те данные, которые нам удалось «ухватить» и состав которых мы можем корректировать в зависимости от задач исследования. В современных цифровых гуманитарных науках такой тип данных называется «капта» (capta). В отличие от более всеобъемлющей и объективной data, capta формируется под цели конкретного исследования из тех неполных данных, которые получилось добыть [1]. База «Пишу тебе» формируется отчасти по этому принципу. Мы действительно собираем то, что можем найти, но, кроме того, можем пытаться осознанно вводить корректировки в состав базы в отношении хронологического и регионального распределения открыток. Например, при поиске открыток мы особенно заостряем внимание на дореволюционном периоде, так как содержательно такие открытки в среднем более информативны (менее шаблонны и унифицированы), чем советские. Подобная фокусировка безусловно отражается на общем соотношении открыток по разным периодам.

[1] Подробнее про data и capta см. Володин А.Ю. Между data и capta: проблемы датафикации исторических исследований // Вестник Пермского университета №3 (46), 2019. С. 137-145.

Структура корпуса

Структура корпуса соответствует тем единицам информации, которые содержатся в каждой открытке и которые мы считаем необходимым зафиксировать. 

База данных фиксирует следующую информацию:

1. Отсканированное изображение или фотография лицевой стороны открытки
2. Отсканированное изображение или фотография оборотной стороны открытки
3. Текст открытки
4. Тип орфографии
5. Имя отправителя
6. Имя получателя
7. Адрес отправителя
8. Адрес получателя
9. Индекс получателя
10. Дата, написанная рукой отправителя
11. Дата со штемпеля (место отправления)
12. Дата со штемпеля (место получения)
13. Дата печати открытки
14. Описание изображения
15. Тип изображения (фотография, репродукция картины, другое)
16. Описание открытки (информация об издательстве и цене)
17. Дополнительные сведения об отправителе (титул, должность, профессиональная принадлежность, родственные связи) 
18. Дополнительные сведения о получателе (титул, должность, профессиональная принадлежность, родственные связи) 
19. Исторический период (дореволюционный, советский, современный)
20. Страна отправления
21. Страна получения
22. Населённый пункт отправления (строгая географическая фиксация)
23. Населенный пункт получения (строгая географическая фиксация)
24–30. Темы открытки (по содержанию текста, по изображению) – теги

Мы разделяем поля на два типа по характеру данных. Информация по пунктам 1–18 относится к так называемым «сырым» (исходным) данным. «Сырые» данные — это те сведения, которые непосредственно содержатся на открытке. Они заносятся в базу данных ровно в том виде, в котором их видит разметчик. Информация по пунктам 19–30 относится к типу метаданных, которые разметчик вносит, анализируя материал открытки. 

Особенности фиксации данных

Для фиксации данных мы руководствовались рядом правил, которые необходимо учитывать при работе с корпусом.

Транскрипция текста

При транскрипции текста дореволюционная орфография переводится в современную. Информация по изначальной орфографии фиксируется в графе «Тип орфографии».

Особенности авторской орфографии (орфографические ошибки, описки) сохраняются в транскрипции.

При транскрипции разметчик пользуется специальной системой знаков для обозначения сложных мест:

  1. Отсутствующий / нечитаемый текст 
    1. Который можно уверенно восстановить.
      Если часть текста не сохранилась, но ее можно с уверенностью восстановить, восстановленные буквы или слова разметчик пишет в квадратных скобках с восклицательным знаком в начале.
      Пример: в тексте видим «п..ветъ», можем восстановить до «п[!ри]вет»
    2. Который можно восстановить с сомнениями.
      Если чтение в восстановленном виде предположительное, то в квадратных скобках разметчик ставит знак вопроса в начале. Пример: в тексте видим «твой …… ..мъ Ѳедотъ», можем предположительно восстановить до «твой [? любящий] [?ку]м Федот»
    3. Можно восстановить лишь отдельные буквы в слове
      Разметчик пишет в квадратных скобках, точками обозначая неразобранное место. Пример: В тексте видим «непонятная часть словаочка», пишем […очка] 
    4. Невозможно восстановить.
      Если фрагмент текста прочитать не удается, разметчик пишет [нрзб]
  2. Форматирование (зачеркивание, подчеркивание и т.д.).
    Иногда в тексте встречается форматирование — выделение подчеркиванием или зачеркнутый текст. Форматирование кодируем с использованием тегов html
    • <s>зачёркнутый</s>,
    • <u>подчёркнутый</u>
    • <b>жирное выделение</b>
  3. Авторские вставки.
    Вписанные над строкой слова и фразы, а также другие авторские вставки и приписки вносятся в текст в {фигурных скобках}. Таким же образом оформляется текст на лицевой стороне открытки (там, где изображение)
  4. Разные варианты прочтения.
    Может возникнуть ситуация, что точный вариант прочтения не понятен и возможно несколько вариантов. Разные варианты прочтения кодируются через [*]: 
    • вариант1 [* вариант2 *вариант3]

Описание изображения

Под описанием изображения мы понимаем только ту информацию, которая прямо пропечатана издателем. Разметчик не описывает изображение самостоятельно, а пишет только то, что напечатано.

География

При заполнении точной географической информации (см. пп. 20–23 структуры) разметчик следует следующим правилам. При записи страны учитывается хронология: у дореволюционных открыток выбирается Российская империя, у советских — СССР, для период с февраля 1917 по декабрь 1922 и после 1991 — Россия. 

Если страна (регион) на момент написания открытки входила в состав более крупного политического образования, то именно это образование записывается в графе «страны». Например, для открытки 1905 года, посланной из Риги, пишется не Латвия, а Российская империя. Для посланной оттуда же в 1960 г. — СССР. 

Поля с населенными пунктами мы заполняем через разделитель »,» в формате от большей административной единицы к меньшей: республика(для советских)-губерния(область)-уезд(район)-город(деревня). Пример: Самарская губерния, Бузулукский уезд, деревня Никифоровка.

В качестве «населенного пункта» может также выступать воинская часть (указывается номер в/ч), а также транспортное средство (поезд, пароход), если открытка была послана в пути и нельзя установить точное место отправки. В последнем случае указывается транспорт и маршрут следования (например, поезд Казань-Самара).

Перевод

Некоторые открытки были написаны на иностранных языках. В таких случаях, если есть возможность (разметчик знает язык), в поле «текст» записывается транскрипция текста на иностранном языке, а в поле «перевод» — перевод на русский.

Датировка

В базе фиксируются три типа дат: 1) дата, указанная автором открытки в тексте, 2) даты с почтовых штемпелей (место отправления и место получения), 3) дата печати открытки. Наиболее часто встречающийся тип — это даты с почтовых штемпелей. Даты печати открытки дают наименее точную хронологическую привязку, но при отсутствии других дат позволяют хотя бы приблизительно датировать отправление открытки. В основном даты печати характерны для открыток советского периода.

При датировании дореволюционных открыток по почтовым штемпелям необходимо принимать во внимание разницу календарей между Российской империей и Европой. Если открытка была послана из европейской страны в Российскую империю, то дата на штемпеле отправления будет указана по Григорианскому календарю, а на штемпеле получения — Юлианскому и наоборот. 

Дополнительные сведения об адресате / отправителе

В отдельном поле фиксируются дополнительные сведения об отправителе и адресате. К таким сведениям относятся формы титулования (Его Высокоблагородие, Высокородие т.д.), родственные связи (мать, отец, сестра и т.д.) и род занятий, если есть прямое указание (гимназист, учитель и т.д.).

Область применения корпуса «Пишу тебе»

Корпус проект «Пишу тебе» может быть полезен широкому кругу исследователей. Ниже мы приводим лишь несколько возможных примеров применения корпуса. Это иллюстрации, но не исчерпывающий список тем и направлений. 

История

Тексты открыток богаты сведениями по различным аспектам истории Российской империи и СССР. Открытки можно использовать как основной источник в качественном или количественном исследовании. Корпус «Пишу тебе» также может дополнять сведения, почерпнутые из других источников. 

Можно выделить следующие сюжеты для изучения на материале корпуса.

  1. Открытки — это идеальный источник для применения методов истории повседневности и исторической антропологии.
  2. Отчетливо можно выделить вопросы, связанные с историей детства, так как множество открыток написано гимназистами (школьниками) или студентами и касается проблем образования. 
  3. Открытки из путешествий можно рассмотреть через призму истории туризма и поездок за рубеж (дореволюционного, раннесоветского периода). Особенно перспективными кажутся тексты, рассказывающие о зарубежных поездках советских граждан в 1920–1930-е годы.
  4. С путешествиями связана также более сложная тема культурной дипломатии в советское время. По этой проблеме команда «Пишу тебе» уже провела небольшое исследование, но существующий корпус позволяет дальше расширять это направление исследований.
  5. Многочисленные фронтовые открытки позволяют подробнее изучить военную повседневность. Корпус содержит открытки не только с полей Великой Отечественной войны, но и Русско-японской, Первой мировой и Гражданских войн
  6. К трагическим событиям истории, отраженным на открытках, относится также Холокост в Восточной Европе. Команда «Пишу тебе» подробно описала открытку из Варшавского гетто и можно предположить, что подобная тематика еще может встретиться в корпусе.
  7. Отправленные из самых разных мест, открытки часто позволяют по-новому взглянуть на локальную историю. Самая очевидная польза для краеведения — это исторические облики городов, запечатленные на открытках. Так, корпус уже привлек внимание краеведов из Туркменистана и Нижнего Новгорода 
  8. К менее очевидным сюжетам относится, к примеру, история межнациональных отношений. Как показывает наш корпус, открытки содержат информацию о положении разных этноконфессиональных групп в Российской империи.
  9. Некоторые открытки проливают свет на «народные» представления о политической жизни Российской империи нач. XX в. (см. открытку с карикатурой на П.Н.Милюкова)

Все перечисленные сюжеты могут быть исследованы как традиционными «качественными» методами с акцентом на отдельные специфичные случаи, так и с помощью количественного анализа, нацеленного на выявление обобщающих тенденций.

Лингвистика и филология

Тексты открыток могут стать источником для синхронических и диахронических исследований в рамках различных лингвистических и филологических методологий.