Skip to content

Проект "Отечественные записки 2.0"

Notifications You must be signed in to change notification settings

dhhse/Otechestvennie_zapiski

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Отечественные записки 2.0

Участники

  • Е. Заковоротная
  • Ю. Ким
  • П. Кудрявцева
  • Е. Волошина

Общая идея проекта:

Создание цифрового издания самого знакового для русской культуры журнала.

Рассматриваемые типы данных и источников:

  1. сканы страниц в старой орфографии

  2. сканы с распознанным текстовым слоем в старой орфографии с Google Books

  3. текст со слоем нормализованной орфографии

Минимальный результат проекта:

  1. создание таблицы с информацией по каждому выпуску журнала (где находится, в каком виде)

  2. создание корпуса с нормализованной орфографией для 20 выпусков

Ожидаемый продукт:

  1. создание корпуса с нормализованной орфографией для 100 выпусков

  2. создание web оболочки корпуса

Максимальный результат проекта:

  1. создание корпуса с нормализованной орфографией для всех выпусков

  2. создание web оболочки корпуса

Этапы работы:

  1. Подготовительный:
  • сбор информации о предшествующих попытках

  • создание таблицы со ссылками на все оцифрованные выпуски

  • определение неоцифрованных выпусков

  • эксперименты с распознаванием текста и переводом орфографии

  1. Основной:
  • распознавание текста уже оцифрованных выпусков

  • оцифровка недостающих выпусков

  • создание корпуса с нормализованной орфографией

  • разработка web-оболочки корпуса

  1. Заключительный:
  • написание отчетной документации по проекту

  • защита проекта

Наши Гугл-доки

Презентации

Скрипт для автоматической конвертации старой орфографии в современную норму

https://github.com/dhhse/prereform2modern

Спеллчекер

https://github.com/kak-to-tak/Google_rusngram_spellcheck

Макет сайта

http://www.im-creator.com/free/ml&texts/otechestvennie_i_zapiski

About

Проект "Отечественные записки 2.0"

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published