- Е. Заковоротная
- Ю. Ким
- П. Кудрявцева
- Е. Волошина
Создание цифрового издания самого знакового для русской культуры журнала.
-
сканы страниц в старой орфографии
-
сканы с распознанным текстовым слоем в старой орфографии с Google Books
-
текст со слоем нормализованной орфографии
-
создание таблицы с информацией по каждому выпуску журнала (где находится, в каком виде)
-
создание корпуса с нормализованной орфографией для 20 выпусков
-
создание корпуса с нормализованной орфографией для 100 выпусков
-
создание web оболочки корпуса
-
создание корпуса с нормализованной орфографией для всех выпусков
-
создание web оболочки корпуса
- Подготовительный:
-
сбор информации о предшествующих попытках
-
создание таблицы со ссылками на все оцифрованные выпуски
-
определение неоцифрованных выпусков
-
эксперименты с распознаванием текста и переводом орфографии
- Основной:
-
распознавание текста уже оцифрованных выпусков
-
оцифровка недостающих выпусков
-
создание корпуса с нормализованной орфографией
-
разработка web-оболочки корпуса
- Заключительный:
-
написание отчетной документации по проекту
-
защита проекта
- папка для первого тома
- для опечаток
- для отметки частотных ошибок
- таблица с номерами томов
- список тегов
- основные проблемы с распознаванием
- выдержки из ОЗ
- таблица участников проекта "ОЗ 2.0" (Ярмарка проектов)
- Презентация технического задания
- Презентация 18.12.2019
- Презентация 13.02.2020
- Презентация 15.04.2020
- Презентация 12.05.2020
- Презентация со встречи с волонтерами 24.05.2020
- Результаты 1.06.2020
https://github.com/dhhse/prereform2modern
https://github.com/kak-to-tak/Google_rusngram_spellcheck
http://www.im-creator.com/free/ml&texts/otechestvennie_i_zapiski