Skip to content

IceForm plan

Anastasiya Kostyanitsyna edited this page Jan 18, 2020 · 8 revisions

Work progress

Уже сделано на 2 декабря

  • Встретились с куратором
  • Организовали регулярные встречи
  • Получили первоначальные данные, с которыми работаем
  • Прочитали литературу о формульных конструкциях
  • Конструкции закрытого класса:
    • Создали список ngram
    • Разбили на предполагаемые формулы
    • Разметили данные
    • Создали приблизительные переводы
    • Выделили "реальные" формулы
  • Начали переводить на разные языки:
    • Apertium: английский, шведский
    • Yandex: английский, шведский
    • Google: английский

Сделано на 16 декабря

Делаем к следующему отчету

  • Конструкции закрытого класса (Настя):
    • Глоссирование +
    • Перевод +
    • Контекстный анализ:
      • tf-idf
      • topic modeling +
    • Применение коллокационного метода
    • Повторение пунктов 1-3
    • Сравнение результатов
  • Допереводим тексты:
    • Yandex: немецкий (возможно, еще другие)
    • Google: шведский, немецкий (возможно, еще другие)
  • Парсим переводы с помощью существующих UDPipe-моделей
  • Выравниваем пословно с помощью fast-align или более сложных инструментовна
  • Думаем над метрикой выравнивания деревьев разбора

Сделано на 20 января

  • Compound splitter
  • Начата разработка над алгоритмом по сортировки списока ngram

Дальнейшие вехи (крупно)