-
Notifications
You must be signed in to change notification settings - Fork 0
IceForm plan
Anastasiya Kostyanitsyna edited this page Jan 18, 2020
·
8 revisions
- Встретились с куратором
- Организовали регулярные встречи
- Получили первоначальные данные, с которыми работаем
- Прочитали литературу о формульных конструкциях
- Конструкции закрытого класса:
- Создали список ngram
- Разбили на предполагаемые формулы
- Разметили данные
- Создали приблизительные переводы
- Выделили "реальные" формулы
- Начали переводить на разные языки:
- Apertium: английский, шведский
- Yandex: английский, шведский
- Google: английский
- Конструкции закрытого класса (Настя):
- Глоссирование +
- Перевод +
- Контекстный анализ:
- tf-idf
- topic modeling +
- Применение коллокационного метода
- Повторение пунктов 1-3
- Сравнение результатов
- Допереводим тексты:
- Yandex: немецкий (возможно, еще другие)
- Google: шведский, немецкий (возможно, еще другие)
- Парсим переводы с помощью существующих UDPipe-моделей
- Выравниваем пословно с помощью fast-align или более сложных инструментовна
- Думаем над метрикой выравнивания деревьев разбора
- Compound splitter
- Начата разработка над алгоритмом по сортировки списока ngram