Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Вопросы по соревнованию #4

Open
alesapin opened this issue Mar 2, 2017 · 3 comments
Open

Вопросы по соревнованию #4

alesapin opened this issue Mar 2, 2017 · 3 comments

Comments

@alesapin
Copy link

alesapin commented Mar 2, 2017

По описанию соревнования возникло несколько вопросов:

  1. Сколько вариантов разбора можно/нужно возвращать? Один?

  2. Правильно ли мы понимаем (согласно описанию соревнования на http://www.dialog-21.ru/media/3880/morphorueval_information_letter2.pdf), что в отсылаемых вам результатах:

    • тег PROPN разметки UD использовать не надо? (и в обучающей выборке его нет)
    • теги Н и PUNCT тоже использовать не надо (они войдут в "остальное")?
    • пассивный залог нигде не проставляется?
  3. В обучающей выборке ГИКРЯ есть ошибки ( например, "надо", "должен", "можно" размечены как прилагательные, "пора" только как существительное). В тестовой выборке будет такая же разметка, как и в обучающей? Т.е. указанные случаи размечать как они размечены сейчас?

  4. Будут ли выложены обещанные (при объявлении соревнования) конечные списки междометий и "остального"?

  5. Что такое синтаксический тип местоимения? Он был заявлен как размечаемый и оцениваемый. Также был указан (как размечаемый) класс местоимений. Что это? В обучающей выборке размечено только лицо у личных местоимений.

@AlexeySorokin
Copy link
Contributor

  1. Да, возвращаемый формат такой же, как входной
  2. Пассивного залога нет, имён собственных тоже, теги H и PUNCT использовать можно, но они всё равно не оцениваются
  3. Упомянутые примеры ошибками не являются. Предикативы ("надо", "можно", "должен") считаются прилагательными и будут так же размечаться в контрольной выборке. Некоторые неточности в обучающей выборке будут исправлены завтра.
  4. Категория "остальное" исключена из выборки.
  5. Это различие между PRON и DET (см. описание https://github.com/dialogue-evaluation/morphoRuEval-2017/blob/master/%D0%9C%D0%BE%D1%80%D1%84%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9%20%D1%81%D1%82%D0%B0%D0%BD%D0%B4%D0%B0%D1%80%D1%82%20MorphoRuEval.txt)

@kmike
Copy link

kmike commented Mar 11, 2017

@AlexeySorokin насчет "Предикативы ("надо", "можно", "должен") считаются прилагательными" - в morphostandard написано

предикативы типа “должен”, “можно” считаются наречиями.

Кому верить?

@AlexeySorokin
Copy link
Contributor

в morphostandard опечатка

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants