-
Notifications
You must be signed in to change notification settings - Fork 11
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Сложная формулировка соглашений #6
Comments
Еще лучше, если бы просто был скрипт, оценивающий качество. Сейчас, я так понимаю, все участники должны писать свои скрипты для этого, учитывая все соглашения, описанные в документе (которые, к тому же, обновляются). |
Да, скрипт, оценивающий качество, тоже был бы очень кстати, но написать его - не так трудозатратно, как разобраться в обозначениях, соглашениях и договоренностях и как-то и их присобачить к своим моделям. |
Кстати, скрипт оценки качества тоже сможет задействовать данные списки оцениваемых частей речи и атрибутов. |
Мы в ближайшее время подробно опишем правила, по которым будет тестирование. К сожалению, на данных ГИКРЯ и Синтагруса у нас не размечены PROPN, поэтому собственность существительных мы не оцениваем. Участники могут конвертировать имена собственные в PROPN либо в NOUN, оцениваться такие ответу будут равнозначно. Из morphostandard: |
Уважаемые организаторы соревнования,
сейчас соглашения по тому, какие части речи и какие атрибуты для них оцениваются сформулированы в нескольких местах и в неформальном виде, из-за этого возникает множество проблем, пара примеров:
Гораздо удобнее будет, если соглашения будут сформулированы формально, в виде списка оцениваемых частей речи и для каждой из них - оцениваемых атрибутов, причем в обозначениях gikrya_fixed.txt, на который вы предлагаете ориентироваться. Сейчас каждому участнику самому приходиться сопоставлять соглашения, описанные в разных источниках на русском языке, с размеченными данными и формализовывать их как-то так:
EVAL_POS2ATTRS = {'NOUN':['Number','Case','Gender'],'ADJ':['Number','Case','Gender','Variant','Degree']}
Будем очень признательны за решение этой проблемы.
The text was updated successfully, but these errors were encountered: