Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Задокументировать поведение скрипта оценки или поменять его #14

Open
kmike opened this issue Mar 11, 2017 · 2 comments

Comments

@kmike
Copy link

kmike commented Mar 11, 2017

Официальный скрипт не считает за ошибку, если в "правильном" варианте какой-то пометки нет, а в предсказанном - есть. Например,

7	кто	кто	PRON	Case=Nom|Number=Sing
7	кто	кто	PRON	Case=Nom|Gender=Masc|Number=Sing

ошибкой считаться не будет. В обратную сторону это не работает - если файлы поменять местами, то такое будет засчитываться за ошибку. Это специально сделано? Если да, то это бы хорошо задокументировать. Такое поведение - вполне удобное, как мне кажется.

@AlexeySorokin
Copy link
Contributor

Да, это сделано специально, чтобы граммемы, не оцениваемые в соревновании (например, вид глагола), не влияли на качество.

@kmike
Copy link
Author

kmike commented Mar 12, 2017

@AlexeySorokin не, тут немного другое - для PRON ведь категория Gender - оцениваемая.
Более очевидный пример - если для ADJ в предсказанных данных добавить Variant=Brev, то это не будет засчитано как ошибка.

Для меня-то это удобно - ведь, например, в ГИКРЯ для слова "кто" род не указан, а в opencorpora/pymorphy2 - указан, и если текущее поведение менять, то род будет засчитываться как ошибка (хотя вроде это полезная доп. информация).

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants