Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Zemberek'ten gelen verilerdeki ek problemleri #1

Open
yigitkonur opened this issue Mar 4, 2017 · 1 comment
Open

Zemberek'ten gelen verilerdeki ek problemleri #1

yigitkonur opened this issue Mar 4, 2017 · 1 comment

Comments

@yigitkonur
Copy link

Merhabalar, öncelikle bu güzel proje için teşekkürler. Proje içerisinde, başta yumuşak g ile biten kelimeler olmak üzere çok sayıda: "davas, bekl, çekil, bebeğ, veril, aydı" gibi kelimeler görüyoruz. Bunlar Hürriyet'ten gelen verileri işlerken yaşanan sorunlardan mı yoksa Zemberek'in ayırım algoritmasındaki problemden mi kaynaklanıyor? Benzer bir konuda çalıştığımız için sizden bilgi rica etmek ve problem hakkında haberdar etmek istedim. Teşekkürler!

@alpcanaydin
Copy link
Owner

Merhaba, teşekkür ederim. Evet böyle bir problem var fakat aslında ne veri ne de zemberek ile direkt olarak ilgili değil. Şöyle ki zemberek verilen kelimenin stem'lerini bir liste olarak geri dönüyor. Örnek vermek gerekirse davasında kelimesi için, dava, davas, davası gibi sonuçlar oluyor ve içinden birini seçmek gerekiyor. Her bir kelime için doğru olanı aynı index'te olmadığı için tam bir çözüm bulamadım açıkcası.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants