Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bundles of markups in parallel corpora #1152

Open
vmonakhov opened this issue Nov 24, 2024 · 1 comment
Open

Bundles of markups in parallel corpora #1152

vmonakhov opened this issue Nov 24, 2024 · 1 comment

Comments

@vmonakhov
Copy link

Will be translated later.

Параллельные корпуса представляют собой единую таблицу, каждая строка которой содержит в себе предложение или некоторую часть оригинального текста и соответствующий ему перевод, разнесённые по разным столбцам.

2024-11-24_19-52-19

Необходимо реализовать механизм, с помощью которого можно связать фрагментарные части или отдельные слова оригинального текста с соответствующими словами/словосочетаниями/токенами текста переводного, указав при этом характер связи: транслит/буквальный перевод и пр.
По возможности реализовать альтернативность таких связей. Другими словами, один и тот же исходный текст может иметь несколько разных соответствий в переводном тексте. Сохранять имя пользователя, создавшего ту или иную связь токенов.
Реализовать сохранение в файл формата Эксель (xlsx) полученных пар токенов с возможностью фильтрации по типу связи (см.выше)

@vmonakhov
Copy link
Author

Technical specifications:

Для построения связей в таблице создаются метки выделением текста с помощью мыши и нажатием кнопки справа в ячейке таблицы. После создания меток такие последовательности слов будут выделены цветным маркером (см. жёлтый маркер на картинке выше) и останутся в неизменном виде до удаления метки пользователем либо редактирования/разделения/удале­ния текста, содержащего эту метку. Удаление меток будет происходить при нажатии на кноп­ку удаления метки справа в ячейке таблицы, удалении или разделении участка текста (по Сtrl-Enter), включающего метку. Если метка участвует в связях, перед её удалением будет запрашиваться подтверждение на удаление связей с её участием.
Одной связью мы ставим в соответствие одну метку из входного текста одной метке из пере­водного. Какая-либо метка может иметь разные соответствия в переводном тексте, сделанные разными пользователями. Нужно сохранять имя пользователя, создавшего ту или иную связь токенов. Создание и удаление связей будет происходить в отдельном окне программы, кото­рое открывается по нажатию кнопки над таблицей параллельных корпусов.
Необходим инструмент сохранения в файл формата Эксель (xlsx) полученных пар токенов (слов/словосочетаний) с возможностью сортировки/фильтрации по типу связи и пользовате­лю, создавшему связь.

vmonakhov added a commit to ispras/lingvodoc that referenced this issue Dec 22, 2024
* Init

* now tsakorpus requires administrator for force mode only

* mutations

* model

* model

* next changes

* alembic migration

* fixes

* daily work

* fixes

* next fixes

* next work

* fixes

* next work

* fixes

* daily work

* next work

* next work

* fixes

* minor

* fixed dnd metadata

* refetching only changed lexical entries

* cleanup

* important fix

* breakdown with markups

* save xlsx

* using real dictionary name

* fix
vmonakhov added a commit that referenced this issue Dec 22, 2024
* add modal Join markups

* part table 2

* part table 1

* add sticky and radio buttons (part)

* kalmyk markup: part

* kalmyk markups: part

* kalmyk markup: part selected relations

* kalmyl markup: buttons m and g

* Init

* queries

* mutations

* model

* fixes

* fixes

* selection

* event listener optimization

* reset markup action

* minor

* highlights

* daily work

* fixes

* merging

* kalmyk marups: fix modal

* kalmyk markup: fix texts

* fixes

* next fixes

* kalmyk markup: fix styles and text

* kalmyk markups: fix translations

* next work

* fixes

* next work

* fixes

* daily work

* next work

* next work

* fixes

* onCleverClose

* minor

* improved JoinMarkupModal

* fixes and beauty

* minor

* fixed dnd metadata

* refetching only changed lexical entries

* cleanup

* kalmyk markups: styles for markers

* kalmyk markups: fix markers

* kalmyk markup: fix markers

* cleanup

* important fix

* breakdown with markups

* kalmyk markup: delete unnecessary

* kalmyk markup: fix styles

* kalmyk markup: add getTranslation

* edit with markups

* kalmyk markup: fix modal

* kalmyk markup: fixes modal

* kalmyk markup: add translation

* kalmyk markup: fix styles

* kalmyk markup: fixes

* beauty

* save xlsx

* using real dictionary name

* using select

* fix

---------

Co-authored-by: nataliauvarova <[email protected]>
Co-authored-by: nataliauvarova <[email protected]>
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant