Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

multi-turn 대화 관련 질문 #19

Open
JH-lee95 opened this issue Jun 2, 2021 · 4 comments
Open

multi-turn 대화 관련 질문 #19

JH-lee95 opened this issue Jun 2, 2021 · 4 comments

Comments

@JH-lee95
Copy link

JH-lee95 commented Jun 2, 2021

안녕하세요,

올려주신 레포지토리 참고해서, 챗봇을 만들어 보고 있습니다.

사용하시지는 않았지만, 트위터 데이터셋으로 multi-turn 대화 챗봇을 만드려고 하셨던 것 같아, 저도 시도해보려고 합니다.

이 경우에, wellnessdata.csv/chatbotdata.txt 에 제가 구한 multi-turn 대화 데이터셋을 단순히 추가하기만 해도 되나요?

아니면 multi-turn의 경우 아예 다른 메커니즘으로 작동할까요?

@nawnoes
Copy link
Owner

nawnoes commented Jun 7, 2021

안녕하세요.

어떤 모델을 사용하실지에 따라 다를거 같습니다.
생성 모델의 경우 추가해서 사용하실 수 있을거 같고
분류의 경우는 다른 방법을 사용하는 것이 좋을것 같습니다

감사합니다!

@JH-lee95
Copy link
Author

JH-lee95 commented Jun 8, 2021

답변 감사합니다!

생성 모델 사용하려고 하고 있습니다.

작성하신 코드를 살펴보니

dialog += "<s>" + line_data[:-1] + "</s>"

위와 같이 s와 /s토큰으로 화자를 구별하는것 같은데, 제가 이해한게 맞나요??

@nawnoes
Copy link
Owner

nawnoes commented Jun 14, 2021

네네 저의 경우는 말씀하신 방법으로 화자를 구별하여 학습하였습니다.
다른 아이디어가 있으시다면 다르게 사용하셔도 괜찮을거 같습니다.

@JH-lee95
Copy link
Author

감사합니다 계속 시도해보겠습니다!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants