Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[week 8] 왜 이번 기법도 semantic에서는 성능이 떨어질까요? #29

Open
kimcando opened this issue May 5, 2022 · 1 comment

Comments

@kimcando
Copy link
Owner

kimcando commented May 5, 2022

본 논문이 제안한 방법은 형태소 단위로 단어를 쪼개고 각각의 embeding을 더했기 때문에 syntactic 테스크에서는 성능이 좋은게 자연스럽습니다.
직관적으로 생각하기에 semantic에서도 성능이 더 좋을것 같았는데 왜 안좋은걸까요?

@kimcando kimcando changed the title 왜 이번 기법도 semantic에서는 성능이 떨어질까요? [week8] 왜 이번 기법도 semantic에서는 성능이 떨어질까요? May 5, 2022
@kimcando kimcando changed the title [week8] 왜 이번 기법도 semantic에서는 성능이 떨어질까요? [week 8] 왜 이번 기법도 semantic에서는 성능이 떨어질까요? May 5, 2022
@eunkey
Copy link
Collaborator

eunkey commented May 5, 2022

오늘 설명에서 말씀드린 점을 요약해드리면

  1. 라는 단어를 tri-gram으로 학습시킨 경우 her라는 부분이 학습되기는 한다.
  2. 빈번하게 등장하지는 않으므로 단어에 큰 영향을 주지는 못함.
  3. 그러나 어쨌든 영향은 존재하기 때문에 semantic 즉, 의미적 영역에서는 성능의 저하가 이루어지는 것
  4. 그에 반해 구문론적 혹은 형태론적에서는 의미가 크게 중요하지 않기 때문에 subword의 강점이 잘 나타나는 것

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants