NLP 경진대회
실제 일상생활에서 가능한 다양한 시나리오 multi-turn 대화를 바탕으로 생성 요약문을 만들어보는 대회대화 스타일은 구어체이고 요약문은 구어체가 아닌 문어체였다. 이 부분을 잘 다뤄야 할 것 같다. 대화 도메인은 다양하게 있었고, train 데이터는 12456개 valid 는 499, test도 499개였다. 대화는 번역체의 느낌이 많이 강했다. nlp를 처음 접해보니 어려움이 많았고 얻어가는 것도 많은 대회였다.잘 pre-train 된 모델을 사용하는거 밖에 하지 못한 아쉬움이 있다. fine-tunning을 해보고 싶었지만 아는게 없어 하지 못했다. 다음에 해보고 싶다. (주어진 train 데이터로 모델을 학습 시키는게 fine-tunning인가..?) 이번 대회에서 한거는 다양한 모델 적용해보는..
2024.05.31