NLP 경진대회 report

2024. 5. 31. 22:25부트캠프

1. Abstract

  • Goal of the Competition 일상 대화 요약, 평가지표 Rouge-1, Rouge-2, Rough-l
  • Timeline
    • May 13, 2024 - Start Date
    • May 27, 2024 - Final submission deadline
  • Description of the work
  •   data augmentation, 여러 pretrained 모델 시험, 성능개선

2. Process : Competition Model

처음 제공된 베이스라인 코드를 이용. 이후 Data augmentation 과 다양한 pretrained 모델을 실험 후 성능이 좋은 모델을 최종 모델로 선정.

3. Process : Issues

test data의 noise 확인, 성능 개선이 되도록  train데이터를 augmentation 하는 작업

모델개선 방법을 성능에 초점을 맞춰 진행,

 

4. Role

bert모델을 기반으로 한 데이터 증강방법 사용, 허깅페이스  pretrain 모델 사용

https://github.com/kyle-bong/K-TACC

5. Results

public, private 모두 8위

6. Conclusion

대회를 하면서 많이 배워가고 문제를 해결하기 위해 접근하는 방식을 배웠다. 앞으로의 대회 참여나 비슷한 프로젝트를 진행할 때 방향성을 잘 잡고 가는게 중요하다는 것을 깨달았다. 협업의 중요성도 깨닫게 되었다.

 

'부트캠프' 카테고리의 다른 글

google machine learning bootcamp - gemma sprint  (3) 2024.10.03
NLP 경진대회  (0) 2024.05.31
자체경진대회-classification  (0) 2024.04.29
CV advanced  (0) 2024.04.29
CV basic  (0) 2024.04.05