NLP 경진대회 report
2024. 5. 31. 22:25ㆍ부트캠프
1. Abstract
- Goal of the Competition 일상 대화 요약, 평가지표 Rouge-1, Rouge-2, Rough-l
- Timeline
- May 13, 2024 - Start Date
- May 27, 2024 - Final submission deadline
- Description of the work
- data augmentation, 여러 pretrained 모델 시험, 성능개선
2. Process : Competition Model
처음 제공된 베이스라인 코드를 이용. 이후 Data augmentation 과 다양한 pretrained 모델을 실험 후 성능이 좋은 모델을 최종 모델로 선정.
3. Process : Issues
test data의 noise 확인, 성능 개선이 되도록 train데이터를 augmentation 하는 작업
모델개선 방법을 성능에 초점을 맞춰 진행,
4. Role
bert모델을 기반으로 한 데이터 증강방법 사용, 허깅페이스 pretrain 모델 사용
https://github.com/kyle-bong/K-TACC
5. Results
public, private 모두 8위
6. Conclusion
대회를 하면서 많이 배워가고 문제를 해결하기 위해 접근하는 방식을 배웠다. 앞으로의 대회 참여나 비슷한 프로젝트를 진행할 때 방향성을 잘 잡고 가는게 중요하다는 것을 깨달았다. 협업의 중요성도 깨닫게 되었다.
'부트캠프' 카테고리의 다른 글
google machine learning bootcamp - gemma sprint (3) | 2024.10.03 |
---|---|
NLP 경진대회 (0) | 2024.05.31 |
자체경진대회-classification (0) | 2024.04.29 |
CV advanced (0) | 2024.04.29 |
CV basic (0) | 2024.04.05 |