NLP 경진대회 report

NLP 경진대회 report

2024. 5. 31. 22:25ㆍ부트캠프

1. Abstract

Goal of the Competition 일상 대화 요약, 평가지표 Rouge-1, Rouge-2, Rough-l
Timeline
- May 13, 2024 - Start Date
- May 27, 2024 - Final submission deadline
Description of the work
data augmentation, 여러 pretrained 모델 시험, 성능개선

처음 제공된 베이스라인 코드를 이용. 이후 Data augmentation 과 다양한 pretrained 모델을 실험 후 성능이 좋은 모델을 최종 모델로 선정.

test data의 noise 확인, 성능 개선이 되도록 train데이터를 augmentation 하는 작업

모델개선 방법을 성능에 초점을 맞춰 진행,

bert모델을 기반으로 한 데이터 증강방법 사용, 허깅페이스 pretrain 모델 사용

public, private 모두 8위

대회를 하면서 많이 배워가고 문제를 해결하기 위해 접근하는 방식을 배웠다. 앞으로의 대회 참여나 비슷한 프로젝트를 진행할 때 방향성을 잘 잡고 가는게 중요하다는 것을 깨달았다. 협업의 중요성도 깨닫게 되었다.

google machine learning bootcamp - gemma sprint (3)	2024.10.03
NLP 경진대회 (0)	2024.05.31
자체경진대회-classification (0)	2024.04.29
CV advanced (0)	2024.04.29
CV basic (0)	2024.04.05