자체경진대회-regression
2024. 4. 3. 11:50ㆍ부트캠프
1. Abstract
- Goal of the Competition 아파트 정보와 버스,지하철 데이터를 이용하여 주택가격예측, 평가지표 RMSE
- Timeline
- March 20, 2024 - Start Date
- April 2, 2024 - Final submission deadline
- Description of the workEDA, feature engineering, 외부데이터 이용, 모델링, 성능개선
2. Process : Competition Model
처음 제공된 베이스라인 코드를 이용. 이후 EDA 와 feature engineering 후 성능이 개선된 버전을 팀의 베이스라인 코드로 이용.
3. Process : Issues
결측치에 대한 처리, 성능 개선에 의미가 없는 데이터를 걸러내는 작업, 외부 데이터 이용
모델개선 방법을 성능에 초점을 맞춰 진행, 큰 값의 아파트를 낮은 값으로 예측하는 것에대해 처리 진행-> Public score가 좋아짐.
이 방향이 맞다고 판단, 데이터처리와 모델링을 진행 -> Private score에서는 순위가 낮아짐.
4. Role
결측치를 네이버 클라우드 API를 이용하여 처리, 주제와 관련된 논문 탐색 및 방법 적용, 외부 데이터 이용 베이스라인 코드 재구축, feature engineering(역세권), 모델링
5. Results
6. Conclusion
대회를 하면서 많이 배워가고 문제를 해결하기 위해 접근하는 방식을 배웠다. 앞으로의 대회 참여나 비슷한 프로젝트를 진행할 때 방향성을 잘 잡고 가는게 중요하다는 것을 깨달았다.
'부트캠프' 카테고리의 다른 글
CV advanced (0) | 2024.04.29 |
---|---|
CV basic (0) | 2024.04.05 |
첫번째 그룹스터디 세미나 및 회고 (0) | 2024.03.15 |
ML project : Home Credit - Credit Risk Model Stability (0) | 2024.02.22 |
ML (0) | 2024.02.02 |