자체경진대회-regression

2024. 4. 3. 11:50부트캠프

1. Abstract

  • Goal of the Competition 아파트 정보와 버스,지하철 데이터를 이용하여 주택가격예측, 평가지표 RMSE
  • Timeline
    • March 20, 2024 - Start Date
    • April 2, 2024 - Final submission deadline
  • Description of the workEDA, feature engineering, 외부데이터 이용, 모델링, 성능개선

2. Process : Competition Model

처음 제공된 베이스라인 코드를 이용. 이후 EDA 와 feature engineering 후 성능이 개선된 버전을 팀의 베이스라인 코드로 이용.

3. Process : Issues

결측치에 대한 처리, 성능 개선에 의미가 없는 데이터를 걸러내는 작업, 외부 데이터 이용

모델개선 방법을 성능에 초점을 맞춰 진행, 큰 값의 아파트를 낮은 값으로 예측하는 것에대해 처리 진행-> Public score가 좋아짐.

이 방향이 맞다고 판단, 데이터처리와 모델링을 진행 -> Private score에서는 순위가 낮아짐. 

4. Role

결측치를 네이버 클라우드 API를 이용하여 처리, 주제와 관련된 논문 탐색 및 방법 적용, 외부 데이터 이용 베이스라인 코드 재구축, feature engineering(역세권), 모델링

5. Results

6. Conclusion

대회를 하면서 많이 배워가고 문제를 해결하기 위해 접근하는 방식을 배웠다. 앞으로의 대회 참여나 비슷한 프로젝트를 진행할 때 방향성을 잘 잡고 가는게 중요하다는 것을 깨달았다.

'부트캠프' 카테고리의 다른 글

CV advanced  (0) 2024.04.29
CV basic  (0) 2024.04.05
첫번째 그룹스터디 세미나 및 회고  (0) 2024.03.15
ML project : Home Credit - Credit Risk Model Stability  (0) 2024.02.22
ML  (0) 2024.02.02