반응형

대회규칙
- 평가산식 (손실함수): Log Loss
- 외부 데이터 사용금지
- 본 경진대회에서 제공한 데이터 외의 모든 외부 데이터는 사용이 금지.
- 단, 제공된 학습 데이터를 바탕으로 사전 학습 모델 또는 허용된 도구를 활용해 데이터 증강 또는 생성하는 것은 가능.
데이터 셋 살피기
훈련 데이터 셋
훈련 데이터 셋은 396개로 분류된 차종, 총 33,113장의 자동차 이미지로 이루어져 있다.
1. 자동차 외관
데이터 셋의 대부분은 자동차의 전체 외관을 담은 이미지로 이루어져 있다.
자동차의 후면, 정면 등 특정 각도가 아니라 다양한 각도에서 찍힌 이미지가 있다.
| 후면 | 정면 | 정측면 | 후측면 |
|---|---|---|---|
![]() |
![]() |
![]() |
![]() |
2. 자동차 내부
아래와 같은 자동차 시트, 기능 버튼 외에도 운전석 사진, 차 내부 천장 등의 데이터도 포함되어 있다.
![]() |
![]() |
3. 그 외
- 자동차의 하부모습
- 정비소에서 리프트에 올려진 모습
- 전면 하부만 찍혔거나 너무 가까이에서 찍혀서 자동차를 식별하기 어려운 이미지
- 트렁크가 열린 상태
- 자동차가 찍히지 않은 사진
- 배경에 다른 차종이 존재하여 분류에 방해되는 요소 등
![]() |
![]() |
![]() |
테스트 데이터 셋
차종이 섞인 8,258개의 이미지로 이루어져 있다.
모델을 최종평가 할 때는 추가 데이터 셋이 제공된다.
훈련 데이터 셋의 이미지들과 크게 다르지 않다.
그러나 다음과 같은 추가적인 특징을 가진 이미지가 식별된다.
| 차량의 상부 | 타이어 | 회사로고, 전후면이 모두 보이지 않는 측면 |
![]() |
![]() |
![]() |
반응형
'Kaggle and DACON' 카테고리의 다른 글
| [DACON] Hecto AI Challenge : 2025 상반기 헥토 채용 AI 경진대회 #2 데이터 정제 (1) | 2025.06.09 |
|---|---|
| [Kaggle] 타이타닉 생존자 수 기초분석 (0) | 2025.05.20 |











