본문 바로가기
Kaggle and DACON

[DACON] Hecto AI Challenge : 2025 상반기 헥토 채용 AI 경진대회 #1 대회 규칙과 데이터 셋

by _taeddy 2025. 5. 27.
반응형

대회규칙

  1. 평가산식 (손실함수): Log Loss
  2. 외부 데이터 사용금지
    - 본 경진대회에서 제공한 데이터 외의 모든 외부 데이터는 사용이 금지.
    - 단, 제공된 학습 데이터를 바탕으로 사전 학습 모델 또는 허용된 도구를 활용해 데이터 증강 또는 생성하는 것은 가능.

데이터 셋 살피기

훈련 데이터 셋

훈련 데이터 셋은 396개로 분류된 차종, 총 33,113장의 자동차 이미지로 이루어져 있다.

1. 자동차 외관

데이터 셋의 대부분은 자동차의 전체 외관을 담은 이미지로 이루어져 있다.
자동차의 후면, 정면 등 특정 각도가 아니라 다양한 각도에서 찍힌 이미지가 있다.
후면 정면 정측면 후측면

2. 자동차 내부

아래와 같은 자동차 시트, 기능 버튼 외에도 운전석 사진, 차 내부 천장 등의 데이터도 포함되어 있다.
   

3. 그 외

- 자동차의 하부모습
- 정비소에서 리프트에 올려진 모습
- 전면 하부만 찍혔거나 너무 가까이에서 찍혀서 자동차를 식별하기 어려운 이미지
- 트렁크가 열린 상태
- 자동차가 찍히지 않은 사진
- 배경에 다른 차종이 존재하여 분류에 방해되는 요소 등
     

테스트 데이터 셋

차종이 섞인 8,258개의 이미지로 이루어져 있다.
모델을 최종평가 할 때는 추가 데이터 셋이 제공된다.

훈련 데이터 셋의 이미지들과 크게 다르지 않다.
그러나 다음과 같은 추가적인 특징을 가진 이미지가 식별된다.
차량의 상부 타이어 회사로고, 전후면이 모두 보이지 않는
측면
반응형