본문 바로가기
Computer Science/Data Science

Data Description - 데이터 이해하기

by Gofo 2022. 6. 3.

Data Description

데이터를 잘 이해하기 위해서 데이터가 어떻게 생겼는지 알아야 한다.

 

Data Statistical Description

데이터의 분포를 수치적(통계적)으로 확인한다.

  • 어디를 중심으로 : centeral tendency(중심점)
    • mean : 평균값
    • median : 중간값(중간에 위치하는 데이터의 value)
    • mode : 가장 많이 발생하는 값
  • 어떻게 퍼져있는가 : diespersion(분포)
    • max, min : 최대/최소
    • quartiles : 데이터를 정렬해서 4구역으로 나눴을 때의 값들($Q_0, Q_1, Q_2, Q_3, Q_4$)
    • outliers : 특이한 행동을 보이는 값
    • variance : 분산

 

댓글