Data Description
데이터를 잘 이해하기 위해서 데이터가 어떻게 생겼는지 알아야 한다.
Data Statistical Description
데이터의 분포를 수치적(통계적)으로 확인한다.
- 어디를 중심으로 : centeral tendency(중심점)
- mean : 평균값
- median : 중간값(중간에 위치하는 데이터의 value)
- mode : 가장 많이 발생하는 값
- 어떻게 퍼져있는가 : diespersion(분포)
- max, min : 최대/최소
- quartiles : 데이터를 정렬해서 4구역으로 나눴을 때의 값들($Q_0, Q_1, Q_2, Q_3, Q_4$)
- outliers : 특이한 행동을 보이는 값
- variance : 분산
'Computer Science > Data Science' 카테고리의 다른 글
[Data Description] Measuring Dispersion (0) | 2022.06.03 |
---|---|
[Data Description] Measuring Central Tendency (0) | 2022.06.03 |
Attributes (0) | 2022.06.03 |
Data Set, Data Object, Attributes (0) | 2022.06.02 |
[Classification] Ensemble - 정확도를 높이기 위한 방법 (0) | 2022.04.18 |
댓글