Data Description

데이터를 잘 이해하기 위해서 데이터가 어떻게 생겼는지 알아야 한다.

데이터의 분포를 수치적(통계적)으로 확인한다.

어디를 중심으로 : centeral tendency(중심점)
- mean : 평균값
- median : 중간값(중간에 위치하는 데이터의 value)
- mode : 가장 많이 발생하는 값
어떻게 퍼져있는가 : diespersion(분포)
- max, min : 최대/최소
- quartiles : 데이터를 정렬해서 4구역으로 나눴을 때의 값들($Q_0, Q_1, Q_2, Q_3, Q_4$)
- outliers : 특이한 행동을 보이는 값
- variance : 분산

[Data Description] Measuring Dispersion (0)	2022.06.03
[Data Description] Measuring Central Tendency (0)	2022.06.03
Attributes (0)	2022.06.03
Data Set, Data Object, Attributes (0)	2022.06.02
[Classification] Ensemble - 정확도를 높이기 위한 방법 (0)	2022.04.18