본문 바로가기

카테고리 338

Classifier Accuracy Measure Accuracy Measure Accuracy의 기준은 대표적으로 4가지가 있다. 이 중 암 진단에서는 sensitivity와 precision을 중요하게 생각한다. sensitivity = t-pos / pos positive하다고 판단된 것 중 진짜 positive한 비율 specificity = t-neg / neg negative하다고 판단된 것 중 진짜 negative한 비율 precision = t-pos / (t-pos + f-pos) 진짜 positive 한 것 중 postivie하다고 판단된 비율 accuracy = (t-pos + t-neg) / (pos + neg) 전체 데이터 중 제대로 판단된 비율 = sensitivity * pos/(pos+neg) + specificity * n.. 2022. 4. 18.
[Prediction] Regression Prediction Numerical value(real-value)를 예측하는 방법이다. 대표적인 방법으로 regression이 있다. vs. Classification 공통점 Model construction → model usage의 단계를 가진다는 것에서 classification과 유사하다. 차이점 Classification categorical class label을 예측한다. Prediction numerical value를 예측한다. continuous-valued function을 이용해서 continuous space에서의 value(real-value)를 예측한다. Regression Predictor variable을 가지고 response variable을 예측한다. 이를 위해 하.. 2022. 4. 18.
[Classification] K-NN(K-Nearest Neighbor) Algorithm K-NN Algorithm = K-Nearest Neighbor Algorithm Lazy learning 방법이다. n-dimension space에서 거리를 기반으로 K개의 이웃을 보고 classification 하는 방법이다. K개의 이웃한 sample들의 label 중 majority voting을 통해 class를 결정한다. Distance를 기반으로 하기 때문에 distance function이 잘 정해져있어야 한다. 실제 결과에 영향이 적은 attribute를 제거한 dimension을 구성하는 것이 중요하다. 단순히 거리만 기반으로 비교하면 fair하지 않기 때문에 거리의 역수를 weight으로 해서 weighted voting을 할 수도 있다. → 거리의 역수의 합을 통해 비교 2022. 4. 18.
Eager Learning vs. Lazy Learning Eager Learning vs. Lazy Learning Training 하는 방식에 따라서 lazy learning과 eager learning으로 나눌 수 있다. Eager Learning test sample이 들어오기 전에 미리 classification rule(model)을 만들어 놓는다. 예 : decision tree 등 Lazy Learning test sample이 들어올 때까지 training data를 저장만 하거나 간단한 preprocessing만 한다. instance-based learning 새로운 instance가 들어오면 learning을 한다. 새로운 instance가 들어올 때 까지 processing을 delay한다. 예 : KNN algorithm 비교 time .. 2022. 4. 18.
[Classification] Associative Classification Associative Classficiation Rule-based classification의 일종이다. Rule을 찾아내는 방법을 association rule mining(apriori, FP-growth 등)으로 수행한다. Association rule을 생성하고 classification을 위해서 association rule을 사용한다. 아래와 같이 precondition들의 conjunction으로 표현한다. $p_1 \cap p_2 \cap ... \cap p_i \rightarrow A_{class} = C (conf, sup)$ Confidence, Support Minimum confidence와 minimum support 이상인 것들에 대해서 classification이 수행된다... 2022. 4. 18.