Knowledge 2 KDD(Knowledge Discovery in Database) KDD (Knowledge Discovery in Database) 아래와 같이 data로 부터 knowledge를 발견해내는 과정을 KDD(knowledge discovery in database) process라고 한다. 넓은 의미로 봤을 때 data minig이라고도 한다. Database DB안의 data는 dirty하다. dirty data : missing information(누락된 정보, 결측치)나 outlier(잘못된 정보)들이 존재하는 데이터들 이러한 문제를 해결하는 과정을 data cleaning이라 한다. Data warehouse dirty data 문제가 해결되고 공통된 형식으로 변환된 데이터들을 관리하는 데이터베이스이다. 여러 정보가 들어있기 때문에 필요한 정보만들 골라야 하는.. 2022. 4. 16. Data Mining이란? Data Mining 많은 데이터(raw data) 속에서 필요한 정보(knowledge, pattern)를 찾아내는 것을 data mining이라 한다. Extraction interesting (non-trivial), implicit, previously unknow and potentially useful) patterns or knowledge from huge amount of data. 배경 데이터가 폭발적으로 증가하고 있다. 데이터는 버려지지 않고 축적되는 경향 데이터를 자동으로 수집하는 도구의 발전 데이터베이스 시스템의 발전(데이터 저장/관리 기술의 발전) Web의 상용화 computerized society : 사회의 컴퓨터화로 인해 무언가를 하기만해도 데이터가 축적된다. 데이터는 많지.. 2022. 4. 16. 이전 1 다음