데이터 전처리 필요1 다양한 데이터 전처리 기법 “데이터 분석의 8할은 데이터 전처리이다.” 전처리에 따라서 데이터 분석의 질이 달라진다. 전처리가 충분히 되어있지 않거나 잘못된 데이터를 사용한 경우에는 1. 분석 결과의 신뢰도가 떨어지고, 2. 예측 모델의 정확도도 떨어진다. 전처리가 잘 되어 있는 경우, 데이터 분석의 질이 높아지고 예측 모델의 성능을 높일 수 있다. 결측치(Missing Data) 중복된 데이터 이상치(Outlier) 정규화(Normalization) 원-핫 인코딩(One-Hot Encoding) 구간화(Binning) 결측치(Missing Data); 누락된 데이터 > 처리하는 방법은 2가지 결측치가 있는 데이터를 제거한다. 결측치를 어떤 값으로 대체한다. (데이터마다 특성을 반영하여 해결하여야 함 수치형 데이터를 보완할 방법은.. 2022. 1. 3. 이전 1 다음