결측치 종류

결측치 처리 방법

최고의 결측치 처리 방법은 존재하지 않는다. 특정 문제에 맞게 적당한 기법을 적용하는 것이 중요하다. Python에서는 주로 numpy, pandas, 사이킷런 등의 패키지에서 여러 방법들을 지원

Untitled

삭제(Deletion)

결측치를 삭제하는 경우는 주로 MCAR일 경우 결측치의 원인이 네트워크나 통신 오류 등으로 다른 변수와 관련성이 없기에 데이터에서 삭제해도 상대적으로 결과에 미치는 영향이 적음 결측치가 데이터셋에서 차지하는 부분이 작을 경우에만 사용해야 함

대체(Imputation)