최고의 결측치 처리 방법은 존재하지 않는다. 특정 문제에 맞게 적당한 기법을 적용하는 것이 중요하다. Python에서는 주로 numpy, pandas, 사이킷런 등의 패키지에서 여러 방법들을 지원

결측치를 삭제하는 경우는 주로 MCAR일 경우 결측치의 원인이 네트워크나 통신 오류 등으로 다른 변수와 관련성이 없기에 데이터에서 삭제해도 상대적으로 결과에 미치는 영향이 적음 결측치가 데이터셋에서 차지하는 부분이 작을 경우에만 사용해야 함
상수처리 결측치를 상수로 대체하는 방법 주로 0을 사용
평균값 대체 각 열의 mean, median, mode로 결측치를 대체
Forward Fill (전진, 시계열) NaN 데이터를 마지막에 관측된 데이터로 대체 이전 시점(t-1)의 유효한 값을 현재 시점(t)의 결측치로 사용 데이터의 패턴이 불규칙하게 바뀌는 경우나 이전 값이 현재 값에 적절하지 않은 경우에는 결과가 왜곡될 가능성
Back Fill (후진, 시계열) NaN 데이터를 다음에 관측된 데이터로 대체 미래 시점(t+1, t+2 등)의 유효한 값을 현재 시점(t)의 결측치로 사용 데이터의 패턴이 불규칙하게 바뀌는 경우나 이전 값이 현재 값에 적절하지 않은 경우에는 결과가 왜곡될 가능성
Interpolation Method (보간법, 시계열) 결측치가 발생한 위치의 앞, 뒤 데이터를 사용하여 적절한 값을 추정하는 방법 가장 쉬운 방법으로는 두 점 사이에 직선을 그어서 직선의 방정식을 만들고, 원하는 값을 계산하는 방법 - 선형 보간법

Linear Regression Imputation Techniques(회귀 대체, 시계열) 선형 회귀 모형을 사용하여 결측치를 추청해서 채워넣는 방법 오차를 고려
