본문 바로가기

fillna

[데이터분석] 데이터프레임 : 특정 열(칼럼)에 있는 데이터를 연산해서 결측치(NaN) 채우기 - fillna() 만약 아래와 같은 데이터프레임이 있다고 가정할 때, itemcountpricetotal 0coffee130003000.0 1juice5400020000.0 2ade25000NaN 3milk120002000.0 4tea34000NaN 5water210002000.0 'count' 칼럼과 'price' 칼럼에 있는 데이터의 곱이 'total' 칼럼의 데이터에 해당되는 것을 살펴볼 수 있는데요, total 칼럼에 2번째 행과 4번째 행을 보면 결측값(NaN)으로 비워져 있는 것을 볼 수 있습니다. 일일이 비어있는 데이터에 값을 넣어줘도 되지만 데이터의 양이 매우 많으면 많은 시간이 소요될 수 있습니다. 따라서 fillna() 라는 함수를 사용하면 한 번에 연산해서 결측값을 채울 수 있는데요, 만약 'total.. 더보기
[데이터분석] 데이터프레임 : 다른 열(칼럼)에 있는 값으로 결측치(NaN) 채우기 - fillna 데이터를 가지고 분석하기 전, 결측치가 있다면 이를 삭제할지 다른 값으로 대체할지 결정해야 하는데요, 같은 행 다른 열에 있는 값으로 결측치를 채우는 방법에 대해서 살펴보도록 하겠습니다. - fillna() : 결측값(NaN) 채우기 먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. itemcountprice1price2 0coffee13000.03500 1juice54000.03500 2ade25000.04500 3milk1NaN2000 4tea34000.04500 5water21000.01000 위 데이터프레임을 보면 'price1' 칼럼에서 3번째 행에 결측값(NaN)이 있는 것을 확인할 수 있는데요, fillna() 함수를 사용하여 'price2' 칼럼의 3번째 행에 있는 데이터로.. 더보기