데이터프레임에서 한 칼럼에 특정한 데이터가 있는지 확인할 수 있는데요,
먼저 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다.
item count price rating
0 coffee 1 3000 4.5
1 juice 5 4000 3.0
2 ade 2 5000 4.0
3 milk 1 3000 2.5
4 tea 3 4000 3.0
5 water 2 1000 4.5
위 데이터프레임은 데이터의 양이 많지 않아서 한눈에 다 들어오지만 모른다 가정할 때,
'item' 칼럼에 'milk' 라는 데이터가 있는지 확인하는 코드는 다음과 같습니다.
df['item'] == 'milk'
df['칼럼명'] == '찾을 데이터' 와 같이 입력하면 아래와 같이 출력되는데요, 해당하는 값이 있으면 True, 없으면 False를 반환합니다.
0 False
1 False
2 False
3 True
4 False
5 False
Name: item, dtype: bool
한편, 데이터가 너무 많다면 일일이 True가 어디에 있는지 확인해야 하는데요, 아래 코드처럼 sum() 함수를 이용하여 개수만 나타낼 수 있답니다.
is_milk = df['item'] == 'milk'
print(is_milk.sum())
달라진 코드가 있다면 True/False 여부를 'is_milk' 라는 변수에 저장했고, 이를 sum() 함수를 통해 True가 몇 개 있는지 나타내도록 하였습니다. 이러한 방법을 사용하면 데이터가 많은 데이터프레임에서도 쉽게 해당 값을 조회할 수 있답니다.
'BLOG > 데이터분석' 카테고리의 다른 글
[데이터분석] 데이터프레임 : 정렬 후 인덱스 재정렬 하기 - reset_index(drop = True) (0) | 2021.03.15 |
---|---|
[데이터분석] 데이터프레임 : 한 칼럼(열)에서 특정 값과 일치하는 행 필터링 하기 (0) | 2021.03.15 |
[데이터분석] plotly : 데이터프레임 3개 칼럼으로 그래프 나타내기 (0) | 2021.03.15 |
[데이터분석] 데이터프레임 : 데이터프레임(dataframe) 여러 개 출력하기 - display() (0) | 2021.03.15 |
[데이터분석] 데이터프레임 : 칼럼 이름이 있는 행을 열로 변환하는 방법 - melt() (0) | 2021.03.15 |