데이터프레임에서 특정 문자열이나 다른 데이터가 있는 행만 따로 출력되어서 보이도록 하려면 어떻게 해야 할까요?
바로, 이를 도와주는 함수가 contains() 이라는 함수인데요, contains() 함수를 이용해서 특정 텍스트 또는 텍스트열이 있는 행만 출력할 수 있답니다.
아래의 코드를 보면서 자세히 설명하도록 하겠습니다.
- contains() : 특정 문자 또는 문자열이 포함된 데이터 찾기
먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.
# <df>
item price count
0 ice water 1000 1
1 milk 2000 5
2 ice coffee 3000 2
3 ade 4000 1
4 latte 5000 3
5 ice tea 6000 2
만약 이 데이터프레임의 'item' 칼럼에서 'ice'라는 문자열이 포함되어 있는 데이터를 찾고, 그 데이터가 있는 행을 출력하고 싶다면 다음과 같이 코드를 입력하면 됩니다.
df[df['item'].str.contains('ice')]
# output :
item price count
0 ice water 1000 1
2 ice coffee 3000 2
5 ice tea 6000 2
코드 실행 결과, 'ice'가 들어간 데이터가 포함된 행만 출력되었음을 확인할 수 있답니다.
'BLOG > 데이터분석' 카테고리의 다른 글
[데이터분석] 데이터프레임 : 랜덤으로 행 복제하는 방법 - sample (0) | 2021.03.16 |
---|---|
[데이터분석] 데이터프레임 : 랜덤으로 행 출력하기 (원하는 비율) - sample (0) | 2021.03.16 |
[데이터분석] 데이터프레임 중간에 생략된 부분 보이게 하는 방법 (0) | 2021.03.16 |
[데이터분석] 데이터프레임 : 특정 칼럼(열)을 리스트로 바꾸는 방법 (0) | 2021.03.16 |
[데이터분석] 데이터프레임 : 특정 칼럼(열)에 있는 데이터 출력하기 (0) | 2021.03.16 |