본문 바로가기

[자연어처리] 패딩(Padding) : 다른 숫자로 패딩하는 방법 (파이썬) 이전 글들에서 pad_sequences() 함수를 사용하여 패딩을 구현하고, 길이 지정 등 다양하게 패딩하는 방법에 대해서 계속 살펴보았는데요, 이번 글에서는 0이 아닌 다른 값으로 패딩하는 방법에 대해서 살펴보겠습니다. 먼저, pad_sequences() 함수를 이용하여 길이 10의 제로패딩을 하는 코드를 작성해보겠습니다. import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer sentences = [['place', 'tree'], ['tree', 'nice', 'green'], ['nice', 'sky', 'and', 'tree'], ['bird', 'tree']] #정수 인코딩 tokenizer= Tokenizer(.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열)에 있는 데이터 출력하기 for문을 이용하면 데이터프레임에서 특정 칼럼(열)에 있는 데이터를 하나씩 출력할 수 있는데요, 먼저, 아래와 같은 데이터프레임(df1)이 있다고 가정해보겠습니다. # itempricecount 0water10001 1milk20005 2coffee30002 3ade40001 4juice50003 5tea60002 이 데이터프레임에서 만약 'item' 칼럼에 있는 데이터를 출력하고 싶다면 다음과 같이 코드를 작성하면 됩니다. for i in df1['item'] : print(i) water milk coffee ade juice tea 출력된 결과, 'item'에 있는 데이터가 모두 잘 출력되었음을 확인할 수 있습니다. 추가로, 만약 'item' 칼럼에 있는 데이터들을 하나의 리스트로 만들고 싶다면 아.. 더보기
[데이터분석] 데이터프레임 : 하나의 데이터 다른 값으로 바꾸기 (2) - iloc 이전 글에서는 loc를 사용해서 데이터프레임에서 하나의 데이터를 다른 값으로 바꾸는 방법에 대해서 살펴보았는데요, loc는 인덱스 이름을 이용해서 데이터를 변경하는 방법이었습니다. 이번에는 인덱스 번호를 이용하는 iloc를 사용해서 데이터를 변경하는 방법에 대해서 살펴보겠습니다 2. iloc[행번호][열번호] = '바꾸는 값' 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountprice 0coffee13000 1juice54000 2ade25000 3milk12000 4tea34000 5water21000 이 데이터프레임에서 'item'이 'juice'인 첫 번째 행에서 'count' 칼럼에 있는 데이터 '5'를 '3'으로 변경하고 싶다고 가정해보겠습니다. 그러기 위해선, 먼저 .. 더보기
[데이터분석] 데이터프레임 : 하나의 데이터 다른 값으로 바꾸기 (1) - loc 데이터프레임에서 하나의 데이터를 다른 값으로 바꾸는 방법은 여러 개가 있는데요, 그중 자주 사용되는 두 가지 방법에 대해서 설명드리도록 하겠습니다. 1. loc['index이름']['칼럼이름'] = '바꿀 값' 첫 번째 방법은 loc을 이용하여 데이터를 바꾸는 방법인데요, 먼저 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountprice 0coffee13000 1juice54000 2ade25000 3milk12000 4tea34000 5water21000 이 데이터프레임에서 만약 'item'이 juice인 행에서 'count' 칼럼에 있는 데이터 '5'를 '3'으로 바꾸고 싶다면 어떻게 해야할까요? 우선 데이터를 바꾸기 전 'item' 칼럼을 인덱스로 설정해야 하는데요, 아래와 같이 .. 더보기
[데이터분석] 데이터프레임 : 한 칼럼(열)에서 특정 값과 일치하는 행 필터링 하기 데이터프레임에서 한 칼럼(열)에 특정 데이터와 일치하는 행을 찾고, 일치하는 행들만 따로 데이터프레임으로 나타내고 싶다면 어떻게 해야 할까요? 아래 코드를 보면서 살펴보도록 하겠습니다. - 한 칼럼(열)에서 특정 값과 일치하는 행 필터링 하기 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water230004.5 위 데이터를 살펴보면 항목(item)마다 'count', 'price', 'rating'에 대한 데이터가 있는데요, 만약 'price'칼럼에서 데이터가 '3000'인 행만 필터링해서 새로운 데이터프레임으로 만들고 싶다면.. 더보기
[파이썬] 딕셔너리 : key로 value 값을 찾으려면? 딕셔너리 데이터를 다룰 때, key를 이용하여 value 값을 찾는 경우가 많은데요, price = {'coffee' : 3000, 'juice' : 4000 } 위와 같이 'price' 딕셔너리가 있고, 'coffee'에 해당하는 value를 알고 싶을 때 다음과 같이 코드를 작성하면 됩니다. price['coffee'] 3000 더보기