[자연어처리] 패딩(Padding) : 길이 지정 방법 - maxlen (파이썬)
이전 글들에서 패딩을 하는 기본적인 방법과, 제로 패딩을 할 때 0을 뒤로 채우는 방법 등에 대해서 살펴보았는데요, 이번에는 패딩을 할 때, 길이를 지정하는 방법에 대해서 살펴보도록 하겠습니다. 먼저, 기본적으로 패딩을 하는 코드를 작성하고, 그 결과를 보겠습니다. import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer sentences = [['place', 'tree'], ['tree', 'nice', 'green'], ['nice', 'sky', 'and', 'tree'], ['bird', 'tree']] tokenizer= Tokenizer() tokenizer.fit_on_texts(sentences) encode..
더보기
[데이터분석] matplotlib : 그래프 눈금 간격 지정 방법
matplotlib 라이브러리는 그래프를 쉽게 그리도록 도와주는 라이브러리인데요, 기본적으로 그래프를 그리면 눈금이 자동으로 지정되어서 출력됩니다. 하지만 눈금이 원하는 그래프와 적절하지 않다면 이를 조정해야 하는데요, 눈금 간격을 지정하는 방법에 대해서 알아보도록 하겠습니다. - 그래프 눈금 간격 설정하기 먼저, matplotlib 라이브러리와 numpy 배열을 이용하여 간단한 그래프를 만들어보도록 하겠습니다. import numpy as np import matplotlib.pyplot as plt a = np.arange(0,10,1) #0,2,4,6,8 plt.plot(a,a,'bo') 출력된 결과를 보면, x축과 y축의 눈금 모두 2로 설정이 되어 있는데요, 눈금 간격을 설정하는 방법은 xtic..
더보기
[데이터분석] matplotlib : grid 설정 / 해제하기 (가로 방향 / 세로 방향)
파이썬에서는 matplitlib 라이브러리를 이용하여 그래프를 쉽게 만들 수 있는데요, grid를 설정하는 방법에 대해 알아보도록 하겠습니다. 먼저, 아래와 같은 그래프가 있다고 가정하겠습니다. import matplotlib.pyplot as plt import numpy as np x = np.arange(3) item = ['coffee', 'tea', 'ade'] values = [2000, 4000, 5000] plt.bar(x, values) plt.xticks(x, item) plt.show() 출력된 그래프를 보면, grid가 설정되어 있는데요, grid에 대한 설정은 plt.grid(True) 또는 plt.grid(False) 코드를 통해 설정할 수 있습니다. 위 그래프에는 grid가 설..
더보기
[파이썬] 데이터프레임(dataframe) 인덱스 설정 / 해제 - set_index, reset_index
데이터프레임을 다룰 때, 인덱스를 설정하는 일이 참 많은데요, 인덱스를 설정하려면 set_index, 해제하려면 reset_index 라고 입력하면 됩니다. 아래의 코드를 보며 살펴보도록 하겠습니다. 1. set_index : 인덱스 설정하기 set_index() 함수를 이용하여 인덱스를 설정할 수 있는데요, 인덱스로 설정할 칼럼 이름을 괄호 안에 입력해주면 된답니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2jui..
더보기