본문 바로가기

단위

[자연어처리] Okt : 형태소 단위로 나누는 방법 (파이썬) 자연어처리를 할 때, 데이터 전처리로 문장을 형태소 단위로 나누는 과정을 거쳐야 하는데요, 파이썬에서 형태소 단위로 나누는 라이브러리는 다양합니다. 그중에서 Okt 라이브러리를 이용하여 형태소 단위로 나누는 방법에 대해서 살펴보도록 하겠습니다. - 형태소 단위로 나누기 먼저, 필요한 라이브러리를 설치해줍니다. from konlpy.tag import Okt import re 그리고, 형태소 단위로 나눌 문장은 다음과 같다고 가정하겠습니다. text1 = "Tue) 오늘도 나는 커피를 마셔요!" Okt 객체를 이용해서 이 문장을 형태소 단위로 나누기 전, 한글과 공백을 제외한 문자를 모두 제거해주어야 하는데요, 정규표현식을 이용해서 코드를 다음과 같이 입력해주면 됩니다. text2 = re.sub("[^가.. 더보기
[데이터분석] matplotlib : 그래프 눈금에 이름 / 단위 나타내는 법 matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있도록 도와주는 라이브러리인데요, 그래프를 만들다 보면 x축이나 y축 눈금에 있는 텍스트를 다른 것으로 변경하거나 단위를 붙여서 나타내고 싶을 수 있습니다. matplotlib 라이브러리에서는 이렇게 눈금의 이름을 바꾸는 것이 가능한데요, 아래 코드를 보면서 살펴보도록 하겠습니다. 1. 그래프 눈금에 이름 또는 단위 나타내기 먼저, 간단한 그래프를 그려보도록 하겠습니다. import numpy as np import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] y = np.arange(1,10,1) plt.xticks(np.arange(0,11,1)) #x축 눈금간격 설정 pl.. 더보기