본문 바로가기

이름

[웹크롤링] 자주 사용되는 select 함수 5가지 - 코드 입력 형식 select함수는 find() 함수와 find_all 함수와는 다르게 여러 기능들을 사용할 수 있는데요, 주로 사용되는 코드 입력 방식에 대해 설명드리도록 하겠습니다. 1. 태그 이름 먼저 첫 번째로, select 함수는 원하는 태그를 찾을 때 많이 사용됩니다. 태그 이름으로 요소를 찾을 때 아래와 같이 입력하면 됩니다. soup.select('태그 이름') 위 코드에서 soup 는 soup = BeautifulSoup(html, 'html.parser') 로 설정된 변수입니다. 한편, 태그를 찾기 위해서 select() 함수 안에 '태그 이름' 을 입력하면 해당 요소가 선택됩니다. 2. 클래스 이름 두 번째로, select() 함수를 이용하여 클래스 이름을 찾는 코드는 다음과 같습니다. soup.sel.. 더보기
[데이터분석] matplotlib : 그래프 눈금에 이름 / 단위 나타내는 법 matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있도록 도와주는 라이브러리인데요, 그래프를 만들다 보면 x축이나 y축 눈금에 있는 텍스트를 다른 것으로 변경하거나 단위를 붙여서 나타내고 싶을 수 있습니다. matplotlib 라이브러리에서는 이렇게 눈금의 이름을 바꾸는 것이 가능한데요, 아래 코드를 보면서 살펴보도록 하겠습니다. 1. 그래프 눈금에 이름 또는 단위 나타내기 먼저, 간단한 그래프를 그려보도록 하겠습니다. import numpy as np import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] y = np.arange(1,10,1) plt.xticks(np.arange(0,11,1)) #x축 눈금간격 설정 pl.. 더보기
[데이터분석] 엑셀을 데이터 프레임으로 불러올 때 Sheet 설정하는 방법 - sheet_name 엑셀 파일을 데이터 프레임으로 불러올 때 보통 다음과 같이 코드를 입력하는데요, import pandas as pd file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx" #해당 경로 df = pd.read_excel(file) 이때 기본 값 설정으로, 엑셀 파일에서 첫 번째 시트인 Sheet1을 불러옵니다. 하지만 데이터 분석을 할 데이터가 Sheet2, Sheet3 또는 특정 이름의 시트에 있을 수 있는데요, sheet를 선택하기 위해선 pd.read_excel() 함수에 인자를 추가해서 입력해주어야 합니다. 바로, sheet_name 이라는 인자를 넣어주면 되는데요, 예를 들어 'Sheet2' 를 열고 싶다면 sheet_name="Sheet2" 를 인자로 넣.. 더보기
[데이터분석] 데이터프레임 : 칼럼(열) 이름 변경하는 방법 - rename() 데이터프레임으로 데이터분석을 할 때, 전처리 과정으로 칼럼의 이름을 알아보기 쉽게 변경하는 경우가 있는데요, 칼럼의 이름을 어떻게 변경하는지 알아보도록 하겠습니다. - rename() : 칼럼(열) 이름 변경하기 rename() 함수는 칼럼의 이름을 변경하는 함수인데요, df.rename(columns = {'old_name' : 'new_name'), inplace=True) 와 같이 코드를 입력해서 사용하면 됩니다. 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd df = pd.DataFrame( {'name': ['coffee', 'tea', 'juice','milk', 'ade'], 'price': [3000, 4000, 5000, 2000, 5000], '.. 더보기