본문 바로가기

클래스

[머신러닝] 사이킷런(Scikit-learn) 데이터의 특성 / 클래스 별 데이터 개수 / 크기 확인하기 사이킷런(Scikit-learn) 라이브러리는 의사결정 트리, 분류, 회귀 등의 알고리즘에 사용하기 적합한 함수 및 데이터를 제공하는 라이브러리로, 이번 글에서는 사이킷런에서 제공하는 데이터를 불러와 데이터의 특성, 클래스 별 데이터의 개수, 크기를 확인하는 방법에 대해서 살펴보도록 하겠습니다. 1. 데이터 불러오기 - iris_data 먼저, 사용할 사이킷런 데이터를 불러와야 하는데요, 그중 대표적인 iris_data 를 불러오도록 하겠습니다. from sklearn.datasets import load_iris iris = load_iris() 데이터를 불러와 iris 라는 변수에 저장해주었습니다. 2. 데이터의 특성 살펴보기 그 다음에, 데이터에 어떠한 특성(keys)이 있는지 살펴보려면 .keys.. 더보기
[웹크롤링] 자주 사용되는 select 함수 5가지 - 코드 입력 형식 select함수는 find() 함수와 find_all 함수와는 다르게 여러 기능들을 사용할 수 있는데요, 주로 사용되는 코드 입력 방식에 대해 설명드리도록 하겠습니다. 1. 태그 이름 먼저 첫 번째로, select 함수는 원하는 태그를 찾을 때 많이 사용됩니다. 태그 이름으로 요소를 찾을 때 아래와 같이 입력하면 됩니다. soup.select('태그 이름') 위 코드에서 soup 는 soup = BeautifulSoup(html, 'html.parser') 로 설정된 변수입니다. 한편, 태그를 찾기 위해서 select() 함수 안에 '태그 이름' 을 입력하면 해당 요소가 선택됩니다. 2. 클래스 이름 두 번째로, select() 함수를 이용하여 클래스 이름을 찾는 코드는 다음과 같습니다. soup.sel.. 더보기