본문 바로가기

크기

[머신러닝] 사이킷런(Scikit-learn) 데이터의 특성 / 클래스 별 데이터 개수 / 크기 확인하기 사이킷런(Scikit-learn) 라이브러리는 의사결정 트리, 분류, 회귀 등의 알고리즘에 사용하기 적합한 함수 및 데이터를 제공하는 라이브러리로, 이번 글에서는 사이킷런에서 제공하는 데이터를 불러와 데이터의 특성, 클래스 별 데이터의 개수, 크기를 확인하는 방법에 대해서 살펴보도록 하겠습니다. 1. 데이터 불러오기 - iris_data 먼저, 사용할 사이킷런 데이터를 불러와야 하는데요, 그중 대표적인 iris_data 를 불러오도록 하겠습니다. from sklearn.datasets import load_iris iris = load_iris() 데이터를 불러와 iris 라는 변수에 저장해주었습니다. 2. 데이터의 특성 살펴보기 그 다음에, 데이터에 어떠한 특성(keys)이 있는지 살펴보려면 .keys.. 더보기
[파이썬] 문자열 길이 & 리스트 안 데이터 개수 구하기 - len() 문자열 길이나 리스트 안에 있는 데이터의 개수 및 크기를 구할 땐 len() 함수를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 문자열 길이 구하기 먼저, 아래와 같은 텍스트가 있다고 가정하겠습니다. text1 = "안녕하세요! 디노랩스 블로그입니다." 이제 이 텍스트의 문자열 길이를 구하고 싶다면 len() 함수를 이용하여 아래와 같이 입력하면 됩니다. num = len(text1) print(num) 19 출력된 값을 보면 19로, 알맞게 문자열의 길이를 잘 구한 것을 확인할 수 있습니다. 이때 띄어쓰기도 한 글자로 포함이 된답니다. 2. 리스트 안에 있는 데이터 개수 구하기 반면, 리스트 안에 데이터가 몇 개 있는지도 len() 함수를 이용하여 구할 수 있는데요, 다음과 같.. 더보기