본문 바로가기

index

[데이터분석] 데이터프레임 : 다중 인덱스 설정하는 방법 - set_index() 데이터프레임에서는 인덱스를 하나만 설정하는 것 말고도 여러 개의 칼럼으로 인덱스를 설정할 수 있는데요, 아래 코드를 보면서 다중 인덱스를 설정하는 방법에 대해 살펴보도록 하겠습니다. - set_index() : 다중 인덱스 설정하기 먼저, 아래와 같은 데이터프레임(df)이 있다고 가정해보겠습니다. classnummatheng 0A19798 1A26776 2A38997 3B17667 4B27989 5B36877 6C19898 7C25887 8C39767 데이터프레임을 보면 'class' 칼럼에 A, B, C 에 해당하는 데이터가 있고, 'num' 칼럼에는 1, 2, 3이라는 데이터가 있으며, 'math'와 'eng' 칼럼에는 점수에 해당하는 값들이 입력되어 있습니다. 만약 위 데이터프레임에서 'class'.. 더보기
[데이터분석] 데이터프레임 : 정렬 후 인덱스 재정렬 하기 - reset_index(drop = True) 데이터프레임으로 분석을 하기 전 전처리 과정을 거치는데요, sort() 함수를 이용하여 정렬을 시키는 경우가 있습니다. 하지만 sort() 함수를 사용하고 나면, 인덱스 번호가 뒤죽박죽 섞이게 되는데요, 이를 재정렬하기 위해 인덱스를 지웠다 새로 만들기보다, reset_index() 함수를 이용하면 쉽게 재정렬 할 수 있답니다. 한 번 아래 코드를 보면서 살펴보도록 하겠습니다. - reset_index(drop=True) : 인덱스 재정렬하기 먼저, 아래와 같이 정렬을 하기 전인 데이터프레임(df)이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water230.. 더보기
[파이썬] 인덱스 반환 함수 - enumerate() 란? enumerate() 함수는 주로 반복문에서 사용되는데요, 몇 번째 반복되고 있는지 인덱스를 확인할 때 사용합니다. enumerate 함수를 어떻게 사용하는지 다음 코드를 보면서 살펴보도록 하겠습니다. - enumerate() 먼저, 아래와 같은 리스트 'list1'이 있고, list1에 있는 데이터를 하나씩 출력할 때 보통 다음과 같이 코드를 작성합니다. list1 = [50,100,150,200,250,300] for i in range(len(list1)) : print(i, "번째 데이터 :", list1[i]) 0 번째 데이터 : 50 1 번째 데이터 : 100 2 번째 데이터 : 150 3 번째 데이터 : 200 4 번째 데이터 : 250 5 번째 데이터 : 300 여기서 반복하는 것을 ran.. 더보기
[파이썬] 데이터프레임(dataframe) 특정 조건을 만족하는 행 삭제하기 - drop() 데이터프레임으로 데이터를 가공할 때, 필요에 맞게 특정 조건을 만족하는 행을 삭제해야 하는 경우가 있습니다. 이때 drop() 함수를 사용하면 되는데요, 아래 예를 들면서 설명하도록 하겠습니다. 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice', 'ade' ], 'price' : [3000, 4000, 5000, 6000], 'rating' : [4.0, 3.5, 3.7, 4.2]}) info itempricerating 0coffee30004.0 1tea40003.5 2juice50003.7 3ade60004.2 이때, 이 데이터프레임에서 만약 'price'가.. 더보기
[파이썬] 데이터프레임(dataframe) 인덱스 설정 / 해제 - set_index, reset_index 데이터프레임을 다룰 때, 인덱스를 설정하는 일이 참 많은데요, 인덱스를 설정하려면 set_index, 해제하려면 reset_index 라고 입력하면 됩니다. 아래의 코드를 보며 살펴보도록 하겠습니다. 1. set_index : 인덱스 설정하기 set_index() 함수를 이용하여 인덱스를 설정할 수 있는데요, 인덱스로 설정할 칼럼 이름을 괄호 안에 입력해주면 된답니다. import pandas as pd info = pd.DataFrame({'item' : ['coffee', 'tea', 'juice' ], 'price' : [3000, 4000, 5000], 'rating' : [4.0, 3.5, 3.7]}) info itempricerating 0coffee30004.0 1tea40003.5 2jui.. 더보기