데이터프레임에서 새로운 행이나 칼럼(열)을 추가하는 방법은 다양한데요, 이번에는 간단하게 칼럼(열)을 추가하는 방법에 대해서 설명하도록 하겠습니다.
- 동일한 값이 들어있는 새로운 칼럼 추가하기
새로운 칼럼을 만들고, 그 칼럼에 모두 동일한 값을 넣어야 하는 경우가 있는데요, 우선 아래와 같은 데이터프레임이 있다고 가정해보겠습니다.
item count price rating
0 coffee 1 3000 4.5
1 juice 5 4000 3.0
2 ade 2 5000 4.0
3 milk 1 3000 2.5
4 tea 3 4000 3.0
5 water 2 1000 4.5
여기에 새로운 칼럼 'category'를 만들고 싶고, 데이터가 모두 'drink' 인 칼럼을 만들고 싶다면 아래와 같이 코드를 간단하게 입력하면 됩니다.
df['category'] = 'drink'
display(df)
item count price rating category
0 coffee 1 3000 4.5 drink
1 juice 5 4000 3.0 drink
2 ade 2 5000 4.0 drink
3 milk 1 3000 2.5 drink
4 tea 3 4000 3.0 drink
5 water 2 1000 4.5 drink
출력된 결과를 보면, 모두 동일한 'drink' 데이터가 들어간 'category' 칼럼이 생성된 것을 확인할 수 있습니다.
- 다른 값이 들어있는 새로운 칼럼 추가하기
한편, 동일한 값이 아닌 각각 다른 값을 넣어주기 위한 방법으로는 array 또는 list를 이용하여 추가하는 방법인데요, 아래와 같은 array와 list가 있다고 가정해보겠습니다.
arr1 = np.array([1,2,3,4,5,6])
list1 = [50,45,40,35,30,25]
그리고 앞에서 동일한 데이터를 추가한 방법처럼 다음과 같이 코드를 작성하면 됩니다.
df['rank'] = arr1
df['score'] = list1
위와 같이 df['새 칼럼명'] = list/array 처럼 입력하면, 아래와 같은 결과가 출력됩니다.
item count price rating category rank score
0 coffee 1 3000 4.5 drink 1 50
1 juice 5 4000 3.0 drink 2 45
2 ade 2 5000 4.0 drink 3 40
3 milk 1 3000 2.5 drink 4 35
4 tea 3 4000 3.0 drink 5 30
5 water 2 1000 4.5 drink 6 25
이때 주의할 점이 있는데요, 바로 list와 array의 길이가 기존 데이터프레임의 행의 개수와 같아야 한다는 것 입니다. 만약 데이터의 길이가 동일하지 않은데 추가를 하면 에러가 나게 됩니다.
'BLOG > 데이터분석' 카테고리의 다른 글
[데이터분석] plotly : 막대 그래프 간단하게 만드는 방법 (0) | 2021.03.15 |
---|---|
[데이터분석] 데이터프레임 : assign() 으로 새로운 칼럼(열) 추가하기 (0) | 2021.03.15 |
[데이터 분석] 빈 데이터 프레임(dataframe) 만드는 방법 (0) | 2021.03.11 |
[데이터분석] matplotlib 그래프 : x축 텍스트 회전하는 방법 - rotation (0) | 2021.03.11 |
[데이터분석] 데이터 프레임 - 새로운 행 추가하기 - loc[ ] (0) | 2021.03.11 |