본문 바로가기

BLOG/데이터분석

[데이터분석] 여러 리스트로 데이터 프레임 만들고 엑셀(excel)로 저장하기 1. 리스트로 데이터 프레임 만들기 여러 리스트가 있다면 이러한 리스트를 모아서 데이터프레임을 만들 수 있는데요, 아래와 같이 3개의 리스트가 있다고 가정해보겠습니다. item = ['아메리카노', '라떼', '차', '에이드', '쥬스'] price = [3500, 4000, 4500, 5000, 4000] rating = [4.2, 3.4, 4.4, 4.0, 3.9] 그리고나서, 위 리스트로 'cafe' 라는 이름의 데이터프레임을 만들고 출력해보겠습니다. import pandas as pd cafe = pd.DataFrame() cafe['항목'] = item cafe['가격'] = price cafe['별점'] = rating display(cafe) # output : 항목가격별점 0아메리카노35.. 더보기
[데이터분석] matplotlib : 에러바(Errorbar, 오차막대) 그리는 방법 그래프를 보면 오차막대라고도 하는 에러바가 그려진 그래프를 볼 수 있는데요, 이 에러바는 데이터의 편차를 나타냅니다. matplotlib 라이브러리에서도 이 에리바가 그려진 그래프를 그릴 수 있게 함수를 제공하는데요, 어떻게 사용해야 하는지 아래 코드를 보면서 살펴보도록 하겠습니다. - errorbar() : 에러바 그리기 먼저, 간단한 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) plt.show() 위 코드에서는 그래프를 그리기 위해 plot() 함수를 사용했는데요, 만약 에러바가 나오는 그래프를 그리려면 errorbar() 함수로 변경하고, 추가로 편차가 입.. 더보기
[데이터분석] matplotlib : 산점도 그래프 그리기 - scatter matplotlib 라이브러리로 산점도 그래프도 그릴 수 있는데요, matplotlib.pyplot 에서 제공하는 scatter() 함수를 이용하여 그릴 수 있습니다. 먼저, x축 데이터와 y축 데이터는 랜덤으로 난수를 100개씩 생성하겠습니다. import matplotlib.pyplot as plt import numpy as np np.random.seed(0) N = 100 x = np.random.rand(N) y = np.random.rand(N) 한편, scatter() 함수를 이용하여 산점도 그래프를 그리기 전, 색깔과 산점도 영역을 랜덤으로 지정해주어야 하는데요, 다음과 같이 입력하면 됩니다. colors = np.random.rand(N) area = (30 * np.random.ran.. 더보기
[데이터분석] matplotlib : 타이틀(제목) 위치 설정하는 방법 - title matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있도록 기능을 제공하는 라이브러리인데요, 이번 글에서는 그래프에서 타이틀을 설정하고, 위치를 설정하는 방법에 대해서 살펴보도록 하겠습니다. 1. 타이틀 설정하기 우선, 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) plt.show() 위 그래프는 타이틀이 설정되어 있지 않은 상태인데요, title() 함수를 추가해서 제목을 지정해보겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) pl.. 더보기
[데이터분석] matplotlib : 원형 마커로 그래프 나타내기 matplotlib 라이브러리로 그래프를 그릴 때, 특정한 설정이 없다면 선 그래프로 그려지는데요, 그래프를 원형 마커가 표시된 그래프로 나타낼 수 있답니다. 한번 아래 코드를 보면서 살펴보도록 하겠습니다. 먼저, 아래와 같이 기본적인 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 25] plt.plot(x,y) plt.show() 그래프를 그리는 함수로 plot(x, y) 함수를 사용했는데요, 기본적으로 선 그래프로 나오는 것을 확인할 수 있습니다. 만약, 원형 마커로 찍힌 그래프로 그리고 싶다면 아래 코드처럼 plot() 함수를 plot(x, y, 'bo') 로 변경해서 입력하면 됩니다. i.. 더보기
[데이터분석] matplotlib : 사용 가능한 색깔, 선 종류, 마커 종류 표시 형식 알아보기 matplotlib 라이브러리는 그래프를 쉽고 간단하게 그릴 수 있게 도와주는 라이브러리로, 다양한 색깔과 선 종류, 그리고 여러 마커 종류를 사용하여 그래프를 그릴 수 있습니다. 하지만 사용 가능한 색깔이나 선 종류 또는 마커 종류를 모르면 그만큼 그래프를 다양하게 그릴 수 없습니다. 따라서 어떠한 색깔이 있고, 어떠한 선 종류와 마커 종류가 있는지 알아두는 게 많은 도움이 될 수 있습니다. 1. Colors 먼저 사용가능한 색깔은 다음과 같습니다. 표시 형식 color 'b' blue 'g' green 'r' red 'c' cyan 'm' magenta 'y' yellow 'k' black 'w' white 2. Line 그다음으로, 사용 가능한 선 종류는 다음과 같습니다. 표시 형식 설명 '-' s.. 더보기
[데이터분석] matplotlib : 축 범위 지정하는 방법 - axis() matplotlib 라이브러리를 이용하면 그래프를 쉽고 간단하게 그릴 수 있는데요, matplotlib 라이브러리에서는 x축과 y축의 범위를 지정하는 axis() 함수를 제공합니다. 그렇다면 axis() 함수로 어떻게 축 범위를 지정하는지 살펴보도록 하겠습니다. - axis() : 축 범위 지정하기 먼저, 간단한 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 8, 27, 64, 125] plt.plot(x,y) plt.show() 이 그래프를 보면, x축은 1에서 5까지, y축은 0에서 120까지로 범위가 지정되어 있는데요, 축 범위를 x축은 0에서 6까지, y축은 0에서 150까지로 axis() 함수를 이용해서.. 더보기
[데이터분석] matplotlib : 두 선 그래프 사이에 특정 영역 색칠하기 - fill_between 지난 글에서는 fill_between() 함수를 사용해서 선 그래프의 특정 구간을 색깔로 채우는 방법에 대해서 살펴보았는데요, 이번에는 두 선 그래프가 있을 때 그 사이 특정 영역에 색칠하는 방법에 대해서 살펴보도록 하겠습니다. - fill_between() : 두 선 그래프 사이에 특정 영역 색칠하기 먼저, matplotlib 라이브러리를 이용하여 두 개의 선 그래프를 그려보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y1 = [1, 8, 27, 64, 125] y2 = [1, 16, 54, 128, 250] plt.xticks(np.arange(0,6,1)) plt.plot(x, y1) plt.plot(x, y2) plt.show() .. 더보기
[데이터분석] matplotlib : 그래프 특정 구간 색칠하기 - fill_between() matplotlib 라이브러리를 이용하여 그래프를 쉽고 간단하게 그릴 수 있는데요, matplotlib 라이브러리에서는 선그래프에서 특정 구간을 색칠해서 나타내는 함수 fill_between()을 제공합니다. 한 번 코드를 보면서 살펴보도록 하겠습니다. - fill_between() : 그래프 특정 구간 채우기 먼저, 그래프를 하나 만들어 보도록 하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 8, 27, 64, 125] plt.xticks(np.arange(0,6,1)) plt.plot(x,y) plt.show() 만약 이 그래프에서 x축의 2와 3 사이의 영역을 색칠하고 싶다면 fill_between() 함수를 사용하면 되는데요,.. 더보기
[데이터분석] 데이터프레임 : 특정 셀 배경색 설정하는 방법 - style, applymap 데이터프레임에서는 셀의 배경색, 폰트 사이즈, 폰트 색깔 등을 지정할 수 있는데요, 이번 글에서는 배경색을 설정하는 방법에 대해서 설명하도록 하겠습니다. - style.applymap() : 데이터프레임 셀 배경색 설정 style.applymap() 함수를 사용하여 셀 배경색을 쉽게 설정할 수 있는데요, 먼저 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. 이 데이터프레임에서 만약 1번째 행 'price' 칼럼에 있는 데이터 '2000'의 배경색을 빨간색으로 지정하고 싶다면 아래와 같이 코드를 입력하면 됩니다. def color_cell(x,color): color = f'background-color:{color}' return color df.style.applymap(color_cell,colo.. 더보기