본문 바로가기

열기

[데이터분석] 엑셀(excel) 파일 dataframe으로 불러오기 - pd.read_excel() 지난 포스팅 중 하나가 csv 파일을 dataframe으로 불러오는 방법과 관련된 글이었는데요, 이번에는 엑셀 파일을 데이터 프레임으로 불러오는 방법에 대해 살펴보도록 하겠습니다. 엑셀 파일을 데이터프레임으로 불러오기 위해 먼저 pandas 라이브러리를 import 해줍니다. 그리고 나서 아래 코드처럼 file 경로를 변수로 설정해주고, pd.read_excel() 함수를 이용하여 데이터프레임으로 열어주면 되는데요, sheet_name 을 입력하여 sheet를 선택할 수 있습니다.(sheet1은 기본값이므로 생략 가능) import pandas as pd file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx" #해당 경로+파일 이름 df = pd.read_exce.. 더보기
[데이터분석] csv 파일 dataframe으로 불러오기 - pd.read_csv() 데이터 분석을 할 때, 데이터가 외부 파일인 csv 파일이라면 이를 불러와야 하는데요, 이때 csv 파일에 있는 데이터를 데이터프레임으로 전환해서 분석을 하려고 한다면 csv 파일을 불러오는 코드보다 바로 데이터프레임 형식으로 불러오는 방법이 좋은데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - pd.read_csv() : csv 파일 dataframe 형식으로 불러오기 pandas 라이브러리에서 제공하는 pd.read_csv() 함수는 csv 파일을 바로 dataframe 형식으로 불러오는 함수입니다. 괄호 안에 파일 이름과 인코딩 정보를 입력하면 되는데요, 아래와 같이 코드를 작성하면 됩니다. import pandas as pd import csv df = pd.read_csv("test1.cs.. 더보기
[파이썬] 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence 에러, 해결 방법은? csv 파일을 열 때, 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence 와 같은 에러가 뜨는 경우가 있는데요, 이러한 경우는 인코딩에서 문제가 발생했다는 뜻입니다. 따라서 만약 csv 파일을 불러왔을 때 인코딩 설정 없이 다음과 같이 코드를 작성했었다면, import csv f = open(r"C\test\sample.csv") f_csv = csv.reader(f) 아래와 같이 코드를 수정해보시기 바랍니다. import csv f = open(r"C\test\sample.csv", encoding="utf-8") # encoding="utf-8" 추가하기 f_csv = csv.reader(f) 더보기
[파이썬] 주피터 노트북에서 csv, 엑셀 파일 열기 - open(), reader() 데이터프레임 등으로 데이터 분석을 할 때, 주로 csv 파일 또는 엑셀 형식의 파일을 불러와 데이터 분석을 하게 되는데요, 이때 csv 파일과 엑셀 파일을 어떻게 불러오는지 알아보도록 하겠습니다. 1. csv 파일 열기 먼저, csv 파일을 불러오려면 csv 라이브러리를 import 해야 합니다. open() 함수를 이용하여 파일을 열고 'f' 라는 변수에 저장하도록 하겠습니다. import csv f = open(r"C\test\sample.csv", encoding="utf-8") #파일이 있는 경로+파일이름.csv 그리고나서 csv.reader() 함수를 이용하여 csv 파일을 읽도록 합니다. f_csv = csv.reader(f) 이렇게 코드를 입력하면 f_csv 에는 csv 파일에 있는 데이터가.. 더보기