본문 바로가기

파일

[웹크롤링] 크롤링한 데이터 메모장(텍스트 파일)에 저장하는 방법 크롤링한 데이터를 메모장과 같은 텍스트 파일에 저장하려면 sys library를 이용하면 되는데요, sys library에서 표준 출력 방향을 모니터가 아닌 다른 변수로 지정해주는 기능을 제공합니다. 즉, 모니터에 출력되는 것이 아니라 텍스트 파일에 저장해주고, 이를 다시 되돌려주기 위해 sys library를 사용하는 것입니다. 따라서 텍스트를 저장하기 전 다음과 같이 코드를 입력해 주어야 합니다. import sys orig_stdout = sys.stdout f = open(f_name, 'a', encoding='UTF-8') #f_name = 파일경로+파일이름.txt로 설정 필요 sys.stdout = f 두 번째 코드는 표준 출력 방향을 모니터가 아닌 다른 변수로 지정한다는 코드고, 세 번째 .. 더보기
[데이터분석] 엑셀(excel) 파일 dataframe으로 불러오기 - pd.read_excel() 지난 포스팅 중 하나가 csv 파일을 dataframe으로 불러오는 방법과 관련된 글이었는데요, 이번에는 엑셀 파일을 데이터 프레임으로 불러오는 방법에 대해 살펴보도록 하겠습니다. 엑셀 파일을 데이터프레임으로 불러오기 위해 먼저 pandas 라이브러리를 import 해줍니다. 그리고 나서 아래 코드처럼 file 경로를 변수로 설정해주고, pd.read_excel() 함수를 이용하여 데이터프레임으로 열어주면 되는데요, sheet_name 을 입력하여 sheet를 선택할 수 있습니다.(sheet1은 기본값이므로 생략 가능) import pandas as pd file = r"C:\Users\Dinolabs\Desktop\데이터분석\sample.xlsx" #해당 경로+파일 이름 df = pd.read_exce.. 더보기
[데이터분석] csv 파일 dataframe으로 불러오기 - pd.read_csv() 데이터 분석을 할 때, 데이터가 외부 파일인 csv 파일이라면 이를 불러와야 하는데요, 이때 csv 파일에 있는 데이터를 데이터프레임으로 전환해서 분석을 하려고 한다면 csv 파일을 불러오는 코드보다 바로 데이터프레임 형식으로 불러오는 방법이 좋은데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - pd.read_csv() : csv 파일 dataframe 형식으로 불러오기 pandas 라이브러리에서 제공하는 pd.read_csv() 함수는 csv 파일을 바로 dataframe 형식으로 불러오는 함수입니다. 괄호 안에 파일 이름과 인코딩 정보를 입력하면 되는데요, 아래와 같이 코드를 작성하면 됩니다. import pandas as pd import csv df = pd.read_csv("test1.cs.. 더보기
[파이썬] 주피터 노트북에서 csv, 엑셀 파일 열기 - open(), reader() 데이터프레임 등으로 데이터 분석을 할 때, 주로 csv 파일 또는 엑셀 형식의 파일을 불러와 데이터 분석을 하게 되는데요, 이때 csv 파일과 엑셀 파일을 어떻게 불러오는지 알아보도록 하겠습니다. 1. csv 파일 열기 먼저, csv 파일을 불러오려면 csv 라이브러리를 import 해야 합니다. open() 함수를 이용하여 파일을 열고 'f' 라는 변수에 저장하도록 하겠습니다. import csv f = open(r"C\test\sample.csv", encoding="utf-8") #파일이 있는 경로+파일이름.csv 그리고나서 csv.reader() 함수를 이용하여 csv 파일을 읽도록 합니다. f_csv = csv.reader(f) 이렇게 코드를 입력하면 f_csv 에는 csv 파일에 있는 데이터가.. 더보기
[파이썬] 텍스트 파일 / 메모장 - 줄 바꿈('\n') 제거하고 읽기 이전 글에서는 텍스트 파일을 불러와 읽는 방법에 대해 살펴보았는데요, 여러 줄의 데이터가 있는 텍스트 파일을 불러와 읽으면 다음과 같이 '\n' 라는 문자도 함께 출력이 됩니다. file = open("c:\\Users\\Dinolabs\\Desktop\\test1.txt", 'rt') lines = file.readlines() print(lines) ['안녕하세요!\n', '디노랩스 블로그입니다\n', '언제든지 방문하세요!\n'] 한편, for문을 이용해서 출력을 해보겠습니다. for line in lines : print(line) 안녕하세요! 디노랩스 블로그입니다. 언제든지 방문하세요! for문을 이용해서 한 줄 씩 출력한 결과, '\n' 라는 문자가 마치 줄 바꿈으로 인식되어서 한 줄씩 띄어져.. 더보기
[파이썬] 현재 위치 또는 특정 폴더의 목록(파일 이름) 리스트를 보고 싶다면? 파이썬에서 파일을 열 때, 그 파일의 이름과 파일 형식을 맞게 입력해야 하는데요, 파일의 이름을 모른다면 직접 폴더를 열어서 이름을 확인하는 과정을 거쳐야 합니다. 하지만 OS 라이브러리에서는 현재 위치 또는 특정 경로 폴더에 있는 파일의 이름을 출력해주는 함수를 제공하는데요, 바로 listdir() 라는 함수입니다. # os.listdir() listdir 함수를 사용하려면 먼저 os 라이브러리를 import 해주어야 합니다. 그다음, 현재 파이썬이 실행되고 있는 폴더의 파일 리스트를 보고 싶다면 다음과 같이 코드를 입력하면 됩니다. import os os.listdir() 위와 같이 입력하면, 현재 폴더에 있는 파일 명이 출력됩니다. 반면, 현재 폴더가 아닌, 다른 폴더에 있는 파일 리스트를 보고 싶.. 더보기