본문 바로가기

리스트

[데이터분석] 여러 리스트로 데이터 프레임 만들고 엑셀(excel)로 저장하기 1. 리스트로 데이터 프레임 만들기 여러 리스트가 있다면 이러한 리스트를 모아서 데이터프레임을 만들 수 있는데요, 아래와 같이 3개의 리스트가 있다고 가정해보겠습니다. item = ['아메리카노', '라떼', '차', '에이드', '쥬스'] price = [3500, 4000, 4500, 5000, 4000] rating = [4.2, 3.4, 4.4, 4.0, 3.9] 그리고나서, 위 리스트로 'cafe' 라는 이름의 데이터프레임을 만들고 출력해보겠습니다. import pandas as pd cafe = pd.DataFrame() cafe['항목'] = item cafe['가격'] = price cafe['별점'] = rating display(cafe) # output : 항목가격별점 0아메리카노35.. 더보기
[데이터분석] 데이터프레임 : 특정 칼럼(열)을 리스트로 바꾸는 방법 데이터프레임에서 특정 칼럼(열)에 있는 데이터를 리스트의 형식으로 만들고 싶을 수 있는데요, 이러한 경우 간단하게 for문을 이용해서 리스트로 만들 수 있답니다. 먼저, 아래와 같은 데이터프레임(df1)이 있다고 가정해보겠습니다. # itempricecount 0water10001 1milk20005 2coffee30002 3ade40001 4juice50003 5tea60002 이 데이터프레임에서 만약 'item' 칼럼에 있는 데이터들을 리스트로 만들고 싶다면 아래와 같이 for문을 사용해서 코드를 입력하면 됩니다. item_list = [] for i in df1['item'] : item_list.append(i) 먼저 비어있는 리스트를 만들고, for문에서 df의 'item' 칼럼에서 데이터를 하.. 더보기
[데이터분석] 데이터프레임 : 칼럼(열) 간단하게 추가하는 방법 데이터프레임에서 새로운 행이나 칼럼(열)을 추가하는 방법은 다양한데요, 이번에는 간단하게 칼럼(열)을 추가하는 방법에 대해서 설명하도록 하겠습니다. - 동일한 값이 들어있는 새로운 칼럼 추가하기 새로운 칼럼을 만들고, 그 칼럼에 모두 동일한 값을 넣어야 하는 경우가 있는데요, 우선 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. itemcountpricerating 0coffee130004.5 1juice540003.0 2ade250004.0 3milk130002.5 4tea340003.0 5water210004.5 여기에 새로운 칼럼 'category'를 만들고 싶고, 데이터가 모두 'drink' 인 칼럼을 만들고 싶다면 아래와 같이 코드를 간단하게 입력하면 됩니다. df['category'] = .. 더보기
[파이썬] 리스트 인덱싱 기초 : list[-1] 이란? 리스트 안에 있는 데이터를 인덱싱 하는 것은 매우 간단하면서도 기초적인 것인데요, 간단하게 인덱싱 하는 방법에 대해 살펴보도록 하겠습니다. - 리스트(List) 인덱싱 하기 우선 다음과 같은 리스트 'list1'이 있다고 가정해보겠습니다. list1 = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ,10] 리스트에서 인덱스는 0부터 시작하는데요, 만약 두 번째 데이터를 갖고 오고 싶다면 인덱스가 1인 데이터를 찾아와야 합니다. 한편, 인덱싱 하는 방법은 리스트명[인덱스번호] 처럼 코드를 입력하면 됩니다. # 첫 번째 데이터 인덱싱 list1[0] # 두 번째 데이터 인덱싱 list1[1] 그렇다면, 리스트에 데이터가 몇 개 인지 모를 정도로 매우 많은데, 마지막에 있는 데이터를 인덱싱 하려면 어.. 더보기
[파이썬] 튜플(Tuple) 이것만 알자! 1. 튜플(Tuple)과 리스트(List)의 차이는? 튜플(Tuple)은 리스트와 같이 여러 개의 데이터를 담아주는 자료형 구조로, 리스트와 비슷한 기능을 합니다. 하지만 리스트는 '[', ']'를 사용하는 반면, 튜플은 아래 코드와 같이 '(', ')'을 사용합니다. list1 = [1, 2, 3, 4, 5] tuple1 = (1, 2, 3, 4, 5) 한편, 튜플은 리스트보다 처리 속도가 더 빠르다고 하는데요, 데이터가 엄청 많을 때 튜플의 처리 속도가 더 빠르다는 것을 확인할 수 있습니다. 또한, 리스트는 데이터를 추가하거나 수정 및 변경이 가능한데요, 튜플은 처음에 지정하고 그 이후에 수정 및 변경이 불가능하답니다. 따라서 튜플의 원소를 수정하려고 하면 아래와 같이 에러가 나는 것을 확인할 수 있.. 더보기
[파이썬] 리스트 안에 있는 데이터 빈도 수 구하기 - Counter() 리스트에 중복된 데이터가 있는 경우, 데이터의 빈도수를 구하고 싶다면 어떡해야 할까요? 바로, Counter 라는 라이브러리를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. - Counter() : 리스트 데이터 빈도수 구하기 Counter 라이브러리는 리스트 안에 있는 데이터의 빈도수를 구한 뒤 딕셔너리 형태로 반환해주는 함수를 제공하는데요, 아래와 같은 중복된 데이터가 있는 리스트가 있다고 가정해보겠습니다. a = ['커피', '쿠키', '차', '케잌', '커피', '차', '케잌', '쥬스', '커피', '쥬스', '차'] 이제 'a' 리스트에 있는 데이터의 빈도 수를 구하기 위해 Counter() 함수를 사용해보겠습니다. 이때 Counter() 함수를 사용하기 위해 Counte.. 더보기
[파이썬] 문자열 길이 & 리스트 안 데이터 개수 구하기 - len() 문자열 길이나 리스트 안에 있는 데이터의 개수 및 크기를 구할 땐 len() 함수를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 문자열 길이 구하기 먼저, 아래와 같은 텍스트가 있다고 가정하겠습니다. text1 = "안녕하세요! 디노랩스 블로그입니다." 이제 이 텍스트의 문자열 길이를 구하고 싶다면 len() 함수를 이용하여 아래와 같이 입력하면 됩니다. num = len(text1) print(num) 19 출력된 값을 보면 19로, 알맞게 문자열의 길이를 잘 구한 것을 확인할 수 있습니다. 이때 띄어쓰기도 한 글자로 포함이 된답니다. 2. 리스트 안에 있는 데이터 개수 구하기 반면, 리스트 안에 데이터가 몇 개 있는지도 len() 함수를 이용하여 구할 수 있는데요, 다음과 같.. 더보기
[파이썬] 리스트를 numpy 배열(array)로 바꾸려면 파이썬에서 numpy는 list 형식의 데이터를 다루지 못하고, array만 다룰 수 있는데요, 만약 리스트로 배열간 곱셈, 합 등 numpy 연산을 하고 싶다면 리스트를 array로 바꾸면 됩니다. 그렇다면 리스트를 array 형식으로 바꾸려면 어떻게 해야 하는지 아래 코드를 보면서 설명드리도록 하겠습니다. 먼저, 아래와 같은 리스트가 있다고 가정해보겠습니다. list1 = [1,2,3,4,5] type(list1) list list1의 타입은 list라고 나오는 것을 확인할 수 있습니다. 그리고나서 이제 list1을 array로 변경하려면 다음과 같이 입력해야 합니다. import numpy as np arr = np.array(list1) type(arr) numpy.ndarray 위와 같이 입력한.. 더보기
[파이썬] 현재 위치 또는 특정 폴더의 목록(파일 이름) 리스트를 보고 싶다면? 파이썬에서 파일을 열 때, 그 파일의 이름과 파일 형식을 맞게 입력해야 하는데요, 파일의 이름을 모른다면 직접 폴더를 열어서 이름을 확인하는 과정을 거쳐야 합니다. 하지만 OS 라이브러리에서는 현재 위치 또는 특정 경로 폴더에 있는 파일의 이름을 출력해주는 함수를 제공하는데요, 바로 listdir() 라는 함수입니다. # os.listdir() listdir 함수를 사용하려면 먼저 os 라이브러리를 import 해주어야 합니다. 그다음, 현재 파이썬이 실행되고 있는 폴더의 파일 리스트를 보고 싶다면 다음과 같이 코드를 입력하면 됩니다. import os os.listdir() 위와 같이 입력하면, 현재 폴더에 있는 파일 명이 출력됩니다. 반면, 현재 폴더가 아닌, 다른 폴더에 있는 파일 리스트를 보고 싶.. 더보기
[파이썬] 데이터를 절댓값으로 바꾼 뒤 내림차순 정렬 하려면? - abs() 1. abs : 절댓값으로 변경 데이터를 절댓값으로 바꿔주는 함수는 바로 abs() 인데요, 간단하게 함수 안에 숫자형 데이터를 입력하면 된답니다. 아래의 코드를 보도록 하겠습니다. num = -50 num2 = abs(num) print(num2) 50 음의 값을 갖는 데이터 'num'을 abs() 함수에 입력하면 양의 값을 가진 데이터로 반환해줌을 볼 수 있습니다. 2. abs + sort : 절댓값으로 변경 후 정렬 한편, 리스트 안에 있는 데이터를 절댓값으로 변경한 뒤 오름차순 또는 내림차순으로 정렬해야 하는 경우가 있는데요, 이러한 경우 for문으로 사용하여 일괄적으로 절댓값으로 변경한 뒤, sort() 함수를 이용하여 정렬을 할 수 있습니다. 아래의 코드를 보도록 하겠습니다. list1=[4,.. 더보기