본문 바로가기

포함

[웹크롤링] 크롤링 데이터 저장 - 중복되지 않는 폴더 생성 방법 (현재 날짜 / 시간 사용) 대량의 이미지를 크롤링하고 저장하는 경우, 중간에 다시 시작해버리면 덮어쓰기가 돼버려서 이전에 저장했던 이미지가 사라질 수 있는데요, 이러한 경우 어떻게 해야 할까요? 다시 시작할 때마다 폴더의 이름을 바꾸기엔 비효율적일 수 있습니다. 따라서 이에 대한 해결책은 바로 폴더명을 현재 날짜, 시간이 들어가게 만들면 되는데요, 이러한 이름으로 폴더를 만들게 되면 절대 폴더가 중복되지 않습니다. 한편, 현재 시간을 측정하기 위해 time 라이브러리를 사용해야 하는데요, 아래 코드를 보면서 현재 날짜, 시간이 들어간 폴더 생성 방법에 대해 알아보도록 하겠습니다. 먼저, 전체 코드를 보도록 하겠습니다. import time basic_dir = "c:\\test\\" #저장할 기본경로 n = time.localti.. 더보기
[데이터분석] 데이터프레임 : 특정 문자열 또는 데이터가 있는 행 출력하기 - contains() 데이터프레임에서 특정 문자열이나 다른 데이터가 있는 행만 따로 출력되어서 보이도록 하려면 어떻게 해야 할까요? 바로, 이를 도와주는 함수가 contains() 이라는 함수인데요, contains() 함수를 이용해서 특정 텍스트 또는 텍스트열이 있는 행만 출력할 수 있답니다. 아래의 코드를 보면서 자세히 설명하도록 하겠습니다. - contains() : 특정 문자 또는 문자열이 포함된 데이터 찾기 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. # itempricecount 0ice water10001 1milk20005 2ice coffee30002 3ade40001 4latte50003 5ice tea60002 만약 이 데이터프레임의 'item' 칼럼에서 'ice'라는 문자열이 포함되어 있는.. 더보기