본문 바로가기

공백

[웹크롤링] 크롤링해서 얻은 텍스트, 앞 뒤 공백 제거하려면? - strip 크롤링을 하면 주로 텍스트를 추출하게 되는데요, 이때 추출한 텍스트 앞, 뒤로 공백이 같이 추출될 수 있습니다. 이러한 경우 공백을 제거한 뒤 저장하는 것이 나중에 분석 및 처리를 위해서도 좋은데요, 어떻게 하면 앞, 뒤 공백을 제거할 수 있는지 살펴보도록 하겠습니다. - strip() : 문자열 앞 뒤 공백 제거하기 먼저, 다음과 같이 뉴스 기사 제목을 크롤링해서 저장한 리스트가 있다고 가정해보겠습니다. news = [' KBS \'절반 억대연봉\' 사과에…나경원 "수신료인상 반대" ', ' SK하이닉스 성과급 불만에 최태원 "작년 연봉 전부 반납" 선언', " 안철수-금태섭 채널 열렸다…野 '계단식 단일화론' 급물살(종합)" , '與, 법관탄핵안 161명 공동발의…4일 국회통과 유력(종합) ', ' .. 더보기
[파이썬] 문자열, 공백/빈칸 기준으로 나누기, 횟수 지정 - split split() 함수는 문자열에서 특장 문자를 기준으로 좌, 우로 끊은 뒤, 리스트로 반환해주는 함수인데요, str.split('기준문자') 처럼 코드를 입력하면 됩니다. 이때 기준문자는 사라집니다. 한편, '기준문자'를 공백/빈칸(" ") 으로 입력하면 공백 기준으로 문자열을 나눌 수 있게 되는데요, 다음과 같이 코드를 입력하면 됩니다. str1 = '홍길동 010-1234-1234 서울종로구 남' str1_list = str1.split(" ") print(str1_list) ['홍길동', '010-1234-1234', '서울종로구', '남'] 위 결과를 보면 빈칸 기준으로 문자열이 나누어진 것을 확인할 수 있습니다. 한편, split(" ") 은 모든 " "에 대해서 나누어졌는데, 한 번만 적용시켜야.. 더보기
[파이썬] 문자열에서 중간 문자를 삭제하는 방법 - replace 문자열 형태의 데이터에서 중간에 특정 문자 또는 문자열을 삭제하고 싶다면 replace 함수를 사용하면 되는데요, 아래 코드를 함께 보도록 하겠습니다. - replace() replace() 함수는 str.replace("바꾸기전문자","바꿀문자") 와 같이 사용할 수 있는데요, "바꿀문자" 부분에 공백("") 으로 입력하면 해당 문자를 삭제할 수 있습니다. str1 = "aaabbbfffcccddd" 다음과 같은 문자열 str1이 있다고 가정할 때, 가운데 'fff' 부분을 지우고 싶다면 replace() 를 이용하여 아래와 같이 코드를 작성하면 됩니다. new_str = str1.replace("fff", "") print(new_str) 'aaabbbcccddd' 바꾸기 전 문자를 "fff", 바꿀.. 더보기
[데이터분석] strip/lstrip/rstrip 문자열 공백 제거하기 데이터 분석을 할 때, 전처리 하기 전 문자열 데이터의 경우 " abc", "abc ", " abc " 와 같이 공백이 포함되어 있는 경우가 있는데요, 이러한 공백은 strip(), lstrip(), rstrip() 함수를 이용하여 제거할 수 있습니다. 1. strip() 첫 번째로 strip 함수는 문자열 기준 양쪽 공백을 모두 제거하는 함수로, 아래와 같이 사용할 수 있습니다. str1 = " abc " print(str1.strip()) 'abc' 위 결과를 보면, 문자 'abc' 좌우에 있던 공백이 사라졌음을 확인할 수 있습니다. 2. lstrip() & rstrip() 한편, lstrip 함수는 문자열 왼쪽에 있는 공백만 제거하는 함수이고, rstrip 은 문자열 오른쪽에 있는 공백만 제거하는 .. 더보기