본문 바로가기

문자열

[웹크롤링] 크롤링해서 얻은 텍스트, 앞 뒤 공백 제거하려면? - strip 크롤링을 하면 주로 텍스트를 추출하게 되는데요, 이때 추출한 텍스트 앞, 뒤로 공백이 같이 추출될 수 있습니다. 이러한 경우 공백을 제거한 뒤 저장하는 것이 나중에 분석 및 처리를 위해서도 좋은데요, 어떻게 하면 앞, 뒤 공백을 제거할 수 있는지 살펴보도록 하겠습니다. - strip() : 문자열 앞 뒤 공백 제거하기 먼저, 다음과 같이 뉴스 기사 제목을 크롤링해서 저장한 리스트가 있다고 가정해보겠습니다. news = [' KBS \'절반 억대연봉\' 사과에…나경원 "수신료인상 반대" ', ' SK하이닉스 성과급 불만에 최태원 "작년 연봉 전부 반납" 선언', " 안철수-금태섭 채널 열렸다…野 '계단식 단일화론' 급물살(종합)" , '與, 법관탄핵안 161명 공동발의…4일 국회통과 유력(종합) ', ' .. 더보기
[데이터분석] 데이터프레임 : 특정 문자열 또는 데이터가 있는 행 출력하기 - contains() 데이터프레임에서 특정 문자열이나 다른 데이터가 있는 행만 따로 출력되어서 보이도록 하려면 어떻게 해야 할까요? 바로, 이를 도와주는 함수가 contains() 이라는 함수인데요, contains() 함수를 이용해서 특정 텍스트 또는 텍스트열이 있는 행만 출력할 수 있답니다. 아래의 코드를 보면서 자세히 설명하도록 하겠습니다. - contains() : 특정 문자 또는 문자열이 포함된 데이터 찾기 먼저, 아래와 같은 데이터프레임이 있다고 가정해보겠습니다. # itempricecount 0ice water10001 1milk20005 2ice coffee30002 3ade40001 4latte50003 5ice tea60002 만약 이 데이터프레임의 'item' 칼럼에서 'ice'라는 문자열이 포함되어 있는.. 더보기
[파이썬] TypeError: 'str' object cannot be interpreted as an integer 에러 발생 이유 및 해결 방법은? TypeError: 'str' object cannot be interpreted as an integer라는 에러가 발생했다면 사용한 데이터의 타입을 한 번 확인해보는 게 좋은데요, 에러 내용에서 알 수 있듯이, 문자열 데이터를 정수형처럼 사용했을 때 나타나는 오류입니다. 예를 들어, '3' 이라는 변수가 있고, 이를 정수형 타입으로 여겨 연산을 하도록 실행했는데, '3'이 정수형(integer) 데이터가 아닌 문자열(str) 데이터였다면 위와 같은 에러가 발생하게 되는 것입니다. 따라서 만약 TypeError: 'str' object cannot be interpreted as an integer 에러가 발생했다면, 정수형 데이터라고 생각했던 데이터가 문자열 데이터는 아닌지 타입을 확인해보시기 바랍니.. 더보기
[파이썬] 문자열 길이 & 리스트 안 데이터 개수 구하기 - len() 문자열 길이나 리스트 안에 있는 데이터의 개수 및 크기를 구할 땐 len() 함수를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 문자열 길이 구하기 먼저, 아래와 같은 텍스트가 있다고 가정하겠습니다. text1 = "안녕하세요! 디노랩스 블로그입니다." 이제 이 텍스트의 문자열 길이를 구하고 싶다면 len() 함수를 이용하여 아래와 같이 입력하면 됩니다. num = len(text1) print(num) 19 출력된 값을 보면 19로, 알맞게 문자열의 길이를 잘 구한 것을 확인할 수 있습니다. 이때 띄어쓰기도 한 글자로 포함이 된답니다. 2. 리스트 안에 있는 데이터 개수 구하기 반면, 리스트 안에 데이터가 몇 개 있는지도 len() 함수를 이용하여 구할 수 있는데요, 다음과 같.. 더보기
[파이썬] 정수 데이터로 입력 받기 - int(), input() 데이터를 입력받을 때, iput() 함수를 사용하는데요, input 함수로 입력받은 데이터는 모두 문자형 타입을 갖습니다. 따라서 숫자를 입력받아도 문자형 타입이기 때문에 연산 등이 안 되는데요, 이를 해결하는 방법이 int()와 input() 함수를 함께 사용하는 것입니다. - 정수 데이터로 입력 받기 int() 함수는 데이터를 정수형 데이터로 바꿔주는 함수인데요, 정수 데이터로 입력받으려면 다음과 같이 int()와 input() 을 함께 사용하면 됩니다. num = int(input("텍스트를 입력하세요 : ")) print(num, type(num)) 텍스트를 입력하세요 : 3 3 이 결과를 보면, 입력한 텍스트 '3' 이 정수형 타입임을 확인할 수 있습니다. 이렇게 정수형으로 입력받는 방법이 매우.. 더보기
[파이썬] 문자열 모두 소문자 or 대문자로 바꾸는 방법 - lower, upper lower() 함수와 upper() 함수를 이용하여 문자열을 모두 소문자 또는 대문자로 바꿀 수 있는데요, 아래 코드를 보며 설명드리도록 하겠습니다. 1. lower() lower() 함수는 문자열에 있는 문자를 모두 소문자로 바꿔주는 함수로, str.lower() 처럼 코드를 입력하면 됩니다. str1 = "Hello! How are you?" str_low = str1.lower() print(str_low) 'hello! how are you?' 위 코드를 보면 문자열 str1 이 모두 소문자로 변경된 것을 확인할 수 있습니다. 2. upper() 반면, upper() 함수는 문자열에 있는 문자를 모두 대문자로 바꿔주는 함수로, str.upper() 과 같이 입력하면 됩니다. str1 = "Hell.. 더보기
[파이썬] 문자열, 공백/빈칸 기준으로 나누기, 횟수 지정 - split split() 함수는 문자열에서 특장 문자를 기준으로 좌, 우로 끊은 뒤, 리스트로 반환해주는 함수인데요, str.split('기준문자') 처럼 코드를 입력하면 됩니다. 이때 기준문자는 사라집니다. 한편, '기준문자'를 공백/빈칸(" ") 으로 입력하면 공백 기준으로 문자열을 나눌 수 있게 되는데요, 다음과 같이 코드를 입력하면 됩니다. str1 = '홍길동 010-1234-1234 서울종로구 남' str1_list = str1.split(" ") print(str1_list) ['홍길동', '010-1234-1234', '서울종로구', '남'] 위 결과를 보면 빈칸 기준으로 문자열이 나누어진 것을 확인할 수 있습니다. 한편, split(" ") 은 모든 " "에 대해서 나누어졌는데, 한 번만 적용시켜야.. 더보기
[파이썬] replace 함수, 2번만 적용 시키려면? 적용 횟수 지정 방법 replace() 함수는 문자열 데이터에서 중간에 특정 문자 또는 문자열을 다른 문자(or 공백)로 대체한다는 점에서 변경(or 삭제)에 사용되는데요, 문자열 안에 모든 동일 문자에 적용되는지, 또 몇 번만 적용시킬 수 있는지 아래의 코드를 보면서 설명하도록 하겠습니다. str1 = "나는 커피를 마시고 싶어요! 커피 한 잔 주세요. 커피는 얼마인가요?" new_str = str1.replace("커피", "차") print(new_str) '나는 차를 마시고 싶어요! 차 한 잔 주세요. 차는 얼마인가요?' str1을 보면 '커피'라는 문자가 세 번이나 들어가고, replace()를 통해 3개의 문자가 모두 '차'로 변경되었습니다. 즉, replace() 함수는 동일 문자에 대해서 일괄적으로 적용이 되는.. 더보기
[파이썬] 문자열에서 중간 문자를 삭제하는 방법 - replace 문자열 형태의 데이터에서 중간에 특정 문자 또는 문자열을 삭제하고 싶다면 replace 함수를 사용하면 되는데요, 아래 코드를 함께 보도록 하겠습니다. - replace() replace() 함수는 str.replace("바꾸기전문자","바꿀문자") 와 같이 사용할 수 있는데요, "바꿀문자" 부분에 공백("") 으로 입력하면 해당 문자를 삭제할 수 있습니다. str1 = "aaabbbfffcccddd" 다음과 같은 문자열 str1이 있다고 가정할 때, 가운데 'fff' 부분을 지우고 싶다면 replace() 를 이용하여 아래와 같이 코드를 작성하면 됩니다. new_str = str1.replace("fff", "") print(new_str) 'aaabbbcccddd' 바꾸기 전 문자를 "fff", 바꿀.. 더보기
[파이썬] 문자를 다른 문자로 바꾸려면? - replace 데이터를 처리할 때, 문자열에서 특정 문자를 다른 문자로 바꾸거나 내용을 바꾸고 싶을 때, replace() 함수를 사용하면 됩니다. replace 함수는 str.replace("바꾸고싶은문자", "바꿀문자") 의 형식으로 코드를 입력하면 되는데요, 아래 예시를 보도록 하겠습니다. str1 = "나는 커피를 마시고 싶어요!" 만약 위와 같은 문자열 str1 이 있고, 문자열에서 '커피'를 '차'로 바꾸고 싶다면 아래와 같이 코드를 작성하면 됩니다. new_str = str1.replace("커피", "차") print(new_str) '나는 차를 마시고 싶어요!' 위 결과를 보면, "커피" 라는 문자가 "차"로 변경되었음을 볼 수 있습니다. 그렇다면, 문자열에 '커피' 라는 문자가 여러 번 있고, rep.. 더보기