본문 바로가기

길이

[자연어처리] 패딩(Padding) : 길이 지정 방법 - maxlen (파이썬) 이전 글들에서 패딩을 하는 기본적인 방법과, 제로 패딩을 할 때 0을 뒤로 채우는 방법 등에 대해서 살펴보았는데요, 이번에는 패딩을 할 때, 길이를 지정하는 방법에 대해서 살펴보도록 하겠습니다. 먼저, 기본적으로 패딩을 하는 코드를 작성하고, 그 결과를 보겠습니다. import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer sentences = [['place', 'tree'], ['tree', 'nice', 'green'], ['nice', 'sky', 'and', 'tree'], ['bird', 'tree']] tokenizer= Tokenizer() tokenizer.fit_on_texts(sentences) encode.. 더보기
[파이썬] 문자열 길이 & 리스트 안 데이터 개수 구하기 - len() 문자열 길이나 리스트 안에 있는 데이터의 개수 및 크기를 구할 땐 len() 함수를 사용하면 되는데요, 아래 코드를 보면서 설명드리도록 하겠습니다. 1. 문자열 길이 구하기 먼저, 아래와 같은 텍스트가 있다고 가정하겠습니다. text1 = "안녕하세요! 디노랩스 블로그입니다." 이제 이 텍스트의 문자열 길이를 구하고 싶다면 len() 함수를 이용하여 아래와 같이 입력하면 됩니다. num = len(text1) print(num) 19 출력된 값을 보면 19로, 알맞게 문자열의 길이를 잘 구한 것을 확인할 수 있습니다. 이때 띄어쓰기도 한 글자로 포함이 된답니다. 2. 리스트 안에 있는 데이터 개수 구하기 반면, 리스트 안에 데이터가 몇 개 있는지도 len() 함수를 이용하여 구할 수 있는데요, 다음과 같.. 더보기
[파이썬] 리스트 길이만큼 for문 반복하기 코딩을 하다 보면, 리스트에 있는 데이터의 수만큼 for문을 반복하는 경우가 많은데요, 데이터 항목의 길이를 구하는 len() 함수를 이용하면 쉽게 표현할 수 있습니다 list1 = [15, 34, 64, 37, 83, 25, 62, 98, 46] 먼저, 위와 같이 9개의 숫자 데이터를 담고 있는 list1 가 있고, 이 리스트 안에 있는 값을 차례로 출력하고 싶다면 for문을 사용하면 되는데요, 이때 for문에는 반복할 범위(range)를 지정해주어야 합니다. 9번을 반복하면 되기 때문에 아래와 같이 코드를 작성해도 되지만, 데이터가 너무 많아 그 길이를 알 수 없을 수 있습니다. for i in range(9) : print(list1[i]) 따라서 len() 함수를 이용하면 되는데요, len() 함.. 더보기