웹 크롤링
[웹크롤링] 한글 URL 인코딩/디코딩 (URL Encoding/Decoding)
Lung Fish
2023. 2. 15. 17:08
🔍 예상 검색어
더보기
# 한글 URL 인코딩
# 한글을 URL 인코딩하기
# URL 인코딩 문자열 한글로 변환하기
# 한국어 URL 인코딩 변환하는 법
# URL 한국어 디코딩
# 파이썬 한글 URL 인코딩
# 파이썬 한글 URL 디코딩
해당 포스팅은 웹 크롤링 시 한글 문자열을 URL 인코딩 하는 방법과 URL 인코딩된 문자를 한글로 디코딩 하는 방법에 대해서 정리하였습니다. 스크립트는 Chat-gpt3 plus 를 통해 도움받았습니다.
1. 한글 문자열을 URL 인코딩 하기 - quote
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = '한글 문자열'
# 한글을 URL 인코딩합니다.
encoded_string = quote(original_string, safe='')
# 결과 출력
print('Original string:', original_string)
print('Encoded string:', encoded_string)
▼ 출력결과
2. URL 인코딩 문자를 한글 문자로 디코딩 하기 - unquote
from urllib.parse import unquote
# URL 디코딩할 문자열
encoded_string = '%ED%95%9C%EA%B8%80%20%EB%AC%B8%EC%9E%90%EC%97%B4'
# URL 인코딩된 문자열을 디코딩합니다.
decoded_string = unquote(encoded_string)
# 결과 출력
print('Encoded string:', encoded_string)
print('Decoded string:', decoded_string)
▼ 출력결과
3. quote(safe = ' ') - safe 매개변수
3.1 original_string = '한글:인코딩:디코딩'
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = '한글:인코딩:디코딩'
# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)
# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)
# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe="''"):', encoded_string3)
▼ 출력결과

3.2 original_string = ':'
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = ':'
# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)
# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)
# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe='"''"'):', encoded_string3)
▼ 출력결과