관리 메뉴

물 만날 물고기

[웹크롤링] 한글 URL 인코딩/디코딩 (URL Encoding/Decoding) 본문

웹 크롤링

[웹크롤링] 한글 URL 인코딩/디코딩 (URL Encoding/Decoding)

Lung Fish 2023. 2. 15. 17:08

🔍 예상 검색어

더보기

# 한글 URL 인코딩

# 한글을 URL 인코딩하기

# URL 인코딩 문자열 한글로 변환하기

# 한국어 URL 인코딩 변환하는 법

# URL 한국어 디코딩

# 파이썬 한글 URL 인코딩

# 파이썬 한글 URL 디코딩


 해당 포스팅은 웹 크롤링 시 한글 문자열을 URL 인코딩 하는 방법과 URL 인코딩된 문자를 한글로 디코딩 하는 방법에 대해서 정리하였습니다. 스크립트는 Chat-gpt3 plus 를 통해 도움받았습니다.

1. 한글 문자열을 URL 인코딩 하기 - quote

from urllib.parse import quote

# URL 인코딩할 문자열
original_string = '한글 문자열'

# 한글을 URL 인코딩합니다.
encoded_string = quote(original_string, safe='')

# 결과 출력
print('Original string:', original_string)
print('Encoded string:', encoded_string)

▼ 출력결과

 

 

2. URL 인코딩 문자를 한글 문자로 디코딩 하기 - unquote

from urllib.parse import unquote

# URL 디코딩할 문자열
encoded_string = '%ED%95%9C%EA%B8%80%20%EB%AC%B8%EC%9E%90%EC%97%B4'

# URL 인코딩된 문자열을 디코딩합니다.
decoded_string = unquote(encoded_string)

# 결과 출력
print('Encoded string:', encoded_string)
print('Decoded string:', decoded_string)

▼ 출력결과

 

 

3. quote(safe = ' ')  - safe 매개변수

3.1 original_string = '한글:인코딩:디코딩'

from urllib.parse import quote

# URL 인코딩할 문자열
original_string = '한글:인코딩:디코딩'

# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)

# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)

# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe="''"):', encoded_string3)

 

▼ 출력결과

 

 

3.2 original_string = ':'

from urllib.parse import quote

# URL 인코딩할 문자열
original_string = ':'

# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)

# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)

# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe='"''"'):', encoded_string3)

 

▼ 출력결과