Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- HackerRank
- 코딩테스트
- python
- 데이터분석솔루션
- leetcode
- pyinstaller
- SQL
- pandas
- 텐서플로우
- 판다스
- KNIME
- 물 만날 물고기
- power-bi
- MYSQL
- 파이썬
- 데이터프레임
- Revising the Select Query II
- sklearn
- 해커랭크
- 프로그래머스
- 나임
- KNIME 데이터 분석
- 코랩
- DB
- 물만날물고기
- colab
- Tableau
- sorted()
- 태블로
- 리스트
Archives
- Today
- Total
물 만날 물고기
[웹크롤링] 한글 URL 인코딩/디코딩 (URL Encoding/Decoding) 본문
🔍 예상 검색어
더보기
# 한글 URL 인코딩
# 한글을 URL 인코딩하기
# URL 인코딩 문자열 한글로 변환하기
# 한국어 URL 인코딩 변환하는 법
# URL 한국어 디코딩
# 파이썬 한글 URL 인코딩
# 파이썬 한글 URL 디코딩
해당 포스팅은 웹 크롤링 시 한글 문자열을 URL 인코딩 하는 방법과 URL 인코딩된 문자를 한글로 디코딩 하는 방법에 대해서 정리하였습니다. 스크립트는 Chat-gpt3 plus 를 통해 도움받았습니다.
1. 한글 문자열을 URL 인코딩 하기 - quote
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = '한글 문자열'
# 한글을 URL 인코딩합니다.
encoded_string = quote(original_string, safe='')
# 결과 출력
print('Original string:', original_string)
print('Encoded string:', encoded_string)
▼ 출력결과
2. URL 인코딩 문자를 한글 문자로 디코딩 하기 - unquote
from urllib.parse import unquote
# URL 디코딩할 문자열
encoded_string = '%ED%95%9C%EA%B8%80%20%EB%AC%B8%EC%9E%90%EC%97%B4'
# URL 인코딩된 문자열을 디코딩합니다.
decoded_string = unquote(encoded_string)
# 결과 출력
print('Encoded string:', encoded_string)
print('Decoded string:', decoded_string)
▼ 출력결과
3. quote(safe = ' ') - safe 매개변수
3.1 original_string = '한글:인코딩:디코딩'
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = '한글:인코딩:디코딩'
# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)
# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)
# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe="''"):', encoded_string3)
▼ 출력결과
3.2 original_string = ':'
from urllib.parse import quote
# URL 인코딩할 문자열
original_string = ':'
# safe 매개변수를 생략하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string1 = quote(original_string)
print('Encoded string (without safe):', encoded_string1)
# safe 매개변수에 ':' 문자를 지정하여 URL 인코딩합니다. ':' 문자는 인코딩하지 않습니다.
encoded_string2 = quote(original_string, safe=':')
print('Encoded string (with safe):', encoded_string2)
# safe 매개변수에 ' ' 여백을 지정하여 URL 인코딩합니다. 모든 문자가 인코딩됩니다.
encoded_string3 = quote(original_string, safe='')
print('Encoded string (with safe='"''"'):', encoded_string3)
▼ 출력결과
'웹 크롤링' 카테고리의 다른 글
[웹 크롤링] - Youtube playlist 재생목록 크롤링 + openpyxl로 제목에 하이퍼링크 연결하여 엑셀 파일로 추출하기 (feat. BANGTANTV-'Seven' playlist) (2) | 2023.07.20 |
---|