欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python爬虫,请求地址中包含中文字符的解决办法

程序员文章站 2024-01-27 08:06:46
...
比如
r=requests.get('www.xxx.com/?city=上海')

这时候可能会导致urlerror,之所以说可能,是因为有的网站后台可能有转码机制,特别是大网站,他们会把地址做一次转码。

对于那些没有做转码的站,则需要自己先转码,转成类似于这种:

'%E4%B8%8A%E6%B5%B7'   ‘上海’

这是中文字符的编码格式,16进制表示

所用到的包是

from urllib import parse

代码如下

from urllib import parse
url='www.xxx.com/?city={}'.format(parse.quote('上海'))
r=requests.get(url)

www.xxx.com/?city=%E4%B8%8A%E6%B5%B7





相关标签: python 爬虫