python爬虫—-谈requests下HTTPS页面乱码问题

日前,为了获取该页面信息,resp.text输出总是乱码。

在次期间找了很多资料。用过来urlopen等等,都是乱码。

最后,设置resp.encoding = ‘UTF-8’才正确解码。

1.如以下页面直接输出会导致乱码
url = 'https://www.zdaye.com/dayProxy.html?tdsourcetag=s_pcqq_aiomsg'
resp = requests.get(url,headers=self.head,verify=False)
print(resp.text)
2.使用以下方法可以顺利解码
url = 'https://www.zdaye.com/dayProxy.html?tdsourcetag=s_pcqq_aiomsg'
resp = requests.get(url,headers=self.head,verify=False)
# 方法一
resp.encoding = 'utf-8'
print(resp.text)

# 方法二
# 对https页面界解码
# text = resp.content.decode("utf-8")
# print(text)
# print(resp.content.decode("utf-8"))

 

文章已创建 60

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部