利用Python获取网页是什么编码格式,这有利于在抓取数据时采用什么方式进行转换。以下是简单的代码片段:
#!/usr/bin/python #Filename:helloworld.py import urllib f=urllib.urlopen('http://www.kiccleaf.com').info() print f.getparam('charset')
输出结果:
UTF-8
静待花开,花开常有香相伴;倾听流水,流水总有乐相陪;有缘清风携舟涉碧水,无缘细雨伴君独自行。
利用Python获取网页是什么编码格式,这有利于在抓取数据时采用什么方式进行转换。以下是简单的代码片段:
#!/usr/bin/python #Filename:helloworld.py import urllib f=urllib.urlopen('http://www.kiccleaf.com').info() print f.getparam('charset')
输出结果:
UTF-8