|  |      1liubo      2013-03-24 15:42:56 +08:00 c = urllib2.urlopen('http://tieba.baidu.com/p/2163299007').read() soup = BeautifulSoup(c,fromEncoding="gbk") title = soup('title')[0].string print title | 
|  |      2polythene      2013-03-24 15:54:45 +08:00 soup('title')[0].get_text()是一unicode串,然后可以encode为各种编码 | 
|      3nkliwenjian      2013-03-24 22:14:55 +08:00 我只是来吐槽一下的。抛开1楼的fromEncoding不谈,只谈编程思路。 c = urllib2.urlopen('http://tieba.baidu.com/p/2163299007') c是最原始的输入,如果需要编码解码的话应该是在原始输入这里来进行,跑那么后进行干嘛? 完全可以先c.read().decode('gbk').encode('utf-8'),再放到BeautifulSoup里面去处理 | 
|  |      4shlzs123      2013-06-20 09:23:57 +08:00 您好,我是饿了么的招聘顾问,请问您投递的简历邮箱地址是多少?我会特别关注一下。 | 
|      5Elwin OP @shlzs123 [email protected],我大概是前天发的邮件吧:-)~ |