导航
导航

First python demo

爬了一下周杰伦贴吧里一个精品图片贴,学习中,代码比较初级啦
代码奉上:

  • 2016-04-05 更新帖
    之前用的是urllib库,现在发现了一个更好更高级的工具库 requests库。所以优化了下我的代码demo

#encoding=utf8
__author__ = 'lingo'
#jay图片链接
import requests
import re
from bs4 import BeautifulSoup
page=1

#总共只有5页
while page<6:

#帖子路径(直接看楼主)
#url= "http://tieba.baidu.com/p/3542842663?see_lz=1&pn="+str(page)

payload = {'see_lz': '1', 'pn': page}
r = requests.get("http://tieba.baidu.com/p/3542842663", params=payload)

#request = urllib2.Request(r)
#response = urllib2.urlopen(request)
soup = BeautifulSoup(r.text)
code_div = soup.find_all(class_="d_post_content j_d_post_content clearfix")
for code in code_div:
#print code.prettify()

#获取jpg图片
code_img = code.find_all("img",src=re.compile("jpg"))
#print code_img
for image in code_img:
print "第"+str(page)+"页图片链接:",image["src"]

#queue.append(image["src"])
page = page + 1
else:
print("完成")
#写入记事本里
#with open('image.txt','w') as f:
#f.write(str(queue)+ '\n')

对了,是python2.7的