|
|
4 years ago | |
|---|---|---|
| README.md | 4 years ago | |
| 理科方向实验报告 电科1班戚昊辉曹浩军.doc | 4 years ago | |
README.md
import requests import json import urllib import os
头部信息可以拼接为字典形式
headers = { "User-Agent": "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36" }
使用 requests 的 get 请求
imgs = requests.get('https://pic.sogou.com/napi/pc/searchList?start=0&xml_len=2000&query=工程师',headers=headers,timeout=1) #使用 json.loads()函数,将json格式数据转换为字典, data = json.loads(imgs.text) print(data) #解析字典,获取资料至字典中 imgdatas = data['data']['items'] #创建图片链接的列表,用来存放页面图片的链接工程师 imgs_url = [] #遍历imgdatas,并将图片链接存放至imgs_url中 for imgdata in imgdatas: imgs_url.append(imgdata['oriPicUrl'])
print(imgs_url) #判断文件夹是否存在,存在则为True,不存在则为False a=os.path.exists('/root/imgs4/') print(a) #如果不存在则将创建 if not a: os.mkdir("/root/imgs4/") print(a) m=0 #下载20张图片 for img_url in imgs_url: #定义一个flag用于判断下载图片是否异常 flag=True try: #urlretrieve() 方法直接将远程数据下载到本地 urllib.request.urlretrieve(img_url, "/root/imgs4/" + str(m) + '.jpg') except BaseException: flag=False if(flag): #下载完成提示 print('**第'+str(m+1)+'张图片下载完成') #每下载完后一张,m累加一次 m = m + 1 #下载完成20张后,停止循环 if m==20: break print('下载完成!')#请在此处编写代码