Go to file

hnu202111020131 6595ef66c8 ADD file via upload		4 years ago
README.md	代码.py	4 years ago
理科方向实验报告电科1班戚昊辉曹浩军.doc	ADD file via upload	4 years ago

README.md

Unescape Escape

import requests import json import urllib import os

头部信息可以拼接为字典形式

headers = { "User-Agent": "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36" }

使用 requests 的 get 请求

imgs = requests.get('https://pic.sogou.com/napi/pc/searchList?start=0&xml_len=2000&query=工程师',headers=headers,timeout=1) #使用 json.loads()函数，将json格式数据转换为字典， data = json.loads(imgs.text) print(data) #解析字典，获取资料至字典中 imgdatas = data['data']['items'] #创建图片链接的列表，用来存放页面图片的链接工程师 imgs_url = [] #遍历imgdatas，并将图片链接存放至imgs_url中 for imgdata in imgdatas: imgs_url.append(imgdata['oriPicUrl'])

print(imgs_url) #判断文件夹是否存在，存在则为True，不存在则为False a=os.path.exists('/root/imgs4/') print(a) #如果不存在则将创建 if not a: os.mkdir("/root/imgs4/") print(a) m=0 #下载20张图片 for img_url in imgs_url: #定义一个flag用于判断下载图片是否异常 flag=True try: #urlretrieve() 方法直接将远程数据下载到本地 urllib.request.urlretrieve(img_url, "/root/imgs4/" + str(m) + '.jpg') except BaseException: flag=False if(flag): #下载完成提示 print('**第'+str(m+1)+'张图片下载完成') #每下载完后一张,m累加一次 m = m + 1 #下载完成20张后，停止循环 if m==20: break print('下载完成!')#请在此处编写代码

README.md Unescape Escape

头部信息可以拼接为字典形式

使用 requests 的 get 请求

README.md

Unescape Escape