hnqm_helper/get_info.py

from DrissionPage import WebPage
from DrissionPage.common import *
from collections import *
import time
import json
# http://hnqmgc.17el.cn/grzx/

def decode(s):
    return json.loads('"%s"' %s) # 由于页面源码中的json字符串是单引号包裹的，所以需要转换成双引号包裹的json字符串
# 创建页面对象，并启动或接管浏览器
page = WebPage()
# 跳转到登录页面
page.get('http://hnqmgc.17el.cn/grzx/',retry=5,timeout=5,interval=1)

# 定位到账号文本框，获取文本框元素
ele = page.ele('#userName') # #的意思是通过id定位元素
# 输入对文本框输入账号
ele.input('51140220050507901X')
# 定位到密码文本框并输入密码
page.ele('#password').input('hnqm123456')
# 定位到验证码文本框并输入验证码
inpcode = page.ele('#yzcode').text # 湖南青马太可爱了吧，验证码居然直接放在页面源码里:)
page.ele('#inpcode').input(inpcode)
# 点击登录按钮
page.ele('#btnLogin').click()
# 进入课程页面
page.ele('.wxtsBox-button').click() # 关闭提示页面
page.ele('#login_btn').click()
page.ele('@value=进入个人中心').click()
# 提取课程信息
time.sleep(2)
page.ele('@value=0').click()
# 获取总页数
course_info = {}
# <div class="paginationjs-nav J-paginationjs-nav">1 / 4</div>
# total_page = int(page.ele('.paginationjs-nav J-paginationjs-nav').text)
total_page = 4
for i in range(total_page):
    # 逐页读取课程信息和完成状态并存放到字典中
    tbodys = page.ele('#tbody')
    # 获取tbody下的所有tr
    trs = tbodys.eles('tag:tr')
    for tr in trs:
        cur_info = tr.text.split('\t')
        course_id = cur_info[0]  # 课程id
        course_type = cur_info[2] # 课程类型
        course_rate = int(cur_info[3][:-1])  # 课程完成百分比
        course_status = cur_info[4]  # 课程完成状态(是否完成习题/评价)
        print(course_id, course_rate, course_status)
        # 存放到字典中
        course_info[course_id] = {'rate': course_rate,'type': course_type,'status': course_status}
    if i != total_page - 1:
        page.ele('@title=Next page').click()
        time.sleep(1)
print(len(course_info))
# 写入json文件中
with open('course_info.json', 'w') as f:
    json.dump(course_info, f)
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								from DrissionPage import WebPage
 								from DrissionPage.common import *
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								from collections import *
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								import time
 								import json
 								# http://hnqmgc.17el.cn/grzx/
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								def decode(s):
 								    return json.loads('"%s"' %s) # 由于页面源码中的json字符串是单引号包裹的，所以需要转换成双引号包裹的json字符串
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								# 创建页面对象，并启动或接管浏览器
 								page = WebPage()
 								# 跳转到登录页面
-													modified:   course_info.json
	modified:   get_info.py
	new file:   single_course.py

											
										
										
											9 months ago
+								page.get('http://hnqmgc.17el.cn/grzx/',retry=5,timeout=5,interval=1)
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
 								# 定位到账号文本框，获取文本框元素
 								ele = page.ele('#userName') # #的意思是通过id定位元素
 								# 输入对文本框输入账号
 								ele.input('51140220050507901X')
 								# 定位到密码文本框并输入密码
 								page.ele('#password').input('hnqm123456')
 								# 定位到验证码文本框并输入验证码
 								inpcode = page.ele('#yzcode').text # 湖南青马太可爱了吧，验证码居然直接放在页面源码里:)
 								page.ele('#inpcode').input(inpcode)
 								# 点击登录按钮
 								page.ele('#btnLogin').click()
 								# 进入课程页面
 								page.ele('.wxtsBox-button').click() # 关闭提示页面
 								page.ele('#login_btn').click()
 								page.ele('@value=进入个人中心').click()
 								# 提取课程信息
 								time.sleep(2)
 								page.ele('@value=0').click()
 								# 获取总页数
 								course_info = {}
 								# <div class="paginationjs-nav J-paginationjs-nav">1 / 4</div>
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								# total_page = int(page.ele('.paginationjs-nav J-paginationjs-nav').text)
 								total_page = 4
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								for i in range(total_page):
 								    # 逐页读取课程信息和完成状态并存放到字典中
 								    tbodys = page.ele('#tbody')
 								    # 获取tbody下的所有tr
 								    trs = tbodys.eles('tag:tr')
 								    for tr in trs:
 								        cur_info = tr.text.split('\t')
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								        course_id = cur_info[0]  # 课程id
 								        course_type = cur_info[2] # 课程类型
 								        course_rate = int(cur_info[3][:-1])  # 课程完成百分比
 								        course_status = cur_info[4]  # 课程完成状态(是否完成习题/评价)
 								        print(course_id, course_rate, course_status)
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								        # 存放到字典中
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								        course_info[course_id] = {'rate': course_rate,'type': course_type,'status': course_status}
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								    if i != total_page - 1:
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								        page.ele('@title=Next page').click()
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago
+								        time.sleep(1)
 								print(len(course_info))
-													new file:   course_info.json
	modified:   demo.py
	renamed:    main.py -> get_info.py
	new file:   kill_course.py

											
										
										
											9 months ago
+								# 写入json文件中
 								with open('course_info.json', 'w') as f:
 								    json.dump(course_info, f)
-													new file:   demo.py
	new file:   main.py

											
										
										
											9 months ago