|
|
@ -31,14 +31,14 @@ public class PaperCrawler {
|
|
|
|
// 科目
|
|
|
|
// 科目
|
|
|
|
private final String COURSE_ID = "likeshuxue";
|
|
|
|
private final String COURSE_ID = "likeshuxue";
|
|
|
|
// 110000 北京 | 310000 上海 | 500000 重庆 | 120100 天津 | 370000 山东 | 410000 河南 | 420000 湖北 | 320000 江苏 | 330000 浙江
|
|
|
|
// 110000 北京 | 310000 上海 | 500000 重庆 | 120100 天津 | 370000 山东 | 410000 河南 | 420000 湖北 | 320000 江苏 | 330000 浙江
|
|
|
|
// 140000 山西 | 350000 福建 | 340000 安徽
|
|
|
|
// 140000 山西 | 350000 福建 | 340000 安徽 | 220000 吉林
|
|
|
|
private final String AREA_ID = "340000";
|
|
|
|
private final String AREA_ID = "220000";
|
|
|
|
// 年份
|
|
|
|
// 年份
|
|
|
|
private final String YEAR = "2015";
|
|
|
|
private final String YEAR = "2016";
|
|
|
|
// 真题试卷 类型(1:真题试卷,2:模拟试卷,3:押题预测,4:名校精品)
|
|
|
|
// 真题试卷 类型(1:真题试卷,2:模拟试卷,3:押题预测,4:名校精品)
|
|
|
|
private final String PAPER_TYPE = "3";
|
|
|
|
private final String PAPER_TYPE = "4";
|
|
|
|
// 开始采集的URL
|
|
|
|
// 开始采集的URL
|
|
|
|
private final String START_URL = "https://tiku.baidu.com/tikupc/paperlist/1bfd700abb68a98271fefa04-16-2-2015-852-1-download";
|
|
|
|
private final String START_URL = "https://tiku.baidu.com/tikupc/paperlist/1bfd700abb68a98271fefa04-16-7-2016-909-1-download";
|
|
|
|
|
|
|
|
|
|
|
|
private RunData runData;
|
|
|
|
private RunData runData;
|
|
|
|
|
|
|
|
|
|
|
|