quant-on-volume/craw_data/dayline/easemoney_dayline.py

import sys
from download import download
import json
import time
import random

import pandas as pd
from tqdm import tqdm

request_params = [
    { "key":"rtntype",
      "value":"5",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"token",
      "value":"4f1862fc3b5e77c150a2b985b12db0fd",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"cb",
      "value":"jQuery1124036208821942748104_1574562443091",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"id",
      "value":"%s",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"type",
      "value":"k",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"authorityType",
      "value":"",
      "equals":True,
      "description":"",
      "enabled":True 
    },
      
    { "key":"_",
      "value":"1574509941411",
      "equals":True,
      "description":"",
      "enabled":True}
]
URI = "http://pdfm.eastmoney.com/EM_UBG_PDTI_Fast/api/js?"

for param in request_params:
    URI += '%s=%s&' % (param["key"], param["value"])

class EastMoneyDayLine(object):

    def __init__(self, end_date='00000000'):

        const_path = sys.path[0].replace("\\craw_data\\dayline", "")
        f = open(const_path + "\\const.json", "r", encoding="utf8")
        self.consts = json.loads(f.read())

        self.stock_list_file = self.consts['stock_list_file']                        # 全部股票信息的csv文件
        self.save_path_prefix = self.consts['day_line_file_prefix']['ease_money']    # 日线存储文件夹目录
        self.end_date = end_date                                                     # 截止日期
        self.codes = self.get_codes()

        self.downloader = download.Downloader()                                      # 下载器

    def craw_one(self, code):
        url = URI % self.process_code(code)
        content = self.handle_jsonp(self.downloader.requests_get(url, type="json").decode("utf8"))
        # print(content)
        data = json.loads(content)
        self.save_json_to_csv(data, code)

    def get_codes(self):
        try:
            df = pd.read_csv(self.stock_list_file, encoding="gbk", error_bad_lines=False)
        except:
            print("ERROR Opening File: %s" % self.stock_list_file)
            return False
        
        codes = []
        for index, row in df.iterrows():
            codes.append(row['股票代码'][1:])
        return codes

    def save_json_to_csv(self, data, code):
        realdata = data['data']
        f = open(self.save_path_prefix + str(code) + ".csv", "w", encoding="gbk")
        f.write(",".join(['日期', '开盘', '收盘', '最高', '最低', '成交量', '成交额', '振幅']))
        f.write("\n")
        for row in realdata[:-1]:
            if ("".join(row[:10].split("-")) < self.end_date): continue
            f.write(row[:-2])
            f.write("\n")
        f.close()

    def process_code(self, code):
        return '%s1' % code

    def handle_jsonp(self, response_content):
        return response_content[response_content.find("{"):-1]

    def check_is_downloaded(self, code):
        try:
            df = pd.read_csv(self.save_path_prefix + code + ".csv")
            return True
        except:
            return False
        

    def controller(self):
        for i in tqdm(range(len(self.codes))):
            code = self.codes[i]
            if (self.check_is_downloaded(code)) return 
            self.craw_one(code)
            time.sleep(random.random()*2)


if __name__ == "__main__":
    east_money_day_line = EastMoneyDayLine()
    east_money_day_line.controller()
    # east_money_day_line.craw_one(600175)      # test craw
bigdata 2 years ago			`import sys`
			`from download import download`
			`import json`
			`import time`
			`import random`

			`import pandas as pd`
			`from tqdm import tqdm`

			`request_params = [`
			`{ "key":"rtntype",`
			`"value":"5",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"token",`
			`"value":"4f1862fc3b5e77c150a2b985b12db0fd",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"cb",`
			`"value":"jQuery1124036208821942748104_1574562443091",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"id",`
			`"value":"%s",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"type",`
			`"value":"k",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"authorityType",`
			`"value":"",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True`
			`},`

			`{ "key":"_",`
			`"value":"1574509941411",`
			`"equals":True,`
			`"description":"",`
			`"enabled":True}`
			`]`
			`URI = "http://pdfm.eastmoney.com/EM_UBG_PDTI_Fast/api/js?"`

			`for param in request_params:`
			`URI += '%s=%s&' % (param["key"], param["value"])`

			`class EastMoneyDayLine(object):`

			`def __init__(self, end_date='00000000'):`

			`const_path = sys.path[0].replace("\\craw_data\\dayline", "")`
			`f = open(const_path + "\\const.json", "r", encoding="utf8")`
			`self.consts = json.loads(f.read())`

			`self.stock_list_file = self.consts['stock_list_file'] # 全部股票信息的csv文件`
			`self.save_path_prefix = self.consts['day_line_file_prefix']['ease_money'] # 日线存储文件夹目录`
			`self.end_date = end_date # 截止日期`
			`self.codes = self.get_codes()`

			`self.downloader = download.Downloader() # 下载器`

			`def craw_one(self, code):`
			`url = URI % self.process_code(code)`
			`content = self.handle_jsonp(self.downloader.requests_get(url, type="json").decode("utf8"))`
			`# print(content)`
			`data = json.loads(content)`
			`self.save_json_to_csv(data, code)`

			`def get_codes(self):`
			`try:`
			`df = pd.read_csv(self.stock_list_file, encoding="gbk", error_bad_lines=False)`
			`except:`
			`print("ERROR Opening File: %s" % self.stock_list_file)`
			`return False`

			`codes = []`
			`for index, row in df.iterrows():`
			`codes.append(row['股票代码'][1:])`
			`return codes`

			`def save_json_to_csv(self, data, code):`
			`realdata = data['data']`
			`f = open(self.save_path_prefix + str(code) + ".csv", "w", encoding="gbk")`
			`f.write(",".join(['日期', '开盘', '收盘', '最高', '最低', '成交量', '成交额', '振幅']))`
			`f.write("\n")`
			`for row in realdata[:-1]:`
			`if ("".join(row[:10].split("-")) < self.end_date): continue`
			`f.write(row[:-2])`
			`f.write("\n")`
			`f.close()`

			`def process_code(self, code):`
			`return '%s1' % code`

			`def handle_jsonp(self, response_content):`
			`return response_content[response_content.find("{"):-1]`

			`def check_is_downloaded(self, code):`
			`try:`
			`df = pd.read_csv(self.save_path_prefix + code + ".csv")`
			`return True`
			`except:`
			`return False`


			`def controller(self):`
			`for i in tqdm(range(len(self.codes))):`
			`code = self.codes[i]`
			`if (self.check_is_downloaded(code)) return`
			`self.craw_one(code)`
			`time.sleep(random.random()*2)`


			`if __name__ == "__main__":`
			`east_money_day_line = EastMoneyDayLine()`
			`east_money_day_line.controller()`
			`# east_money_day_line.craw_one(600175) # test craw`