Commit Graph

61 Commits (ddcf3951458b7ba1ecd5382dbf37050cc56236aa)
 

Author SHA1 Message Date
wufayuan ddcf395145 将爬虫采集器替换并嵌入合并到系统中,大幅度提高爬取速度
2 years ago
wufayuan 13bcb4a915 重写了爬虫采集器,弃用selnium,爬取手机端知网,多线程爬取
2 years ago
wufayuan 60f93c0f0e 重写了爬虫,弃用selnium,爬取手机端知网,多线程爬取
2 years ago
wufayuan ad427ef9bc 最后一次正确的测试
2 years ago
wufayuan 3c186535e9 基本功能初步完成,优化:取消一条一条写入数据库,任务结果爬取完毕后一次性写入数据库;优化分布式集群;优化系统参数配置,只需要在settings.ini里改就行;优化任务分发模块,若当前接收任务太多,多出的任务将处于等待状态,当分布式节点或服务器爬虫出现空闲的时候等待状态的任务才开始运行
2 years ago
wufayuan f4aedd9cfd 基本功能初步完成,优化:取消一条一条写入数据库,任务结果爬取完毕后一次性写入数据库;优化分布式集群;优化系统参数配置,只需要在settings.ini里改就行;优化任务分发模块,若当前接收任务太多,多出的任务将处于等待状态,当分布式节点或服务器爬虫出现空闲的时候等待状态的任务才开始运行
2 years ago
wufayuan 27899262f5 基本功能初步完成,优化:取消一条一条写入数据库,任务结果爬取完毕后一次性写入数据库;优化分布式集群;优化系统参数配置,只需要在settings.ini里改就行;优化任务分发模块,若当前接收任务太多,多出的任务将处于等待状态,当分布式节点或服务器爬虫出现空闲的时候等待状态的任务才开始运行
2 years ago
wufayuan ff11f3bfc1 基本功能初步完成
2 years ago
wufayuan 06e1f4c565 重写了connect通信程序与服务器通信系统,彻底重写了终端节点集群,对整个系统进行了较大幅度的优化,优化集群为多进程,增加轮询间隔,小优化
2 years ago
wufayuan 58c2162918 重写了connect通信程序与服务器通信系统,彻底重写了终端节点集群,对整个系统进行了较大幅度的优化,优化集群为多进程,增加轮询间隔
2 years ago
wufayuan f7c0dd043d 重写了connect通信程序与服务器通信系统,彻底重写了终端节点集群,对整个系统进行了较大幅度的优化
2 years ago
wufayuan ae894c1fc0 重写了connect通信程序与服务器通信系统,彻底重写了终端节点集群,对整个系统进行了较大幅度的优化
2 years ago
wufayuan 4fbc6cc294 重写了connect通信程序与服务器通信系统,目前可用性应当大幅提升,运行情况正常
2 years ago
wufayuan 2f4fa14b2b 重写了connect通信程序与服务器通信系统,目前可用性应当大幅提升,运行情况正常
2 years ago
wufayuan b681c1b92d 也许可以运行了
2 years ago
wufayuan 592d6f9941 较为完整的代码
2 years ago
wufayuan 846d44206e 较为完整的代码
2 years ago
wufayuan 39cbef6fe5 较为完整的代码
2 years ago
wufayuan 5ffd4fd363 较为完整的代码
2 years ago
wufayuan 1757411834 较为完整的代码
2 years ago
wufayuan da9136e30d 较为完整的
2 years ago
wufayuan 89f513ef95 重新上传了爬虫服务器程序结构图
3 years ago
wufayuan 9bd7cbcc9d 重新上传了爬虫服务器程序结构图
3 years ago
wufayuan 1df39c735e 重新上传了爬虫服务器程序结构图
3 years ago
wufayuan df874efba1 完善readme
3 years ago
wufayuan db0776ae56 完善readme
3 years ago
wufayuan a25f843862 完善readme
3 years ago
wufayuan 5702c8e9f5 完善readme
3 years ago
wufayuan f3588e82ac 完善readme
3 years ago
wufayuan 656ead319e 完善readme
3 years ago
wufayuan b1a90b646c 重构了整个项目,使之更符合“多个系统-相互协同”的模型,同时,实现了爬虫任务系统及其分发与远程和本地结果组合。多系统采用轮询的方式,一旦接受任务就开启对应的执行线程,整个系统得以真正实现多用户同时访问。此外,完善了cookie机制,包括用户认证与识别,完善了从数据库中提取数据并组合,完善了多系统协调机制,初步实现了客户端的初始代码等等
3 years ago
wufayuan a1a73aa412 初步完成服务器向多个客户端递交爬虫请求,客户端返回爬虫结果到全局外部变量
3 years ago
wufayuan 64a607e50b 梳理了项目结构
3 years ago
wufayuan e69f4ea071 初步完善了服务器中存在的“当前用户信息表”,以及保存它的外部变量,同时修缮了数据库处理,以及提供了cookie认证机制,经过初步验证;此外初步实现了爬虫任务分发功能,还未验证,因为需要改写客户端文件。
3 years ago
wufayuan 3d8e40bb5e 进一步完善同时请求登陆注册等用户相关情况
3 years ago
wufayuan 0c45592b8f 进一步完善爬取结果写入数据库
3 years ago
wufayuan 2dbf99feda 进一步完善爬取结果写入数据库
3 years ago
wufayuan 9501253095 完善爬取结果写入数据库
3 years ago
wufayuan 36e16a99ba 完善爬取结果写入数据库
3 years ago
wufayuan d551d46612 实现web服务器向爬虫服务器通信,请求登录和注册,以及丰富了两者之间的通信类型
3 years ago
wufayuan d85e78127c 实现web服务器向爬虫服务器通信,请求登录和注册,以及丰富了两者之间的通信类型
3 years ago
wufayuan eb4dec2e7b 实现web服务器向爬虫服务器通信,请求登录和注册,以及丰富了两者之间的通信类型
3 years ago
wufayuan 1a9e10313a 实现web服务器向爬虫服务器通信,请求登录和注册,以及丰富了两者之间的通信类型
3 years ago
wufayuan 888089ca40 将ui服务器初步写成,实现与爬虫服务器基本通信
3 years ago
p3t2ja9zs b51f5cbf93 Merge pull request '爬虫' (#3) from developer_wufayuan into master
3 years ago
wufayuan 673fa7aa41 将爬虫写了一部分,但还未实现服务器向客户端分发任务
3 years ago
p3t2ja9zs 28453d0077 Merge pull request '基本爬虫' (#2) from developer_wufayuan into master
3 years ago
wufayuan 271dda7b12 实现基本爬虫功能, 爬取知网数据
3 years ago
dellpc b1a979b148 数据库注册登录的基本框架
3 years ago
dellpc ddcd0f4da9 database
3 years ago