代码拉取完成,页面将自动刷新
同步操作将从 PeaceXie/Wepy 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
命令行-运行参数
pynews.py <city|id> <link|cont|0|auto> [test]
argv[0] : 运行文件
argv[1] : 城市(eg.dg)或规则id(eg.1024)或数据id(eg.5678)或不限(eg.0)
argv[2] : link:采集网址, cont:采集详情, 0:link+cont, auto:备用
argv[3] : 可选, 不为空即当成`test`模式,测试规则不保存到数据库
eg:
- pynews.py 1025 link test --- 测试-规则id=1025 的列表规则
- pynews.py dg link --- 采集-所有dg规则 的网址
- pynews.py 1024 link --- 采集-规则id=1024 的网址
- pynews.py 1024 cont test --- 测试-规则id=1024 的详情规则
- pynews.py dg cont --- 采集-所有dg规则 的详情
- pynews.py 1024 cont --- 采集-规则id=1024 的详情
- pynews.py 5678 rowc test --- 测试-数据id=5678 的详情规则
- pynews.py 5678 rowc --- 采集-数据id=5678 的详情规则
- pynews.py 0 0 --- 采集所有 - 网址和详情
/trunk/app/
/trunk/app/libs/
/trunk/views/front/npa/
生活是艰难的:甚至需要爬……
Weipa, Weipy, Wepy, 微爬 …… 又是失眠中名字出来了! 但是:微爬(Wepy),尽量让您轻松愉快的爬知识,爬价值,爬乐趣!
微爬(Wepy,Wepthon):是一款轻量、免费、共享的通用Python微框架;适用于CMS开发,爬虫开发!
基于 Python, Flask/Blueprint/jinja, Mysql/Sqlite, PyQuery 等开源模块开发
基于Blueprint分组扩展,基于MKV的控制器/方法扩展
环境需求:Python3+, Flask(Jinja2,Werkzeug), Mysql/Sqlite, PyQuery
环境安装
安装Mysql数据库(爬虫要用)
配置应用
[cdb]
相关参数运行应用
appcfg.ini
配置中修改) /branches/ --- Porsonal Test Code!
- /ex100/
- /ex200/
- /hipy/
/trunk/_cache/ --- 缓存目录
/trunk/app/ --- 微爬(Wepy)
- /ctrls/ - 控制器
- /data/ - db, config
- /static/ - js,css 资源
- /views/ - 模板
- /web.py - 运行入口
- /mpa.py - 命令行-多进程运行入口(有点鸡肋味道)
/trunk/blog/ --- 单独blog演示 (v1)
/trunk/core/ --- 核心库包
/trunk/import/ --- 导入库包
/trunk/impui/ --- 外部UI库
/trunk/test/ --- Porsonal Test Code!
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。