1 Star 0 Fork 4

swaince / go crawler

forked from 张金富 / go crawler 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
main.go 975 Bytes
一键复制 编辑 原始数据 按行查看 历史
张金富 提交于 2018-07-12 17:33 . 重构 request.Parser
package main
import (
"imooc.com/ccmouse/u2pppw/crawler/engine"
"imooc.com/ccmouse/u2pppw/crawler/scheduler"
"imooc.com/ccmouse/u2pppw/crawler/zhenai/parser"
"imooc.com/ccmouse/u2pppw/crawler/persist"
"imooc.com/ccmouse/u2pppw/crawler/config"
)
func main() {
//engine.SimpleEngine{}.Run(engine.Request{
// Url: "http://www.zhenai.com/zhenghun",
// ParseFunc: parser.ParseCityList,
//})
itemChan, err := persist.ItemSaver(config.ElasticIndex)
if err != nil {
panic(err)
}
e := engine.ConcurrentEngine{
//Scheduler: &scheduler.SimpleScheduler{},
Scheduler: &scheduler.QueuedScheduler{},
WorkerCount: 100,
ItemChan: itemChan,
RequestProcessor: engine.Worker,
}
e.Run(engine.Request{
Url: "http://www.zhenai.com/zhenghun",
Parser: engine.NewFuncParser(
parser.ParseCityList,
config.ParseCityList),
})
//e.Run(engine.Request{
// Url: "http://www.zhenai.com/zhenghun/shanghai",
// ParseFunc: parser.ParseCity,
//})
}
Go
1
https://gitee.com/swaince/goCrawler.git
git@gitee.com:swaince/goCrawler.git
swaince
goCrawler
go crawler
master

搜索帮助