1 Star 0 Fork 0

Beibuwan / beibuwan-crawlab

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
BSD-3-Clause

基于 Crawlab 分布式爬虫管理系统构建的北部湾城市群综合科技服务资源爬虫平台

综合科技服务资源爬虫平台

建设目的

-- 基于 Golang 的爬虫管理平台,支持任意语言编写的爬虫。

综合科技服务平台定位是第三方的科技服务撮合、交易平台,它自身不提供具体的科技服务项目,而是通过收集、汇总包括验检测认证、研究开发、知识产权等多个领域科技服务资源和提供服务的市场主体,对外提供综合科技服务资源门户。基于以上定位,通过爬虫技术对科技服务资源进行数据获取、清洗、整理,是平台建设的基础。

平台接入的科技服务数据资源是多源、异构、实时的,工程人员需要开发大规模的爬虫脚本,制定定时运行任务,健康爬虫运行状态,并适时地升级匹配技术来保证资源数据的完整性、可用性。因此,针对大规模爬虫脚本进行版本管理、运行监控,保证爬虫的健康是必要的。

综合科技服务资源爬虫平台,提供爬虫版本管理、分布式运行、定时任务等功能,提高大规模爬虫脚本的健康程度,保证科技服务资源数据的完整性、可用性,是综合科技服务平台门户的关键基础设施。

访问地址(测试环境,不稳定)

http://81.68.87.116:8080
账号/密码:admin/admin

快速开始

源代码运行

  1. 克隆仓库
cd beibuwan-crawlab
  1. 运行后端
cd backend
go mod tidy
go run main.go
  1. 运行前端
cd ../frontend
npm i && npm run serve
  1. 访问 http://localhost:8080

与开源爬虫管理平台 Crawlab 比较

Beibuwan Crawlab Crawlab
跨语言爬虫
多节点部署
定时任务
查看日志
爬虫版本管理
数据统计
消息通知
在线编辑
可配置爬虫
SDK
BSD 3-Clause License Copyright (c) 2020, Crawlab Team All rights reserved. Redistribution and use in source and binary forms, with or without modification, are permitted provided that the following conditions are met: 1. Redistributions of source code must retain the above copyright notice, this list of conditions and the following disclaimer. 2. Redistributions in binary form must reproduce the above copyright notice, this list of conditions and the following disclaimer in the documentation and/or other materials provided with the distribution. 3. Neither the name of the copyright holder nor the names of its contributors may be used to endorse or promote products derived from this software without specific prior written permission. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.

简介

爬虫管理平台 展开 收起
Vue 等 5 种语言
BSD-3-Clause
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/beibuwan/beibuwan-crawlab.git
git@gitee.com:beibuwan/beibuwan-crawlab.git
beibuwan
beibuwan-crawlab
beibuwan-crawlab
master

搜索帮助