1 Star 0 Fork 119

张如豪nice / DS

forked from Vanishi / DS 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
MIT

DS

软件介绍

  • 这是一个Qt开发的可以替代爬虫的网页数据采集软件,它最重要的特点就是,降低了采集网页数据的门槛,由至少掌握一门编程语言降低到只要会操作电脑即可。

关于DS

  • DS名称出自于Data Spider 英文缩写,我几年前写过一个类似的工具软件,但当时受限于个人水平,那个软件在逻辑上存在许多难以在逾越的bug,所以一直都搁置了。 直到几个月前,我决定重新完善一下,因为那个软件虽然存在很多bug,但思路非常好,搁置着太可惜,之后我重新复习了一下Qt,又经历挺长一段时间,终于在最近完成一个可用的版本。
软件主界面.png

软件开发环境

  • C++11
  • Qt 5.15.2
  • Qt Creator 9.0.2
  • VS2019
注意 2023.3.26之后,V1.3及其之后的版本,已经兼容Qt6.4.3,当前软件开发环境
  • C++11
  • Qt 6.4.3
  • Qt Creator 9.0.2
  • VS2019

安装开发环境需要注意的几点

  • 这个软件内嵌了一个谷歌浏览器,是基于Qt自带的QWebView控件实现的, Qt中只有MSVC系列的编译器才能使用这个控件,MinGW的编译器是不可以使用的, 所以大家想要运行这个软件,一定要确保自己的电脑安装了MSVC系列的编译器。

  • 如何安装MSVC系列的编译器?

  • 在安装Qt之前,首先安装Visual Studio,这样在安装Qt时才能够勾选MSVC, 并正常安装。
  • Qt版本和MSVC系列编译器版本的对应关系
  • 关于这个版本对应关系, 我并没有在官网找到相关描述,我所了解的几个版本关系如下:
  • Qt5.15.2 支持 VS2019
  • Qt5.14.2 支持 VS2019 和 VS2017
  • Qt6.4.3 支持 VS2019
  • 强烈建议大家先安装VS再安装Qt,如果先安装Qt再安装VS,需要手动配置编译器,很麻烦。
  • 希望大家能够尝试使用Qt6,因为这个软件的核心就是自动化控制内置的谷歌浏览器, 而最新版的Qt环境,内置的谷歌浏览器内核是最新的,性能也会比Qt5.15.2好很多。

一直以来我开发这个软件的初衷

  • 当今时代,无处不存在对数据获取的需求。对于企业来说, 可以通过招聘开发人员专门进行数据采集。 但对于大部分 需要数据,但不懂开发的个人来说,获取数据则是困难的, 很显然,他们是不可能通过编程开发进而获取数据的。

  • 编写报告, 撰写论文,从事分析相关的研究人员,政府公务人员,销售人员,运营人员, 学生等,在日常工作生活都有面临采集网页数据的需求。 但很多时候,大部分人仅仅是需要一批网页数据,通过分析得出一些结论。 但是由于获取数据的成本较高,还需要额外学编程语言开发采集, 这对于他们来说是极其痛苦的,因为不能把有限的时间放在最有价值的事情上。

  • 虽然开发程序采集数据,这对于开发人员来说,是比较简单的, 但是对于一个不懂编程的人,这是困难的, 而且即使是开发人员,可能也不愿意编写程序采集数据,因为太浪费时间。

对DS的展望和计划

  • 希望DS能够成为一款类似于office,WPS 一样的一个办公必备软件,每一位有需要的职场人员,都可以使用DS进行采集数据,来应对日常工作

  • DS将永久开源,所有功能永久免费,我会保持更新,也希望有兴趣的开发者能够一起完善,并希望大家多提意见或建议,

软件声明

  • 本产品只是采集数据的工具,我们不对数据版权负责。我们尊重版权,您必须在采集之前联系数据所有者取得授权, 任何因数据授权产生的问题由使用者负生部责任,另外对于数据的使用请严格遭守《国家网络安全法》, 使用本软件即代表悠同意此声明

授权协议

  • 本项目自有代码使用宽松的MIT协议,在保留版权信息的情况下可以自由应用于各自商用、非商业的项目。 但是本项目也零碎的使用了一些其他的第三方库,包括使用了Qt, 由于使用本项目而产生的商业纠纷或侵权行为一概与本项目及开发者无关,请自行承担法律风险。 在使用本项目代码时,也应该在授权协议中同时表明本项目依赖的第三方库的协议,以及遵循相应的规定。
MIT License Copyright (c) 2022 Vanishi Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

简介

一个Qt开发的可以替代爬虫的网页数据采集软件,它最重要的特点就是,降低了采集网页数据的门槛,由至少必须掌握一门编程语言降低到只要会操作电脑即可。 展开 收起
C++
MIT
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
C++
1
https://gitee.com/zhang-ruhao-nice/DS.git
git@gitee.com:zhang-ruhao-nice/DS.git
zhang-ruhao-nice
DS
DS
master

搜索帮助

14c37bed 8189591 565d56ea 8189591