1 Star 0 Fork 1

邀月清风 / WordPress蜘蛛分析插件Spider Analyser

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
readme.txt 13.75 KB
一键复制 编辑 原始数据 按行查看 历史
闪电博 提交于 2021-03-23 19:34 . = 1.2.3 =
=== Spider Analyser - WordPress搜索引擎蜘蛛分析插件 ===
Contributors: wbolt,mrkwong
Donate link: https://www.wbolt.com/
Tags: Spider Analyser, SEO, Googlebot, MJ12bot, Spider, Baiduspider, SemrushBot, Bytespider, 360Spider
Requires at least: 4.8
Tested up to: 5.7
Stable tag: 1.2.3
License: GNU General Public License v2.0 or later
License URI: http://www.gnu.org/licenses/gpl-2.0.html
Spider Analyser是一款用于跟踪WordPress网站各种搜索引擎蜘蛛爬行日志,并进行详细的蜘蛛爬行数据统计、蜘蛛行为分析、蜘蛛爬取分析及伪蜘蛛拦截等。
== Description ==
Spider Analyser是一款用于跟踪WordPress网站各种搜索引擎蜘蛛爬行日志,并进行详细的蜘蛛爬行数据统计、蜘蛛行为分析、蜘蛛爬取分析及伪蜘蛛拦截等。
功能包括:
### 1.蜘蛛概况
支持查看网站日常各大搜索引擎蜘蛛来访的数据;
* **今日蜘蛛**
方便站长快速了解当日、昨日及30天平均的来访蜘蛛数、爬取URL数及平均爬取URL数。
* **趋势图**
支持按今天、昨天、最近7天及最近30天查看蜘蛛数、爬取URLs总量、响应状态码及热门蜘蛛爬取链接数走势折线图,并可查看上一周期数据,以作对比分析。
* **Top10蜘蛛**
支持按今天、昨天、最近7天及最近30天查看Top10蜘蛛的爬取URL数及占比相关数据。
* **Top10蜘蛛爬取URL**
支持按今天、昨天、最近7天及最近30天查看Top10蜘蛛爬取URL的爬取次数及占比,方便站长对热门蜘蛛爬取页面URL进行分析。
* **Top10热门文章**
按今天、昨天、最近7天及最近30天查看Top10热门文章,以便于站长分析热门文章蜘蛛爬取情况以进一步优化文章页SEO。
### 2.蜘蛛日志
支持按今天、最近7天及最近30天查看蜘蛛日志,包括蜘蛛访问时间、状态码、访问链接、蜘蛛IP及蜘蛛名称等参数。
并且支持按蜘蛛名称、状态码及时间进行筛选日志;以及可通过访问URL、蜘蛛IP搜索蜘蛛日志。
### 3.蜘蛛列表
蜘蛛列表包含蜘蛛清单、蜘蛛IP段、疑似伪蜘蛛及蜘蛛拦截四部分的功能,其中:
* **蜘蛛清单**
列表包括蜘蛛名称、蜘蛛类型、蜘蛛地址、最近来访时间、爬取URLs及占比情况等数据,支持按蜘蛛名称、蜘蛛类型及时间段筛选查询;并且支持忽略或者拦截指定蜘蛛。
* **蜘蛛IP段**
在该列表可以查看不同蜘蛛对应IP段及其占比情况,支持按蜘蛛名、时间进行筛选查询。
* **疑似伪蜘蛛**
协作站长快速发现疑似伪蜘蛛名称及IP地址,便于快速对伪蜘蛛执行拦截操作。
* **蜘蛛拦截**
蜘蛛拦截列表用于站长管理蜘蛛拦截清单,支持站长按名称、IP/IP段或者名称+IP/IP段对蜘蛛进行拦截操作。
注:蜘蛛拦截可通过蜘蛛日志列表、蜘蛛清单列表、蜘蛛IP段列表及疑似伪蜘蛛列表对蜘蛛进行拦截。
### 4.访问路径
支持按今天、最近7天及最近30天查看蜘蛛访问路径(爬取页面URL)具体信息列表,包括URL、URL类型、爬取次数及占比情况等数据。
并且支持按蜘蛛名称、类型、状态、时间、访问URL及蜘蛛IP进行筛选查询。
### 5.文章爬取
此功能模块是为了方便站长按蜘蛛名称、不同状态的文章类型及时间,快速了解网站文章蜘蛛访问量、出链数及入链数。站长再根据这几个指标,对文章进行内链布局处理,提升蜘蛛爬取频率,从而提升网站收录量。
### 6.插件设置
* **记录管理**-支持自定义蜘蛛类型及设置蜘蛛记录状态。
* **链接自定义**-允许通过设置链接规则来区分蜘蛛爬取URL链接类型,支持添加自定义或者修改新增现有链接类型的规则。
* **日志设置**-支持设置插件日志保留时间周期(最近30天、最近3个月、最近6个月、最近1年或永久),日志备份及删除和自定义蜘蛛。
Spider Analyser插件非常适合站长作为网站SEO优化的辅助工具,通过数据统计深入了解更大搜索引擎蜘蛛爬取页面URL的行为习惯。WordPress站长可以利用该插件,并结合<a href='https://www.wbolt.com/plugins/sst?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='WordPress网站SEO优化插件'>WordPress网站SEO优化插件</a>、<a href='https://www.wbolt.com/plugins/bsl?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='百度推送插件'>百度推送插件</a>和<a href='https://www.wbolt.com/plugins/skt?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='关键词推荐插件'>关键词推荐插件</a>,对WordPress网站内容的搜索引擎收录及排名优化可以做到事半功倍的效果!
== Installation ==
方式1:在线安装(推荐)
1. 进入WordPress仪表盘,点击'插件-安装插件',关键词搜索'Spider Analyser',找搜索结果中找到'Spider Analyser'插件,点击'现在安装';
2. 安装完毕后,启用 `Spider Analyser` 插件.
3. 通过仪表盘左侧菜单'蜘蛛分析'即可查看蜘蛛概况及蜘蛛日志.
方式2:上传安装
FTP上传安装
1. 解压插件压缩包spider-analyser.zip,将解压获得文件夹上传至wordpress安装目录下的 `/wp-content/plugins/`目录.
2. 访问WordPress仪表盘,进入'插件'-'已安装插件',在插件列表中找到'Spider Analyser',点击'启用'.
3. 通过仪表盘左侧菜单'蜘蛛分析'即可查看蜘蛛概况及蜘蛛日志.
仪表盘上传安装
1. 进入WordPress仪表盘,点击'插件-安装插件';
2. 点击界面左上方的'上传按钮',选择本地提前下载好的插件压缩包spider-analyser.zip,点击'现在安装';
3. 安装完毕后,启用 `Spider Analyser` 插件;
4. 通过仪表盘左侧菜单'蜘蛛分析'即可查看蜘蛛概况及蜘蛛日志.
关于本插件,你可以通过阅读<a href='https://www.wbolt.com/spider-analyser-plugin-documentation.html?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='插件教程'>Spider Analyser插件教程</a>学习了解插件安装、设置等详细内容。
== Frequently Asked Questions ==
= 如何应对蜘蛛日志过多导致数据库反应缓慢? =
(1)将插件日志保留周期改为最近30天;(2)及时删除历史日志;(3)对不必要的蜘蛛日志,设置为忽略或者添加至拦截列表。
= 为什么插件统计的蜘蛛日志与服务器日志数据有差异? =
插件仅统计前端页面的蜘蛛访问日志,服务器日志则统计所有数据访问日志。因此,理论上服务器日志蜘蛛访问数据应该大于插件的蜘蛛访问数据。但插件统计的数据已经足以作为搜索引擎蜘蛛分析。
= Spider Analyser插件的蜘蛛数据存放在哪里? =
数据库。由于该数据仅用于网站管理分析时使用,存放在数据库更加实时和准确,主要是占数据库空间,对服务器性能影响可以忽略不计。
= Spider Analyser插件是否会识别伪蜘蛛? =
会伪蜘蛛进行识别,如站长发现可疑伪蜘蛛,可以通过Robots.txt进行屏蔽。查看教程《<a href='https://www.wbolt.com/optimize-wordpress-robots-txt.html?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='Robots.txt教程'>如何编写和优化WordPress网站的Robots.txt</a>?》,但不是所有蜘蛛不一定遵循该协议。也可以通过插件进行拦截。拦截前务必确保该蜘蛛为伪蜘蛛或者不需要的蜘蛛。
= 访问路径统计中URL类型为什么有些现实为unknown? =
部分历史数据及一些未能够识别类别的蜘蛛访问URL地址,均列为unknown。在后面的插件版本,将会加入URL类型分组自定义功能。
== Notes ==
Spider Analyser是一款专门为WordPress开发的<a href='https://www.wbolt.com/plugins/spider-analyser?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='Spider Analyser插件'>搜索引擎蜘蛛分析插件</a>.
闪电博(<a href='https://www.wbolt.com/?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='闪电博官网'>wbolt.com</a>)专注于原创<a href='https://www.wbolt.com/themes' rel='friend' title='WordPress主题'>WordPress主题</a>和<a href='https://www.wbolt.com/plugins' rel='friend' title='WordPress插件'>WordPress插件</a>开发,为中文博客提供更多优质和符合国内需求的主题和插件。此外我们也会分享WordPress相关技巧和教程。
除了Spider Analyser插件外,目前我们还开发了以下WordPress插件:
- [百度搜索推送管理-历史下载安装数100,000+](https://wordpress.org/plugins/baidu-submit-link/)
- [热门关键词推荐插件-最佳关键词布局插件](https://wordpress.org/plugins/smart-keywords-tool/)
- [IMGspider-轻量外链图片采集插件](https://wordpress.org/plugins/imgspider/)
- [Smart SEO Tool-高效便捷的WP搜索引擎优化插件](https://wordpress.org/plugins/smart-seo-tool/)
- [WP资源下载管理-快速打造资源下载博客网站](https://wordpress.org/plugins/download-info-page/)
- [博客社交分享组件-打赏/点赞/微海报/社交分享四合一](https://wordpress.org/plugins/donate-with-qrcode/)
- [HTML代码代码优化工具-一键清洗转载文章多余代码](https://wordpress.org/plugins/imgspider.zip/)
- [WP VK-WordPress知识付费插件](https://wordpress.org/plugins/wp-vk/)
- 更多主题和插件,请访问<a href='https://www.wbolt.com/?utm_source=wp&utm_medium=link&utm_campaign=spider-analyser' rel='friend' title='闪电博官网'>wbolt.com</a>!
如果你在WordPress主题和插件上有更多的需求,也希望您可以向我们提出意见建议,我们将会记录下来并根据实际情况,推出更多符合大家需求的主题和插件。
致谢!
闪电博团队
== Screenshots ==
1. Spider Analyser-蜘蛛概况界面截图.
2. Spider Analyser-蜘蛛日志统计界面截图.
3. Spider Analyser-访问路径统计界面截图.
4. Spider Analyser-文章爬取界面截图.
5. Spider Analyser-蜘蛛列表界面截图.
6. Spider Analyser-插件设置界面截图.
== Changelog ==
= 1.2.3 =
* 优化蜘蛛概况趋势图,移除爬取URLs均值数据统计,新增蜘蛛爬取链接状态码、热门蜘蛛爬取链接数趋势;
* 列表新增数据列升降序排列支持;
* 优化蜘蛛日志列表,增加状态码筛选项及列表数据;
* 优化内容推荐版块展示逻辑;
* 加入缓存机制,以提升部分数据加载性能;
* 增加Pro及免费版本功能对比列表。
= 1.2.2 =
* 优化列表拦截/忽略操作交互体验,拦截/忽略记录不在原列表显示;
* 修复列表忽略操作无效bug;
* 蜘蛛拦截列表新增路径及拦截方式列;
* 优化文章爬取列表显示数据,支持全局数据读取;
* 引入全新列表UI库,增强交互体验;
* 修复蜘蛛清单所有状态筛选项错误bug,改为所有类型筛选项;
* 进步优化插件相关页面移动端兼容性。
= 1.2.1 =
* 新增部分数据列表数据项查看更多入口;
* 优化蜘蛛概况数据统计图表UI布局;
* 重新调整蜘蛛列表,拆分为蜘蛛清单、蜘蛛IP、疑似伪蜘蛛和蜘蛛拦截多个Tab标签页;
* 优化蜘蛛拦截规则,支持名称、IP/IP段或名称+IP/IP段三种拦截方式;
* 重新调整插件设置,拆分为记录管理、链接规则和日志设置多个Tab标签页;
* 新增蜘蛛日志备份下载功能;
* 修正搜狗蜘蛛日志无法记录bug。
= 1.2.0 =
* 新增热门文章列表,支持站长了解文章蜘蛛爬取量、出链数及入链数;
* 新增蜘蛛IP段列表,以便于站长了解不同蜘蛛对应IP段数据;
* 新增疑似伪蜘蛛识别功能;
* 新增蜘蛛名称及蜘蛛IP拦截功能,以便于站长对不需要的蜘蛛或者IP进行拦截;
* 蜘蛛概况新增访问路径快捷入口;
* 蜘蛛日志、蜘蛛列表及访问路径等列表新增拦截操作选项;
* 其他功能体验优化及已知问题修复。
= 1.1.4 =
* 紧急修复蜘蛛忽略设置可能导致相似名称蜘蛛被忽略bug.
= 1.1.3 =
* 新增日志保留时间选项及删除日志操作;
* 新增蜘蛛列表管理,支持自定义蜘蛛,蜘蛛类型及记录开关;
* 新增链接自定义类型及规则设置,支持新增或者修改URL类型及链接规则;
* 优化蜘蛛列表,新增按蜘蛛名称筛选支持。
= 1.1.2 =
* 新增蜘蛛访问路径数据列表功能;
* 新增访问路径类型数据统计,支持按首页、文章页、独立页、分类页、搜索页、作者页、Feed、Sitemap、API和其他类型归类URL;
* 其他已知问题及bug修复。
= 1.1.1 =
* 新增蜘蛛列表功能,支持查看站点更多蜘蛛相关数据信息;
* 新增更多蜘蛛数据统计,支持300+不同类型蜘蛛数据统计;
* 优化插件移动端界面样式。
= 1.1.0 =
* 新增日志筛选搜索功能;
* 新增版本升级提示功能;
* 修复部分蜘蛛无法统计bug。
= 1.0.3 =
* 优化爬虫日志记录规则,由每小时更新改为实时更新;
* 删除原有的本地日志记录功能,改为直接数据库记录。
= 1.0.2 =
* 修复数据图表纵坐标参考值出现小数的bug;
* 修复统计图表数据取值异常问题;
* 优化数据统计图表当期及上期折线样式(当期实线,上期虚线)。
= 1.0.1 =
* 修复部分网站无数据展示bug;
* 优化插件部分统计数据术语,统一标准;
* 优化移动端展示外观;
* 删除非必要文件。
= 1.0.0 =
* 新增今日蜘蛛数据统计功能;
* 新增蜘蛛数据趋势图功能;
* 新增Top10搜索引擎蜘蛛统计功能;
* 新增Top10蜘蛛爬取URL统计功能;
* 新增蜘蛛日志功能,统计蜘蛛访问时间、状态码、访问链接、蜘蛛IP及蜘蛛名称等数据。
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
PHP
1
https://gitee.com/we91/spider-analyzer.git
git@gitee.com:we91/spider-analyzer.git
we91
spider-analyzer
WordPress蜘蛛分析插件Spider Analyser
master

搜索帮助

344bd9b3 5694891 D2dac590 5694891