CLI 版本
GUI 版本
日本电影元数据 抓取工具 | 刮削器,配合本地影片管理软件 Emby, Jellyfin, Kodi 等管理本地影片,该软件起到分类与元数据(metadata)抓取作用,利用元数据信息来分类,供本地影片分类整理使用。
当你运行了本软件,即代表你接受了以下条款
若用户不同意上述条款任意一条,请勿使用本软件
When you run the software, you accept the following terms
If the user does not agree with any of the above terms, please do not use this software
图片来自网络,图片仅供参考,具体效果请自行联想
Docker容器可以方便在在NAS上使用。
sudo docker-compose build jav
JAVUID=$(id -u) JAVGID=$(id -g) JAV_PATH=<FullPathToLibrary> sudo docker up -d jav
<FullPathToLibrary>/organized
, 失败的内容会移入<FullPathToLibrary>/failure_output
.config.ini
的内容。详细请看以下完整文档
如果运行源码版,运行前请安装Python环境和安装以下模块
在终端 cmd/Powershell/Terminal 中输入以下代码来安装模块
pip install requests pyquery lxml Beautifulsoup4 pillow
[common]
main_mode=1
1为普通模式,
2为整理模式:仅根据女优把电影命名为番号并分类到女优名称的文件夹下
success_output_folder=JAV_outputd
failed_output_folder=failed
设置成功输出目录和失败输出目录
方便PT下载完既想刮削又想继续上传的仓鼠党同志
[common]
soft_link=0
1为开启软链接模式
0为关闭
[proxy]
proxy=127.0.0.1:1081
timeout=10
retry=3
proxy=127.0.0.1:1081
打开config.ini
,在[proxy]
下的proxy
行设置本地代理地址和端口,支持Shadowxxxx/X,V2XXX本地代理端口
素人系列抓取建议使用日本代理
路由器拥有自动代理功能的可以把proxy=后面内容去掉
本地代理软件开全局模式的用户同上
如果遇到tineout错误,可以把文件的proxy=后面的地址和端口删除,并开启代理软件全局模式,或者重启电脑,代理软件,网卡
timeout=10
10为超时重试时间 单位:秒
retry=3
3即为重试次数
[update]
update_check=1
0为关闭,1为开启,不建议关闭
[priority]
website=javbus,javdb,fanza,xcity,mgstage,fc2,avsox,jav321
用,
英文逗号分开网站,刮削顺序从左往右
[escape]
literals=\
folders=failed,JAV_output
literals=
标题指定字符删除,例如iterals=\()
,则删除标题中\()
字符
folders=
指定目录,例如folders=failed,JAV_output
,多目录刮削时跳过failed,JAV_output
[debug_mode]
switch=1
如要开启调试模式,请手动输入以上代码到config.ini
中,开启后可在抓取中显示影片元数据
[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title
已有默认配置
title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长
上面的参数以下都称之为变量
自定义规则方法:有两种元素,变量和字符,无论是任何一种元素之间连接必须要用加号 + ,比如:'naming_rule=['+number+']-'+title
,其中冒号 ' ' 内的文字是字符,没有冒号包含的文字是变量,元素之间连接必须要用加号 +
该为影片路径规则
目录结构规则:默认 location_rule=actor+'/'+number
不推荐修改时在这里添加 title,有时 title 过长,因为 Windows API 问题,抓取数据时新建文件夹容易出错。
该为媒体库内标题的命名规则规则,NFO文件内标题<title>命名规则
影片命名规则:默认 naming_rule=number+'-'+title
在 Emby, Kodi等本地媒体库显示的标题,不影响目录结构下影片文件的命名,依旧是 番号+后缀。
[update]
update_check=1
1为开,0为关
以下运行参数均为可选参数
如果遇到番号比较奇葩的影片,同时存在于可刮削的网站,可用拖动影片之主程序刮削,或者输入以下
AV_Data_Capture xxx-xxx-xxx.mp4
可以用-c
或者--config
选择其他配置文件
默认值为config.ini
AV_Data_Capture -c config_other.ini
AV_Data_Capture -a
输入参数即可在刮削结束后自动结束程序
建议使用视频合并合并为一个视频文件
可以把多集电影按照集数后缀命名为类似ssni-xxx-cd1.mp4m,ssni-xxx-cd2.mp4,abp-xxx-CD1.mp4
的规则,只要含有-CDn./-cdn.
类似命名规则,即可使用分集功能
运行 AV_Data_capture.py/.exe
当文件名包含: 中文,字幕,-c., -C., 处理元数据时会加上中文字幕标签
可以打开cmd命令提示符,把 AV_Data_capture.py/.exe
拖进cmd窗口回车运行,查看错误,出现的错误信息依据以下条目解决
Updata_check
和 JSON
相关的错误跳转 网络设置
字幕文件前缀必须与影片文件前缀一致,才可以使用该功能
FileNotFoundError: [WinError 3] 系统找不到指定的路径。: 'JAV_output''
在软件所在文件夹下新建 JAV_output 文件夹,可能是你没有把软件拉到和电影的同一目录
请设置好代理
同上
可以提取元数据的网站:avsox, javbus, javdb, dmm(fanza), fc2, jav321, mgstage(素人)
目前作者已经完善了番号提取机制,功能较为强大,各大网站的影片请用以下规则命名(dmm(fanza)下载的影片除外)
COSQ-004.mp4
对于dmm(fanza)上下好的电影,请使用影片cid命名,示例如下
kawd00969.mp4
条件:文件名中间要有下划线或者减号"_","-",没有多余的内容只有番号为最佳,可以让软件更好获取元数据 对于多影片重命名,可以用 ReNamer 来批量重命名
暂时无解,可能是网络问题或者pillow模块打包问题,你可以用源码运行(要安装好第一步的模块)
针对格式比较奇葩的番号
影片放在和程序同一目录下,拖动至AV_Data_Capture.exe
,即可完成刮削和整理
开启 SMB,并在 Windows 上挂载为网络磁盘即可使用本软件,也适用于其他 NAS
怎么样,看着自己的日本电影被这样完美地管理,是不是感觉成就感爆棚呢?
tg官方电报群: 点击进群
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。