Code Monkey home page Code Monkey logo

javsp's Introduction

JavSP

Jav Scraper Package

汇总多站点数据的AV元数据刮削器

提取影片文件名中的番号信息,自动抓取并汇总多个站点数据的 AV 元数据,按照指定的规则分类整理影片文件,并创建供 Emby、Jellyfin、Kodi 等软件使用的元数据文件

License LICENSE Python 3.8 Crawlers test Latest release 996.icu

功能特点

下面这些是一些已实现或待实现的功能,在逐渐实现和完善,如果想到新的功能点也会加进来。

  • 自动识别影片番号

  • 支持处理影片分片

  • 汇总多个站点的数据生成NFO数据文件

  • 每天自动对站点抓取器进行测试

  • 多线程并行抓取

  • 下载高清封面

  • 基于人脸识别定位裁剪素人系列的海报

    由于使用默认数据集时OpenCV的检测效果不好,特别是还有FC2等素人影片加在封面上的各种奇怪水印、爱心、马赛克、黑条,以及五花八门的图片角度……(能不能正经点拍照!怒!!)

    所以虽然当前版本已经实装了人脸识别,但是可用性还很差,所以配置文件中默认禁用了此功能。

    但是目前版本依然包含了一些稳定性方面的更新,以及适配浏览器机制和部分站点抓取器的更新(Chrome和Edge的Cookies机制有更新),新版本应该还是会比之前的好用一点。

    可以来这里下载现在的版本

  • 自动检查和更新新版本

  • 翻译标题和剧情简介

  • 匹配本地字幕

  • 使用小缩略图创建文件夹封面

  • 保持不同站点间 genre 分类的统一

  • 不同的运行模式(抓取数据+整理,仅抓取数据)

  • 可选:所有站点均抓取失败时由人工介入

安装

  • 想要快速上手?

    前往软件发布页下载最新版本的软件,无需安装额外工具,开箱即用

  • 更喜欢源代码?

    请确保已安装 Python (此项目以 Python 3.8 开发)

     git clone https://github.com/Yuukiy/JavSP.git
     cd JavSP
     pip install -r requirements.txt
     python JavSP.py
    

使用

软件开箱即用,首次运行时会在软件目录下生成默认的配置文件 config.ini。如果想让软件更符合你的使用需求,也许你需要更改配置文件:

以任意文本编辑器打开 config.ini,根据各个配置项的说明选择你需要的配置即可。

此外软件也支持从命令行指定运行参数(命令行参数的优先级高于配置文件)。运行 JavSP -h 查看支持的参数列表

更详细的使用说明请前往 JavSP Wiki 查看

如果使用的时候遇到问题也欢迎给我反馈😊

问题反馈

如果使用中遇到了 Bug,请前往 Issue 区反馈(提问前请先搜索是否已有类似问题)

参与贡献

此项目不需要捐赠。如果你想要帮助改进这个项目,欢迎通过以下方式参与进来(并不仅局限于代码):

  • 帮助撰写和改进Wiki

  • 帮助完善单元测试数据

  • 帮助翻译 genre

  • Bugfix / 新功能?欢迎发 Pull Request

  • 要不考虑点个 Star ?(我会很开心的)

许可

此项目的所有权利与许可受 GPL-3.0 License 与 Anti 996 License 共同限制。此外,如果你使用此项目,表明你还额外接受以下条款:

  • 本软件仅供学习 Python 和技术交流使用

  • 请勿在微博、微信等墙内的公共社交平台上宣传此项目

  • 用户在使用本软件时,请遵守当地法律法规

  • 禁止将本软件用于商业用途

javsp's People

Contributors

yuukiy avatar dependabot[bot] avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.