lianshan9527 / chenyme-aavt Goto Github PK

View Code? Open in Web Editor NEW

This project forked from chenyme/chenyme-aavt

0.0 0.0 0.0 16.69 MB

这是一个全自动（音频）视频翻译项目。利用Whisper识别声音，AI大模型翻译字幕，最后合并字幕视频，生成翻译后的视频。

License: MIT License

Python 94.92% Batchfile 5.08%

chenyme-aavt's Introduction

Chenyme-AAVT V0.6.1

Note ：长文本字幕翻译的错位问题将会后续优化。由于开始准备考研，更新速度可能会放缓，感谢理解~~~

非常感谢您来到我的 AI Auto Video-Audio Translation 项目！该项目旨在提供一个简单易用的全自动视频（音频）识别、翻译工具，帮助您快速识别声音并翻译生成字幕文件，然后将翻译后的字幕与原视频合并，以便您更快速的实现视频翻译。

Tips：推荐选用 Faster-whisper 和 Large 模型以获得最好的断句、识别体验。

注意： 首次使用 Whisper 模型时需下载，国内建议开启 VPN 下载。启用 GPU 加速需下载 CUDA 和 PyTorch，且保证PyTorch 版本与 CUDA 匹配，否则程序识别失败会默认禁用GPU加速。

麻烦给一颗免费的星叭~感谢!!!

测试效果点击下载

项目亮点

支持 faster-whisper 后端。

支持 GPU 加速。

支持 VAD 辅助识别。

支持 ChatGPT、KIMI 翻译。

支持多种语言识别、翻译。

支持多种字幕格式输出。

支持字幕修改，二次精翻。

支持字幕、视频预览。

支持AI总结、问答。

Kimi 是由月之暗面（Moonshot AI）团队的超长记忆 AI 助手

moonshot官网：https://www.moonshot.cn/

kimi官网：https://kimi.moonshot.cn/

如何安装

更快速的安装（省去下载FFmpeg）

见releases

正常安装

本项目需要依赖 Python 环境和 FFmpeg,可能会用到 CUDA 和 PyTorch 。

安装 Python 环境

您需要安装 Python 3.8 或更高版本。
您可以从 Python官网下载并安装最新版本的 Python。

安装 FFmpeg

您需要安装 FFmpeg。
您可以从 FFmpeg官网下载并安装 FFmpeg。

设置 FFmpeg 为环境变量

按下 Win+R 快捷键打开运行对话框。
在弹出的框中输入 rundll32 sysdm.cpl,EditEnvironmentVariables，然后点击确定。
在上面的用户变量中找到 Path，双击。
点击新建，输入刚刚下载的 FFmpeg 的路径。示例：D:\APP\ffmpeg（请根据自己的实际路径调整！）。

运行 install.bat

在项目根目录下运行 install.bat 来安装所有依赖库。

如何使用

设置参数

在config内设置 OPENAI_API_KEY、OPENAI_BASE_URL、KIMI_API_KEY，以便使用翻译引擎。
您也可以在网页中设置各项参数，目前版本已经可以自动保存到config中，无需重新设置。

运行程序

运行 webui.bat
等待网页跳转，如果没有跳转请自行在浏览器输入http://localhost:8501/
首次使用streamlit，可能会要求输入email，直接Enter跳过即可。
上传文件，设置模型，运行程序，耐心等待处理

注意事项

请确保您的系统已经正确安装了 Python，并且版本号为 3.8 或更高。
请确保已经安装了 FFmpeg，并设置 FFmpeg 为环境变量。
请确保运行 install.bat，安装所有依赖库。
使用 GPU 加速时请确保安装了正确的 CUDA 和 Pytorch 版本
推荐使用 faster-whisper 和 Large 模型，以获得最好的断句体验，但模型需要从 Huggingface 下载。

TODO

识别相关

翻译相关

ChatGPT翻译优化*
更多的语种翻译
更多的翻译模型
更多的翻译引擎

字幕相关

其他

注：含`*`的功能还不稳定，可能存在某些BUG。

特别鸣谢

本人是 AI 时代的受益者，本项目的开发基本是站在巨人的肩膀上实现的。主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕，利用 Streamlit 搭建快速使用的 WebUI 界面，以及 FFmpeg 来实现字幕与视频的合并。

lianshan9527 / chenyme-aavt Goto Github PK

chenyme-aavt's Introduction

Chenyme-AAVT V0.6.1

Note ：长文本字幕翻译的错位问题将会后续优化。由于开始准备考研，更新速度可能会放缓，感谢理解~~~

麻烦给一颗免费的星叭~感谢!!!

项目亮点

如何安装

更快速的安装（省去下载FFmpeg）

正常安装

如何使用

注意事项

TODO

识别相关

翻译相关

字幕相关

其他

注：含*的功能还不稳定，可能存在某些BUG。

特别鸣谢

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper、kimi的开发人员！

如有问题和建议，随时联系我!

截图

主页面

音频

视频

chenyme-aavt's People

Contributors

Recommend Projects

Recommend Topics

Recommend Org

注：含`*`的功能还不稳定，可能存在某些BUG。