Code Monkey home page Code Monkey logo

jptokr_tools's Introduction

답답해서 만든 도구들

허접한 코드지만, 일단 돌아가긴 돌아간다.

VOATgenerator는 뭔가

"사용자가 무료, 무제한으로 이용할 수 있는 로컬 음성인식 자막생성 프로그램(비디오 지원)"

기능

비디오나 오디오 파일 이름과 같은 이름으로 된 SRT 자막 파일이 있다면 VOAT가 인식합니다.
그럼 VOAT가 자막 타이밍에 맞춰 오디오를 잘라내고
그 음성에서 인식한 텍스트를 자막 파일에 집어넣습니다.

지원하는 언어는, 영어, 한국어, 일본어, 중국어, 등이 있습니다.
언어 선택은 기본이 자동인데,
일본어면 일본어, 영어면 영어로 지정해주면 좋습니다. 별로 차이는 없는데 약간 빨라집니다.
윗 네 언어 말고 다른 언어면 자동 인식으로 두세요.

설치 방법

1.압축파일 다운 받고 압축풀기..
ffmpeg라는 프로그램이 설치되어 있지 않으면, 따로 설치하거나, 아니면 같이 배포한 배치파일을 실행할 것.
2.돗단배 아이콘을 단 VOATgenerator.exe 클릭.
3.비디오나 오디오 파일들 드래그 앤 드롭.
4.인식할 언어 설정하고, 음성 인식 시작 버튼 누르기.
5.침착하게 프롬프트창을 보며 기다리기.(오디오가 길수록, 그래픽카드가 별로일수록 느립니다.)

필수사양

돌리는 데 필요한 컴퓨터 사양은 먼저 엔비디아 그래픽 카드여야 하고 vram이 최소 4기가는 되야 합니다.
엔비디아 그래픽카드가 없을 경우, 자동으로 cpu로 진행되는데 그럼 매우 느립니다.
램은 최소 8기가, cpu는 적당한 거.
저장 용량은 6.64기가 정도 필요합니다. 최대한 줄여서 저 정도네요. 게임 하나 받는다고 생각하셔요...

기타 정보

프로그램이 사용하는 음성 인식 모델은 openai 회사에서 배포한 whisper large-v2 모델에서
약간 개조를 거친 faster-whisper large-v2모델을 사용합니다.

음성 인식이 가장 정확하게 되는 언어는 스페인어 1위, 영어 3위, 일본어 6위, 한국어 27위, 중국어 30위 순입니다.
도표 참조하세요
https://github.com/openai/whisper

VOice Analyzing Text라서 VOAT입니다. 완전 어거지인데..

used library

https://github.com/guillaumekln/faster-whisper
https://github.com/librosa/librosa
https://github.com/cdown/srt

ezTransWeb_fix는 뭔가

Source by https://github.com/HelloKS/ezTransWeb
원래 있던 코드에서
파이썬 3.11 32비트환경에서 Translator++ 지원이 가능하도록 몇몇 부분을 수정.
기존에는 코드만 있었지만 사용하기 편하도록 exe파일로 만들었다. Release로 가서 받자.
다운로드 링크

trans.eztransweb.js는 Translator++에 이지트랜스 지원을 위한 플러그인.
Source by https://arca.live/b/simya/57025402
batchDelay를 1에서 0.1로 바꾼 것 빼고는 수정한 부분은 없다.
적용 방법은
Translator++\www\js\autoload
경로로 들어가 이 파일을 집어넣으면 된다.

jptokr_tools's People

Contributors

gembleman avatar

Stargazers

 avatar

Watchers

 avatar

Forkers

khdong0714

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.