patui / nosub Goto Github PK
View Code? Open in Web Editor NEWC++ Subtitle Editor (全新C++字幕软件,https://www.nosub.cn)
C++ Subtitle Editor (全新C++字幕软件,https://www.nosub.cn)
和时间轴选取任意区间播放一样,可以选择任意区间压制导出视频;
在波形图为加载完毕之前,先导入字幕文件,操作视频播放器或是字幕编辑器必然闪退;
软件很好用,就是不知道能不能出个mac的版本
Hello patui,
Would like to know how to add back the googles Speech Engine.
Is it in config.ini or configcore.json?
Thx for you contribution in Nosub, it is near to prefect...
Eric
从B站上下了个视频,https://www.bilibili.com/video/av45327535/。
格式为1080p的mp4,nosub可以打开但不能自动切轴,左下角状态栏显示 convert to pcm file failed。
请看看如何解决,谢谢。
如声音的空白间隔之内多少不断行
以及音量多少以上不断行
还有同一行最多几个字便强迫断行
比如说 人的说话 同一行有时也会有停顿与呢喃
"今天刚好有个..这个..新闻"
以目前的版本 这个同一行的文字 会被断成三行
今天刚好有个
这个
新闻
也有人的说话很快速 霹雳啪拉说个不停
字幕的同一行就会变得很长 造成阅读上的困难
这两个问题
都会让自动断行在事後修正时间增加许多
另外 可以新增一个 自动剪掉无声片段并输出成XML的功能吗?
将视频里没有讲话的部份自动剪除
(也可设定参数值 低於多少分贝以下剪除
剪除的缓出入时间 少於几毫秒以内的空白不剪除等等)
剪除後合并 并输出为xml 供剪视频软件使用
這個自動上字幕軟體雖然做的很棒,但希望能讓使用者自行變更顯示介面中的文字內容
例如在程式資料夾建立一個lang資料夾,裡面放類似zh-CN.json、zh-TW.json、en-US.json,
例如這樣可以讓使用者自行翻譯成自己的語言,甚至協助Pull requests翻譯檔案。
节选自 Line 47: ## 2.今日头条旗下-巨量创意平台Web版(免费)
缺点:
- 需要注册。
- 需要上传视频文件(必须是视频)。
您在这里提到了【需要注册】是一个缺点,那么
节选自 Line 25: ## 讯飞听见-听见译制(免费)
缺点:
- 目前没有发现;
又在这里表示 “没有发现缺点”,是否表示 “听见译制” 是不需要注册的?如果是,如何做到这一点?
能不能编译一个32位操作系统用的
比如泰语字幕 ,被ffmpeg硬编码后,有些顶上的声调符号不知道是被切掉了还是压缩了,莫名其妙的消失了
音视频转录后,经常出现批量的语音识别错词(中文状态),希望能有批量替换功能,解决后期精校的工作量
rt
背景:
目前ASR效果还可以(提前Spleeter不知到能不能提高识别率)。
但是断句太烂,音频识别出文本后,可以考虑手动/只能断句,最后进行AFA(Automatic Forced Alignment)。
看了音文强制对齐,识别率不低啊,感觉可以语音转文字,支持的语言也多
即使是影视素材,英文识别率也挺高的,就有个思路,不知道大佬有没有兴趣:
1、语音转文本:Montreal Forced Aligner (可以用其他转写)
2、英文智能标点:http://bark.phon.ioc.ee/punctuator (中文没了解)
3、手动/半自动断句(.!?等),部分修正("i'""i "等)
4、带时间戳音文对齐:Montreal Forced Aligner、aeneas、YouTube(添加字幕有自动对齐)
音文对齐工具
1、Montreal Forced Aligner(支持挺多语言的):
https://zhuanlan.zhihu.com/p/86657478
效果:
https://www.youtube.com/watch?v=LgrX5gNgxx0&ab_channel=MahdiChtourou
https://www.youtube.com/watch?v=VONAIXelJYg&ab_channel=AdvancedSkeleton
https://www.youtube.com/watch?v=OLXrlcnndBs&ab_channel=YutingHsueh
2、aeneas(多语言支持,有free Webapp):
https://www.readbeyond.it/aeneas/
使用感受:声音干净的素材对得很齐(如Audiobook,讲解等),影视在干净的地方还很准,嘈杂处对得很糟糕。
配合Spleeter/iZotope RX.8,人声分离后,准度会提高很多。
经过测试,Spleeter有600s持续运行时间限制,增加时长容易引起内存溢出,16G内存能跑800s左右。
SpleeterGui,傻瓜式安装,支持批量拖入,最高能跑700s左右。
长音频还是用iZotope RX.8吧。
Hello Patui,
你好,我想问如何导出capcut (剪映海外版)手机软件的外语的字幕,比如日语韩语字幕。因为之前有使用SpeechJsonParser插件而可以顺利导出剪映的字幕。因此想问你要如何在插件内设定capcut以便在在emulator里面导出字幕,不知你可以协助?谢谢
对高DPI分辨率的支持;
人工字幕有听不清的地方做了标注。
请问,Nosub的编译环境是什么样的?
能否在readme中增加一部分对于编译的说明,谢谢。
测的商品播放器在60帧,加速播放的时候存在性能瓶颈。
Please add japanese and korean speech to text.
WinHttpReceiveResponse: 12152: 服务器返回的信息无效或不可识别
需求说明:
NoSub在断句方面的速度很快,希望能增加一个导出当前句子对应的视频的功能。这样方便针对复杂句子反复听读,NoSub也可以当外语学习软件了。
个人看ffmpeg有个命令行,可以比较容易实现。建议放到右侧列表右键菜单或者底部波形图右键菜单中。
希望能增加此特性。谢谢。
RT
RT
暂时测试不是程序版本,也不是音视频的问题,在播放界面无法显示总时长。
具体原因未知,此条Issues记录之后,之后重构的时候处理。
电脑win7 旗舰版;
问题来自:@开心百分百
蓝奏云 无法下载,希望增加其他下载方式
我配置好key和secret 以及云存储后运行nosub语音转写出现闪退,讯飞和腾讯没有任何问题
再次打开提示语音任务失败
快捷键分几个层次,建议考虑,谢谢。
L1: 针对当前功能定义一下快捷键,希望增加上一句,下一句的挑战快捷键;
L2: 快捷键可自定义
L3: 可自定义类似vim的单键快捷键,j/k跳转到上/下句,i进入当前句子字幕编辑
后端语音识别引擎两个问题:
1.腾讯语音任务识别,没有标注任务识别的原因;
2.客户端,任务失败后,还一直显示查询中;
查询asr_task表中的任务:
"id": 876,
"task_id": "1753459270"
"asr_task_id": "776521430199424",
FFmpeg Log日志:
`[Parsed_ass_0 @ 000002580dd21b00] ass_read_file(C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass): fopen failed
[Parsed_ass_0 @ 000002580dd21b00] Could not create a libass track when reading file 'C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass'
[AVFilterGraph @ 000002581039a7c0] Error initializing filter 'ass' with args ''C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass''
Error reinitializing filters!
Failed to inject frame into filter network: Invalid argument
Error while processing the decoded data for stream #0:0
Conversion failed!`
通过分析:
应该是ASS路径和编码格式导致的问题;
可以参考这样的压缩格式:
ffmpeg -i D:/TempDemo/AC99.mp4 -vcodec libx264 -filter_complex subtitles='C\:/ProgramData/AC99.ass:charenc=UTF-8' -y D:/TempDemo/Test_Video/UP_video/AC99_H264.mp4
上面省略了部分压制参数;
Windows下使用的是反斜杠"\"。
Linux下使用的是正斜杠"/"
另外注意ASS路径在单引号之间,而且盘符的冒号前面要加转移符\,非UTF-8编号,通过charenc=UTF-8强制转换为UTF-8格式;
两种方式:
1.云端自动备份;(比如自动识别完成后,自动云端备份一次SRT文件)
2.开发程序重复查询已经成功的任务的入口;
RT,现在实时查找算法存在瓶颈;
后续需要改进;
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.