How to add googlespeechengine

Hello patui,

Would like to know how to add back the googles Speech Engine.
Is it in config.ini or configcore.json?

Thx for you contribution in Nosub, it is near to prefect...

Eric

问题：convert to pcm file failed

从B站上下了个视频，https://www.bilibili.com/video/av45327535/。
格式为1080p的mp4，nosub可以打开但不能自动切轴，左下角状态栏显示 convert to pcm file failed。
请看看如何解决，谢谢。

离线自动声音排轴能否可以设定参数值?

如声音的空白间隔之内多少不断行
以及音量多少以上不断行
还有同一行最多几个字便强迫断行

比如说人的说话同一行有时也会有停顿与呢喃
"今天刚好有个..这个..新闻"
以目前的版本这个同一行的文字会被断成三行
今天刚好有个
这个
新闻

也有人的说话很快速霹雳啪拉说个不停
字幕的同一行就会变得很长造成阅读上的困难

这两个问题
都会让自动断行在事後修正时间增加许多

另外可以新增一个自动剪掉无声片段并输出成XML的功能吗?
将视频里没有讲话的部份自动剪除
(也可设定参数值低於多少分贝以下剪除
剪除的缓出入时间少於几毫秒以内的空白不剪除等等)
剪除後合并并输出为xml 供剪视频软件使用

可自訂義顯示語言

這個自動上字幕軟體雖然做的很棒，但希望能讓使用者自行變更顯示介面中的文字內容
例如在程式資料夾建立一個lang資料夾，裡面放類似zh-CN.json、zh-TW.json、en-US.json，
例如這樣可以讓使用者自行翻譯成自己的語言，甚至協助Pull requests翻譯檔案。

雖然說這功能沒有必要在這階段先做，可以晚點再做，先把上字幕核心搞好，加油!!

About 推荐的字幕制作平台.md

节选自 Line 47: ## 2.今日头条旗下-巨量创意平台Web版（免费）
缺点：

需要注册。

需要上传视频文件（必须是视频）。

您在这里提到了【需要注册】是一个缺点，那么

节选自 Line 25: ## 讯飞听见-听见译制（免费）
缺点：

目前没有发现；

又在这里表示 “没有发现缺点”，是否表示 “听见译制” 是不需要注册的？如果是，如何做到这一点？

"AudioFileASREngineGroup": {
"IFlyAudioFileASREngine": {
"EngineGroup": [
{
"Name": "Wong xXXXXXX",
"APPID": "ldjflkjasd",
"APISecret": "44391aXXXXXXXXXXXXXXXXXX",
"APIKEY": " eb861XXXXXXXXXXXXXXXX",
"Language": "zh"

但走不下去.

感恩回覆....

Eric Wong

双击定位到文件夹，文件夹打开了两次。

有支持32位操作的么

能不能编译一个32位操作系统用的

增加无限撤销功能

波形图加载首次加载过慢。【性能优化】

打开视频，自动加载同文件夹下的srt字幕文件

ffmpeg 压硬字幕，某些语种会有问题

比如泰语字幕，被ffmpeg硬编码后，有些顶上的声调符号不知道是被切掉了还是压缩了，莫名其妙的消失了

字幕文本的查找、替换功能？

音视频转录后，经常出现批量的语音识别错词（中文状态），希望能有批量替换功能，解决后期精校的工作量

希望在预览时能够选择编译转义字符

如题，在这种情况下能够选择将\n转译为换行，将<i></i>中间的文字转译为斜体。

希望可以添加可以几条字幕同时平移的功能

rt

希望能加一条线，指示一下目前播放到哪了

就像这样

希望加入Automatic Forced Alignment（音文对齐）和Spleeter（音轨分离）

背景：
目前ASR效果还可以（提前Spleeter不知到能不能提高识别率）。
但是断句太烂，音频识别出文本后，可以考虑手动/只能断句，最后进行AFA（Automatic Forced Alignment）。

看了音文强制对齐，识别率不低啊，感觉可以语音转文字，支持的语言也多
即使是影视素材，英文识别率也挺高的，就有个思路，不知道大佬有没有兴趣：
1、语音转文本：Montreal Forced Aligner （可以用其他转写）
2、英文智能标点：http://bark.phon.ioc.ee/punctuator （中文没了解）
3、手动/半自动断句（.!?等），部分修正（"i'""i "等）
4、带时间戳音文对齐：Montreal Forced Aligner、aeneas、YouTube（添加字幕有自动对齐）

音文对齐工具
1、Montreal Forced Aligner（支持挺多语言的）：
https://zhuanlan.zhihu.com/p/86657478

效果：
https://www.youtube.com/watch?v=LgrX5gNgxx0&ab_channel=MahdiChtourou
https://www.youtube.com/watch?v=VONAIXelJYg&ab_channel=AdvancedSkeleton
https://www.youtube.com/watch?v=OLXrlcnndBs&ab_channel=YutingHsueh

2、aeneas（多语言支持，有free Webapp）：
https://www.readbeyond.it/aeneas/
使用感受：声音干净的素材对得很齐（如Audiobook，讲解等），影视在干净的地方还很准，嘈杂处对得很糟糕。
配合Spleeter/iZotope RX.8，人声分离后，准度会提高很多。
经过测试，Spleeter有600s持续运行时间限制，增加时长容易引起内存溢出，16G内存能跑800s左右。
SpleeterGui，傻瓜式安装，支持批量拖入，最高能跑700s左右。
长音频还是用iZotope RX.8吧。

【UI BUG】部分电脑视频播放器下面有一条黑线

播放器与波形图连接处，并不是所有机器都有这个问题；

科大讯飞webAPI调用接口有修改

SSL Error: WINHTTP_CALLBACK_STATUS_FLAG_CERT_DATE_INVALID SLL certificate is expired.

和json里面EngineGroup 配置信息不一致

如何导出软件字幕

Hello Patui,

你好，我想问如何导出capcut （剪映海外版）手机软件的外语的字幕，比如日语韩语字幕。因为之前有使用SpeechJsonParser插件而可以顺利导出剪映的字幕。因此想问你要如何在插件内设定capcut以便在在emulator里面导出字幕，不知你可以协助？谢谢

增加对高DPI，4K屏幕的支持；

对高DPI分辨率的支持；

人工字幕有听不清的地方做了标注。

编译环境问题

请问，Nosub的编译环境是什么样的？
能否在readme中增加一部分对于编译的说明，谢谢。

收集程序崩溃时的dump信息

参考文献：
https://www.spirithy.com/2017/02/13/using-breakpad-and-analysis-dump/

时间轴字幕条增加多选模式。【新需求】

视频播放器性能瓶颈

测的商品播放器在60帧，加速播放的时候存在性能瓶颈。

Add Korean and Japanese speech to text

Please add japanese and korean speech to text.

语音任务失败

WinHttpReceiveResponse: 12152: 服务器返回的信息无效或不可识别

新特性：增加导出当前语句的功能

需求说明：
NoSub在断句方面的速度很快，希望能增加一个导出当前句子对应的视频的功能。这样方便针对复杂句子反复听读，NoSub也可以当外语学习软件了。
个人看ffmpeg有个命令行，可以比较容易实现。建议放到右侧列表右键菜单或者底部波形图右键菜单中。
希望能增加此特性。谢谢。

增加工程文件的概念【用户体验优化】

RT

语音文件转写成功后自动加载字幕【用户体验优化】

RT

部分WIN7用户无法播放视频和音频

暂时测试不是程序版本，也不是音视频的问题，在播放界面无法显示总时长。
具体原因未知，此条Issues记录之后，之后重构的时候处理。

电脑win7 旗舰版；

问题来自：@开心百分百

蓝奏云无法下载

蓝奏云无法下载，希望增加其他下载方式

aliyun转写闪退问题

我配置好key和secret 以及云存储后运行nosub语音转写出现闪退，讯飞和腾讯没有任何问题
再次打开提示语音任务失败

求助 nosub.exe打不开，显示如图，感谢！

路径没中文，安装了C++运行库，检查了dll没什么问题，不知道哪里出问题了

语音识别上传文件报错

视频：RC01.mp4
识别引擎：Nosub后端服务语言识别；

<html>
<head><title>413 Request Entity Too Large</title></head>
<body>
<center><h1>413 Request Entity Too Large</h1></center>
<hr><center>nginx/1.20.1</center>
</body>
</html>

新特性需求：增加快捷键

快捷键分几个层次，建议考虑，谢谢。
L1: 针对当前功能定义一下快捷键，希望增加上一句，下一句的挑战快捷键；
L2: 快捷键可自定义
L3: 可自定义类似vim的单键快捷键，j/k跳转到上/下句，i进入当前句子字幕编辑

纯字幕编辑模式下，闪退；

点击【开始时间】或是【结束时间】时，直接闪退；

Nosub Server语音任务失败客户端一直等待查询中。

后端语音识别引擎两个问题：
1.腾讯语音任务识别，没有标注任务识别的原因；
2.客户端，任务失败后，还一直显示查询中；

查询asr_task表中的任务：

"id": 876,
"task_id": "1753459270"
"asr_task_id": "776521430199424",

视频压制失败的问题分析；

FFmpeg Log日志：
`[Parsed_ass_0 @ 000002580dd21b00] ass_read_file(C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass): fopen failed
[Parsed_ass_0 @ 000002580dd21b00] Could not create a libass track when reading file 'C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass'
[AVFilterGraph @ 000002581039a7c0] Error initializing filter 'ass' with args ''C:\Users\濮滃浗鍚沑AppData\Local\Temp\2021_03_31_09_53_47_941.ass''

Error reinitializing filters!
Failed to inject frame into filter network: Invalid argument
Error while processing the decoded data for stream #0:0

Conversion failed!`

通过分析：
应该是ASS路径和编码格式导致的问题；

可以参考这样的压缩格式：
ffmpeg -i D:/TempDemo/AC99.mp4 -vcodec libx264 -filter_complex subtitles='C\:/ProgramData/AC99.ass:charenc=UTF-8' -y D:/TempDemo/Test_Video/UP_video/AC99_H264.mp4

上面省略了部分压制参数；

Windows下使用的是反斜杠"\"。

Linux下使用的是正斜杠"/"

另外注意ASS路径在单引号之间，而且盘符的冒号前面要加转移符\，非UTF-8编号，通过charenc=UTF-8强制转换为UTF-8格式；