Code Monkey home page Code Monkey logo

1c7 / translate-subtitle-file Goto Github PK

View Code? Open in Web Editor NEW
2.3K 38.0 191.0 13.32 MB

:robot: 字幕组机翻小助手 - 【功能1:翻译字幕文件】 .srt .ass .vtt 【功能2:语音转文字】(拖入视频或音频识别出字幕) (最新版 v4.1.0 更新时间2021年2月23号) 可配置12家翻译服务商,如谷歌,百度,腾讯,彩云,IBM,Azure,Amazon等(可配置6家语音服务商:阿里云,讯飞,腾讯云,IBM,Azure,Amazon )优点:1. 可以用多家服务商,2. 自己配 API Key 用自己账户的免费额度,比如腾讯每月有500万字符的免费翻译额度,IBM 500分钟的语音转文字免费额度(tern.best 那个域名过期了我不想续费了)Azure 语音转文字和 DeepL 免费版出了问题,用不了是正常的,请等待下个版本修复。

Home Page: https://tern.1c7.me

ass srt vtt desktop-app subtitle captions electron vuejs

translate-subtitle-file's Introduction

字幕组机翻小助手 - 视频演示 - 教程

这是什么?(为您解决什么问题?)

这个软件是用来翻译字幕文件的,比如 .srt, .vtt, .ass 这样后缀的字幕文件。

产品优点

您可以自己配置翻译服务商的 API Key,意思是直接使用服务商的翻译 API。

  • 好处:这样价格最低,没有中间商抽成,还可以合理利用服务商提供的免费额度(一般是100万字符/月的免费额度)
  • 坏处:你需要自己去服务商平台上注册和申请服务,用起来会比较麻烦和复杂(比如申请百度的翻译 API 大概要5-10分钟左右)

重要信息

本软件有桌面端+网页端。由于桌面端遇到一些问题(因为面包多更换了域名导致无法激活专业版),现在建议先用网页端。

如何使用本软件?

重要通知(1) (2023年1月30号)

  • 机翻小助手网页版上线了! https://tern.1c7.me 网页版打开就能用,非常方便,欢迎尝试。
  • 备注1: 版本 4.2.0 和更早的版本,都只有桌面端,必须下载使用,有些麻烦,建议先用网页版。
  • 备注2:目前网页版只支持字幕文件翻译功能,语音转文字功能暂时没有。

重要通知(2)(关于桌面版无法激活的问题)

  • 由于2022年10月份面包多更换了域名,从 mianbaoduo.com 换成了 mbd.pub,所以机翻小助手桌面端软件的激活功能出了问题。
  • 简单说就是版本 4.2.0(和之前更早的版本)都无法激活。
  • 2022年10月,11月,12月,2023年1月,开发者都在写代码,2023年1月30号发布了网页版。
  • 我会给网页版添加更多翻译服务商,语音转文字功能只能排期到后面。先把翻译的功能做好。

本软件为您解决什么问题?

解决2个问题:

  1. 机翻字幕文件,用机器翻译处理 .srt .ass .vtt 文件,比如可以英翻中,也支持其他语言(具体支持哪些语言,看你选的是哪家服务商)
  2. (仅桌面版可用)语音转文字,比如拖入 .mp4 .mkv .mp3 .aac .m4a .ts 等视频音频文件,机器生成字幕,输出的文件可以是 .txt(纯文本) 和 .srt (字幕)

桌面版下载地址

  • 下载 Windows 版本 (.zip) 下载后如何使用:解压 zip 得到一个文件夹,找 .exe 文件,双击即可
  • 下载 macOS 版本 (.dmg) 下载后如何使用:双击 dmg,打开后把 App 拖入到应用程序里即可,和其他 App 的安装方式一致

媒体评价

软件外观(桌面版)

解决什么问题?:1. 翻译字幕文件

比如拖入英语字幕,翻译成中英双语字幕

说明

  1. 支持三种字幕格式:.srt,.ass,.vtt
  2. 支持多种语言如德语,法语,日语,韩语,俄语,西班牙语,意大利语(只要翻译服务商支持,软件就支持)
  3. 如果不想要中英双语,也可以只要中文,不要英文(具体设置方法见下方截图)

设置输出格式

设置为"译文"即可(下图中的红框里,从上往下数起,第二个选项)

如果想要中英双语,那么需要设置成"原文+译文",点击右侧白色按钮可"设置格式"

解决什么问题?:2. 可以语音转文字

拖入音频或视频,识别出文字,然后输出为"纯文本"或"字幕"
音频支持: mp3, flac, wav, m4a, opus
视频支持: mp4, mkv, mov, webm, avi, wmv

说明:

  1. 如果选择"输出为字幕",还可以进行后续翻译,可以做到拖入视频,得到中英双语字幕

软件支持两个操作系统:Windows 和 macOS

Windows 下的运行截图

macOS 下的运行截图

适合谁用?

  1. 个人
  2. 字幕组(翻译视频的人)

使用场景

  1. 个人:看视频教程或其他没字幕的视频,机翻一下字幕,对质量要求不高,大概看懂 80% 内容就行
  2. 字幕组:先用机器翻译对字幕进行粗加工,然后再手动改进,这样效率更高

(备注:如果你对字幕质量要求很高,想要信达雅,最好还是雇人翻译。机器翻译的准确度区间 50%~85%)

价格 (Pricing)

软件分为两个版本:

  1. 免费版(适合95%的人)
  2. 专业版

免费版的特点

  • 字幕翻译:每个月上限 100 万字符 (上限重置时间:次月1号)
  • 语音转文字:每个月上限 10 小时 (上限重置时间:次月1号)

专业版的特点

  • 字幕翻译:翻译字符无上限
  • 语音转文字:无时间上限
  • 字幕翻译:提供字符数统计功能,
    可以看到用腾讯云翻译了 25 万个字符,用百度翻译了 7 万个字符,用谷歌翻译了 10 万个字符。
    可单独为服务商设置字符数上限,避免超出额度
  • 语音转文字:支持时长统计

重要说明:专业版的"无上限"指的是软件本身不做任何使用量的限制(免费版会做限制,参考上一段说明)
"无上限"和服务商没有任何关系,"无上限"不等于免费,
服务商该怎么计费还是怎么计费,服务商怎么收费不会受到软件是"免费版"还是"专业版"的影响。

举个实际例子,阿里云的语音转文字服务,每天的免费额度是2小时(有效期3个月)
假设你连续5天,每天都把2小时的免费额度用完,
那么在第6天,虽然阿里云的免费额度还有,但是软件的免费版10小时已经到了,就会提示无法继续使用了。
除非等到下个月1号重置,或者随便买一个专业版(比如7天的专业版) 就可以继续使用了。

当你购买这款软件的专业版,你实际上购买的价值是:

  1. 一个漂亮的图形界面
  2. 通过这个界面可以"直接"使用服务商提供的服务,中间没有经过任何第三方。
    ('语音转文字'服务或是'翻译'服务)
  3. 因为是"直接"使用的服务商,那么你直接给服务商交费就行
    (因此,费用不可能比这个还低了,而且你还可以用服务商提供的免费额度)

支持的服务商列表

字幕翻译支持如下服务商(共13家):

  • 彩云
  • 腾讯云
  • 百度
  • 阿里云
  • 有道
  • 搜狗
  • 小牛
  • 译云
  • 亚马逊
  • 谷歌
  • Azure
  • Yandex
  • IBM
  • DeepL

查看表格: 免费额度和价格

语音转文字支持如下服务商(共6家):

  • IBM
  • Azure
  • Amazon
  • 讯飞
  • 阿里云
  • 腾讯云

查看表格: 免费额度和价格

说明:所有语音转文字服务商都支持"任务历史"功能,
意思是只要文件成功传给服务商,服务商开始处理了,那么就可以关掉软件,不需要一直开着。
过一阵子再回来看任务做完没

语音转文字的免费额度

  • 阿里云:每天2小时(有效期3个月)
  • 讯飞:5个小时(一次性)
  • 腾讯云:10小时(每个月)
  • Amazon:60分钟(每个月)
  • Azure:60分钟(每个月)
  • IBM:500分钟(每个月)(500分钟 = 8小时20分钟)

基本概念:

  1. 先设置一家服务商,如果要用字幕翻译,就设置一家翻译服务商,如果要用语音转文字,就设置一家语音服务商
  2. 拖入文件,字幕的文件后缀是 .ass .vtt .srt,音视频的文件后缀是 .mp4 .mkv .mp3 .flac .wav .m4a .opus
  3. 从下拉菜单中选择服务商,选择源语言和目标语言(如果是字幕翻译),或者选择音频语言(如果是语音转文字),点击右侧"开始"按钮,就会开始处理了

推荐哪家服务商?

如果是字幕翻译

  • 推荐先申请百度,因为免费额度无限,而且注册流程较快,无需等待人工审核,照着"使用教程"一步步做大概5分钟就行

  • 彩云每个月免费额度100万,不过申请流程中有人工审核,因此需要1-3天,可以先申请了然后过几天看成功没,如果急用就不要申请彩云,来不及。

  • 其他服务商可以自己一个个试试,因为很难打分评比出哪个服务商"最好"

如果是语音转文字

  • 推荐用阿里云,因为每天2个小时的免费额度

  • 讯飞的免费额度是5小时(一次性) 不过只支持中文和英文两种语言

  • 简而言之:如果要识别中文,推荐阿里云,讯飞,腾讯云(按这个顺序)

  • 如果要识别英文,推荐 IBM Azure Amazon (英语是这些服务商的母语,按理应该比国内服务商好那么一些,用户可以自行对比试试)

  • 如果要识别其他语言,日语,泰语,德语,法语等等,自己先在下拉列表里找一找,看看哪家服务商支持你想要的语言,然后再去申请那家服务商

替代品 (和本软件功能相似的其他软件)

使用简单。打开网页即可使用,不是桌面软件(好评)
如果嫌弃机翻助手配置很麻烦,希望不要配置直接用,那么用字幕酱。
官方的费用说明:1分钟内免费,最低可0.2元/分钟
(费用说明文字复制于官网,时间2020年8月28号,价格请以官方最新说明为准,此处仅提供参考)

操作系统:支持 Windows,不支持 macOS
支持阿里云作为语音转文字服务商,
百度和腾讯作为翻译服务商(也就是支持的服务商数量没有本软件多)
界面美观程度稍差一点点(相对于本软件而言)
但客服比较好,两个 Q 群都有500人左右,群内活跃度较高


英译中¥32/分钟,中译英¥35/分钟


机器快转0.33元/分钟, 中文人工精转 80元/小时起


文档原话:(Arctime平台采用“积分”作为统一的虚拟货币,1元=100积分)
全自动语音转写每分钟价格:普通话/粤语/英语30积分,其他语种45积分。机器翻译每100字符扣除1积分。

学习成本对非程序员太高。
是命令行工具,没有图形界面,

截止到2020年8月28日,支持4家语音转文字服务商:谷歌的2个+讯飞+百度。
(我也没有搞懂谷歌那2个有啥区别)

基本原理是把音频拆分成多个60秒以下的文件,然后通过服务商的短语音识别 API 进行识别,
最终输出字幕文件(srt, ass 等格式)

pyTranscriber 就是给 Autosub 包了一层图形界面,(用的 PyQT)
系统支持:支持 Windows 和 Linux, macOS 最多只到 Mojave 和之前。
(对 macOS 的支持程度这一段说明来自 Release 页面)

对比

在同时满足以下条件下,其他软件没有本软件好:

  1. 便宜
    1. 服务商有免费额度
    2. 哪怕付费也是直接给服务商付费,没有中间商提价
      价格不可能比这个还低了
  2. 界面美观
  3. 可批量处理文件(字幕/音频/视频)
  4. 支持市面上几乎所有服务商,用户可以随意自由切换服务商使用

软件作者联系方式

邮件: [email protected]
QQ: 1003211008

用户 QQ 群 (欢迎加群)

  • 三群: 128986462(人数: 2/200)
  • 二群:658774053(人数: 500/500)
  • 一群:982808006(人数: 495/500)

推荐一下别人的产品

  1. 字幕酱 https://www.zimujiang.com/
  2. VideoSrt Pro https://www.yuque.com/viggo-t7cdi/videosrt-pro/cpwtwl

translate-subtitle-file's People

Contributors

1c7 avatar eyasliu avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

translate-subtitle-file's Issues

amazon语音服务有点问题

bucket 名称应该设置为可配置,不能写死
否则API报错:
Error: The requested bucket name is not available. The bucket namespace is shared by all users of the system. Please select a different name and try again.

请教azure语音识别转字幕

用了你的软件,功能很全面,请问你是怎么处理azure的返回数据的,我在做个azure平台语音转字幕的软件,可没发现微软没提供单词时码信息,只返回纯文本和总时长和总偏移

希望加入deepl API的支持

软件非常棒,但是我有deepl的付费api,软件目前只能用网页版的deepl,还没有配置deepl api的地方,希望后续支持

语音转文字(谷歌)正确配置账户信息后无法测试成功

语音转文字(谷歌)正确配置账户信息后无法测试成功
已为谷歌云账户配置了均在相同地域的语音转文字服务帐号 (Service accounts) .json和对象存储桶名称。但是多次测试等待较长时间也无法显示测试成功。
客户端版本:windows 4.1.0
05-25_23-23

azure语音转文字的断句很差

azure语音转文字4.1.0无法使用,3.9.0正常,但断句是根据时间截断,造成字幕看起来怪怪的,作者准备修改这功能吗?

问卷调查:是否需要命令行版本的机翻助手?(请用户们留下你宝贵的意见)

解释

当前这个机翻助手的桌面端软件,需要拖入/选择后进行操作(操作前需要设置服务商配置)

目标

有些程序员用户希望在命令行处理

问题

  1. 你是否需要这样一个命令行工具?
  2. 目前有2个功能"字幕文件翻译" 和"语音转文字",如果做成命令行,你希望先实现哪个?对你而言哪个用的比较频繁,价值大一些?
  3. 收费方面,有什么看法可以分享?
  • 备注:收费肯定要收的,只是多少和方式的问题

语音识别时间过长

两小时长的英文语音识别了一个小时还未成完成,请问这是正常的么?用的阿里云。
image

希望能增加批量翻译字幕文件功能

首先谢谢作者的无私贡献,把此翻译小助手开源,小助手美中不足的是没有批量翻译字幕文件的功能,对于需批量翻译的字幕文件(如:国外的电视剧等),需单个拖拽翻译工作量比较大,所以希望作者在百忙之中能够抽出时间给翻译小助手增加批量翻译字幕文件功能。

腾讯的报错了

收到,能提供一些信息吗?

  • Window/Mac?
  • 版本 1.0.5还是?
  • 正确配置了腾讯云信息吗?
  • 截个图?

哇 你回复的真快 是说appid不存在 我先试了百度的是可以的

vtt文件无法翻译吗?

加个wx:[隐私屏蔽] 我现在只是本地使用vtt功能,代码有点混乱,所以没有告知你。

谷歌语音识别,如果选择英语(美国)、英语(爱尔兰),转录出的英文文字没有空格

例如:
1
00:00:00,000 --> 00:00:03,200
hellodragonsmynameisSamJonesI'm

2
00:00:03,200 --> 00:00:06,300
thefounderofgenerateandI'mheretodaytoask

3
00:00:06,300 --> 00:00:09,400
the£60,000inreturnfor10%

4
00:00:09,400 --> 00:00:13,100
equitywithin

5
00:00:13,100 --> 00:00:16,200
theadvertisingindustryisthatit'sbuilt

但如果只选择“英语”,不选择具体国家或地区,就没有这种问题:但准确率锐减。
例如:
1
00:00:00,000 --> 00:00:03,000
how many dragons my name is Sam Jones on the

2
00:00:03,000 --> 00:00:06,000
founder of generate and I'm here today to ask

3
00:00:06,000 --> 00:00:09,200
the 60,000 lb in return to 10%

4
00:00:09,200 --> 00:00:12,400
equity the elephant Secrets

5
00:00:12,400 --> 00:00:15,400
within the advertising industry is that is

使用GCP的语音转文字,测试配置是否正确的时候一直显示测试中

GCP的账号设置应该是没问题的,我看了一下之前CLOSED的问题也在软件里添加了HTTP的代理,网址测试也都是通的,但是测试配置是否正确时就一直显示测试中;我用的是CLASH,我看了一下CLASH的CONNECTION界面,IBM,AMAZON点击测试后都会有相应的新链接(显示走代理)出现,但是GCP的按了测试键后却没有,想咨询一下作者大概会是啥问题?

有2个小问题希望能改进

1.每次打开软件都要重新选择翻译服务器商,软件无法记忆上次使用过的服务商

2.翻译后的文件默认不是和原来的文件在一个目录,或者能添加手动指定目录功能

是否有即时翻译功能(或者考虑开发)

平常看一般视频的话用字幕或者音频转换翻译太摸了,想试试同传软件。找了好多天的同声传译软件,他们的即时翻译功能都不能满意,如:在翻译转换的间隔时说话会被吞字,导致下一句开头缺字等等问题。期待作者能锦上添花,加入这个功能。

还算满意的两个案例参考:
https://1heisuzuki.github.io/speech-to-text-webcam-overlay/
语音识别成文本很快,很准,可识别夹杂英语。就是翻译只有谷歌生草机。

https://www.bilibili.com/video/BV1pF411w7z3/
语音识别接口只有阿里云,识别夹杂英语不太行。翻译接口少,没有deepl。

同一文件夹下,连续翻译多个字幕时,后面翻译的字幕会叠加前面翻译的字幕

问题:

在同一文件夹下,连续翻译多个字幕时,后面翻译的字幕会叠加前面翻译的字幕

环境:

  • macOS Mojave 10.14.4

复现步骤:

  1. 找一个多字幕的文件夹
  2. 拖入翻译 字幕1,翻译后中英字幕正常显示
  3. 拖入翻译 字幕2,翻译后会把 字幕1 的内容叠加到 字幕2 的翻译结果中去,播放时就会同时显示3-4行中英字幕
  4. 拖入翻译 字幕3,翻译后会把 字幕1 、字幕2 的翻译结果加到 字幕3 的翻译结果中去,播放时就会同时显示5-6行中英字幕

希望大佬帮忙修复~我平时看MOOC就指望你这个字幕翻译工具了~

对ass字幕中的\N处理有缺陷

ass字幕中的\N表示换行,很多长句会使用这种方法分成多行显示。但软件没有正确处理它,直接将其当作普通文本处理了,导致翻译结果混乱。
建议在翻译前将\N替换成空格,得到翻译结果后再根据语句长度自动分行。
不建议将每行文本单独翻译,因为多行字幕可能是一整句话,拆开翻译结果会不准确。

readme文档说明很多错误,有误导用户的嫌疑

不推荐腾讯云,字幕断句有问题(一句一大段文字)如果只是想输出纯文字,那问题不大,但如果需要字幕,那质量很差,一句话很多个字,在屏幕上会显示4-5行,占满半个屏幕,影响观看,如果自己去调整时间轴又比较费时。

我自己的测试,腾讯云的语音识别效果远好于阿里云的语音识别,你没看错,远好于阿里云,腾讯云语音之所以有一句一大段的问题,是因为文件转写本身并不是完全针对字幕场景的,需要开发者根据接口返回的分词数据,自行断句切割,而腾讯云语音识别的API接口已经提供了分词功能,这个工作要开发者来完成。

另外腾讯云的翻译也是如此,
如果我没有看错接口,腾讯云翻译也是支持一次翻译多句话的,请认真阅读文档。

欢迎提出建议/意见,可以在这里面留言或者直接开个新 issue,都可以。

目前(2020年11月)我手头可以做的事情有:

  • 出海 (赚国外市场的钱)
    • 优化软件的英文版界面(缺了的翻译都补上)
    • 英文版官网,怎么写宣传语
    • 英文的支付渠道要实现,可能是 paddle
    • 海外的宣传
  • 做中文官网
  • 在国内宣传
  • 加一些新功能
    • 压制视频
    • 支持 lrc 歌词文件翻译
    • 支持 txt 文本文件翻译
    • 把 SRT 做成可编辑的,目的是优化时间轴

[多图] 版本变更

每次升级版本,增加了一些新功能或者做了一些改动。
有一些是可以用文字说清楚的,但还有一些配个图片更好。

这里存放版本更新说明。每个版本改了什么,具体长什么样。

公告 2021-3-5 ("输出格式"是空的问题)

软件版本 v4.1.0

image

image

image

目前有2个 win10用户,1个 mac 用户。反馈"输出格式"下拉菜单为空的问题。

这是一个 bug。我无法复现出来,
目前暂不清楚什么原因造成了这个 bug。
如果有愿意用 teamviewer/向日葵 让我联机调试一下的用户,请联系我。Q 群 982808006。进群直接找群主

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.