语音文件转文字

语音文件转文字

https://speech-to-text-demo.ng.bluemix.net/

每个月给自己一个硬性的存款和要求印尼一定又有一笔钱不能动他刚开始任意每个月一棒子也成品后来我就百分之六十百分之七十到现在我升至百分之九十网络可以。好了大家好我是巴林左炜把关注商业财经现在转行研究六年后的大洞欢迎收听后浪爱反目来后来坟墓年轻的声音。播出。最近很多打工人肯定听说过延迟退休啊属严重追效来了那我身边的同事们呢也开始啊盘算着自己到了五六十岁还能干什么还得干多少年才能退休呢相比来说呢这个烦恼对于质检年轻人来说可能呃就没有那么杀伤力了你别说五六十岁人家可能盘算着三十五岁就要退休了定下这个目标真不是说笑如果我告诉你如果成为塞尔组每个人都可能在三十五岁提前退休你相信吗。针对有可能呢这期节目我们就来聊聊怎么做你就有可能在三十五岁过上优选的退休生活以及是不是每个人都是合作费尔组这里面到底有多少坑。这次节目我们邀请到的嘉宾是一位就能后的创业者塞尔运动的实践者小欣来仙境小心和大家打招呼。大家好我是小心一个即将退休的九零后。黑客即将退休后就我们这叫聊着塞尔玛可能大家对这个词还不是特别的熟悉呃他是挨挨而已就是那个火的那个单词的四个字母他的意思是反弹书您的判断瑞台呃卫的首字母意思就是财务独立提早退休就我理解他又比较简单的方法就是你先存一大笔钱绕村很长时间存活这个钱之后您每年就靠这个利息来生活难就可以退休了那只是我的一个一个了解到概念将请小心就是聊聊你对这个饭的定义时尚。呃艾尔呢就遭遇放在国外却像你说的那样是有一笔比较大的成广然后通过至它的利益以及生活当时呢在中国的国银根莫宁不太一样所以本质上差不多档次我们还以为做一些修改而且呢像八月运动它集资物资等大家讲的那样与财务自由超级有一定厦门很大的名字档案不同因为发言赢得更多的像财务独立而不是财务自由嗯财务独立和财务自由龙区别吗。那财务自由扔向大家讲呃呃好几轮艾尔一百亿啊防御保姆啊那财务努力让鳄鱼已有一比还送了光的钱然后又用相对乐观的被动东渡可以支持第一个生活了一个状态

autosub

更新:最近发现autosub不错,利用Google Web Speech API,免费生成SRT字幕,而且速度挺快,两个小时的音频几分钟就转换好了,目前支持90多种语言。

https://zhuanlan.zhihu.com/p/59159735

https://github.com/BingLingGroup/autosub/releases/tag/0.5.5-alphagithub.com

打开releases发布页下载autosub的pyinstaller压缩包

下载到本地解压之后,点击run.bat文件,键入

G:\sw\autosub-0.5.7-alpha-win-x64-pyinstaller\autosub_pyinstaller>autosub -S cmn-hans-cn -D zh-cn -i "G:\CMCoOR4DwNWKATtkqgB2Ivae (online-audio-converter.com).mp3"

将源文件转换为"C:\Users\cutep\AppData\Local\Temp\tmpkgqutp9h.wav"来检测语音区域。
ffmpeg.exe -hide_banner -y -i "G:\CMCoOR4DwNWKATtkqgB2Ivae (online-audio-converter.com).mp3" -vn -ac 1 -ar 48000 -loglevel error "C:\Users\cutep\AppData\Local\Temp\tmpkgqutp9h.wav"

使用ffprobe来检查转换结果。
ffprobe.exe "C:\Users\cutep\AppData\Local\Temp\tmpkgqutp9h.wav" -show_format -pretty -loglevel quiet
[FORMAT]
filename=C:\Users\cutep\AppData\Local\Temp\tmpkgqutp9h.wav
nb_streams=1
nb_programs=0
format_name=wav
format_long_name=WAV / WAVE (Waveform Audio)
start_time=N/A
duration=0:42:33.036833
size=233.737577 Mibyte
bit_rate=768 Kbit/s
probe_score=99
TAG:encoder=Lavf58.29.100
[/FORMAT]

转换完毕。
使用Auditok检测语音区域。
Auditok语音区域检测完毕。
"C:\Users\cutep\AppData\Local\Temp\tmpkgqutp9h.wav"已被删除。

按照语音区域将音频转换为多个短语音片段。
转换中: 100% |############################################################################################| Time:  0:01:42

将短片段语音发送给Google Speech V2 API并得到识别结果。
语音转文字中: N/A% |
:13:36
Traceback (most recent call last):
  File "autosub\__main__.py", line 25, in <module>
  File "autosub\__init__.py", line 159, in main
  File "autosub\cmdline_utils.py", line 1369, in audio_or_video_prcs
  File "autosub\core.py", line 635, in list_to_googletrans
  File "site-packages\googletrans\client.py", line 249, in detect
  File "site-packages\googletrans\client.py", line 75, in _translate
  File "site-packages\googletrans\gtoken.py", line 200, in do
  File "site-packages\googletrans\gtoken.py", line 65, in _update
AttributeError: 'NoneType' object has no attribute 'group'
[2092] Failed to execute script __main__

https://app.xunjiepdf.com/voice2text/

在线语音转文字转换仅支持20M

Live Transcribe

Google也推出了Live Transcribe,能够将环境中的语音实时转为文字,目前支持70多种语言,在Google Play可以下载。

Powered by Jekyll and Theme by solid

本站总访问量