OpenAI基于Whisper的音频转录服务汇总

OpenAI在2022年9月开源了 Whisper 自动语音识别系统 ,并在2023年3月与ChatGPT API一起发布了Whisper的API版本。

Whisper 本身是开源的(https://github.com/openai/whisper),因此可以基于 Whisper自建或二次开发。而Whisper API 提供的是 Whisper v2-large 模型,价格每分钟 0.006 美元。

OpenAI基于Whisper的音频转录服务汇总-有点鬼东西

Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别,Whisper 还能实现多种语言的转录,以及将这些语言翻译成英语。

因此最近涌现出了很多基于Whisper的音频转文字服务。

汇总一下基于Whisper的音频转文字服务。

writeout.ai:https://github.com/beyondcode/writeout.ai

Good Tape:https://www.mygoodtape.com

Auris AI:https://aurisai.io

AirCaption:https://www.aircaption.com

Revoldiv:https://revoldiv.com

由于Whisper确实需要GPU加持,有开发人员将Whisper从Python迁移成C++版本,可以运行在CPU上。

https://github.com/ggerganov/whisper.cpp

https://whisper.ggerganov.com 这是基于whipser.cpp及WASM的实例。

Whisper ASR Webservice 将Whisper封装成Web服务及Docker服务,方便自建。

https://github.com/ahmetoner/whisper-asr-webservice

Aiko:https://sindresorhus.com/aiko  基于Whisper的Mac应用

除了这些基于Whipser的转录服务外,强烈推荐 大名鼎鼎的转录服务 oTranscribe ,开源免费。

常见问题
你们的资源正规吗?
本站所有图片均为正规机构写真,无露D,无大CD,有这方面要求的请绕道。 网传资源,素材内的人物来自正规社交平台(微博等),不含违反国家法律规定的相关影像资料;建议各位老湿尊重著作权,维护原创作者的利益,有能力购买正版。
网站可以不用下载直接在线观看吗?
本站是图片资源下载站,大部分图片都需要下载解压后观看,少数栏目提供在线观看,具体以文章页内实际为准。
下载后提示文件损坏、解压出错怎么办?(资源一般不会有问题,有问题干嘛还分享?先看教程在发言!)
这种情况一般都是文件下载不完整或解压软件的问题,解压软件电脑端建议用7z、好压等正规软件,安卓建议用"Zarchiver" 苹果建议用"解压专家"。本站有详细解压教程请参考 详细解压教程请→点击查看
资源下载后手机用户如何解压?
在本站其他遇见的问题怎么办?
可点击进入本站文档专题,查找相关疑问解答:点击学习

评论0

请先
本站网址:kusucai.xyz 开通本站VIP,全站即可下载,尊享全网互联网资源
没有账号?注册  忘记密码?