基于OpenAI宣布开源的多语言语音识别系统Whisper,市面上应该没有第二个比它更准确的多语言语音识别系统了,我今天发布的这个软件就是基于它进行优化后的FastWhisper项目的GUI版本FasterWhisperGUI,之前论坛已经发布过WhisperDesktop了,所以我简单说一下它们之间的区别,因为WhisperDesktop是基于C++的Whisper项目而非FastWhisper的,所以效果肯定是没有本软件好的,速度也更慢,并且它也不支持额外参数,导致真正使用的时候效果并不好,我就是因为这点弃用WhisperDesktop的,此外,本软件还支持基于Demucs的人声提取(你应该也找不出第二个比它好的人声提取项目了)以及基于whisperX的字幕处理功能。

这是faster-whisper的图形用户界面软件,您可以:

将音频或视频文件转录为srt/txt/smi/vtt/lrc文件

将在线OpenAI-whisper模型转换为ct2格式

提供VAD模型和whisper模型的所有参数

现在,它支持whisperX

支持Demucs模型

支持whisper large-v3模型

GitHub地址:https://github.com/CheshireCC/faster-whisper-GUI

基于谷歌Colab的在线项目:https://github.com/Ayanaminn/N46Whisper

下载地址
123盘
密码:无
百度云盘
密码:xgig
本地下载
Huggingface模型
密码:无
百度云盘
密码:63zj
历史上的今天
01月
8
    抱歉,历史上的今天作者很懒,什么都没写!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。