温馨提醒

如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢

本文最后更新于2023年12月20日,已超过 180天没有更新

特征:

基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”

纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性

比 OpenAI 的实现快得多。

混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT

内置性能分析器,可测量单个计算着色器的执行时间

内存使用率低

用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。

用于音频捕获的语音活动检测。

官方网站:https://github.com/Const-me/Whisper

使用步骤:

下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如下图,作者推荐1.42G这个模型,下面百度云盘下载链接)

解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型

加载完成后,就可以进行语音转文了

ggml-medium 语音模型(官方):https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

作者推荐ggml-medium.bin(大小为 1.42GB) https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc 提取码: xnbc

最小的体验包:https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1

https://www.aliyundrive.com/s/4Q1kv3GYMWu

https://pan.baidu.com/s/1psBcyAm0O5JygXccL7GCqA   提取码:52pj

https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko

历史上的今天
12月
20
    抱歉,历史上的今天作者很懒,什么都没写!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。