GoForum🌐 V2EX

[自荐] CapsWriter-Offline v2.5 好用的 PC 端的语音输入工具,高准确率、低延迟,支持热词、LLM 后处理

JackalZhao · 2026-05-09 23:05 · 0 次点赞 · 1 条回复

demo

按住 CapsLock 或 鼠标 X2 说话,松开就上屏。就这么简单。

CapsWriter-Offline 是一个专为 Windows 打造的完全离线语音输入工具。

✨ 核心特性

  • 语音输入:按住 CapsLock 键鼠标侧键 X2 说话,松开即输入,超低延迟,默认去除末尾逗句号。支持对讲机模式和单击录音模式。
  • 文件转录:音视频文件往客户端 exe 一丢,字幕 (.srt)、文本 (.txt)、时间戳 (.json) 统统都有。
  • 数字 ITN:自动将「十五六个」转为「 15~16 个」,支持各种复杂数字格式。
  • 热词替换:在 hot.txt 记下偏僻词,通过音素模糊匹配,相似度大于阈值则强制替换。
  • 正则替换:在 hot-rule.txt 用正则或简单等号规则,精准强制替换。
  • LLM 角色:预置了润色、小助理等角色,当识别结果的开头匹配任一角色名字时,将交由该角色处理。
  • 托盘菜单:右键托盘图标即可添加热词、复制结果、清除 LLM 记忆。
  • C/S 架构:服务端与客户端分离,虽然 Win7 老电脑跑不了服务端模型,但最少能用客户端输入。
  • 日记归档:按日期保存你的每一句语音及其识别结果。
  • 录音保存:所有语音均保存为本地音频文件,隐私安全,永不丢失。

CapsWriter-Offline 的精髓在于:完全离线(不受网络限制)、响应极快高准确率高度自定义。我追求的是一种「如臂使指」的流畅感,让它成为一个专属的一体化输入利器。无需安装,一个 U 盘就能带走,随插随用,保密电脑也能用。

以下为支持的模型:

引擎名 准确性 速度 格式 显卡加速
Paraformer ★★★☆☆ ★★★★★ ONNX
SenseVoice-Small ★★★☆☆ ★★★★★ ONNX
Fun-ASR-Nano ★★★★☆ ★★★★☆ ONNX + GGUF
Qwen3-ASR ★★★★★ ★★★☆☆ ONNX + GGUF

性能参考( 20s 音频转录延迟):

模型 CPU U9-285H GPU RTX5050
Paraformer 0.6s -
SenseVoice-Small 0.6s 0.15s
Fun-ASR-Nano 2.0s 0.5s
Qwen3-ASR-1.7B 4.0s 1.0s

功能文档:

下载地址:

1 条回复
yukminnie · 2026-05-09 23:20
#1

“如臂使指”是一个汉语成语,拼音为 rú bì shǐ zhǐ,意为像胳膊支配手指一样。它比喻指挥顺畅、运作得心应手、行动无阻、没有牵制。

对不起,看成臀了。心想怎么有这么刁钻的成语。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: JackalZhao
发布: 2026-05-09
点赞: 0
回复: 0