系统:PC
日期:2026-01-21
类别:杂类工具
版本:v2.1.0
CapsWriter离线版是一款开源免费的离线语音输入工具,其实这个领域的商业软件其实不少,而这款软件的最大优势就在于可以免费使用了,当然软件免费并不意味这款软件的质量差,语音转文字延迟低速度快,并且支持中英混输、自动阿拉伯数字、自动调整中英间隔,转化出来的文本绝大部分可以直接使用,无需网友将转化内容进行二次编辑。
CapsWriter离线语音输入工具的操作也非常简单,长按键盘上的大写锁定键后,软件会开始语音识别,当然,需要网友电脑有音频设备,毕竟是语音转化,当你再次松开大写锁定键时,识别的结果就可以立马输入指定的文本框了,适合多种应用场景,无论是聊天还是写代码假加入注释都能轻松搞定。
1、可通过编辑config.py文件配置服务端地址、快捷键、录音开关等功能。
2、可以同时服务多台客户端,实现多用户同时使用。
3、支持将音视频文件拖动到客户端打开,生成srt字幕文件。
4、若识别结果以关键词开头,会被记录在特定的年/月/关键词-日期.md文件中,关键词在keywords.txt中定义。
5、默认将每次录音识别结果记录在特定的年/月/日.md文件中,录音文件保存在年/月/assets目录下。
6、可在指定的热词文件中添加热词,客户端动态加载。
7、自动调整中英文之间的间隔,提升转录质量。
8、自动识别并转录阿拉伯数字。
9、支持中英文混合输入。
10、转录准确率高,识别精准。
11、实时转录,延迟极低。
12、支持长时间录音,没有时间限制。
13、可完全离线运行,无需网络连接。
1、软件与模型下载
本例演示环境为Windows11,另外需要准备一个麦克风。
首先,我们需要下载CapsWriter-Offline的64位版本,可以使用服务端、客户端。然后需要下载models.zip模型文件。

将软件和模型下载好后进行解压,然后将解压好的模型文件夹models复制到解压好的CapsWriter-Offline的文件夹中并替换原有的同名文件夹。

2、本地使用测试
现在我们首先双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

这时我们在双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

显示连接成功即可开始使用了。
软件在Windows系统中默认使用大小写切换键caps lock进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

可以看到对语音的识别非常准确,连标点符号也是。
除了支持无限时长语音的转写,作者在更新后,软件现在还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。大家感兴趣的话,可以自行尝试。
1、热词功能
可以在 hot-en.txthot-zh.txt hot-rule.txt 中添加三种热词,客户端动态识别载入。
2、日记功能
默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets。
3、关键词日记
识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义。
4、转录功能
将音视频文件拖动到客户端打开,即可转录生成 srt 字幕、txt文本等等。
1、软件无需安装,解压即可使用。

2、解压后找到下图快捷方式,双击启动即可。

热门推荐
相关应用
实时热词
评分及评论
点击星星用来评分