返回项目列表

软件产品维护中

SpeakIn

Windows 桌面语音输入与 AI 文本优化工具

SpeakIn（声入）是一款面向 Windows 的桌面语音输入工具，支持全局热键唤起、实时转写、自动输入到当前窗口，并可结合 AI 对文本进行润色、翻译与结构化处理，适合高频文字生产与 AI 协作场景。

项目主页下载地址 GitHub

更新于 2026.04.09

Tauri 2RustReactCPALWASAPIWebSocketVAD

项目介绍

SpeakIn（声入）是一款面向 Windows 的桌面语音输入工具，用户可通过全局热键快速开始录音，将语音实时转换为文字，并直接输出到当前焦点窗口，无需切换应用或打断当前工作流。

它主要面向独立开发者、内容创作者以及重度使用 AI 的用户，适合需求描述、方案讨论、问题分析、内容草拟等高频文字输入场景。相比传统键盘输入，SpeakIn 更强调效率、自然表达与长期使用体验。

核心能力

支持豆包、百炼 Paraformer、千问 Qwen3 ASR 等多种语音识别服务商
支持 AI 二次优化，可进行润色、纠错、翻译与结构化改写
支持麦克风输入与系统声音转写两种音频来源
提供粘贴输入、模拟键入、仅识别不输出等多种输出方式
提供全局热键、桌面 Overlay、静音检测与自动结束等能力

技术架构

项目基于 Tauri 2 构建，采用 Rust 后端与 React 前端。音频采集后经过 VAD 过滤、重采样与 WebSocket 流式传输，识别结果可选进入 AI 优化链路，最终通过模拟输入或剪贴板写入目标应用。

隐私说明

SpeakIn 不收集、不存储用户录音与文本内容。音频与文本仅在本地处理后发送至用户自行配置的服务商，相关凭据保存在操作系统原生密钥管理器中。