SpeakIn(声入)是一款面向 Windows 的桌面语音输入工具,用户可通过全局热键快速开始录音,将语音实时转换为文字,并直接输出到当前焦点窗口,无需切换应用或打断当前工作流。
它主要面向独立开发者、内容创作者以及重度使用 AI 的用户,适合需求描述、方案讨论、问题分析、内容草拟等高频文字输入场景。相比传统键盘输入,SpeakIn 更强调效率、自然表达与长期使用体验。
核心能力
- 支持豆包、百炼 Paraformer、千问 Qwen3 ASR 等多种语音识别服务商
- 支持 AI 二次优化,可进行润色、纠错、翻译与结构化改写
- 支持麦克风输入与系统声音转写两种音频来源
- 提供粘贴输入、模拟键入、仅识别不输出等多种输出方式
- 提供全局热键、桌面 Overlay、静音检测与自动结束等能力
技术架构
项目基于 Tauri 2 构建,采用 Rust 后端与 React 前端。音频采集后经过 VAD 过滤、重采样与 WebSocket 流式传输,识别结果可选进入 AI 优化链路,最终通过模拟输入或剪贴板写入目标应用。
隐私说明
SpeakIn 不收集、不存储用户录音与文本内容。音频与文本仅在本地处理后发送至用户自行配置的服务商,相关凭据保存在操作系统原生密钥管理器中。