返回项目列表
软件产品维护中

SpeakIn

Windows 桌面语音输入与 AI 文本优化工具

SpeakIn(声入)是一款面向 Windows 的桌面语音输入工具,支持全局热键唤起、实时转写、自动输入到当前窗口,并可结合 AI 对文本进行润色、翻译与结构化处理,适合高频文字生产与 AI 协作场景。

项目主页下载地址GitHub

更新于 2026.04.09

Tauri 2RustReactCPALWASAPIWebSocketVAD

项目介绍

SpeakIn(声入)是一款面向 Windows 的桌面语音输入工具,用户可通过全局热键快速开始录音,将语音实时转换为文字,并直接输出到当前焦点窗口,无需切换应用或打断当前工作流。

它主要面向独立开发者、内容创作者以及重度使用 AI 的用户,适合需求描述、方案讨论、问题分析、内容草拟等高频文字输入场景。相比传统键盘输入,SpeakIn 更强调效率、自然表达与长期使用体验。

核心能力

  • 支持豆包、百炼 Paraformer、千问 Qwen3 ASR 等多种语音识别服务商
  • 支持 AI 二次优化,可进行润色、纠错、翻译与结构化改写
  • 支持麦克风输入与系统声音转写两种音频来源
  • 提供粘贴输入、模拟键入、仅识别不输出等多种输出方式
  • 提供全局热键、桌面 Overlay、静音检测与自动结束等能力

技术架构

项目基于 Tauri 2 构建,采用 Rust 后端与 React 前端。音频采集后经过 VAD 过滤、重采样与 WebSocket 流式传输,识别结果可选进入 AI 优化链路,最终通过模拟输入或剪贴板写入目标应用。

隐私说明

SpeakIn 不收集、不存储用户录音与文本内容。音频与文本仅在本地处理后发送至用户自行配置的服务商,相关凭据保存在操作系统原生密钥管理器中。