Changelog

近期更新

san 瞬写的持续打磨。
每个功能都来自真实用户反馈,小步快跑,稳步前行。

5 大地域口音普通话增强

川渝 / 东北 / 两广 / 江浙 / 西北 5 大口音识别强化,内置热词库与提示词规则,零模型改动即可生效。

VAD 断句流式并行架构

首创端侧 VAD 语音活动检测 + ASR/LLM 双线程并行处理,把端到端规整延迟从 5-7s 压缩到 800ms 级别。

宿主应用感知(App-Aware)

自动读取前台 App 进程,匹配微信/飞书/Outlook/Notion 等 20+ 主流职场 App 的最佳 Prompt 模板。

双轨渐变 + 魔法棒 + 一键回滚

灰色 ASR 实时上屏 → 黑色 AI 精整的 200ms 渐变;⌘+K 唤起魔法棒局部重写;⌥+Z 一键回滚口述原稿。

端侧动态 RAG(本地词典 + 通讯录 + 剪贴板)

1.5B 端侧模型 System Prompt 动态注入三源 RAG,专有名词识别 F1 从 0.61 提升至 0.94,全部本地完成。

端侧声纹分割(2-4 人会议)

ECAPA-TDNN 声纹特征 + 谱聚类,2-4 人会议 DER ≤ 18%,全程本地完成,声纹嵌入不落盘不同步。

E2EE 多端同步

Argon2id + AES-256-GCM + BIP-39 助记词 + 用户自有 iCloud/OneDrive/WebDAV,零知识云端同步,密钥永不离开设备。

免动手语音指令(30+ 高频指令)

以「瞬写,」/「小写,」/「Hey San,」等前缀口述控制命令,系统识别为指令而非正文,无需切换键盘。

长文本流式滑动语义压缩

20-30 分钟连续口述场景下,8GB 设备内存稳定 ≤ 1.5GB;后台摘要 + KV-Cache 阶段性释放,零用户感知。

电池能效自适应三档降级

30% / 15% / 5% 三档自动降级;差旅 / 突发停电等真实边缘场景下,保护续航,连接电源后自动恢复完整功能。