README file from
GithubLexVoice
English summary: LexVoice is an Obsidian desktop plugin for recording audio, transcribing speech, generating live outlines, reviewing meeting sediment candidates, and saving reusable Markdown objects such as todos, learning cards, people records, and ASR hotwords. It is not a hosted cloud service and does not include API keys; users configure their own speech-to-text and LLM providers.
LexVoice 是一个 Obsidian 桌面端插件,做录音、转写、实时大纲和会议沉淀。
它不是云服务,也不自带 API Key。你得接入自己的语音转写服务和大模型——把会议、访谈、课程、视频音频、个人口述这些东西整理成可回听、可复用、可沉淀的 Markdown。
1.2.0 · 失踪人口回归,带回来一万行代码
LexVoice 一开始就是个录音转写插件:录下来、转成文字、生成纪要,完事。但用了一段时间我发现,会议真正有价值的东西不在那篇转写稿里——转写稿生成完那一刻基本就没人再打开了。值得留下来的是:谁说了什么、要做什么、学到了什么、下次还会用到的术语。
所以 1.2.0 把 LexVoice 从"转写工具"重做成了"会议工作台"。录音只是入口,后面的大纲、沉淀、对象库才是重点。顺便还做了亿点点美化工作,界面更优雅,交互更清晰。
主要功能
实时大纲
录音时章节边录边长,不用等录完才看到 AI 整理结果,会议进行到一半就能扫一眼"刚才聊了啥"。
录完后章节和播放器联动——点章节直接跳到对应录音位置。录音中也能回看前面已经生成的章节,录音本身不受影响。
录音结束后进入最终整理态,AI 会把内容补全成完整纪要。
会中纪要
录音过程中可以在"大纲"下方记现场备注。只在录音会话的大纲页出现,不会跑到沉淀和纪要列表里碍事。
普通文字就是普通备注,但首字符是这几个符号会触发不同处理:
触发 AI 即时助理:
#概念— 开会突然听到"既判力"不懂,打#既判力回车,AI 给出定义、用法、在当前讨论里的意义?问题— "刚才那个判例叫啥",打?刚才那个判例回车,AI 结合当前转写和大纲直接回答!重点— "这条要单独跟进",打!这是核心争议点回车,AI 标记为重点并说明最终纪要怎么处理
只标记不触发 AI:
@指派人— 当场记下"这事 @腾哥 跟进",最终纪要归并待办时会优先把任务挂到 ta 名下/创建待办—/下周前出第二版方案,最终纪要会把这条作为一个明确的待办归入待办候选
半角全角都认(# 和 # 等价)。AI 不抢转写资源,会等到转写空档时再跑。所有会中备注会一起进入最终纪要的整理 prompt,作为"现场补充材料"标注清楚,不会被混进转写原文。
沉淀工作流
每篇纪要扫一次,AI 把内容拆成四组候选:
- 人员:逐条裁决,留下 / 合并 / 忽略
- 待办:默认全选,可编辑责任人、日期、子任务
- 学习:概念、机制、案例、观点、问答
- 热词:人名、机构、品牌、术语,后续 ASR 识别更准
处理完一组进下一组,跟流水线似的。已完成的组可以回看,也可以重扫。
对象库
LexVoice 不只是把内容导出成一篇 Markdown,而是把会议里值得复用的东西变成 Obsidian 里的独立对象:
- 人员档案
- 待办卡片
- 学习卡片
- ASR 热词
- 概念墙 / 待办墙 / 学习卡片墙
这些对象都在你自己的 vault 里,不在某个外部服务上。下次开会提到同一个人,能自动关联到已有档案。
待办增强
候选阶段就能行内编辑责任人、截止日期、子任务,全程没有弹窗。入库后写入标准 Markdown 待办格式,能被 Tasks 等插件识别。删除或重做时来源信息保留下来,方便追溯。
录音可靠性
- 录音前后都有电平条,告诉你麦克风和电脑音频到底在不在工作
- "真实麦克风保护"——避免把 CABLE Output、BlackHole、VoiceMeeter、Stereo Mix 这种虚拟声卡误当成真实麦克风
- 设置页有设备检测,"录了但没声音"这种问题不用慢慢猜
- 删除转写记录时会问要不要顺便把录音文件也删了
导出
一篇纪要可以接着生成:
- HTML 报告
- HTML PPT
- 可编辑 PPTX
- 邮件草稿
.eml
纪要列表
侧边栏按时间轴列最近的纪要,默认筛选本周,也能按模板筛。当前打开的纪要会高亮。右键菜单清理过一遍,尽量贴近 Obsidian 原生习惯。
基本工作流
- 打开 LexVoice 侧边栏
- 选模板和音频输入
- 开始录音,看一眼电平条有没有反应
- 录音中查看实时大纲,需要的话加会中备注
- 停止录音,等 AI 整理最终纪要
- 打开"沉淀",过一遍人员、待办、学习卡片、热词
- 要交付的话生成 HTML 报告、PPT、PPTX 或邮件草稿
| 内容 | 路径 |
|---|---|
| 录音文件 | LexVoice/录音 |
| 转写纪要 | LexVoice/转写纪要 |
| 学习卡片 | LexVoice/学习卡片 |
| 待办卡片 | LexVoice/待办 |
| 邮件草稿 | LexVoice/邮件草稿 |
| 词汇表 | LexVoice/词汇表.md |
设置里都能改。
准备工作
必需:
- Obsidian 桌面端
- 一个语音转写服务(云端 API 或本地都行)
- 用来放录音和纪要的 vault 目录
推荐:
- 大模型服务——实时大纲、纪要整理、沉淀、导出、自定义模板优化都靠它
- 虚拟音频设备——录电脑音频或线上会议音频用
- 真实麦克风——混合录制自己声音用
- 领域词汇表——人名、产品名、机构名、术语识别准确率会高很多
音频输入与真实麦克风
Obsidian 桌面端跨平台直接捕获系统音频不太稳定。要录线上会议、网页视频、课程、电脑播放的声音,一般得靠虚拟音频设备。
常见的:
- Windows: VB-Cable
- macOS: BlackHole
- Linux: PulseAudio / PipeWire monitor source
Windows 上用 VB-Cable 时要注意命名别搞混:
- 会议软件、浏览器、系统输出选 CABLE Input
- LexVoice 读的是录音设备里的 CABLE Output
- 要同时录自己的话,真实麦克风必须选本机麦克风,不要选 CABLE Output、BlackHole、VoiceMeeter 或 Stereo Mix
如果电平条不动,先跑一下设备检测,别直接开长录音。
隐私
LexVoice 没有广告、没有分析、没有遥测。设置保存在本地 .obsidian/plugins/lexvoice/data.json。
录音文件存到你选的本地 vault 路径。LexVoice 没有云端存储,也不会把录音传到 LexVoice 服务器上(因为根本没这服务器)。
但如果你用的是云端转写或云端大模型,相关音频、转写文本、prompt 上下文是会发给你配的服务商的。涉及客户资料、医疗、法律、人事、招聘、内部战略这种敏感内容时,建议用本地转写 + 本地大模型,录音前也最好取得相关人员同意。
详见 PRIVACY.md。
安装
手动安装:
- 关掉 Obsidian
- 把插件文件放到
<你的 vault>/.obsidian/plugins/lexvoice/ - 重新打开 Obsidian
- 设置 → 第三方插件,启用 LexVoice
- 打开 LexVoice 设置页,先把转写服务和音频输入配好
协议与致谢
LexVoice 用 MIT License 发布,详见 LICENSE。
HTML PPT 这个功能的设计思路来自 alchaincyf/huashu-design——HTML-first 的幻灯片工作流和它那套设计原则给了我很大启发,按原项目许可要求在此标注:Derived from alchaincyf/huashu-design。