在遥远的银河系某处,有一种神奇的小鱼,把它塞进耳朵里就能听懂宇宙中任何语言。
Baberu 大概就是那种感觉——按住 fn 键说话,松开后文字就出现了。
它不需要联网,不需要付费,也不会把你的声音发送到任何地方。
一切都在你的 Mac 上完成。
What It Does
-
🎤
按住说话,松开输入
按住 fn 键录音,松开自动识别并输入到任何 app
-
🔐
完全本地运行
语音数据不离开你的电脑,断网也能用
-
🌍
中英日多语言
自动检测语言,支持中英混说
-
✨
智能文本优化
ASR 模型原生去除语气词,热词列表提高专业术语识别率,中英文间自动加空格
-
🔄
语音翻译
点一下 fn 再按住说话翻译为英文,点两下再按住翻译为日文(macOS 15+,离线)
-
∞
无限使用
没有账号,没有订阅,没有使用次数限制
⚠ Mostly Harmless (Early Version)
- 这是一个非常早期的版本,界面粗糙,代码也是
- 没有经过充分测试,可能会崩溃或出现奇怪的问题
- 未来版本可能不兼容当前的设置和数据
- 如果遇到问题,重启通常能解决
System Requirements
-
Apple Silicon Mac REQUIRED
M1 / M2 / M3 / M4 系列芯片,Intel Mac 暂不支持
-
macOS 11.0 Big Sur 或更高版本
语音翻译功能需要 macOS 15 Sequoia
-
约 3GB 可用磁盘空间
语言模型约 2GB,运行时需要额外空间
-
运行时占用约 6GB 内存
模型常驻内存,建议 16GB 内存的机器使用
Getting Started
- 打开 DMG,把 Baberu 拖到 Applications 文件夹
- 右键点击 Baberu,选择「打开」(因为没有开发者签名)
- 授予麦克风权限
- 授予辅助功能权限:系统设置 → 隐私与安全性 → 辅助功能
- 等待模型下载完成(约 2GB,需要几分钟)
- 关闭 app,再重新打开一次
- 看到菜单栏出现 🐟 图标,就可以开始用了
How to Use
-
🎙️
语音输入
按住 fn 键说话,松开后自动识别并输入文字
-
🇬🇧
翻译为英文
先点一下 fn,再按住 fn 说话,松开后翻译为英文输入
-
🇯🇵
翻译为日文
先点两下 fn,再按住 fn 说话,松开后翻译为日文输入
Technical Notes
Baberu 使用 Fun-ASR-Nano
语音识别模型,通过 Apple Silicon 的 Metal GPU 加速推理。
应用本身用 Swift 编写,ASR 服务用 Python + FastAPI 实现,
通过本地 HTTP 通信。所有数据存储在 ~/Library/Application Support/Baberu/