
跟着大模子与多模态智商执续爆发,语音交互正成为新一代输入风口。像手机端的豆包语音输入法(豆包输入法郑再版发布!搜狗输入法代替品!),凭借精确识别、智能断句、当然流通,获利深广好评。
但豆包语音输入法现在尚未发布 Windows 版块,电脑端念念用上同款体验并障翳易。市面上其它语音输入器具,要么依赖云霄 API、需要按量付费。
最近,微软径直甩出王炸,开源了超强语音转文本模子 VibeVoice-ASR,并基于它推出了一款开箱即用的语音识别输入器具「Vibing」提供了 Windows 和 macOS 客户端。
VibeVoice-ASR 是微软开源的90 亿参数长入语音识别大模子,在 GitHub 上获利海量 Star,号称刻下 ASR 边界的 “长语音王者”。50 + 语言支撑:中英羼杂、多语种切换皆能稳识别,不切片、不免强:一次性处理长达 60 分钟音频,64K 超长潦倒文,全程语义连贯。
IM体育官方网站首页
免费、开源、开箱即用的 Windows 语音识别输入器具「Vibing」使用很简单,按下快捷键 Ctrl+Win 即可快速激活语音转文本,在 Word、浏览器、聊天窗口等苟且输入框皆能径直用,无谓切换软件。

按下 Ctrl+Win+Alt 支撑语音翻译,可径直外语转华文,也能华文转其他语言,翻译准确、延伸极低,凤凰彩票跨境疏通、外文听写皆能用。

自界说热词,专考场景更准支撑添加行业术语、专属名词,责罚专科词汇识别不准的问题,科研、法务、技能岗皆适配。

功能先容
超长语音输入:单次录制支撑5 分钟以上贯穿语音,无谓分段、无谓反复暂停,联贯说完。
自界说热词库:可添加东谈主名、专科术语、行业黑话等专属词汇,识别更精确,告别不异改错。
潦倒文意图意会:不单逐字转写,更能鸠合语境读懂你的实在意图,抒发更当然、更准确。
50 + 种语言全覆盖:支撑巨匠 50 余种语言输入,自动识别语种,无谓手动切换。
中英羼杂开脱说:一句话里中英文平素穿插,照样精确识别,适合日常白话习尚。
大模子 AI 智能润色:自动将白话化语音整理为提醒、流通、多礼的书面文本,径直可用。
及时语音翻译:边说边翻译,跨语言疏通、外语听写、外文纪录一步到位。
归来
在语音输入成为刚需的今天,微软 VibeVoice-ASR + Vibing 组合,无谓费钱买 API凤凰彩首页,一键唤起、超长语音、多语言翻译、谈话东谈主辞别,扫数拉满。不错说是现在最释怀的开源语音输入法之一。

备案号: