作者:Anders Hvelplund,Jabra 高级副总裁
传统键盘曾经是人机交互不可或缺的工具,但随着人工智能语音指令成为常态,它逐渐淡出了我们的视线。
人工智能语音技术能够以接近人类水平的准确度理解人类语音,这将改变我们与设备之间的交互方式。从办公室办公到娱乐和消费技术等各个领域,语音指令正逐渐取代键盘。从基于文本的交互到语音激活式指令,这种转型不仅提升了便利性,也是一场生产力和技术的革命。
这将彻底改变人类工作、沟通和与周围世界交互的方式,不过,这对当今的组织和员工意味着什么?让员工摆脱键盘束缚,为他们提供高级语音驱动工具,企业可以盘活效率、推动创新和改善协作。
步入语音交互新时代,大声“说出”您的需求。
语音激活式 AI 技术已然
研究表明,人类说话速度比打字快四倍,因此,从效率的角度来看,在个人和办公环境中采用语音技术显然是明智之举。
语音激活式 AI 允许用户通过语音控制系统、分析数据和自动执行任务。它可以简化工作流程,帮助员工提升办公效率,在免提或时间敏感的情况下尤其实用。这意味着,您再也无需打字,只要与可以实时聆听、理解和响应的人工智能系统进行自然对话就行。
伴随于此,国内各语音助手应用加速落地。但它们始终未能达到预期效果。尽管它们可以为您提供最新的天气预报或播放 Taylor Swift 新歌,但用途终究还是过于有限。用户很快发现这些智能助手并不“智能”。此外,它们在口音理解、上下文理解和处理复杂任务等方面也非常吃力,导致用户好感度较低。与以往不同,我们发现人工智能系统其实可以进一步优化,因为其智能程度越来越高,现在甚至可以访问工作数据等上下文数据。
近期,由 OpenAI ChatGPT 衍生的生成式 AI 逐渐兴起,彻底颠覆了技术现状。在许多领域,我们离比肩人类水平的人工智能还相差甚远,但最新模型显然要比先前的“语音助手”智能得多。关于这一点,用户最有发言权。ChatGPT 在两个月内达到了 1 亿用户,成为历史上最快达到 1 亿用户的服务,比 TikTok 快了7个月,创造了新的用户增长记录。这种趋势将彻底改变我们使用电脑及与电脑交互的方式。
如今语音识别技术已经相当成熟,这项技术需要与生成式 AI 相互配合,才能在语音激活 AI 方面取得真正的突破。要理解个中原因,不妨想象用语音撰写电子邮件。如果只有语音识别功能,体验会非常糟糕,因为口语表达缺乏清晰的书面简洁性和结构性。这就是生成式 AI 的优势所在:AI 模型已经可以准确理解您的意图。只需花几分钟与它交谈,它就能准确总结和提取您想要表达的意思。不止如此,它还能采取实际
行动。
如今,您已经可以借助 ChatGPT 、 Copilot 等其他AI工具回复电子邮件、总结会议、创建 PPT 演示文稿、编写电脑代码等。无论是哪项任务,语音完成效率都会更高。综合使用这几种技术,使用语音完成各种任务的速度都会快于使用键盘。
随着人工智能的不断进步,语音办公势必要成为未来的主流趋势,但其效果非常考验声音清晰度,毕竟噪音干扰仍然是语音系统面临的一项主要挑战。如果身处嘈杂环境,人工智能模型根本无法理解您的说话内容。Jabra 最近委托第三方对嘈杂环境下的转录准确度(人工智能正确理解的单词百分比)进行研究,结果显示许多人在办公室使用的消费级设备与专业级设备之间存在很大差距。在语音识别准确度方面更是天壤之别。消费级设备的准确率只有 55%,AI 客服代表根本无法理解您的要求。
这也是Jabra产品真正发挥作用的地方。外部研究表明,在提供准确的转录方面,我们的耳机优于其他耳机,尤其是在嘈杂的环境中,几乎不会出错。先进的降噪麦克风、波束成形技术和精确的语音检测算法有效地消除了周围的噪声,提高了语音清晰度,使人工智能工具的转录准确率达到了令人印象深刻的97%。想要实现极致协作体验时,尤其如此。
语音是企业的竞争优势
生产力的未来无疑是生成式 AI,而生成式 AI 采用率的关键是语音准确度。有人担心不久的将来人工智能会取代知识型员工,但比这更精确的解读是——“一个人不会被人工智能取代,而会被使用人工智能的人取代”。我们也可以进一步理解为“一个人会被使用人工智能语音交互的人取代”,因为他们的交互效率远远高于使用键盘和文本的人。
键盘时代即将终结,企业是否准备好迎接新纪元,利用语音的力量成就全新水平的效率、适应能力和创新能力,从而在数字化程度日益提升的世界舞台中取得竞争优势?事实证明,语音激活式 AI 技术可以大幅改善职场生产力和协作效率,企业如果想要在如今快速发展的技术环境中保持领先地位,就要立即着手采用语音激活式 AI。