搜狗AI走向产业改造:纵横捭阖术与录音笔的新声态

发布时间:2020-08-07 08:20:07 作者:naojiti
来源:ITPUB博客 阅读:115

昨天,搜狗举办了一场名为“全新「声」态,AI未来”的发布会。而这场发布会中的主角之一,竟然是我们熟悉又陌生的录音笔。

说录音笔这款产品熟悉,大概是它曾经是很多大学生上课时的标配,对于脑极体这样的文字工作者来说,更是采访时必不可少的工具。但说它陌生,是因为不知不觉间,这款产品似乎已经远离主流电子消费品市场很久了。据新思界产业研究中心发布的《2019-2023年录音笔行业深度市场调研及投资策略建议报告》显示,2017年至今,我国录音笔行业出货量增长已基本停滞。随之而来的,是市场上产品开始出现大规模的同质化现象,厂商如何抓住日新月异的技术机会,如何在市场中博得生机,都成了眼下急需解决的问题。

搜狗在发布会中究竟提出了哪些举措,这些举措又能否帮助录音笔产业突破当前的困境?

录音笔是如何逐渐被手机替代的?

在解答这些问题之前,我们要先弄清楚,录音笔到底怎么了?

虽然录音笔比不上手机、耳机等等产品的普遍需求程度,但在教育、企业会议、采访等等场景中,录音笔本应有其稳固的需求市场。为什么在今天会出现如此严重的产业萎缩现象呢?

对录音笔产业冲击最大的,当属手机功能的进一步完善。随着手机收音和降噪技术的不断提高,在一些噪音干扰不那么强的场景中,开始有越来越多的人选择用手机替代录音笔。

同时AI技术的不断提升,也进一步削弱了录音笔的应用价值。对于工作处理来说,音频处理的效率显然是远低于文字的,即使是在使用录音笔时,我们常常也是导出录音,通过软件转换成文字。而现在大多数AI语音转录软件均在移动端有所布局,让手机录音转文字变得非常方便。甚至还有不少AI企业在尝试挑战人工速记的“实时转录”。这时录音笔不管是通过U盘还是蓝牙传输录音文件再进行转换,都显得多了一重麻烦。

搜狗AI走向产业改造:纵横捭阖术与录音笔的新声态

但即便如此,录音笔仍然具有其不可替代的价值。像很多场合,尤其在学校中,是不适宜携带手机的。而且相比手机,录音笔的续航能力和简便操作仍然占据优势。

如今这一产业需要的,是在技术和产业生态上重塑新生。

搜狗AI录音笔写下的起点

回归主题,这一次发布会中,搜狗提出了两项举措,一项是向录音笔行业开放搜狗听写服务,另一项是联合爱国者、纽曼、索尼录音笔、万成集团等等传统录音笔厂商,成立了AI创新联盟。

想要理解搜狗的纵横捭阖之术,我们可以先从搜狗AI录音笔C1这款产品说开去。

搜狗AI录音笔C1发布于今年春天,在这次发布会上又推出了具有全新外观的炫彩版本。除了常规通过降噪算法、自动增益等等技术提升录音质量之外,搜狗AI录音笔C1还提供了一系列创新功能——录音转文字、同声传译、云端储存。也就是说,在录音过程中,音频就会被转换成文字,还可以通过云端存储来实现跨终端操作。

这样一来,应用录音笔再也不需要在手机、电脑之间传来传去,或是来回复听转写,就能实现高效的文本编辑。

搜狗AI走向产业改造:纵横捭阖术与录音笔的新声态

这款产品的推出,实则是对录音笔工具属性的重新赋予。录音笔从此从一款提供录音的工具,变成了将现场录音转换成文档的工具。

这种程度的效率提升,是足以撬动市场的,搜狗AI录音笔C1在极短时间内就在多个电商平台取得了单品销量第一的位置。但对于录音笔这一整个产业来说,光有一款产品显然不足够。

纵横之术:一剂给予录音笔产业的技术疗法

搜狗的纵横术,就是开放出已经在自己产品上成功试验的听写服务技术体系给整个行业,通过一剂精准的“技术疗法”,在当下来让整个录音笔行业重焕活力。

简单来说,纵横术给予了录音笔行业两方面的赋能。

一方面是技术赋能。

搜狗作为输入法领域的老玩家,与语音转写技术打交道的时间和频率都很高。在实时语音转写中,搜狗应用的是自研的延迟可控的Adaptive Attention-based模型;在非实时语音转写功能上,则使用了业界领先的Transformer-based端到端语音识别技术。两种技术的结合满足了不同场景下的需求,也让语音转写准确率达到了95%以上,并支持1小时音频最快5分钟出稿。不论从识别准确率上还是转写速度上,都不逊色于市面上主流的AI转写软件。

因为口语和书面语言之间天然的差异,在机器语音转写时,人们常常会遇到一些细节上的问题:例如无法区分说话对象、文字语序混乱不符合阅读习惯、标点错误等等。导致即使由机器完成了转写,往往还需要人工进行整理,这种情况显然是非常低效的。

而搜狗基于输入法产品中用户使用习惯的数据,对于文字内容的处理捻熟于心,通过智能辅助编辑向用户提供智能纠错、智能文本顺滑、标点预测等等功能,再进一步提升录音笔工作效率。

另一方面是成长赋能。

输入法产品为搜狗带来的,不仅仅是技术上的累积,还有庞大的流量池。目前搜狗输入法APP端拥有超过4.5亿的日活用户,PC端更是占据99%的市场份额。现如今这一庞大的流量池已经与搜狗的智能转写服务打通,未来应用这一服务的用户将会越来越多。

这意味着搜狗开放给录音笔在语音识别、智能纠错等等方面的能力会在反复应用中不断锤炼提升,层出不断的新俚语、新术语也能通过云端同步其中,录音笔产品技术能力的成长体系得到了保障,长远来看其工具价值呈现出了一种稳步上升的状态。

捭阖之术:比产品更广阔的产业改造空间

和纵横术同样重要的,是搜狗的“捭阖术”——AI创新联盟的成立。

在上面的纵横术中,我们看到的是通过AI赋能,提升录音笔工作效率,重塑其工具价值,让录音笔拥有了重新“夺回”自己市场的可能。但对于这一堪称“历史悠久”的产业来说,除了和手机进行领地争夺,还是否能产生其他火花?

答案当然是肯定的。

比如,录音笔产业时时刻刻都流入着大量的语音数据,其中囊括着不同语言、不同垂直领域,这些珍贵的数据如果能够被留存利用起来,可以发掘出巨大的价值。

又比如,录音笔一直依靠单一的硬件盈利模式,现如今随着技术能力的提升,降低硬件入手门槛,通过软件进行盈利,或者打造移动端软件开拓广告收入等等,都是录音笔产业开拓收入来源的可能。

搜狗AI走向产业改造:纵横捭阖术与录音笔的新声态

更重要的,是AI创新联盟中“AI”一词的存在。搜狗作为AI企业,和录音笔这样的硬件产业能碰撞出的绝不仅仅是几款新产品。录音笔产业所掌握的收音经验与技术、供应链上累积的优势,与搜狗的AI能力相结合,给予整体行业创新刺激所带来的收益,将远超我们的想象。

由此可见,搜狗联合录音笔产业的纵横捭阖,不仅仅重新激活了让一款不适应当下应用场景的硬件产品,更是给予了整个产业无限的改造空间与可能,让他们更好的跟上技术大潮。

纵横捭阖之术,并非是为录音笔一个产业打造,而是搜狗面对产业世界的一种态度。

进入2018年以来,工业AI、产业互联网等等词汇层出不穷,其概念都是相似的——用AI技术更好的改造传统行业。而搜狗也找到了自己的“兵法”,从技术的输入到对合作伙伴的捏合,都在为产业整体技术升级的大工程添砖加瓦。

推荐阅读:
  1. Linux用户态与内核态通信的方式有哪些
  2. python3下实现搜狗AI API的代码示例

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

ai 产业 录音笔

上一篇:高校数据安全解决方案-网站版

下一篇:Python自动化运维开发----基础(十七)类的反射

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》