![免唤醒、低延时、可离线,让KTV点歌更轻松 免唤醒、低延时、可离线,让KTV点歌更轻松]()
说到KTV,八零九零后应该能勾起不少回忆,但随着越来越多娱乐形式的出现,KTV市场存在逐渐被侵食的趋势。这几年,不少人开始琢磨KTV如何满足年轻人的消费场景,有的把KTV变成了主题Party,也有不少企业把唱歌产品做到了家里,也有像科大讯飞这样的人工智能公司,在研究如何通过语音技术让K歌变得更简单、更自然!
不妨想一想,在没有语音操作前,人们是怎么点歌的?
在KTV小聚,想要点歌得先走到包厢前面的点歌屏前,在屏幕上选择歌星点歌或者歌名点歌,然后在屏幕里跳出的键盘上用拼音等方式来搜索。这样传统的点歌方式,让一些腼腆的男孩女孩们“羞”于上台。
![免唤醒、低延时、可离线,让KTV点歌更轻松 免唤醒、低延时、可离线,让KTV点歌更轻松]()
后来,为了便捷,VOD厂商们纷纷推出了APP、微信小程序等点歌方式。把点歌屏搬到手机上,确实方便了很多,但是由于需要扫码下载、学习应用等繁琐过程,对于用户来说实际上还是有点麻烦。关于点歌这件事,科大讯飞很早就联合VOD客户,探讨如何运用语音技术让歌曲的点播变得更加简单易用。
2017年之前,我们使用了语音唤醒技术,一次唤醒一次交互,让KTV点歌可以直接使用语音交互。由于需要唤醒,用户使用不习惯,语音交互在KTV场景下一直得不到广泛的落地应用。
2018年,VOD客户为了极致的用户体验,曾尝试去掉唤醒词,使用讯飞先进的全双工语音技术,满足KTV歌曲点歌随时可语音交互的需求,但是由于无效的语音交互量巨大,语音技术无法得到大范围的落地使用。
2019年初,科大讯飞联合巨嗨,推出了多唤醒技术,满足了KTV点歌场景下高频语料的直接说话,这不仅提升了交互效率,同时很大程度上过滤了无效的语音交互,让语音技术在KTV语音点歌的推广落地成为可能。
2020年,科大讯飞再次联合巨嗨、博视联等国内VOD合作伙伴推出“免唤醒”语音交互技术,实现了点歌领域高频语料交互,全部无需唤醒,直接实现语音交互,真正实现了用户不需要动手,只需要对着话筒说话,就可以轻轻松松玩转点歌。
▲ 科大讯飞合作伙伴巨嗨语音点歌界面
除了点歌之外,讯飞专门针对KTV场景语音交互做了深度设计,用户在唱歌的时候,想要切歌,或者切原唱伴唱、切音效模式、调整音量、快进XX秒等等,只需要拿起话筒,就可以实现控制交互。在KTV的实际应用上,甚至连控制KTV包间灯光灯效,喊服务员、购买酒水零食等等,你只需对着话筒说话就可以实现。
![免唤醒、低延时、可离线,让KTV点歌更轻松 免唤醒、低延时、可离线,让KTV点歌更轻松]()
▲科大讯飞合作伙伴巨嗨语音呼叫服务界面
说了这么多,是不是觉得语音点歌很方便呢?但是KTV商家们对此或许还会有很多疑问,比如:
1. 需不需要每次语音控制都要喊一下系统的名字,如:小飞小飞,来一首XXX;
2. 网络不好的时候,语音交互的响应延时高不高?
3. 在没有网络的时候是否可以使用?
4. KTV的复杂环境下,语音识别准确率高不高?能不能用?
这些都是KTV商家与用户们普遍关心的问题,也是2020年升级KTV语音交互解决方案要解决的实际问题。
首先,讯飞的KTV语音交互解决方案是“免唤醒”方案,用户不需要先喊系统的名字。用户设备的控制、音视频播放的控制、歌曲内容的点播,以及应用界面的浏览操作等等都可以直接语音交互,为您的产品打造更自然的人机交互体验。
![免唤醒、低延时、可离线,让KTV点歌更轻松 免唤醒、低延时、可离线,让KTV点歌更轻松]()
▲科大讯飞AIUI与博视联合作产品:超能视频音响
其次,讯飞全新升级的KTV语音交互解决方案支持离在线结合,在弱网、无网情况下一样可以控制设备、控制播放。纯离线场景下,可以做到300ms快速响应,让设备比真人还“听话”。
最后,KTV环境如此嘈杂,语音是否能够准确识别的问题,答案自然是肯定的。KTV语音交互背后是科大讯飞识别引擎技术的支撑,目前该产品方案已经在国内各大VOD厂商设备集成,并在全国数万家KTV场所得到验证,无论是商用KTV产品还是家庭K歌产品,效果都能得到保障。
语音交互在K歌场景中的应用,可以切实让用户感受到语音交互带来的便捷,为唱歌这件事带来更加沉浸的享受。未来,对于语音交互在K歌领域的应用,讯飞将持续打磨核心技术效果,为合作伙伴提供更加优质的技术服务,提升用户K歌体验!