随着人工智能的逐步发展,语音标注的应用场景已经普及到了我们生活的方方面面。作为人们信息获取以及沟通等需求最为方便快捷的路径就是智能语音。
在我们的日常生活中,语音助手、智能音箱、智能客服等都有智能语音的参与。它的易用性、便利性和无需屏幕操作等方面的特点大大提升了我们生活的便捷度。
正是语音标注的存在,才实现了语音的智能化。
什么是语音标注?
语音标注就是把语音中包含的文字信息、各种声音标记提取出来,再进行转写或者合成。人工智能通过学习这些标注后的数据,从而具备“听力”,使计算机可以实现精准的语音识别能力。
语音标注常见任务类型
语音切割转写
语音切割要求标注人员需要考虑语境、语法和语义,将语音按照规定的时间间隔进行分割,标注过程中通过打点剪切的方式得以实现;语音转写是指将音频中的内容转写成文字的过程,以手动录入的方式实施。
语音校对
语音校对的任务难度低于语音切割转写,是针对原始的语音转写结果进行检查和修改,是对不标准的发音进行校正的过程。
拼音和停顿标注
对照音频和文本为文本添加拼音和声调。这要求标注人员对停顿时长有准确的感知,对拼音的轻声和儿化音有良好的语感。
语音采集
语音采集主要是语音录制,看似简单,实则对环境因素要求较高。底噪过大、喷麦等情况都会影响语音采集的质量。
字幕时间戳校正
字幕时间戳校正主要是确保音频与文字内容相对应,保证声音和文字同步展示。简而言之,声音停止时,文字在屏幕上消失。
(部分内容摘自网络,如有侵权,请联系删除。)
上一篇
下一篇


