
随着人工智能的逐步发展,语音识别技术已经普及到了我们生活的方方面面。在我们的日常生活中,语音助手、智能音箱、智能客服等都应用到了语音识别。语音标注是数据标注行业中一种比较常见的标注类型。下面就给大家介绍一下常见的语音标注方法有哪些?
ASR语音转写
ASR就是自动语音识别技术,是一种将人的语音转换成文本的技术。语音转写就是将语音数据转写成文字数据的过程,是数据标注领域比较常见的一种标注形式。转写是把一种字母表中的字符转换成另一种字母表中的字符的过程,简单来说,转写就是字符之间相对应的转换。ASR
语音转写就是通过和理解过程把语音信号转变为相应的文本或命令的高技术。
语音切割
语音切割是识别自然语言中的单词,音节或音素之间的边界的过程。语音切割是语音识别技术领域的一个重要的子问题。正如大多数自然语言处理问题一样,进行语音分割需要考虑到语境,语法和语义。
语音清洗
语音清洗是对语音进行重新审查和校验的过程,目的在于删除重复的信息,纠正存在的错误,并提供语音一致性。语音清洗是语音数据预处理的第一步,也是保证后续结果正确的重要一环。
情绪判定
人类的语音中包含了许多信息,语音中的情绪信息是反应人类情绪的一个非常重要的行为信号,同时识别语音中所包含的情绪信息是实现自然人机交互的重要一环。同样一条语音内容,用不同的情绪说出来,其所带有的语义可能是完全不同的,只有计算机同时识别出语音的内容以及语音所带有的情绪,我们才能准确的理解出语言的语义,因此理解语音的情绪能让人机交互变得更有意义。
声纹识别
声纹识别是生物识别技术中的一种,通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,简单的说就是辨别某句话是否是某个人说的一种技术。声纹识别主要应用在公安、司法等需要利用声纹鉴定人员身份的领域中;在日常生活中还被用于利用声纹密码进行身份认证,登陆,授权,打卡、语音唤醒等。
音素标注
音素是根据语音的自然属性划分出来的最小语音单位,依据音节里的发音动作来分析,一个动作构成一个音素。音素是构成音节的最小单位或最小的语音片段,是从音质的角度划分出来的最小的线性的语音单位。
韵律标注
语音合成系统中的韵律标注一般采用基于文本信息预测韵律的方式。该种语音标注,基于文本信息进行韵律预测,通常根据声母、韵母、词、短语、段落等信息确定的韵律预测结果。由专业的标注人员根据韵律预测结果完成韵律标注。
发音校对
发音校对就是对整个口语训练过程中的数据的采集以及对不标准的发音进行纠正的过程。发音校对可用于智能搜索中。
上一篇
下一篇