您当前的位置:首页 > 新闻中心 > 行业新闻
在线体验 | 中英文语音的音段自动切分与标注 2021年12月06日

体验页面地址(仅适用于电脑端操作,建议采用 chrome 浏览器):https://keyan.chnling.cn/index.php/segment/

图1:操作页面


操作简要说明:

1. 先在顶部“语言”下拉选项中选定要操作的语言类型,目前仅支持汉语普通话和英语。默认为汉语普通话,若要处理英文语料,请在下拉列表中选择,这一步应在打开声音文件之前完成。不支持中英文混合文本。

2. 然后点击顶部的“打开”按钮,读取电脑中的一个声音文件,声音数据将被上传至服务器端进行处理。声音文件要求如下:单通道,16000Hz的采样率,wav格式;声音文件名可支持汉字,但不可含有空格、括号等特殊字符;一个声音文件通常为一句话的内容,所包含的内容不能太长,建议少于30个汉字。

3. 接下来在“语句文字内容”输入框中录入相应的发音文字内容,目前可支持中文和英文,按照普通文稿的方式录入相应的文字内容即可,可包含标点符号,英文应少于255个字符,中文应少于128个汉字。

4. 在输入发音文字内容之后,点击“分词及标点符号处理”按钮,即可得到相应的分词结果(调用的是百度自然语言处理API)。英文文本也需点击此操作。如果对分词结果不满意,可以手工加入或删除空格把词语分隔开来。

5. 在整理好分词文本之后,点击“拼音转写”按钮,即可得到相应的拼音转写结果。如果对拼音结果不满意,可以手工录入或修改。

6. 在修改好拼音内容之后,点击“生成发音词典”按钮,即可得到发音文本中所包含的发音词典内容。发音词典内容通常无须修改。

7. 在得到发音词典内容之后,点击“生成音素列表”按钮,即可得到发音文本中所包含的音素列表。音素列表通常也无须修改。

8. 完成上述操作之后,点击“上传分词及拼音数据”按钮,可将当前语句的相应数据(分词、拼音、发音词典、音素列表)上传至服务器端保存,后面再处理相同的语句时可直接调用。

9. 最后,点击“提交切分”按钮,即可得到相应的数据结果。提交切分之前请再次检查一下语言类型是否与当前发音内容一致

10.完成自动切分与标注之后,系统会显示相应的下载操作按钮,如有需要,可点击“下载切分结果文件”按钮,下载相应的 TextGrid 标注文件,其格式和数据示例如下所示。

图2:音段自动切分与标注的结果数据


注意:自动切分与标注的音段数据,仍然需要进一步手工检校修改!此系统仅用于体验操作,不保证操作的流畅性和切分质量,也不保证一直开放。用户上传的声音数据将被不定期清理,但发音文本、分词、发音词典等文本数据将被匿名保存,系统中的其他用户可调用。


转载自语音学堂


分享到:

最热资讯

热门标签