在线体验 | 中英文语音的音段自动切分与标注

2021年12月06日

体验页面地址（仅适用于电脑端操作，建议采用 chrome 浏览器）：https://keyan.chnling.cn/index.php/segment/

图1：操作页面

操作简要说明：

1. 先在顶部“语言”下拉选项中选定要操作的语言类型，目前仅支持汉语普通话和英语。默认为汉语普通话，若要处理英文语料，请在下拉列表中选择，这一步应在打开声音文件之前完成。不支持中英文混合文本。

2. 然后点击顶部的“打开”按钮，读取电脑中的一个声音文件，声音数据将被上传至服务器端进行处理。声音文件要求如下：单通道，16000Hz的采样率，wav格式；声音文件名可支持汉字，但不可含有空格、括号等特殊字符；一个声音文件通常为一句话的内容，所包含的内容不能太长，建议少于30个汉字。

3. 接下来在“语句文字内容”输入框中录入相应的发音文字内容，目前可支持中文和英文，按照普通文稿的方式录入相应的文字内容即可，可包含标点符号，英文应少于255个字符，中文应少于128个汉字。

4. 在输入发音文字内容之后，点击“分词及标点符号处理”按钮，即可得到相应的分词结果（调用的是百度自然语言处理API）。英文文本也需点击此操作。如果对分词结果不满意，可以手工加入或删除空格把词语分隔开来。

5. 在整理好分词文本之后，点击“拼音转写”按钮，即可得到相应的拼音转写结果。如果对拼音结果不满意，可以手工录入或修改。

6. 在修改好拼音内容之后，点击“生成发音词典”按钮，即可得到发音文本中所包含的发音词典内容。发音词典内容通常无须修改。

7. 在得到发音词典内容之后，点击“生成音素列表”按钮，即可得到发音文本中所包含的音素列表。音素列表通常也无须修改。

8. 完成上述操作之后，点击“上传分词及拼音数据”按钮，可将当前语句的相应数据（分词、拼音、发音词典、音素列表）上传至服务器端保存，后面再处理相同的语句时可直接调用。

9. 最后，点击“提交切分”按钮，即可得到相应的数据结果。提交切分之前请再次检查一下语言类型是否与当前发音内容一致。

10.完成自动切分与标注之后，系统会显示相应的下载操作按钮，如有需要，可点击“下载切分结果文件”按钮，下载相应的 TextGrid 标注文件，其格式和数据示例如下所示。

图2：音段自动切分与标注的结果数据

注意：自动切分与标注的音段数据，仍然需要进一步手工检校修改！此系统仅用于体验操作，不保证操作的流畅性和切分质量，也不保证一直开放。用户上传的声音数据将被不定期清理，但发音文本、分词、发音词典等文本数据将被匿名保存，系统中的其他用户可调用。

转载自语音学堂