语音标注自动音段对齐工具SPPAS使用笔记

[更新日期：2014/7/2 10:54:23]

SPPAS工具是由Brigitte Bigi（Laboratoire Parole et Langage – Aix-en-Provence – France）开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注，音段对齐的工具，目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善，但是对于一般的语音研究者来说，能够自动产生出带有音段信息，并且边界相对整齐的Praat标注文件TextGrid已经是大大提升了工作效率。所以推荐给进行语音研究，而且数据量规模很大的朋友。

打开网站有困难的请到资源里下载：

首先是一些使用时的注意事项：

具体使用步骤应该是安装工具，在自己的电脑上配置这个工具使用的环境（需要有四个插件安装，下文会提到）将自己的语音语料制作成一个一个的声音文件，这里的一个的涵义是一个句子，一个词，一个字为单位，短的篇章也可以，但是篇章不要太长，否则效果很差。制作成这样的声音文件之后，再制作相应的文本文档，比如：录音的声音文件Sound001.wav内容是"Can you help me?"，那么需要制作一个同样文件名称的文本文件Sound001.txt，内容就添加这个句子 Can you help me ，这个文本文件的格式为UTF8格式。然后将这样的文件都添加到SPPAS操作窗口里，选择相应的语言，选择音段对齐选项，点击“执行”就可以产生出来音段对齐的TextGrid了这其中对于如何把工具环境安装好，对于只有文科基础的同学不太容易操作，但是一旦安装好了，以后就可以直接使用了。

本文力求对每个环节都写的简单一些，让更多想使用这个工具的人能够很快的将工具配置好，节省自己的工作效率。

1. 安装

这部分主要就是大概翻译了一下官方网站上的Installation这一部分。

windows环境下的安装如何知道自己的电脑是32-bits还是64-bits结构(win7)：点击开始，点击控制面板里的，系统，在系统类型里可以看到是32位操作系统还是64位。Python installationClick here to downloadPython根据操作系统类型选择下载文件：32位：Windows x86 MSI Installer (2.7.6)(sig)64位：Windows X86-64 MSI Installer (2.7.6)(sig)安装过程即和常规安装软件的过程类似。WxPython installation根据操作系统类型选择下载文件：32位：

wxPython3.0-win32-py2732-bit Python 2.7

64位：

wxPython3.0-win64-py2764-bit Python 2.7

安装过程：Sox installationJulius installationSPPAS工具的下载安装MacOS环境下的安装2. 制作声音文件和文本手工制作声音文件和文本文件批量制作声音文件和文本文件orderfilenamesentence1Sound_1.wav2Sound_2.wav3Sound_3.wav4Sound_4.wav5Sound_5.wav6Sound_6.wav7Sound_7.wav8Sound_8.wav

我们利用产生的文件名，把录音对应的内容，和文件名对应起来。如下面所示

Sound_1.wav关心Sound_2.wav刚刚Sound_3.wav单一Sound_4.wav糟糕Sound_5.wav新鲜Sound_6.wav餐厅Sound_7.wav西瓜Sound_8.wav车厢

然后再使用，本人编写的另外一个工具，可以直接产生有这些内容的文本文件，工具下载地址如下：

批量产生有内容列表的UTF-8格式文本文件

产生的文件内容如下，之所以使用这样的工具产生文本，主要是为了产生UTF-8格式的文本文件。

3. 导入SPPAS进行切分经过上面的步骤，我们已经制作了批量的声音文件和文本文件，把这些文件放在同一个目录内：

然后打开SPPAS这个工具，点击Add files将声音文件添加到窗口里，同时，有同样文件名的txt也会被添加到窗口里，把这些文件通过使用ctrl或者shift键，全部选择，然后把右侧的几个对齐的选项选择，并且在语言里选择相应的语言，比如这里选择的是中文，ZH。

点击右下角的这个长的按钮，，就是执行按钮，然后系统就会自动产生出来对齐音段的TextGrid文件。一般情况下，会同时产生几个TextGrid

缘是浪漫的相遇，瞬间让你我的心化为永恒！

相关文章：

你感兴趣的文章：

标签云：