因公司业务需要需使用kaldi语音识别工具,现将kaldi环境配置等步骤列出来,用于记录:
1.安装虚拟机:
下载虚拟机VMware,并安装,虚拟机安装比较简单,可自行百度进行安装,在此不再重复。
2.Ubuntu操作系统安装:
下载Ubuntu镜像文件,本人选择的事Ubuntu16.04版本。
3.在虚拟机上安装Ubuntu系统,该步骤会进行详细说明,如下:
3.1 VMware安装完成之后选择创建新虚拟机

3.2 选择下载好的镜像文件
3.3选择下一步,设置系统名称及密码

3.4 继续点击下一步 设置系统安装位置,这里选择自己比较大的一个盘即可

3.5 继续下一步 选择磁盘容量,此处建议稍微选大一些,否则之后kaldi跑数据会出现容量不足的错误

3.6 下一步,选择自定义硬件设置 建议将内存和处理器进行调整,本人电脑内存8G此处设置6G,
因kaldi数据集一般都比较大,运行时比较耗费内存,此处调大,处理器个数根据自己电脑的配置
进行相应调整


3.7 返回上一页,点击完成。等待VMware自动安装Ubuntu系统
4.ubuntu下安装kaldi
4.1 打开unbuntu终端使用Ctrl+Alt+T快捷键可直接打开,输入
git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
即从github上下载kaldi最新版本,因kaldi在github上是持续更新维护,所以该路径下的kaldi
版本比较完整,需要的例子及运行例子的源码什么的都有,
如果ubuntu没有安装git使用一下命令安装即可:
sudo apt-get install git
4.2 下载完成之后进行解压缩,找到kaldi的压缩包直接右键提取。
4.3 目录介绍:tools目录全是kaldi依赖的包,egs为kaldi提供的实例,其中包含常用的数据集运行的
源码,src目录为kaldi 的源代码
4.4 kaldi编译
4.4.1 编译之前确保安装了一下组件:
apt-get,subversion,automake,autoconf,libtool,zlib,wget,libatal








