IntERPhonic语音合成系统是面向中、高端应用的语音合成系统,以先进的大语料语音合成技术和语音韵律描述体系为基础,提供面向任意文本、任意篇章的连续语音合成功能,合成音质可媲美真人发音。目前,InterPhonic系列产品已经成为市场上的主流语音合成系统,在电信客服、语音门户、证券客服等领域都有了广泛的应用,不论是效果还是系统稳定性都得到用户的肯定。
InterPhonic CE 2.2作为其InterPhonic系列的最新产品,在合成效果方面,除了继续提高中文与英文的合成效果之外,还在两者之间如何更加流畅的衔接,以及如何更加方便快捷的实现效果定制方面取得了显著的改进。除此之外,在系统的实用性、易用性等方面又有了进一步的提高,在此基础上,InterPhonic C&E2.2还新增了很多新的特性,如推出功能更加强大和完善的TTS Server Express语音合成服务器软件,并且首次加入了CSSML编辑器和TTS Doctor技术支持工具。
一、 技术改进
1. 产品效果方面
为了体现讯飞以人为本的宗旨,为了使用户感受到专业语音科技给他们带来的便利。InterPhonic CE v2.2在合成效果方面,主要增加了CE2.1系统中缺少的语气词合成、改进了短语、短句效果,同时改进了前端文本处理过程:
·语气词处理
语气的应用,例如“是吗?”“为什么呢?”“啊!”等。
在InterPhonic CE2.2以前的合成系统中不包含语气词的合成,对这些语气的处理都按照陈述语在一些语音应用中存在者一些非陈述气进行,这种处理影响了语音应用的效果。InterPhonic CE 2.2引进了语气词合成的处理,能够处理疑问、感叹等语气效果。这样使得这些生活中常用的语句真正做到人性化,让用户体验到亲切感。
·短语合成效果改进
InterPhonic CE 2.2在音库中补充了一定的短句语料,扩大短句语料的覆盖面,同时在前端文本分析中加入了短语语境的判断和处理。改进之后的系统在合成一些包含大量短句、短语的文本时效果上有比较明显的提升,例如人名、地名、短语合成。这种特性让系统的使用范围得到进一步加强。
·前端韵律算法改进
InterPhonic CE v2.2中通过对词类调整和未登录词算法的改进,提高了韵律树生成准确率,改进了合成自然度。可以使合成的声音更加和谐,愉悦听众的耳朵。
·多音字处理改进
新的多音字处理算法提高了多音字识别的准确率。减少了系统的误读率,更容易让用户接受。
2. 产品架构方面
·桌面版
InterPhonic CE 2.2系统提供了全新意义的桌面版,这种桌面版系统在保证与企业版相同的合成效果以外,有以下特点:
1. 系统尺寸小
系统占用硬盘空间小,减少资源消耗,用户可以灵活安装,安装后占用硬盘空间比以往版本更小;
2. 系统响应时间
桌面版合成系统能够快速启动,而且合成时也不会出现停顿,可以达到桌面软件应用要求;
3. 提供所有的开发接口
提供与企业版相同的开发接口,改进后的TTS COM控件可以提供多个应用的并发使用。




