1. 概述
1.1 呼叫中心简介
呼叫中心作为一种能充分利用最新通信手段和计算机技术的现代化服务方式,早在七、八十年代就已引起国内外的广泛关注。近年来,呼叫中心在世界各地更是呈现出高速发展的态势。对于那些拥有大量客户群体的行业,如电信、银行、证券、保险、房地产、家电、运输、互联网、公共服务机构等行业,呼叫中心已经得到了非常广泛的应用。
呼叫中心对企业的作用不仅可以有效、快速地改善服务,提高客户的满意度,而且可以降低企业营运成本、完善营业网络和营销手段,挖掘潜在用户、增加企业的综合竞争力。
对客户而言,能够通过电话、电子邮件、传真、WEB/WAP查询、语音及网页同步、短消息等各种方式享受到企业的服务。同时,企业的呼叫中心不只是被动地接受客户的服务要求,而且可以主动地与客户保持良好的联系,实现"一对一的个性化服务"。如果再将客户关系管理(CRM)融入呼叫中心系统中,就可以通过全面管理用户数据、业务数据、业内信息等进行多方位的统计分析和数据挖掘,为市场营销人员及领导决策人员提供更加科学的、量化的决策依据。
1.2 呼叫中心对于TTS技术的需求
语音合成技术能够以有限的资源占用,将各种文字信息及时转化汉语连续语音,并且合成语音连续、可懂、自然。这样无需对大量的信息进行录音,极大地节省了工作量和存储空间,尤其是在信息内容经常变动的动态查询场合(如股市行情查询),更加是起到了预录音技术无法替代的作用。很好地解决了现代信息社会海量数据和动态查询的需求。因此,语音合成技术是呼叫中心系统能够提供高质量、智能化、个性化自动语音服务的关键技术。可以预见,语音合成技术在呼叫中心行业中有着非常广阔的应用前景。
2. 讯飞语音技术呼叫中心应用方案
2.1 语音合成技术简介
语音合成(Text To Speech),简称TTS技术,它涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
解决的主要问题就是如何将文本状态的文字信息转化为可听的声音信息。使以往只能用眼睛看的文字信息,也可以用耳朵来听。
语音是信息传播的一大媒介,随着多媒体信息需求的增大,语音服务系统近年来发展较为迅速。传统的语音服务系统一般采用录音回放技术。由于这种方法必须对信息文本事先进行录音,并以声音文件格式存储,因此,所占用的存储空间非常大。另外,这种技术的一个更大的缺点是不能实时反映信息的更新,而且在系统运行前要建立大量的语音信息库,应用范围有很大的局限性。语音合成技术是将任意文本实时的转换为自然语音输出,且输出的语音清晰可懂,无需对大量的信息进行录音,极大的减少了工作量和节省了存储空间。尤其是在信息内容需要经常变动的动态查询场合,如新闻查询、股市信息、有声E-mail系统,都是传统的预录音技术无法代劳的。结合其它技术,语音合成技术可以广泛地应用于各个领域。
2.2 语音合成服务的实现方式
CallCenter中TTS应用可以通过两种方式实现:在线合成方式和离线合成方式,两者的最大差别在于在线合成系统的输出是可控制的语音数据流,而离线合成系统的输出是完整的语音文件,因而在线合成可以实现各种复杂的业务,而离线合成系统最主要的功能是替代人工录音;两者在成本也有较大差异:在线合成需要较多的并发线数,对硬件要求也较高,而离线合成无需大量的并发合成,对硬件要求较低。
2.2.1 在线合成系统方案——VAP Express
1. VAP Express的特点及相关机制
iFly VAP Express提供基于TCP/IP网络的集群式语音合成服务,语音合成服务采用动态负载均衡(Load Balance)机制对任务进行动态调度、由网络中的语音合成服务器(TTS Server)集群共同分担,完全能够适应大规模、实时、多路的语音服务需求。同时在客户端提供了简捷有力的客户代理,以方便应用系统的开发。

VAP Express主要应用于大规模的CTI系统中,采用独立的语音服务器节点向系统提供语音合成的服务。在这种方式下,将语音合成作为软件系统中的一个模块,提供网络调用接口对TTS的访问,语音合成服务器以单节点或集群的方式提供。系统的结构如下图所示:
(1) 单节点合成系统的内部结构及与客户端的接口
合成系统包括语音服务器接口和合成内核。合成内核由合成器和语音库构成,语音库可以根据需要替换,产生不同的合成效果和风格。语音服务器接口调用合成内核通过TCP/IP接口相应客户端请求。如下图所示。




