Voice IC
『语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。
根据语音芯片的输出方式分为两大类,一种是PWM输出方式,一种是DAC输出方式,PWM输出音量不可连续可调,不能接普通功放,目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大,该语音芯片声音连续可调,可数字控制调节,可外接功放。
音质的优劣取决于ADC和DAC位数的多少。』
基本概念
- 语音信号的量化:采样率(f)、位数(n)、波特率(T)
采样:将语音模拟信号转化成数字信号。
采样率:每秒采样的个数(byte)。
波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second
采样位数:指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。
- 采样率
奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。
嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。
一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。而DKC系列语音芯片采样可以做到22K。
- 常用语音格式
- PCM格式:Pulse Code Modulation,脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
- WAV格式:WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。它符合资源互换文件格式(RIFF)规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。
- MP3格式:MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。
Maxlinear Voice Telephony SLIC
Subscriber Line Interface Circuits (SLIC):用于家庭网关和企业解决方案的用户线路接口电路。
Maxlinear的用户线接口解决方案将CMOS编解码器和高压线驱动器组合在一个封装中,这种方案提供了所需的灵活性和性能,以实现用于客户无线终端接入设备(CPE)的成本优化的语音应用。
产品组合提供用于一个和两个FXS端口的设备。MaxLinear的SLC210和SLC220为MaxLinear SoC提供了专有的强大SSI接口。DXS10x和DXC10x通过PCM/SPI或CSI接口与所有主要的第三方宽带SoC提供经验证的集成和性能。
参考资料
评论