语音芯片

Voice IC

『语音芯片定义：将语音信号通过采样转化为数字，存储在IC的ROM中，再通过电路将ROM中的数字还原成语音信号。

根据语音芯片的输出方式分为两大类，一种是PWM输出方式，一种是DAC输出方式，PWM输出音量不可连续可调，不能接普通功放，目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大，该语音芯片声音连续可调，可数字控制调节，可外接功放。

音质的优劣取决于ADC和DAC位数的多少。』

基本概念

采样：将语音模拟信号转化成数字信号。

采样率：每秒采样的个数（byte）。

波特率：每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second

采样位数：指在二进制条件下的位数。一般在没有特别说明的情况下，声音的采样位数指8位，由00H--FFH，静音定为80H。

奈奎斯特抽样定理（Nyquist Law）：要从抽样信号中无失真地恢复原信号，抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时，信号的频谱有混叠。抽样频率大于2倍频谱最高频率时，信号的频谱无混叠。

嗓音的频带宽度为20～20K HZ左右，普通的声音大概在3KHZ以下。所以，一般CD取的音质为44.1K和16bit，如果碰到某些特别的声音，如乐器，音质也有用48K和24bit的情况，但不是主流。

一般在我们处理针对普通语音IC的时候，采样率最高达到16K就够了、说话声一般取8K（如电话音质）、6K左右。低于6K效果比较差。而DKC系列语音芯片采样可以做到22K。

PCM格式：Pulse Code Modulation，脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样，使其离散化，同时将抽样值按分层单位四舍五入取整量化，同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
WAV格式：WAV是最常见的声音文件格式之一，是微软公司专门为Windows开发的一种标准数字音频文件，该文件能记录各种单声道或立体声的声音信息，并能保证声音不失真。但WAV文件有一个致命的缺点，就是它所占用的磁盘空间太大（每分钟的音乐大约需要12兆磁盘空间）。它符合资源互换文件格式（RIFF）规范，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。
MP3格式：MP3是一种音频压缩技术，其全称是动态影像专家压缩标准音频层面3（Moving Picture Experts Group Audio Layer III），简称为MP3。它被设计用来大幅度地降低音频数据量。

Maxlinear Voice Telephony SLIC

Subscriber Line Interface Circuits (SLIC)：用于家庭网关和企业解决方案的用户线路接口电路。

Maxlinear的用户线接口解决方案将CMOS编解码器和高压线驱动器组合在一个封装中，这种方案提供了所需的灵活性和性能，以实现用于客户无线终端接入设备（CPE）的成本优化的语音应用。

产品组合提供用于一个和两个FXS端口的设备。MaxLinear的SLC210和SLC220为MaxLinear SoC提供了专有的强大SSI接口。DXS10x和DXC10x通过PCM/SPI或CSI接口与所有主要的第三方宽带SoC提供经验证的集成和性能。

参考资料

★博文内容均由个人提供，与平台无关，如有违法或侵权，请与网站管理员联系。

★文明上网，请理性发言。内容一周内被举报5次，发文人进小黑屋喔~