语音芯片

Voice IC

『语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。

根据语音芯片的输出方式分为两大类,一种是PWM输出方式,一种是DAC输出方式,PWM输出音量不可连续可调,不能接普通功放,目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大,该语音芯片声音连续可调,可数字控制调节,可外接功放。

音质的优劣取决于ADC和DAC位数的多少。』

基本概念

  1. 语音信号的量化:采样率(f)、位数(n)、波特率(T)

采样:将语音模拟信号转化成数字信号。

采样率:每秒采样的个数(byte)。

波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second

采样位数:指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。

  1. 采样率

奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。

嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。

一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。而DKC系列语音芯片采样可以做到22K。

  1. 常用语音格式
  • PCM格式:Pulse Code Modulation,脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
  • WAV格式:WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。它符合资源互换文件格式(RIFF)规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。
  • MP3格式:MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。 

Maxlinear Voice Telephony SLIC

Subscriber Line Interface Circuits (SLIC):用于家庭网关和企业解决方案的用户线路接口电路。

Maxlinear的用户线接口解决方案将CMOS编解码器和高压线驱动器组合在一个封装中,这种方案提供了所需的灵活性和性能,以实现用于客户无线终端接入设备(CPE)的成本优化的语音应用。

产品组合提供用于一个和两个FXS端口的设备。MaxLinear的SLC210和SLC220为MaxLinear SoC提供了专有的强大SSI接口。DXS10x和DXC10x通过PCM/SPI或CSI接口与所有主要的第三方宽带SoC提供经验证的集成和性能。

参考资料

  1. https://www.maxlinear.com/products/interface/voice
  2. https://baike.baidu.com/item/%E8%AF%AD%E9%9F%B3%E8%8A%AF%E7%89%87/7299889?fr=aladdin#2

★博文内容均由个人提供,与平台无关,如有违法或侵权,请与网站管理员联系。

★文明上网,请理性发言。内容一周内被举报5次,发文人进小黑屋喔~

评论