随着社会的进步,打造个人专属网红的产品如雨春笋般的涌现,而当今最流行的网络直播项目在各个领域里大放异彩,其中市场最为火爆的音频网络直播产品更是各大厂家的热门竞争领域。那我们先普及了解什么是"网络直播",它大致分两类,一类是在网上提供电视信号的观看,例如各类体育比赛和文艺活动的直播,这类直播原理是将电视(模拟)信号通过采集,转换为数字信号输入计算机,实时上传网站供人观看,相当于"网络电视";另一类是人们所了解的"网络直播":在现场架设独立的信号采集设备(音频+视频)导入导播端(导播设备或平台),再通过网络上传至服务器,发布至网址供人观看。本项目主要是介绍网络音频直播的设备及产品开发,在开发系统之前先明白音频主播在工作中通常需要以下常见的几种设备:
1、麦克风
音频主播用的麦克风主要有两种类型,一种是动圈麦克风,另一种是电容麦克风,娱乐主播以及绝大部分非MC(喊麦,主持)用的都是电容麦克风。
2、耳机
一般来说入耳式的监听耳机和头戴式的监听耳机比较常见。
3、麦克风支架
麦克风支架的作用就是安装之后就可以调整麦克风的位置和距离。
4、防喷网
在开播的时候,经常会将气流喷到麦克风话筒上面。这样录出来的声音就会带有明显的爆音现象,而且会伴随着杂音,使用麦克风防喷罩可以有效地避免喷话筒现象的发生。尤其是在使用高灵敏度的电容麦克风的时候,安装一个防喷罩能有效的避免这一现象。
5、声卡
声卡主要分为两种,内置声卡可以把麦克风、吉他或者其他乐器与计算机连接。一个典型的声卡可以把模拟信号转换成计算机可以处理的数字音频信息,声卡又分为内置声卡和外置声卡。台式计算机搭配内置声卡,内置独立声卡相对于同价位的USB接口的声卡效果会好一点。外置声卡。其内置强劲的音效处理器混响效果、变声效果众多功能于一体,轻松实现网络 K 歌(听湿录湿)、网络直播、主持喊麦、语音聊天、音乐聆听、专业录音等使用模式。
二、方案介绍
基于“Realtek RTL4040/4042 with RWS蓝牙”的网红直播设备能够轻松完成上述立志做网红设备的厂家及工程师爱好者的需求。了解了音频网络直播设备的组成之后,本文重点介绍其核心组成部分即本系统所采用的Realtek RTL4040/4042 芯片构成的网络音频直播核心:即智能USB 声卡,其强大的音频录放功能可以满足任何录放功能,并且一揽子交钥匙的HDK方案让你轻松完成整个方案的电路设计。
1,RTL4040/4042芯片
描述:
ALC4042是一款低功耗单芯片USB 2.0高速音频编解码器,内置MCU,可灵活使用。它适用于耳机,耳机转接,扬声器和麦克风应用。内部MCU还可以开发到许多不同的应用程序,例如Microsoft™Lync /Skype / VoIP设备,移动电话或平板计算机/平板对接设备。 ALC4042兼容USB Audio Class 1.0和USB 2.0全速,因此无需任何附加软件即可即插即用安装在主要操作系统上。 内部DAC支持44.1~384 KHz和ADC支持44.1~192 KHz采样率,分辨率为16/24/32位。ALC4042还集成了16K字节OTP和晶体,但需要很少的无源组件制作成品。 这样,它可以节省总BOM成本,PCB面积可以更小。
特点:
-
具有105dBA SNR的数模转换器
-
具有94DBA SNR的模数转换器
-
一个立体声DAC支持8/16/22.05/24/32/44.1/48/96/176.4/192 / 384KHz采样率,16/24/32位
-
两个立体声ADC支持8/16/22.05/24/32/44.1/48/96/176.4/192 / 384KHz采样率,16/24/32位
-
G类耳机输出,不带隔直电容超低功耗,用于耳机播放
-
硬件前馈或回馈有源噪声取消(ANC)特征=带前置放大器的单端模拟麦克风输入(0/20/24/30/35/40/44/50 / 52dB)
-
低噪声麦克风和可程序设计MICBIAS电压电平
-
音频插孔检测功能
-
带有自定义多功能控制支持的4键式耳机
-
一个I2S数字接口,支持master /slave工作模式
-
一个12S数字接口支持(8/16/22.05/44.1/48/88.2/96/176.4/192/384kHz,16/24/32位)
-
I2S数字接口支持TDM格式输出/输入
-
I2C控制接口,支持master/slave
-
两个立体声数字麦克风接口
-
SPI(串行外设接口,模式0~模式3)连接到串行闪存,用于切换代码和配置自定义参数
-
连接外部设备的UART接口
-
内置模拟LDO
-
48针QFN'Green'包装
延伸阅读
2,RWS RTL8763BFR芯片
Realtek瑞昱RTL8763BFR低功耗蓝牙5.0双模芯片。这是瑞昱首款支持AI唤醒的TWS蓝牙耳机芯片。也是近期TWS 5.0真无线蓝牙耳机方案界中的领军者。Realtek瑞昱RTL8763BFR支持蓝牙5.0规范,支持HFP1.7,HSP1.2,A2DP1.3,AVRCP1.6,SPP1.2和PBAP1.0。在本系统方案中,采用RTL8763BFR 来设计一个无线蓝牙模块,方便集成在我们的智能USB 声卡系统中,从而实现有线+无线的音源输入。
以下阐述蓝牙模块的设计:
2.1、硬件设计
A)电源设计
RTL8763BFR RWS芯片支持两种电源输入,一种锂电池(VBAT:2.8-4.5V),一种电源适配器主要给锂电池充电(4.5V–6.5V),其充电电流可达400mA,其芯片内置充电保护功能和外接环境保护检测功能,因此非常适合usb充电方式。芯片内部有两路开关调节器,分别供电1.8V的AVCC/AVCCDRV和1.2V电压的VDDCORE/VD12_SYN/VD12_RF。
B)系统设计
复位电路
为了保证电路的稳定可靠,RTL8763BFR RWS芯片可通过外部的复位开关触发HW_RST_N脚进行复位,通常为了节省成本和空间,该方案仅仅通过外部的充电复位就可以完成系统的正常复位(低电平有效保持低脉冲> 5ms即可)。
时钟电路
RTL8763BFR RWS芯片有两路时钟源,一种是40M的主时钟源为ARM/BT baseband的正常工作时钟源,不需要外部负载电容,在MP时需要进行校准,为7~9pf。另外一种是RTC时钟源32.768k,通常工作在sleep模式下。
音频电路
音频的输入与输出电路设计,音频输入支持三种方式接入模式(Single end mode、Capless mode、Differential mode),其按照拾音器的不同有四种接入方式(AUX-IN、1-MIC、Dual MIC、Digital MIC),音频输出支持S /PDIF接口。
SPI Flash设计
针对不同的使用者需要,RTL8763BFR RWS芯片可外接各种Flash,但尽量使用我们推荐的型号(仅仅RTL8763BM/BMR/BS):
RTL8763BF/BFR supports 8M-bits on chip FLASH memory
RTL8763BO supports 16Mbits on chip flash memory
RTL8763BM/BMR/BS support 1-bit and 2-bit mode
RF电路设计
RTL8763BO支持IQM和TPM,RTL8763BM,RTL8763BF,RTL8763BS仅仅支持IQM
—RFIO_IQM支持双模,最大功率+10dBm、接收灵敏度-94dBm @2M EDR
—RFIO_TPM是专用于BLE最大功率+4dBm
天线设计
支持pifa天线和chip天线、顶针天线,具体的天线设计可以参考Realtek原厂参考设计及推荐厂家(万诚、华新科等等)
外设引脚设计
- —GPIO(可配置高达32 GPIOs)
- —Timer可配置PWM function
- —I2C支持master/slave模式
- —SPI支持master / slave模式
- —UART(高速串口最大速率达4M)
- —GDMA可配置达8 channel数量且支持Single & multi访问技术
- —ADC(8-channel /12-bit ADC)
- —Keyscan(可达12x20的最大矩阵)
- —支持Q-decoder
- —支持IR接收
- —支持SD host相容SD 2.0
- —支持大容量USB传输
2.2、软件设计
RTL8763BFR RWS芯片软件设计,采用一站式的“傻瓜式”设计技术,让所有的客户轻松构建自己的RWS无线耳机系统,主要的软件设计为以下:
A)MCU配置
MCU配置工具主要是针对系统控制方面,通过配置工具能够产生.SCF和.APF檔,其中.SCF文件为系统配置文件,.APF文件为音讯应用参数设置文件,其主要的目的是:为每个客户设计生成定制的配置文件和自定义操作任何源代码的目的,这些操作全部通过APP UI工具来实现的。这些工具是通过特别授权的账号可供客户下载。
B)DSP配置
DSP配置工具主要是针对音频方面的配置,其中主要包括有以下内容:
—声音处理:1-mic/2-mic NR(降噪)、AEC(声回波消除)/ AES(声回波抑制)、MB-AGC(多波段自动增益控制)、高通滤波器(高通滤波器)、发送端EQ配置、DAC / ADC设置
—音讯的A2DP /输出处理:支持音频处理功能、MB-AGC、音频扩大、参数EQ、发送端EQ配置、音频传递函数、模式配置、允许开发人员以任何想要的顺序排列声音效果。
—无线DSP控制:Bluetooth链路配置
—外围硬件控制:主要定义I2S接口、模拟译码接口等等
—SDK开发接口配置:随客户要求自定制可配置成语音和音频接口
7、动态范围(Dynamic Range):动态范围是指音响系统重放时最大不失真输出功率与静态时系统噪声输出功率之比的对数值,又指一个多媒体硬盘播放器输出图像的最亮和最暗部分之间的相对比值。一般性能较好的音频设备动态范围在100dB以上。动态范围是指设备能够处理的最大信号与最小信号的比值。
3,TPA3131D2:20W 无滤波器 D 类立体声放大器
TPA313xD2 是用于驱动扬声器的高效立体声数字放大器功率级,峰值驱动功率高达 2x42W/4Ω。 TPA3131/32D2 的印刷电路板 (PCB) 通过底部 PowerPAD 进行散热,无需使用散热器,同时可持续提供 2 × 4W/8Ω (TPA3131D2) 至 2 × 25W/8Ω (TPA3132D2) 范围内的输出功率。
TPA313xD2 高级振荡器/PLL 电路采用多开关频率选项来抑制 AM 干扰;搭配使用主从模式同步选项时,还可使多个器件实现同步。
TPA313xD2 针对短路、过热、过压、欠压和直流等故障提供了全面保护。 在超载情况下,器件会将故障情况报告给处理器,从而避免自身遭到损坏。
特性相容器件包括:2 × 50W TPA3116D2(PowerPAD 朝上)、2 × 15W TPA3130D2(PowerPAD 朝下)和 2 × 30W TPA3118D2(PowerPAD 朝下)。
产品特性
- 支持多种输出配置
- 7.4V 电压、8Ω 桥接负载 (BTL) 负载条件下的功率为 2 × 4W (TPA3130D2)
- 19V 电压、8Ω BTL 负载条件下的功率为 2 × 25W (TPA3132D2)
- 7.4V 电压、8Ω 桥接负载 (BTL) 负载条件下的功率为 2 × 4W (TPA3130D2)
- 19V 电压、8Ω BTL 负载条件下的功率为 2 × 25W (TPA3132D2)
- 宽电压范围:4.5V 至 26V
- 汽车抛负载兼容
- 高效 D 类运行
- 兼具 > 90% 的功率效率与低空闲损耗特性,无需散热器即可稳定运行
- 高级调制系统配置
- 兼具 > 90% 的功率效率与低空闲损耗特性,无需散热器即可稳定运行
- 高级调制系统配置
- 多重开关频率
- AM 抑制
- 主从模式同步
- 高达 1.2MHz 的切换频率
- AM 抑制
- 主从模式同步
- 高达 1.2MHz 的切换频率
- 采用具有高 PSRR 的回馈功率级架构,降低了 PSU 需求
- 可程序设计功率限制
- 差分和单端输入
- 立体声模式和单声道模式(采用单滤波器单声道配置)
- 由单电源供电运行,减少了组件数量
- 集成了具有错误报告功能的自保护电路,其中包括过压、欠压、过热、直流检测和短路等保护
- 散热增强型封装
- 32 引脚超薄型四方扁平无引线 (VQFN) 封装(焊盘朝下)
- 32 引脚超薄型四方扁平无引线 (VQFN) 封装(焊盘朝下)
- -40°C 至 85°C 环境温度范围
应用
- 笔记本计算机和超极本
- 平板电视
- 消费类音讯应用
4,Nutube 双三极管阀
Korg Nutube 6P1 是一款基于真空荧光显示屏 (VFD) 技术的经典双三管热管阀(真空管)的现代更新产品。它的尺寸更小,功耗远远更低,但是能提供和传统真空管放大器一样富有谐波的音讯。它具有阳极网格灯丝结构,与三码真空管相同。它采用便利的 DIL 格式封装,甚至像原装那样“发光”。成像板上有荧光片,类似于真空荧光显示屏,当电流流动时,会产生绿色白色的光。
Nutube 6P1 芯片在长达 30,000 小时的使用寿命内提供高可靠性。它可以在低至 5V 的电压下运行,并且在功耗方面只能提供 12mW (每个通道)。Nuctube 6P1 也提供极佳的线性,类似于理想的双三角代码。
Nuctube 6P1 是开发、原型设计和制造的理想设备,无论您是 Diyer 还是 OEM 组织。它可用于创建耳机放大器或吉他放大器。小的工作电流也适合电池供电的设备。
• 高质量
• 高可靠性
• 低功耗
•低电压
•紧凑封装
特征:
• 最大阳极电压:80 V 直流 • 加热器(细丝)电压:0.7 V 直流
• 加热器(细丝)电流:17 mA x 2
• 最大阳极功率:1.7 mW
• 典型电压放大(输出电压/输入电压):5
• 工作温度范围:-40 至 +85°C
• 尺寸:17 x 46 mm(不包括引脚)
它有多大?
纽管封装的尺寸为 45 x 16 x 5.6 (不包括引脚)。
它使用多少功率?
Nuctube 使用的电力不到传统管的 2% 。
真真空管声音:
纽管产生温暖独特的真空管声音。它提供极佳的线性。
5,电源系统
整机供电系统由24v外接电源供电,24v主供电为后级PA功放供电,采用直接供电能够提供充沛的功率,再降压输出12v->5v->3.3v LDO 供内部其他系统的供电,整个电路小巧灵活简单。
四、软件开发
本系统由于采用ALC4042做声卡主控,其内置的fw免去了一般软件产品的开发过程,若需要定制fw则可以通过原厂修改fw。在这里我们采用RTL8763BFR模块做主控,通过这个芯片灵活的程序设计来解决一些简单的系统工作流程控制,至于RTL8763BFR的软件开发,本文不做更详细的说明,读者可查阅作者其他的方案及文稿。
五、测试
音讯AUDIO设备测试,主要测试频响,失真THD,信噪S/N,噪声NOISE,当然有的还要求测试功率,常用的测试仪器有Audio Precesion(现在),7723A/B(早期).通过产生一个正弦信号输入到设备里面,从输出端监测输出信号.
从话筒、功率放大器、扬声器等等关键点的测量,衡量音讯设备的主要技术指针有频率响应特性、谐波失真、信噪比、动态范围等。下面简单介绍音讯设备常见的测试指针:
1、电平(Level):音讯设备测试中常用的测试电平主要有以下几种,①给定输出电平,如 1V 、1W或单位增益;②能产生固定失真的电平 , 如1% THD+N;③设备工作电平,噪声低的同时又有着合适的动态余量;④测试文档指定的输入或输出电平。测试时应根据情况的不同来选择适合的电平去测量设备,所以首先必须非常清楚自己应该使用哪种电平。通常根据DUT(Device under test)的性能来说,对于增益可调的则可通过调整增益来实现输出指定的测试电平,但是固定增益的DUT就不能通过调整增益来进行了,如果需要DUT输出1Vrms的信号,用AP的Signal Generator输出一个1KHz的正弦信号,将AP的Analyzer窗口中 Level单位设置为V,然后调整信号发生器的输出幅值使Analyzer中的Level值变为1V即可;对于需要DUT输出1W的测试情况,寻找输入电平的方法类似,只需将Level的单位选择为W即可;当然对于要找打1%的THD+N输入信号,则要将Analyzer窗口中的Function Reading选择为THD+N Ratio即可。
2、频率响应(FrequencyResponse):频率响应测量观察的是不同频率的电平输入到被测设备后产生的输出电平,是对音讯设备内的数模/模数转换器频率响应能力的一个评价标准。通常是用等幅正弦波从极低频率扫描到极高频率输入到设备,如果设备的响应非常平直,那么在频响曲线上的反映应该是所有频率的输出电平均等,轨迹线几乎无变化且斜率接近于零。最简单的全频段响应测量可以只选择要测频段内极低、极高个中间频率进行测试。如果这些频率的输入电平相同,则被测设备的输出电平代表其对这些频率的实际响应情况。在低频与高频部分,信号的重建比较困难,所以在这两个频段通常都会有衰减的现象。输出质量越好的装置,频率响应曲线就越平直,反之不但在高低频处衰减得很快,在一般频段,也可能呈现抖动的现象。
3、总谐波失真加噪声(THD+N,Total Harmonic Distortion plus Noise):谐波失真是在音频信号中多出了一些额外增加的频率信号,谐波频率是原始信号的整数倍。总谐波失真是被测设备谐波的所有测量结果总和。THD+N会根据测量带宽的不同而发生变化,所以需要使用高通和低通滤波器来限制测量带宽,并在结果的部分标明测试时所使用的实际带宽。通常采用的带宽范围是20Hz 至 20kHz。THD+N还会随着施加信号的电平和频率的不同而产生变化。所以通常采用约1kHz 的中频信号以及标准工作或*输出电平来测量设备。
4、串扰(Crosstalk):在多信道的音频系统中通常会发生一个信道的信号以低电平的形式泄漏到另外一个通道里的情况,这种跨信道泄漏的信号被称之为串扰,其通常表述为泄漏信号和原始信号之间的比率,串扰在实际设备中非常难以被消除干净。串扰主要是设备通道导体之间电容耦合的结果,并且通常表现出随频率上升而增加的特性。串扰结果通常只是单一的数字。然而,对设备进行扫频测试可以客观反映其在工作带宽内的实际串扰性能。在AP上测试音讯设备的Crosstalk通常为保证DUT的两信道有相同的对地输入阻抗,必须将DUT两个信道分别接入AP信号输出端口A和B,当要测试A 受到B的串扰时时,则在AP信号发生器中关闭信道A,只打开信道B,并在Analyzer窗口中选择Crosstalk功能选中信道A,就可以直接读出该定频输入下串扰大小,当然输入扫频信号也可以在全频带内进行扫频测试Crosstalk。
5、信噪比(Signal-to-noise ratio):噪声水平的大小往往这取决于你的信号有多大,信噪比(SNR)正是这种设备性能的具体反映。输入信号通常为设备的标准工作电平或最大不失真输出电平。使用最大不失真输出电平测出来的信噪比结果也称为动态范围,因其描述了被测设备的两个极端性能数值。动态范围对于数字设备有些不同的含义。其通常用负的分贝值表示。在传统的信噪比测量方法里,需要进行两次测量以及少许运算。 首先控制AP(或DUT的增益)找到使DUT的THD+N达到1%失真点的电平作为参考电平,通过按键F4将参考电平设置到AP中,之后关闭发生器,将读数单位设置为dBr就可直接读取SNR。在测试SNR时尤其要注意用滤波器限制测量带宽。
6、相位(Phase):在音讯行业中,相位测量指的是以参考波形为基础来测量出周期性波形(如正弦波)在一个周期内的时间偏移量。参考波形通常选用的是系统内部不同节点处的相同信号或不同信道的相关信号。设备输入/输出相位和通道间相位是两种最常见的相位测量方法。相移会根据频率不同而变化,所以通常会用多个频率或以扫频的方式得出相位响应图。通常情况下相位相位差对电平不敏感,所以设置DUT的输出电压高于本底噪声且不失真即可,而通道间的相位差会岁频率的变化而变化,因此为了全面反映相位差信息通常进行扫频测量。
►场景应用图
►产品实体图
►展示板照片
►方案方块图
►核心技术优势
1. 具有105dBA SNR的数模转换器 2. 具有94DBA SNR的模数转换器 3. 一个身历声DAC支持8/16/22.05/24/32/44.1/48/96/176.4/192 / 384KHz取样速率,16/24/32位 4. 两个身历声ADC支持8/16/22.05/24/32/44.1/48/96/176.4/192 / 384KHz取样速率,16/24/32位 5. G类耳机输出,不带隔直电容超低功耗,用于耳机播放 6. 硬体前馈或回馈有源杂讯取消(ANC)特征=带前置放大器的单端类比麦克风输入(0/20/24/30/35/40/44/50 / 52dB) 7. 低杂讯麦克风和可程式设计MICBIAS电压电平 8. 音讯插孔检测功能 9. 带有自订多功能控制支援的4键式耳机 10. 一个I2S数位界面,支援master /slave工作模式 11. 一个12S数位界面支援(8/16/22.05/44.1/48/88.2/96/176.4/192/384kHz,16/24/32位) 12. I2S数位界面支援TDM格式输出/输入 13. I2C控制界面,支援master/slave 14. 两个身历声数位麦克风界面 15. SPI(串列外设界面,模式0~模式3)连接到串列快闪记忆体,用于切换代码和配置自订参数 16. 连接外部设备的UART界面 17. 内置模拟LDO 18. 48针QFN'Green'包装
►方案规格
智慧USB声卡 with 蓝牙无线方案 1、主控方案:高性能Realtek ALC4042 + RTL8763BFR 蓝牙无线 2、方案特点: 高性能Realtek ALC4042具有105dBA SNR的数模转换器,非常适合可携式音讯直播领域 ,具有优秀的音效及声响效果; 根据要求不同可支援耳机及扩音器功能; 支援多种信号输入格式和方式(无线及有线); 提供SDK、API等二次开发界面;用户可对亮度、对比度、饱和度、清晰度等完整属性页面进行控制; 3、应用领域: 可携式音讯播放机;可携式音讯直播设备应用;