浅谈语音质量保障:如何测试 RTC 中的音频质量?
背景介绍
详解 WebRTC 高音质低延时的背后 — AGC(自动增益控制)
硬货专栏 |深入浅出 WebRTC AEC(声学回声消除)
RTC 语音测试链路拆解
RTC 语音测试链路拆解
![](https://filescdn.proginn.com/e07b13737fa77742d068c986fddbd89d/5acbe35cbc128f02d07607fbf5e8d062.webp)
音频质量测试方案
![](https://filescdn.proginn.com/046c107238f1af24e00d6829d99ff237/ba6389e37e5ee0332fd249fff392e668.webp)
客观测试方法
有效频宽
![](https://filescdn.proginn.com/d65efa326ecd3c4196d194338ed85876/ea3cbe7440299b65d18b99631b9c33fd.webp)
端到端延迟
测试素材:一段连续的单音。
指标计算:录制文件中读取未经过传输的音频起始时间记为 t1,读取经过会议传输的音频起始时间记为 t2,则 Delay=t2-t1。
![](https://filescdn.proginn.com/ef086f1751673bb9424e1b88703941ca/37e0cfe12e856346da01ed278cf77168.webp)
ANS
测试拓扑
![](https://filescdn.proginn.com/d38c2ff9ea27f48aeaba82f48ece5e69/6882335dd6abe4a0d7f332c27fb2def8.webp)
测试素材
分类 | 音频素材 | 音频素材 |
声学噪声 | 白噪声 | 如下是粉红噪声示意图: |
粉红噪声 | ||
真实环境噪声 | 咖啡馆噪声 | 如下是办公环境噪声示意图: |
汽车空间内噪声 | ||
会议室空间内噪声 | ||
办公环境噪声 | ||
餐馆环境噪声 | ||
地铁站/高铁站环境噪声 | ||
街道环境噪声 | ||
带噪人声 | 信噪比10dB | 如下是信噪比为10dB的带噪人声: |
信噪比15dB | ||
信噪比25dB |
指标计算
![](https://filescdn.proginn.com/1a4f4db558522fca4155b92f3df3e6b1/76508cd86aaadbc9f85daec42e9c19fe.webp)
AGC
测试拓扑
测试素材
分类 | 音频素材 | 音频素材 |
阶梯音量人声 | “大-小-大”平稳性声音素材(以3dB步长音量增减) | 如下是“大-小-大”平稳性声音素材示意图: |
不同音量男声&女声(打分) | 小音量(打分) | 如下是用于打分中音量人声: |
中音量(打分) | ||
大音量(打分) |
指标计算
![](https://filescdn.proginn.com/eea7576a534f01e4e2a57cae2905e924/b73196accf0fc8d67b750b7585a5dda3.webp)
![](https://filescdn.proginn.com/b44e6f5c5c1b1335178c3c0d4369f5b6/33e7cb1d6cfc08e2930cb83a7410e7c8.webp)
测试拓扑
![](https://filescdn.proginn.com/0eab75e613ea9b9eb80ca37cc267ae89/56848d4411bc7c6eb5d286780a05da9a.webp)
![](https://filescdn.proginn.com/cb38c6b6f9c70c7bb3e18c1c7b8475ee/39a9fa6cb08945d298dac4bd7c4beb94.webp)
测试素材
分类 | 音频素材 | 音频素材 |
单讲 | 连续标准人声素材(男声、女声、孩童、老人) | 连续人声素材示意图: |
双讲 | 双讲人声素材(包含连续说话、单字说话) | 双讲人声素材(包含连续说话、单字说话)示意如下: |
指标计算
测试拓扑:参考 ANS 测试拓扑。
测试素材:ITU-P863 提供标准人声素材。
指标计算:如下框架图展示了 STOI 计算流程,当前业内已有 matlab 和 python 对该算法的工程实现。
![](https://filescdn.proginn.com/ef6aa78a3196ec21641388217562b3b0/cb500c15ea29b88dfc773093b512d858.webp)
测试拓扑:参考 ANS 测试拓扑。
测试素材:ITU-P863 提供标准人声素材 &VQT 内置语音测试素材。
指标计算:POLQA MOS 分。
测试拓扑:参考 ANS 测试拓扑。
测试方法:测试素材:ITU-P863 提供标准人声素材。
指标计算:PESQ MOS 分
主观测试方法
评分方法
![](https://filescdn.proginn.com/242712d9517adb7ccae19d29ace8f608/26adb5ad4336408bc20dfbf6405d91d4.webp)
评价维度
测试场景
![](https://filescdn.proginn.com/365cc9e4f1c4d0af202479f5d543b41c/29d058e45b2f2c098c592b3fecbcd9b2.webp)
技术交流,欢迎加我微信:ezglumes ,拉你入技术交流群。
推荐阅读:
觉得不错,点个在看呗~
![](https://filescdn.proginn.com/345354ddc6bb6c8455badef441ed3899/fddef2ac4d3b2648b4e668feef2c09af.webp)
评论