一.概况:
评估 Camera 的图像质量是一个复杂的工作,我们可以按照一些测试标准,借助一些测试仪器,进行客观项的测试,通过客观数据来测评一个图像的质量。Camera 图像毕竟是给人看的,图像质量最终还是要人的感官来体现,所以这里我们要加入主观测评来定义图像质量。但是由于主观评测一般很难数据化和具体化,所以很难准确定义,这里介绍一个“五分制图像质量主观评测法”图像评测方法。希望可以对一些 Camera 产品的图像质量评测有帮助。
二.五分制图像质量主观评测法
评价应该采用专业人士和非专业人士共同组成的专家组来评价,建议参与人数 5~12,评测过程中可提过程,不讨论结果(可提要测试什么,但不能讨论图像效果怎么样),对每个项目按照 5 分制打分。参与评测人员参考以上五分制对所有的图像质量维度进行打分,
在打分时可扩展到一位小数对结果进行修正。对正向或中性维度可参考表 2-1 中“五级质量制”进行评分,比如清晰度、色彩还原等;对负向维度可参考表 2-1 中“五级损伤制”,去噪效果、去隔行效果、亮色串扰等。
按表 2-1“五分制”评分后可对结果做以修正,精确到扩展一位,即可以给出一位小数部分的评分。如,大致看了某视频序列后,觉得图像质量一般,初步评分为 3,之后在后几个序列中,感觉还可以提升,这时可将该维度评分修正为 3.2。修正时根据场景在实际引用中的重要性考虑修正评分的幅度。
图像质量主观评价时,发现存在的明显缺陷,如物体移动时图像边缘明显的锯齿状、断裂等现象。应根据程度给对应的评价维度降分,甚至到最低。
参评人员打分结果最多可精确到小数点后 1 位,但最终的数据处理结果精确到小数点后 2 位。所有产品保持黑盒,参与人员不能有明示或暗示具体的产品及其型号,评测数据记录中以代号,如 A、B、C 替代,评测完毕后方可进行具体产品的讨论。
评测概要表述如下:
产品黑盒
评估人员(专业人士和非专业人士 5~12 人)
总体粗略印象(1、2、3、4、5)
根据具体场景修正评分(一般精度 0.1)
汇总平均(精度 0.01)(该结果为产品最终评估结果)
分数 |
Level |
五级质量制<正向> |
五级损伤制<逆向> |
5 |
优 |
图像质量极佳,十分 |
图像上无法察觉有损伤或干扰存在 |
4 |
良 |
图像好,比较满意 |
图像上有稍可察觉的损伤或干扰,但并不令 |
3 |
中 |
图像一般,可以接受 |
图像上有明显察觉的损伤或干扰,令人有些 |
2 |
差 |
图像较差,勉强可看 |
图像上损伤或干扰较严重,令人相当讨厌 |
1 |
劣 |
图像低劣,无法观看 |
图像上损伤或干扰及严重,不能观看 |
表 2-1 五分制图像质量主观评测法
三.五分值主观维度评估方式
No |
测试维度 |
参考关注方式 |
参考评分方式(仅供参考,不限定,根据各维度总体印象 |
1 |
清晰度 |
主要观察静止、运 |
图像混叠(线条叠加再一起,虽线条清楚,但不是原 |
2 |
对比度 |
主要关注局部对比 |
局部对比度好(亮处不过曝,暗处够亮) +0.2;/局部对 |
3 |
去噪 |
图像噪声大小 |
由于噪声,背景图像无法分辨 -0.2 噪声数量较大 -0.1; |
4 |
色彩还原 |
色彩还原主要包含三个方面:白平衡 |
全局的整理偏色,-0.5; 灰色区域出现其他颜色(白平衡)-0.2; |
5 |
锯齿 |
边缘的平滑程度 |
目测每个锯齿所占据像素大小,目测可以看到的每个像素 |
6 |
闪烁 |
画面整理或局部边 |
明显的 AE 闪烁,-0.5;明显的 AWB 闪烁,-0.5; |
7 |
伪彩 |
密集的条纹处出现 |
全屏的摩尔纹,-0.5; |
8 |
块效应 |
由量化步长较大引 |
块较大,-0.3; |
9 |
呼吸效应 |
图像帧间参考引起 |
画面比例占到全屏,-0.3; |
10 |
拖影 |
物体运动后背景出 |
运动物体出现背景的边缘线条等 -0.2; |
11 |
(肤色)还原 |
属于色彩还原中的 |
一个专项,专用于
肤色的还原
肤色失真,偏向其他颜色 -0.5;
肤色偏淡或过饱和 -0.2。
12
亮处细节于评估亮处细节
属于清晰度中的一
个专项测试,仅用分细节,难以分辨 -0.2。
亮处过亮,无法分辨 -0.3;
较亮处可以压制,物体分辨清楚 +0.2;较亮处损失部
13 |
暗处细节 |
属于清晰度中的一 |
暗处过暗,无法分辨,-0.3; |
14 |
紫边 |
亮处边缘出现的紫 |
点光源,目测光源紫边相比光源直径每 20% -0.1; |
15 |
亮度 |
专项,属于清晰度 |
画面整体亮度近同 正常照度人眼实景 +0.2; |
表 3-1 五分值主观维度评估表
四.五分值主观维度评估方式
在主观维度的评估中,评测人员在每个场景中给相应维度独立打分,各维度取平均即
为该场景的评分,所有场景的平均分加权后即得到全场景的加权分,这个即可视为总分。
评测人员使用的评测表举例,如下表 4-1 所示
测试维度 |
A 产品 |
B 产品 |
备注 |
静物场景 |
5.0 |
5.0 |
- |
人物场景 |
5.0 |
5.0 |
- |
远景场景 |
5.0 |
5.0 |
- |
宽动态场景 |
5.0 |
5.0 |
- |
低照度场景 |
5.0 |
5.0 |
- |
复杂纹理场景 |
5.0 |
5.0 |
- |
运动场景 |
5.0 |
5.0 |
- |
光线变化场景(AE) |
5.0 |
5.0 |
- |
强光场景 |
5.0 |
5.0 |
- |
开阔场景 |
5.0 |
5.0 |
- |
外场 AWB |
5.0 |
5.0 |
- |
外场低照度 |
5.0 |
5.0 |
- |
外场运动 |
5.0 |
5.0 |
- |
外场强光抑制 |
5.0 |
5.0 |
- |
关键维度加权平均 |
- |
- |
- |
表 4-1 主观维度评估表示例
五.五分值主观维度评估方式
评测结果分级 |
指标 |
单维度 |
全部维度 |
关键维度加 |
备注 |
A 级—有竞争力的产 |
Passed |
≥3.0 |
高于标杆 |
高于标杆 |
全部条件成 |
B 级—质量(图像) |
Passed |
≥3.0 |
高于标杆 |
- |
全部条件成 |
C 级—不合格或无竞 |
Failed |
- |
低于标杆 |
低于标杆 |
达成条件之 |
表 5-1 数据结果及应用示例
标杆:在参与评测前由版本测试策略制定。
单维度:参与主观评测的每个维度
参考文献:
- “Hisilicon IP Camera 图像质量测试标准”
评论
Marlon
2020年10月15日