Python可视化⽬标检测框的实现代码
⽬录
1 引⾔
2 举个栗⼦
3 实现
3.1 函数讲解
3.2 读⼊图像
3.3 标签美化
3.4 ⾓点美化
3.5 综合效果
4 透明效果实现
5 扩展应⽤
6 总结
7 参考
1 引⾔
随着计算机视觉算法⼯程师的内卷,从事⽬标检测的⼩伙伴们越来越多了.
很多时候我们费了九⽜⼆虎之⼒训练了⼀版模型,可是可视化出来的效果平淡⽆奇.
是不是有点太不给⼒啦,作为计算机视觉⼯程师,我们是不是应该关注下如何优雅地可视化我们模型地检测结果呢?
2 举个栗⼦
最常⽤的可视化⽬标检测结果的就是我们所说的矩形框,矩形框的画法也可以分为好多中,我们以下图进⾏说明:
我们以上图⽪卡丘的矩形检测框为例,左上为我们常⽤的不带标签的输出框,右上为YOLO系列美化带标签后的矩形框,左下为四个⾓点美化后的矩形框,右下为带标签的⾓点美化矩形框.
3 实现
3.1 函数讲解
在opencv中,我们通常使⽤angle函数进⾏矩形框的绘制,该函数的⼀般形式如下:
相应的参数含义如下:
image: 输⼊图像
start_point: 矩形框左上点坐标
end_point: 矩形框右下点坐标
color: 矩形框颜⾊默认BGR顺序
thickness: 线的粗细,其中 -1 代表填充整个矩形
3.2 读⼊图像
我们使⽤上述函数,来画我们的⽰例图像:
html矩形框代码怎么写img_name = './pikachu.jpg'
img = cv2.imread(img_name)
box = [ 140, 16,468,390, "pikachu"]
box_color = (255,0,255)
结果如下:
左侧为我们的原图,右侧为我们画框的效果图.
3.3 标签美化
接下来我们来给矩形框添加标签,我们观察上述画图函数,注意最后⼀个参数thickness,如果此值等于-1,那么将对矩形框执⾏填充效果.基于此,我们来写标签美化代码,如下:
def draw_label_type(draw_img,bbox,label_color):
label = str(bbox[-1])
labelSize = TextSize(label + '0', cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2)[0]
if bbox[1] - labelSize[1] - 3 < 0:
(bbox[0], bbox[1] + 2),
(bbox[0] + labelSize[0], bbox[1] + labelSize[1] + 3),
color=label_color,
thickness=-1
)
cv2.putText(draw_img, label,
(bbox[0], bbox[1] + labelSize + 3),
cv2.FONT_HERSHEY_SIMPLEX,
0.5,
(0, 0, 0),
thickness=1
)
else:
(bbox[0], bbox[1] - labelSize[1] - 3),
(bbox[0] + labelSize[0], bbox[1] - 3),
color=label_color,
thickness=-1
)
cv2.putText(draw_img, label,
(bbox[0], bbox[1] - 3),
cv2.FONT_HERSHEY_SIMPLEX,
0.5,
(0, 0, 0),
thickness=1
)
上述代码中,⾸先计算标签⽂本的⼤⼩,然后据标签⽂本⼤⼩进⾏矩形填充,最后使⽤cv2.putText画对应的标签⽂本.运⾏效果如下:
左侧为原图,右侧为添加⽂本标签后的结果图.
3.4 ⾓点美化
上述添加完标签后,由于标签框和⽬标矩形框颜⾊⼀致,边界处不太容易区分,这⾥添加对⾓点美化的代码,代码如下: def draw_box_corner(draw_img,bbox,length,corner_color):
# Top Left
cv2.line(draw_img, (bbox[0], bbox[1]), (bbox[0] + length, bbox[1]), corner_color, thickness=3)
cv2.line(draw_img, (bbox[0], bbox[1]), (bbox[0], bbox[1] + length), corner_color, thickness=3)
# Top Right
cv2.line(draw_img, (bbox[2], bbox[1]), (bbox[2] - length, bbox[1]), corner_color, thickness=3)
cv2.line(draw_img, (bbox[2], bbox[1]), (bbox[2], bbox[1] + length), corner_color, thickness=3)
# Bottom Left
cv2.line(draw_img, (bbox[0], bbox[3]), (bbox[0] + length, bbox[3]), corner_color, thickness=3)
cv2.line(draw_img, (bbox[0], bbox[3]), (bbox[0], bbox[3] - length), corner_color, thickness=3)
# Bottom Right
cv2.line(draw_img, (bbox[2], bbox[3]), (bbox[2] - length, bbox[3]), corner_color, thickness=3)
cv2.line(draw_img, (bbox[2], bbox[3]), (bbox[2], bbox[3] - length), corner_color, thickness=3)
上述函数参数解释如下:
draw_img 输⼊图像
bbox ⽬标检测框形式(x1,y1,x2,y2)
length 直线长度
corner_color 直线颜⾊
运⾏结果如下:
左侧为原图,右侧为添加⾓点美化后的结果图.
3.5 综合效果
综合上述标签美化和⾓点美化,可以得到⼆者综合后的效果图如下:
4 透明效果实现
通过angle函数设置thickness我们可以得到填充后的图像,进⽽利⽤opencv中的cv2.add_weight函数可以实现透明效果.
⽰例如下:
左侧为img , 右侧为填充后的draw_img,那么利⽤add_weight进⾏加权的代码如下:
alpha = 0.8
gamma = 0
out_img = cv2.addWeighted(img,alpha,draw_img,1-alpha,gamma)
运⾏后的效果图如下:
左侧为 alpha=0.5的效果图,右侧为alpha=0.8的效果图.
和原图放到⼀起进⾏对⽐,如下:
是不是看上去优雅多了…
5 扩展应⽤
利⽤上述原理,我们可以⽅便地将透明效果从矩形框迁移⾄不规则封闭区域, 样例如下:
左侧为我们输⼊分割⽹络的原始图像,右侧为我们分割⽹络可⾏驶区域的推理图,我们使⽤alpha=0.6对上述两幅图进⾏加权,得到结果如下: