完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性的改进模型。
类别激活图(CAM)是一种用于计算机视觉分类任务的强大技术。它允许研究人员检查被分类的图像,并了解图像的哪些部分/像素对模型的最终输出有更大的贡献。 基本上,假设我们构建一个CNN,目标是将人的照片分类为“男人”和“女人”,然后我们给它提供一个新照片,它返回标签“男人”。有了CAM工具,我们就能看到图片的哪一部分最能激活“Man”类。如果我们想提高模型的准确性,必须了解需要修改哪些层,或者我们是否想用不同的方式预处理训练集图像,这将非常有用。 在本文中,我将向你展示这个过程背后的思想。为了达到这个目的,我会使用一个在ImageNet上预训练好的CNN, Resnet50。 我在这个实验中要用到的图像是,这只金毛猎犬: 首先,让我们在这张图上尝试一下我们预训练模型,让它返回三个最有可能的类别: fromkeras.applications.resnet50 importResNet50 fromkeras.preprocessing importimage fromkeras.applications.resnet50 importpreprocess_input, decode_predictions importnumpy asnpmodel = ResNet50(weights= ‘imagenet’)img_path = ‘golden.jpg’ img = image.load_img(img_path, target_size=( 224, 224)) x = image.img_to_array(img) x = np.expand_dims(x, axis= 0) x = preprocess_input(x)preds = model.predict(x) # decode the results into a list of tuples (class, deion, probability) print( ‘Predicted:’, decode_predictions(preds, top= 3)[ 0]) 如你所见,第一个结果恰好返回了我们正在寻找的类别:Golden retriver。 这个想法是这样的:想象我们有一个训练好的CNN,我们给它提供一个新的图像。它将为该图像返回一个类。然后,如果我们取最后一个卷积层的输出特征图,并根据输出类别对每个通道的梯度对每个通道加权,我们就得到了一个热图,它表明了输入图像中哪些部分对该类别激活程度最大。 让我们看看使用Keras的实现。首先,让我们检查一下我们预先训练过的ResNet50的结构,以确定我们想要检查哪个层。由于网络结构很长,我将在这里只显示最后的block: fromkeras.utils importplot_model plot_model(model) 让我们使用最后一个激活层 activation_49 来提取我们的feature map。 golden = model.output[:, np.argmax(preds[ 0])] last_conv_layer = model.get_layer( ‘activation_49’) fromkeras importbackend asK grads = K.gradients(golden, last_conv_layer.output)[ 0] pooled_grads = K.mean(grads, axis=( 0, 1, 2)) iterate = K.function([model.input], [pooled_grads, last_conv_layer.output[ 0]]) pooled_grads_value, conv_layer_output_value = iterate([x]) fori inrange(pooled_grads.shape[ 0]): conv_layer_output_value[:, :, i] *= pooled_grads_value[i] heatmap = np.mean(conv_layer_output_value, axis= -1) importmatplotlib.pyplot asplt heatmap = np.maximum(heatmap, 0) heatmap /= np.max(heatmap) plt.matshow(heatmap) 这个热图上看不出什么东西出来。因此,我们将该热图与输入图像合并如下: importcv2 img = cv2.imread(img_path) heatmap = cv2.resize(heatmap, (img.shape[ 1], img.shape[ 0])) heatmap = np.uint8( 255* heatmap) heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET) merged= heatmap * 0.4+ imgplt.imshow(merged) 如你所见,图像的某些部分(如鼻子部分)特别的指示出了输入图像的类别。 |
|
|
|
只有小组成员才能发言,加入小组>>
物联网工程师必备:怎么选择不同的无线连接技术,本指南帮你忙!
3282 浏览 1 评论
【DFRobot TinkerNode NB-IoT 物联网开发板试用连载】WIFI功能测试
3932 浏览 0 评论
【DFRobot TinkerNode NB-IoT 物联网开发板试用连载】Arduino的替代SublimeText3+STino
3439 浏览 0 评论
使用端口扩展器轻松高效地向IIoT端点添加具有成本效益的子节点
4001 浏览 1 评论
20676 浏览 11 评论
模组有时候复位重启后输出日志为“REBOOT_CAUSE_SECURITY_PMU_POWER_ON_RESET”的原因?
791浏览 2评论
1006浏览 2评论
1016浏览 1评论
1136浏览 1评论
378浏览 1评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-18 10:11 , Processed in 0.914133 second(s), Total 78, Slave 62 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号