我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 域分解 >

AAAI 2019 论文解读 基于区域分解集成的目标检测

归档日期:07-23       文本归类:域分解      文章编辑:爱尚语录

  文章提出了一种 R-DAD 的方法来对 RCNN 系列的目标检测方法进行改进。

  作者的想法动机其实很简单,就是假如一辆车的左边被人遮挡了,那么这辆车的右边带来的信息其实才是更可信的。基于这个想法,文章提出 R-DAD(Region Decomposition and Assembly Detector),即区域分解组装检测器,来改善生成的 Region Proposals。

  文章以 Faster-RCNN 的网络结构为例,修改成它提出的 R-DAD 结构:

  MRP 表面意思就是生成多尺度的 Region Proposal,方法很简单,就是使用传统的 RPN 生成一些建议框,然后用不同的缩放因子(文章使用了 5 种缩放因子作为一组 s=[0.5,0.7,1,1.2,1.5])对生成出的建议框进行不同比例的缩小放大,从而提高 Region Proposals 的多样性。

  如图一,生成了不同尺度的区域,有一些仅仅是局部有一些是大于目标本身的,但是这也带来了一个问题,就是原来的 Region Proposals 已经可以说是极大的数量了,再乘以五倍,想要网络能够完全利用这些建议框是不切实际的,作者最后还添加了 RoI 的采样层,对分数低的和跟 ground truth 重叠率低的进行了筛选。

  由 MRP 网络生成的各种 Region Proposals 可以进一步适应目标之间因为空间变化所导致的特征变化,提高结构的鲁棒性。

  2. RDA(Region Decomposition and Assembly)模块,作者也称它为 mutil-region-based appearance model,即基于多区域的外观模型,它可以同时描述一个物体的全局外观和局部外观,RDA 分为目标分解和目标区域集成的两部分,目标分解如图二所示,把一个目标分为上下左右四个方向的分解部分。

  一般会先用线性插值两倍上采样之后再分解,后面作者给出了表格表示这样效果更好。左右刚好是特征图的左右一半,上下也同理,都会送入 RAB 模块,RAB 模块如图三所示:

  RAB 模块是一个类似 maxout 的单元,理论上它可以逼近任何连续的函数,所以我们使用 RAB 而不是直接使用 ReLU。这表明可以通过配置不同的分层地组合 RAB 模块来表示各种各样的目标特征。

  跟训练 RPN 网络相似,R-DAD 也需要最小化分类损失和回归损失,如下:

  文章中做了各种设置的组合,关于 MRP 里缩放因子的组合、是否有 RDA 模块以及是否上采样,得分如下表所示:

  与没有上下区域分解集成的 R-DAD 对比,有上下分解集成的误判率低很多,因为它在复杂情形下被遮挡物体会更有选择地相信得到的信息。

  1. 文章提出因为我们最大化目标在横向空间位置上局部特征的语义响应,与使用支持小区域的最大池化相比,在没有深层次结构的情况下,我们可以改善特征位置的空间不变性。我的理解就是作者取了上下左右四个方向的特征模板,最后对四个方向进行了融合语义信息,利用了横向空间上的空间不变性,揭示了不同方向上的语义关系。

  2. 在复杂场景下,如有目标对象被另一目标对象遮挡时,通过左右上下模板筛选出来的特征是更符合真实场景的,这样的 Region Proposals 也更加可信。

  3. 同时描述了全局特征和局部特征的语义信息,在 RAB 的组装上具有很强的可操作性,通过配置分层式地组装 RAB 模块,以及修改特征模板,特征的表达会更加灵活。

  这个区域分解集成的算法令我觉得跟以前传统的人脸识别算法提取 Haar-like 特征有点异曲同工之处,同样都是把特征图分成上下两部分,然后做特征提取操作,都是定义了特定的特征模板,这就很容易理解为什么作者要做 multi scale 的操作了,因为在以前使用 Haar/SIFT/HoG 的时候,往往都需要使用 muti scale 来检测。

  但是 R-DAD 为什么对特征只分成上下各一半,左右各一半这种特征模板,文章并没有给出令人信服的理由。尽管如此,这也是一个对目标检测的改进方向,通过 MRP 和 RDA 模块代替了之前的单纯的 RPN 网络,而且在不使用 FPN (Feature Pyramid Networks) 的情况下取得了不错的 mAP,这样看来 R-DAD 是 2 stage 目标检测系列的另一种技巧,综合了横向空间上的语义信息。

  如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

  总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

  PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。

  • 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

  PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

  点上方蓝字计算机视觉联盟获取更多干货在右上方···设为星标★,与你不见不散推荐几篇CPRR2019最新论文,含目标检测、分割、深度表示、GAN等领域【1】Stron......博文来自:Sophia_11的博客

  在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里,你会快速get每篇精选论文的亮点和痛点,时刻紧跟AI前沿成果。点击本文底部的「阅读原文」即刻加入社区,查看更多最...博文来自:Paper weekly

  问耕发自凹非寺量子位出品公众号QbitAI中午时分,周志华教授发了一条微博。人工智能顶级会议AAAI2019,目前的论文摘要提交达到7745篇,创下新纪录......博文来自:量子位

  报道:闻菲   源文:新智元2019人工智能开年顶会AAAI的录取结果已出,投稿数量高达7745篇,录取率仅为16.2%,论文评审的繁重与严格可想而知。这两年AI顶会......博文来自:机器学习算法与Python学习

  机器之心卷积神经网络(CNN)近年来已经取得了很大的成功,但研究者仍在进一步推进研究前沿,提出新的思路和方法。在本文中,技术分析师JoshuaChou将解读三篇有关卷积神经网络的AAAI2019论文。...博文来自:zhuiqiuk的专栏

  作者丨谢若冰单位丨腾讯微信搜索应用部研究方向丨知识表示学习知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(headentity,relation,trailenti...博文来自:Paper weekly

  本文为4月11日,香港大学博士生——陈云博士在第26期PhDTalk中的直播分享实录。4月11日晚,来自香港大学的博士生陈云现身PaperWeekly斗鱼直播间,向大家介绍了其所在团队在零资源机器翻译...博文来自:Paper weekly

  2019年首场AI顶会AAAI2019即将开幕,本文介绍此届大会的获奖信息,包括:杰出论文奖、杰出学生论文奖、经典论文奖、蓝天理念奖、Feigenbaum奖、杰出程序委员会成员等。AAAI2019,进...博文来自:weixin_33816300的博客

  整理一下CVPR2019目标检测的一些文章解读,目前比较忙,没时间细看CVPR2019论文及code汇总、《...博文来自:spectre

  今天是二月的第一天,是一个月的新的开始,估计现在有很多学生都已经进入了漫长的寒假,希望你们在寒假空闲之余可以慢慢来阅读我们的精彩推送。今天我们将的就是目标检测,说到目标检测,很多人都会想到许多经典的框...博文来自:gzq0723的博客

  本文由「AI前线」原创,原文链接:AAAI2018最佳论文出炉,中国留学生再下一城编辑|Natalie译者|马卓奇消息来源|AAAI官网,TwitterAI前线导读:”人工智能顶级会议AAAI2018...博文来自:weixin_33725515的博客

  本文简单综合性地介绍一下SSD,SSD文章内容信息较多,若有失误之处,望能热心指出,感谢.SSD框架介绍: 算法的主网络结构是VGG16,将两个全连接层改成卷积层(Conv6与Conv7)再增加4个卷...博文来自:weixin_41041772的博客

  【导语】最近,AI科技大本营陆续为大家介绍了多篇2019CVPR的精彩、优质论文解读!为了方便大家集中学习,营长特此为大家做了近期的汇总整理!不仅如此,作为清明小长假的第一天,营长精心准备了更精彩的福...博文来自:AI科技大本营

  美国时间1月27日,AAAI2019大会在夏威夷正式拉开序幕,AAAI作...博文来自:喜欢打酱油的老鸟

  在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里,你会快速get每篇精选论文的亮点和痛点,时刻紧跟AI前沿成果。点击本文底部......博文来自:Paper weekly

  这段时间了解了一下深度学习中的目标检测常用的模型,为以后学习打一打基础,其中基于候选区域的目标检测经典模型必属RCNN,FastRCNN,FasterRCNN,网上有很多大牛的博客讲的都很详细,大家可...博文来自:BistuSim的博客

  本文介绍了三篇AAAI2019论文,前两篇分别研究了机器人如何学习环境中的物品拥有权以及对物品的操作能力,后一篇研究了是否能用当今的深度学习方法来模拟简单的人类认知活动。分析师简介:Joni目前是日本...博文来自:weixin_34269583的博客

  在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里,你会快速get每篇精选论文的亮点和痛点,时刻紧跟AI前沿成果。点击本文底部......博文来自:Paper weekly

  在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里,你会快速get每篇精选论文的亮点和痛点,时刻紧跟AI前沿成果。点击本文底部的「阅读原文」即刻加入社区,查看更多最...博文来自:Paper weekly

  ECCV2018所有录用论文清单,这篇人家就记录的挺好这个一个github上面一个人整理的最新的cvpr,eccv顶会论文ECCV2018论文解读及资源集锦(10月17日更新,含全部论文下载链接),这...博文来自:小膜仙的博客

  CVPR2017有很多优秀的论文,但,学,是无止境的,正所谓“伤其十指,不如断其一指”,这么多内容我也不可能一一整理。未来,导师让我做目标检测与目标追踪等方向的研究。因此,以下,只整理了关于目标检测与...博文来自:dengheCSDN的博客

  编者按:人工智能领域的顶级会议、第32届国际人工智能协会年会(AAAI2018)于当地时间2018年2月2日-2月7日在美国新奥尔良(NewOrleans)举行。微软亚洲研究院自然语言计算组的实习生闫...博文来自:微软研究院AI头条

  Github地址:【有表格和代码整理,值得关注】参考文章:博文来自:微风❤水墨

  作者导言:以下是我2018-2019年发表的关于深度学习在问答系统和对话系统的应用的paper,感兴趣的读者可以查阅。大家如果有关于这些paper的问题,欢迎发邮件到我的email(yangliuyx...博文来自:

  先放大神的论文和源码镇楼:SSDGithub:请选择分支SSDSSDpaper:博文来自:

  一、把员工所有的数据都放在数据库里,然后通过卷积网络进行训练得到输出。如果部门新增加拉一个人,不用重新对网络进行训练,而只需把新进来的员工的图片放到数据库里,然后运用d函数进行判断。d函数即把人脸跟数...博文来自:

  作者:Fengcall11文章来源:如有兴趣可以**点击加入极市CV专业微信群**,获取更多高质量干货...博文来自:

  一、目标检测问题的定义1、定义:目标检测时图片中对可变数量的目标进行查找和分类。2、需要解决的问题目标种类与数量问 目标尺度问题:目标稠密、目标大小等 外在环境干扰问题:遮挡、光照 二、目标检测问题的...博文来自:

  作者非主流出品AI科技大本营(公众号ID:rgznai100)ICLR2019的论文提交已经截止。根据官方消息,本届大会共收到近1600篇投稿,相比......博文来自:

本文链接:http://belanovica.com/yufenjie/377.html