自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

吴建明wujianming_110117

吴建明专业博客wujianming_110117

  • 博客(100)
  • 问答 (8)
  • 收藏
  • 关注

原创 Camera HDR Algorithms

Camera HDR AlgorithmsHDRI是High-Dynamic Range(HDR)image的缩写,也就是高动态范围图像。它就是为了解决更好的存储高动态范围图像这个问题而发明出来的。简单地说,HDRI是一种亮度范围非常广的图像,它比其它格式的图像有着更大亮度的数据贮存。而且它记录亮度的方式与传统的图片不同,不是用非线性的方式将亮度信息压缩到8bit或16bit的颜色空间内,而是用...

2020-03-31 20:18:17 229

原创 噪声标签的负训练:ICCV2019论文解析

噪声标签的负训练:ICCV2019论文解析NLNL: Negative Learning for Noisy Labels论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Kim_NLNL_Negative_Learning_for_Noisy_Labels_ICCV_2019_paper.pdf摘要卷积神经网络(CN...

2020-03-31 19:01:25 518

原创 无监督域对抗算法:ICCV2019论文解析

无监督域对抗算法:ICCV2019论文解析Drop to Adapt: Learning DiscriminativeFeatures for Unsupervised Domain Adaptation论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Lee_Drop_to_Adapt_Learning_Discrim...

2020-03-31 14:41:10 367

原创 字符识别OCR原理及应用实现

字符识别OCR原理及应用实现文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。工业场景的图像文字识别更加复杂,出现在很多不同的场合。例如医药品包装上的文字、各种钢制部件上的文字、容器表面的喷涂文字、商...

2020-03-30 20:25:21 676

原创 4D雷达成像技术

4D雷达成像技术当我们谈及3D捕捉时,总是先想到光学传感器。当我们讨论在第四维度(时间)讨论视觉数据时,倾向于考虑场景数据调度。这些是我们多年来关注激光雷达(LiDAR)和摄影测量,以及用户针对缓慢移动的大型项目,在时间尺度上将这些技术应用于静态物体所造成的偏见。对自动驾驶汽车不可思议的需求推动了多种传感器的发展,因为,我们不能随便将从某个应用中获取的传感技术,毫不改动地投入其它应用。就像4D...

2020-03-30 19:36:09 403

原创 大型图像数据聚类匹配:ICCV2019论文解析

大型图像数据聚类匹配:ICCV2019论文解析Jointly Aligning Millions of Images withDeep Penalised Reconstruction Congealing论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Annunziata_Jointly_Aligning_Milli...

2020-03-30 19:09:42 211

原创 深度学习数据特征提取:ICCV2019论文解析

深度学习数据特征提取:ICCV2019论文解析Goal-Driven Sequential Data Abstraction论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Muhammad_Goal-Driven_Sequential_Data_Abstraction_ICCV_2019_paper.pdf摘要自动数...

2020-03-30 11:34:54 349

原创 深度学习常见问题解析

深度学习常见问题解析计算机视觉与自动驾驶 今天一、为什么深层神经网络难以训练?1、梯度消失。梯度消失是指通过隐藏层从后向前看,梯度会变得越来越小,说明前面层的学习会显著慢于后面层的学习,所以学习会卡主,除非梯度变大。梯度消失的原因:学习率的大小,网络参数的初始化,激活函数的边缘效应等。在深层神经网络中,每一个神经元计算得到的梯度都会传递给前一层,较浅层的神经元接收到的梯度受到之前所有层梯度...

2020-03-30 09:03:28 152

原创 如何挑选深度学习 GPU?

如何挑选深度学习 GPU?深度学习是一个对计算有着大量需求的领域,从一定程度上来说,GPU的选择将从根本上决定深度学习的体验。因此,选择购买合适的GPU是一项非常重要的决策。那么2020年,如何选择合适的GPU呢?这篇文章整合了网络上现有的GPU选择标准和评测信息,希望能作为你的购买决策的参考。1 是什么使一个GPU比另一个GPU更快?有一些可靠的性能指标可以作为人们的经验判断。以下是针对...

2020-03-29 19:51:43 213

原创 视频动作定位的分层自关注网络:ICCV2019论文解析

视频动作定位的分层自关注网络:ICCV2019论文解析Hierarchical Self-Attention Network for ActionLocalization in Videos论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Pramono_Hierarchical_Self-Attention_Netwo...

2020-03-29 19:08:26 263

原创 三维点云去噪无监督学习:ICCV2019论文分析

三维点云去噪无监督学习:ICCV2019论文分析Total Denoising: Unsupervised Learning of3D Point Cloud Cleaning论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Hermosilla_Total_Denoising_Unsupervised_Learning...

2020-03-29 10:59:52 592

原创 摄像头定位:ICCV2019论文解析

摄像头定位:ICCV2019论文解析SANet: Scene Agnostic Network for CameraLocalization论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Yang_SANet_Scene_Agnostic_Network_for_Camera_Localization_ICCV_201...

2020-03-29 07:32:36 200

原创 深度学习扫地机器人

深度学习扫地机器人如今,家电的智能化是行业大趋势,从解放人类的双手到成为用户的人工智能伴侣,家用电器的应用场景不断拓展。在这其中,扫地机器人已成为家电行业中逆势增长的一个突出品类。扫地机器人进入中国市场较晚,但是到2018年市场规模已经达到了577万台。近6年来,该品类的市场规模翻了10倍。根据某主流电商平台数据显示,2019年全年,扫地机器人的销售额已经占到了智能家电销售总额的三成以上,并...

2020-03-29 06:19:30 290

原创 细粒度语义分割:ICCV2019论文解析

细粒度语义分割:ICCV2019论文解析Fine-Grained Segmentation Networks:Self-Supervised Segmentation for Improved Long-Term Visual Localization论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Larsson_Fi...

2020-03-28 15:28:31 416

原创 目标形体形状轮廓重建:ICCV2019论文解析

目标形体形状轮廓重建:ICCV2019论文解析Shape Reconstruction using Differentiable Projections and Deep Priors论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Gadelha_Shape_Reconstruction_Using_Differenti...

2020-03-28 11:13:06 150

原创 2-2.5-3D的室内场景理解

2-2.5-3D的室内场景理解主要内容摘要随着低成本、紧凑型2-2.5-3D视觉传感设备的出现,计算机视觉界对室内环境的视景理解越来越感兴趣。本文为本课题的研究提供了一个全面的背景,从历史的角度开始,接着是流行的三维数据表示和对可用数据集的比较分析。在深入研究特定于应用程序的细节之前,简要介绍了在文献中广泛使用的底层方法的核心技术。之后根据基于场景理解任务的分类,回顾了所开发的技术:包括全局室...

2020-03-28 06:24:59 166

原创 激光雷达和V2X技术

激光雷达和V2X技术

2020-03-27 20:08:22 125

原创 图像超分辨率与天气预报

图像超分辨率与天气预报虽然我们每天都看天气预报,但是你知道我们所看到的天气预报是怎么预测出来的吗?气象预报按天气预报的时效长短,可粗略分为:短时天气预报、短期天气预报、中期天气预报和长期天气预报。数值模式预报是天气预报的主要预测手段。气象数值预报数值模式预报是根据大气运动的数学模型,利用当前天气状况作为输入数据而做出天气预报的手段,通常使用超级计算机或分布式计算集群依据一系列动力学框架来完...

2020-03-27 19:06:09 344

原创 点云配准的端到端深度神经网络:ICCV2019论文解读

点云配准的端到端深度神经网络:ICCV2019论文解读DeepVCP: An End-to-End Deep Neural Networkfor Point Cloud Registration论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Lu_DeepVCP_An_End-to-End_Deep_Neural_Ne...

2020-03-27 18:22:41 810

原创 人脸真伪验证与识别:ICCV2019论文解析

人脸真伪验证与识别:ICCV2019论文解析Face Forensics++: Learning to DetectManipulated Facial Images论文链接:http://openaccess.thecvf.com/content_ICCV_2019/papers/Rossler_FaceForensics_Learning_to_Detect_Manipulated_...

2020-03-27 15:28:37 505

原创 人体姿态和形状估计的视频推理:CVPR2020论文解析

人体姿态和形状估计的视频推理:CVPR2020论文解析VIBE: Video Inference for Human Body Pose andShape Estimation论文链接:https://arxiv.org/pdf/1912.05656.pdfCode and pretrained models are available at: https://github.com/mk...

2020-03-27 11:26:21 479

原创 FPGA最全科普总结

FPGA最全科普总结FPGA 是可以先购买再设计的“万能”芯片。FPGA (Field Programmable Gate Array)现场可编程门阵列,是在硅片上预先设计实现的具有可编程特性的集成电路,它能够按照设计人员的需求配置为指定的电路结构,让客户不必依赖由芯片制造商设计和制造的 ASIC 芯片。广泛应用在原型验证、通信、汽车电子、工业控制、航空航天、数据中心等领域。Altera L...

2020-03-27 07:26:23 362

原创 深度人脸识别:CVPR2020论文要点

深度人脸识别:CVPR2020论文要点Towards Universal Representation Learning for Deep Face Recognition论文链接:https://arxiv.org/pdf/2002.11841.pdf摘要识别狂野的面孔是极其困难的,因为它们看起来有各种各样的变化。传统的方法要么使用目标域中的特定注释变化数据进行训练,要么通过引入未标记...

2020-03-26 20:30:45 796

原创 视频教学动作修饰语:CVPR2020论文解析

视频教学动作修饰语:CVPR2020论文解析Action Modifiers: Learning from Adverbs in InstructionalVideos论文链接:https://arxiv.org/pdf/1912.06617.pdf摘要我们提出了一种从结构视频中学习副词表达的方法,该方法使用对伴随叙述的弱监督。我们的方法的关键是,副词的视觉表现高度依赖于它所适用的动作,...

2020-03-26 19:22:41 122

原创 分层条件关系网络在视频问答VideoQA中的应用:CVPR2020论文解析

分层条件关系网络在视频问答VideoQA中的应用:CVPR2020论文解析Hierarchical Conditional Relation Networksfor Video Question Answering论文链接:https://arxiv.org/pdf/2002.10698.pdf摘要视频问答(VideoQA)具有挑战性,因为它需要建模能力来提取动态视觉伪影和远距离关系,...

2020-03-26 15:57:04 165

原创 慢镜头变焦:视频超分辨率:CVPR2020论文解析

慢镜头变焦:视频超分辨率:CVPR2020论文解析Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time VideoSuper-Resolution论文链接:https://arxiv.org/pdf/2002.11616.pdfThe source code is released in:https://github.com/M...

2020-03-26 13:00:18 594

原创 模糊视频帧插值:CVPR2020论文点评

模糊视频帧插值:CVPR2020论文点评Blurry Video Frame Interpolation论文链接:https://arxiv.org/pdf/2002.12259.pdf摘要现有的工作主要通过帧去模糊和帧内插两种方法来降低运动模糊和上变频帧率。然而,很少有研究涉及到联合视频增强问题,即从低帧速率的模糊输入中合成高帧速率的清晰结果。本文提出了一种模糊视频帧内插方法,可以同时...

2020-03-26 09:41:49 851

原创 实时实例分割的Deep Snake:CVPR2020论文点评

实时实例分割的Deep Snake:CVPR2020论文点评Deep Snake for Real-Time Instance Segmentation论文链接:https://arxiv.org/pdf/2001.01629.pdf摘要本文提出了一种基于轮廓的深度snake方法用于实例的实时分割。与最近一些直接从图像中回归物体边界点坐标的方法不同,deep snake使用神经网络迭代地...

2020-03-25 19:46:59 704

原创 给手绘图着色(添加颜色或色彩):CVPR2020论文点评

给手绘图着色(添加颜色或色彩):CVPR2020论文点评Learning to Shade Hand-drawn Sketches论文链接:https://arxiv.org/pdf/2002.11812.pdf摘要本文提出了一种全自动的方法来产生详细和准确的艺术阴影对线素描和照明方向。本文还提供了一个新的数据集,其中包含1000个用灯光方向标记的线条和阴影对示例。值得注意的是,生成的阴...

2020-03-25 17:27:22 226

原创 图像分类:CVPR2020论文解读

图像分类:CVPR2020论文解读Towards Robust Image Classification Using SequentialAttention Models论文链接:https://arxiv.org/pdf/1912.02184.pdf摘要在这篇文章中,我们提出用一个受人类感知启发的注意力模型来扩充一个现代的神经网络结构。具体地说,我们对一个神经模型进行了逆向训练和分析,...

2020-03-25 11:30:27 1243

原创 CVPR2020论文解读:OCR场景文本识别

CVPR2020论文解读:OCR场景文本识别ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-CurveNetwork∗论文链接:https://arxiv.org/pdf/2002.10200.pdf摘要场景文本的检测与识别越来越受到人们的关注。现有的方法大致可以分为两类:基于字符的方法和基于分割的方法。这些方法要...

2020-03-24 19:59:47 893

原创 CVPR2020论文解读:手绘草图卷积网络语义分割

CVPR2020论文解读:手绘草图卷积网络语义分割Sketch GCN: Semantic Sketch Segmentation withGraph Convolutional Networks论文链接:https://arxiv.org/pdf/2003.00678.pdf摘要介绍了一种用于手绘草图语义分割和标注的图形卷积神经网络SketchGCN。我们将输入草图视为二维点集,并将...

2020-03-24 18:10:35 459 1

原创 汽车芯片综述

汽车芯片综述智能驾驶涉及人机交互、视觉处理、智能决策等,核心是 AI 算法和芯片。伴随汽车电子化提速,汽车半导体加速成长,2017 年全球市场规模 288 亿美元(+26%),远高于整车销量增速(+3%),其中占比最高的为功能芯片 MCU(66 亿美元,占比 23%),随后还包括功率半导体(21%)、传感器(13%)等。汽车半导体按种类可分为功能芯片 MCU(Microcontroller U...

2020-03-24 14:33:01 1029

原创 CVPR2020论文解析:视觉算法加速

CVPR2020论文解析:视觉算法加速GPU-Accelerated Mobile Multi-view StyleTransfer论文链接:https://arxiv.org/pdf/2003.00706.pdf摘要据估计,2018年售出的智能手机中,有60%配备了多个后置摄像头,从而实现了3D照片等多种支持3D的应用。3D照片平台(Facebook 3D Photo、Holopix...

2020-03-24 12:47:14 212

原创 CVPR2020无人驾驶论文摘要

CVPR2020无人驾驶论文摘要无人导读/ Starsky是一种比较独特的方案。它是在高速上自动驾驶,第一公里最后一公里采用远程驾驶的模式,Starsky的卡车可以由人类远程操作。没有使用较为昂贵的激光雷达,而是选择了摄像头+毫米波雷达的传感器配置。国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,在世界范围内具有顶级的权威性与影响力,同时也是圈内学者关注和交流的重要...

2020-03-23 20:34:43 372

原创 CVPR2020论文解析:视频语义检索

CVPR2020论文解析:视频语义检索Fine-grained Video-Text Retrieval with HierarchicalGraph Reasoning论文链接:https://arxiv.org/pdf/2003.00392.pdf摘要随着视频在网络上的迅速出现,视频与文本的跨模式检索越来越受到人们的关注。目前解决这个问题的主要方法是学习一个联合嵌入空间来测量跨模态...

2020-03-23 19:55:51 411

原创 视觉SLAM技术应用

视觉SLAM技术应用·SLAM技术背景SLAM技术全称Simultaneous localization and mapping,中文为“同时定位与地图构建”。SLAM可以在未知的环境中实时定位自身的位置,并同时构建环境三维地图,是计算机视觉领域以及机器人领域中非常关键的一项技术,有着非常广泛的应用,例如VR、AR、机器人、自动驾驶等领域。SLAM技术在机器人领域应用广泛,可以采用各种各...

2020-03-22 22:19:30 74

原创 Waymo的自主进化

Waymo的自主进化3月初,Waymo在推特上宣布,共获得了22.5亿美元(约合人民币156亿元)融资,由Silver Lake(银湖资本)、CanadaPension Plan Investment Board(加拿大养老金计划投资委员会)、Mubadalainvestment(阿布扎比的主权财富基金)等公司领投,零部件巨头麦格纳集团、硅谷风投机构AndreessenHorowitz、汽...

2020-03-22 21:35:04 87

原创 自动驾驶传感器产业链

自动驾驶传感器产业链智能驾驶的发展将大幅提升对传感器的需求量。超声波雷达、毫米波雷达和多摄像头系统已经在高端汽车上应用;随着智能驾驶发展势如破竹,环境感知技术将快速发展,进一步发挥协同作用。虽然传感器仅仅是自动驾驶汽车的一部分,但是市场前景十分广阔。据法国权威市场分析机构Yole Développement 的统计,智能驾驶主要通过摄像头(长距摄像头、环绕摄像头和立体摄像头)和雷达(超声波雷...

2020-03-22 21:14:45 440

原创 激光雷达目标检测

激光雷达目标检测激光雷达,是以发射激光束探测目标的位置、速度等特征量的雷达系统。其工作原理是向目标发射探测信号(激光束),然后将接收到的从目标反射回来的信号(目标回波)与发射信号进行比较,作适当处理后,就可获得目标的有关信息,如目标距离、方位、高度、速度、姿态、甚至形状等参数,从而对飞机、导弹等目标进行探测、跟踪和识别。它由激光发射机、光学接收机、转台和信息处理系统等组成,激光器将电脉冲变成光脉...

2020-03-22 20:11:49 983

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除