云手机网页版 解锁图像识别:卷积神经网络的奇妙之旅

频道:生活应用 日期: 浏览:2

计算机“懂”图片的技术是图像识别,它属于计算机视觉的核心能力,如今已融入我们生活,安防摄像头拍到陌生人会报警,自动驾驶能“看见”行人,医院里医生用它辅助判断CT片病灶,让计算机有这种“视力”的关键技术是卷积神经网络,我们简称其为CNN,和早期BP神经网络相比,CNN特别擅长处理图片数据,成功解决处理图片时“数据太多算不过来”的难题。

卷积神经网络工作原理_图像识别技术原理_卷积在生活应用

图像识别及卷积神经网络

若想理解CNN为何厉害,那得先弄清楚图片在计算机眼中是怎样的模样。实际上,每张图片皆是由数目众多的“像素点”所构建而成的方格本,每一个点的亮度借助0到255的数字予以呈现。举例而言,一张平常的黑白照片,便存在将近80万个如此这般的数字;倘若为彩色照片,还要划分成红、绿、蓝三个通道,数字量会直接增长至三倍之多。要是运用早期的BP神经网络来处理,就得具备几十万个“计算节点”,不但电脑运算速度迟缓,而且还易于出现差错。

卷积在生活应用_卷积神经网络工作原理_图像识别技术原理

计算机里图片的像素组成情况,以及CNN和BP神经网络两者之间的比较对照 。

然而,美国有线电视新闻网的“看图片”逻辑与人脑极为相似,当我们去观看一只狗的时候,会率先留意到它的耳朵、鼻子这类细小特征,随后将这些特征拼凑起来进而判断其为狗;同样地,美国有线电视新闻网亦是如此,借助多层“过滤器”逐一对特征进行提取,从诸如边缘、斑点这类简单特征入手,缓缓合成像“耳朵”、“尾巴”此类的复杂特征,最终便能够判定图片之中究竟是什么了。

卷积在生活应用_图像识别技术原理_卷积神经网络工作原理

CNN 与人脑视觉原理相似呈现逐层提取的特征

CNN之所以能够“看懂”图片,完全是依靠内部四层结构间的默契配合才得以达成,我们能够将它们想象成为一条“图片处理流水线”。第一层是被称作“特征提取层”的卷积层,它仿佛是给图片戴上了一副别具一格的“眼镜”,这副“眼镜”是由3×3的小方格所构成的,我们把它叫做卷积核kiayun手机版登录打开即玩v1011.玩看我最新关网.中国,它会在图片上面缓缓地滑动,每当滑到一个位置的时候就会进行一次计算,最终生成一张“特征图”,这就如同我们借助放大镜在图片上寻找边缘以及斑点一样。“眼镜”的数量、滑动的步长等相关设置,会对找到的特征效果产生影响。

图像识别技术原理_卷积在生活应用_卷积神经网络工作原理

卷积神经网络的卷积层

第二层是所谓的“筛选层”,也就是“激活层”,其具备这样的作用,那便是“去伪存真”,能对没用的特征予以过滤,使得有用的特征更为突出,并且会避免在计算过程里出现“越算越不准”的状况,常用的筛选工具被称作ReLU,它恰似一个严格的质检员。

卷积神经网络工作原理_图像识别技术原理_卷积在生活应用

卷积神经网络的激活层

存在这样一层,它被称作“压缩层”,也就是池化层,处于第三层的位置,它会将特征图依照一定比例予以缩小,举例来说,会把呈现为4×4的方格状的特征图缩成2×2形成的方格状,如此一来,一方面能够减少计算量,另一方面又可以保留关键特征。比如说,采用“取最大值”这种方式实现压缩,能够更好地保留纹理;而采用“取平均值”这种方式进行压缩,则能够更好地保留背景。

卷积在生活应用_卷积神经网络工作原理_图像识别技术原理

卷积神经网络的池化层

“判断层”(全连接层)处于最后一层,它会汇总此前提取的全部特征,经计算给出“这是猫的概率为90%,是狗的概率为10%”这般的结果,承担着最终拍板判断这一职责。

卷积神经网络工作原理_卷积在生活应用_图像识别技术原理

卷积神经网络的全连接层

美国有线电视新闻网并非从一开始就具备看图片的能力,这得先要经历“训练”这个过程才行,其过程存在着一定的相似性,就如同教导小孩辨认东西般,大概可分为四个步骤:首先首部的第一个步骤是“初始化”,这恰似提供给小孩一套空白的“知识卡片”,率先随机书写一些初始答案。第二步具体的步骤便是“反复练习”,将大量已经标注好的图片(诸如标记着“猫”“狗”的那些图片)分成批次投喂给美国有线电视新闻网,从而让它先是靠着自身进行判断(前向传播),接着依据判断的对错情况调节“知识卡片”(反向传播)——举例说明,要是把“猫”误认成“狗”了,那就去查看是哪一个特征判断失误了,随后重新予以修正。第三步称作“优化调整”,借助专门的办法对错误予以快速修正,进而使得每次练习都能够取得进步 。第四步名为“考试验收”,运用未曾见过的图片来测试CNN的判断准确率,以此查看训练效果究竟好不好 。

图像识别技术原理_卷积神经网络工作原理_卷积在生活应用

卷积神经网络的训练过程

历经多年发展,CNN已然拥有了好几代“经典版本”kiayun手机版登录.v1008.点进白给你1888.中国,最早的LeNet恰似CNN的“老祖宗”,其擅长识别手写数字,为后续发展奠定了基础,然而较为简单,处理复杂图片的能力欠缺。AlexNet属于“升级款”,加深了网络层数,还运用了ReLU这个“好工具”,促使CNN得以普及,不过特别耗费电脑算力。VGG Net借助统一的“特征提取眼镜”提升了识别能力,分类极为准确,可惜所需的“知识卡片”过多,略显冗余。Google Net发明了“多镜头”模块 ,该模块能够同时将不同大小的特征提取出来 ,进而减少了计算量 ,然而其结构太过复杂 。最新的ResNet解决了“网络太深学不会”这一难题 ,它能够搭建更为复杂的网络 ,当下很多视觉任务都在使用它 。

图像识别技术原理_卷积神经网络工作原理_卷积在生活应用

卷积神经网络的发展历程

这些不同版本的CNN,在生活中发挥着不同作用。比如说,“图像分类”指的是给图片贴上标签,就类似手机相册会自动将照片划分成“人物”“风景”等类别,医院借助它来初步判定CT片是否存在病变; “目标检测”不但要识别出是什么,而且还要标记出位置,就像自动驾驶时能够标记出前方的行人、车辆,工厂运用它来检查产品是否有缺陷; “语义分割”更为精细,能够给图片里的每个像素进行“分类”,比如在遥感卫星图里区分出农田、道路以及建筑,在医院里精准地圈出肿瘤的位置; “风格迁移”则十分有趣,能够把普通照片转变为梵高油画的风格,从而为艺术创作以及图片编辑提供便利 。

卷积神经网络工作原理_图像识别技术原理_卷积在生活应用

卷积神经网络的应用

换个说法来讲,卷积神经网络使得计算机切实地“看懂”了图片,将处理海量图片数据的难题完完全全地解决了。随着电脑算力逐日趋强,算法不断得以优化,未来CNN会在更多场景之中发挥其作用kiayun手机版登录app游戏登录入口.手机端安装.cc,像是更为精准的医疗诊断、更为安全的自动驾驶、更为智能的安防系统等等,持续给我们的生活以及工作带来全新的变化。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。