今天的你我是如何跟图像识别产生关系的?
那如此神奇的图像识别技术是如何实现的?
1) 信息数据的获取。借助于数字摄像机、扫描仪、数码相机等设备进行图像采集,并且将其存储于计算机的数据库内,用于后续程序的开展,信息数据的获取是图像识别过程的第一步。
2) 信息数据预处理。在获取和传输过程中,图像的质量或多或少会造成一定的退化,此过程主要是对图像进行去噪、变换以及平滑等处理操作,,改变原来图像的亮度、色彩分布、对比度等参数,将图像的特征和重要信息突显。
3) 特征抽取与选择。指在模式识别中,抽取及选择图像特征,正如上文论述的,各种各样的图像都具有对应的特点,计算机采用一定方式进行分离,抽取能区分图像的特征。抽取的特征是否有效决定着图像能否被成功识别。
4) 分类器设计与分类决策。此步骤是图像识别的最后一步,分类器设计是指以有效的程序制定出一个识别规则,这种识别规则能够按照某种规律对图像进行识别,而不是盲目混乱的进行识别,借此识别规律能够将相似的特征种类突显,致使图像识别过程的辨识率更高,之后通过对特殊特征的识别,完成图像的评价和确认。
漫长的实验探索,图像识别技术在发展中不断创新
清晨的阳光缓缓漫入房间,悠然醒来的你,按下闹钟,查阅今日的天气预告与环境污染监测。正是利用图像识别技术对航空遥感和卫星遥感图像进行处理,让我们轻松知晓今天天气。
周末早上怎能不搭配一顿丰盛的营养早餐?专心做好早餐,良好的生活习惯使得你想知道这些食物的热量,于是拿出手机对早餐扫一下拍个照,就能得到大致热量与营养成分。
突然想起,今天要去做常规身体检查,匆忙赶向地铁,地铁入口的人脸识别系统会对出入人群进行排查,保卫你的安全。
体检进行中,验血、拍片,不需要长时间的等待,医生借助图像识别技术能够快速且精准进行读片,让你第一时间了解自己的健康状况。
万幸,身体各项指标正常,一边回家一边和朋友聊天。朋友发来一张裙子的照片,你觉得很好看,于是使用淘宝的拍立淘功能,轻松地下单购买…….这些美好生活的每时每刻都离不开图像识别技术。
那如此神奇的图像识别技术是如何实现的?
人类能识别事物,那么计算机能识别事物吗?很久之前科学家们就开始思考这个问题。人类好像生来就擅长识别,一个对飞机及其组件细节一知半解的儿童,确能毫不费力的在各种各样的图像、插图中认出飞机。人类是如何做到的呢?
当人类在看图像时,并不是无目的的观察图像,而是下意识的寻找图像特征,也就是在图像轮廓曲度最大或轮廓方向突然改变的地方。眼睛的扫描路线也总是依次从一个特征转到另一个特征上。同时,在大脑里有一个机制负责整合信息,把分阶段获得的信息整理完整,从而辨别图像。
科学家们获得到启发,于是将同样的图像识别原理应用在计算机中,对图像的重要特征进行分类与提取,并且排除无用的多余特征,进而使计算机图像识别技术得以实现。举个例子,当计算机在识别英文大写字母时,L有且只有一个直角,X是两条交叉的线段,这些显著特征成为计算机进行识别的关键。
1) 信息数据的获取。借助于数字摄像机、扫描仪、数码相机等设备进行图像采集,并且将其存储于计算机的数据库内,用于后续程序的开展,信息数据的获取是图像识别过程的第一步。
2) 信息数据预处理。在获取和传输过程中,图像的质量或多或少会造成一定的退化,此过程主要是对图像进行去噪、变换以及平滑等处理操作,,改变原来图像的亮度、色彩分布、对比度等参数,将图像的特征和重要信息突显。
3) 特征抽取与选择。指在模式识别中,抽取及选择图像特征,正如上文论述的,各种各样的图像都具有对应的特点,计算机采用一定方式进行分离,抽取能区分图像的特征。抽取的特征是否有效决定着图像能否被成功识别。
4) 分类器设计与分类决策。此步骤是图像识别的最后一步,分类器设计是指以有效的程序制定出一个识别规则,这种识别规则能够按照某种规律对图像进行识别,而不是盲目混乱的进行识别,借此识别规律能够将相似的特征种类突显,致使图像识别过程的辨识率更高,之后通过对特殊特征的识别,完成图像的评价和确认。
漫长的实验探索,图像识别技术在发展中不断创新
最初的图像识别是非常笨拙的,需要科学家从图像中提取一系列特征(比如边缘,角落,颜色),进行手动编码,进而将大量的编码数据灌输到计算机中,才能形成相应图像的识别程序,并且只有与数据库完全一致的图像才能被成功识别。在这一阶段,计算机的识别与人类眼睛的识别还存在巨大的差异,一方面计算机识别的能力非常有限,另一方面对于某一类特别相似的特征,可能会出现识别错误的现象。
经过漫长的实验探索,科学家们发现神经网络可以很好解决这两个问题。不需要手动编码,而是采用“自动”的方式“学习”原始图像数据中显著特征,并且在神经网络中,被提取和捕捉的图像特征能够加以映射,能更为精确、全面的完成图像识别。但是从计算角度来看,这并不是一个节约的解决办法,一个传统的神经网络在处理一张很小的图片时(假设30*30像素)仍然需要50万个参数以及900个输入神经元。并且一旦图片变大了(例如500*500像素),参数以及输入的数目就会达到非常高的数量级。
人工智能的进程就是不断发现问题、解决问题的过程。于是,科学们为了能简单的处理较大的图像,发明了卷积神经网络(CNNs,Convolutional Neural Networks)。一张图片中,两个距离较近的像素相比于距离较远的像素更为相似,这些靠近且相似的像素通常并不是图像的显著特征,于是卷积神经网络像拥有“过滤器”一样,排除大量的不重要的相似像素,同时每个神经元只需要负责处理一张图像的一个特定部分,从而减少图像处理的计算压力。
虽然还有许多问题尚未解决:如何对图像做更深入的理解?图像中物体之间的关系是什么?但是不可否认的是,图像识别技术发展至今,得到了令人刮目相看的进化,并且给人们的生活带来了多维度的提升。
人工智能有望真正改变我们每一个人的生活,而这样的改变正在发生,为了让人们的生活变得更美好,智视科技的图像识别技术正在加速研发,其基于智视科技的独特算法,具有小样本学习,实时持续学习、硬件资源消耗低三大优势,目前还在不断更新中。
【返回上页】