智视科技-新闻详情页

首页>新闻中心>正文

图像识别技术就像个万花筒！越解锁越神奇！

2020-06-19 14:01

今天的你我是如何跟图像识别产生关系的？

清晨的阳光缓缓漫入房间，悠然醒来的你，按下闹钟，查阅今日的天气预告与环境污染监测。正是利用图像识别技术对航空遥感和卫星遥感图像进行处理，让我们轻松知晓今天天气。

周末早上怎能不搭配一顿丰盛的营养早餐？专心做好早餐，良好的生活习惯使得你想知道这些食物的热量，于是拿出手机对早餐扫一下拍个照，就能得到大致热量与营养成分。

突然想起，今天要去做常规身体检查，匆忙赶向地铁，地铁入口的人脸识别系统会对出入人群进行排查，保卫你的安全。

体检进行中，验血、拍片，不需要长时间的等待，医生借助图像识别技术能够快速且精准进行读片，让你第一时间了解自己的健康状况。

万幸，身体各项指标正常，一边回家一边和朋友聊天。朋友发来一张裙子的照片，你觉得很好看，于是使用淘宝的拍立淘功能，轻松地下单购买…….这些美好生活的每时每刻都离不开图像识别技术。

那如此神奇的图像识别技术是如何实现的？

人类能识别事物，那么计算机能识别事物吗？很久之前科学家们就开始思考这个问题。人类好像生来就擅长识别，一个对飞机及其组件细节一知半解的儿童，确能毫不费力的在各种各样的图像、插图中认出飞机。人类是如何做到的呢？

当人类在看图像时，并不是无目的的观察图像，而是下意识的寻找图像特征，也就是在图像轮廓曲度最大或轮廓方向突然改变的地方。眼睛的扫描路线也总是依次从一个特征转到另一个特征上。同时，在大脑里有一个机制负责整合信息，把分阶段获得的信息整理完整，从而辨别图像。

科学家们获得到启发，于是将同样的图像识别原理应用在计算机中，对图像的重要特征进行分类与提取，并且排除无用的多余特征，进而使计算机图像识别技术得以实现。举个例子，当计算机在识别英文大写字母时，L有且只有一个直角，X是两条交叉的线段，这些显著特征成为计算机进行识别的关键。

图像识别基本过程

1）信息数据的获取。借助于数字摄像机、扫描仪、数码相机等设备进行图像采集，并且将其存储于计算机的数据库内，用于后续程序的开展，信息数据的获取是图像识别过程的第一步。
2）信息数据预处理。在获取和传输过程中，图像的质量或多或少会造成一定的退化，此过程主要是对图像进行去噪、变换以及平滑等处理操作，,改变原来图像的亮度、色彩分布、对比度等参数，将图像的特征和重要信息突显。
3）特征抽取与选择。指在模式识别中，抽取及选择图像特征，正如上文论述的，各种各样的图像都具有对应的特点，计算机采用一定方式进行分离，抽取能区分图像的特征。抽取的特征是否有效决定着图像能否被成功识别。
4）分类器设计与分类决策。此步骤是图像识别的最后一步，分类器设计是指以有效的程序制定出一个识别规则，这种识别规则能够按照某种规律对图像进行识别，而不是盲目混乱的进行识别，借此识别规律能够将相似的特征种类突显，致使图像识别过程的辨识率更高，之后通过对特殊特征的识别，完成图像的评价和确认。

漫长的实验探索，图像识别技术在发展中不断创新

最初的图像识别是非常笨拙的，需要科学家从图像中提取一系列特征（比如边缘，角落，颜色），进行手动编码，进而将大量的编码数据灌输到计算机中，才能形成相应图像的识别程序，并且只有与数据库完全一致的图像才能被成功识别。在这一阶段，计算机的识别与人类眼睛的识别还存在巨大的差异，一方面计算机识别的能力非常有限，另一方面对于某一类特别相似的特征，可能会出现识别错误的现象。

经过漫长的实验探索，科学家们发现神经网络可以很好解决这两个问题。不需要手动编码，而是采用“自动”的方式“学习”原始图像数据中显著特征，并且在神经网络中，被提取和捕捉的图像特征能够加以映射，能更为精确、全面的完成图像识别。但是从计算角度来看，这并不是一个节约的解决办法，一个传统的神经网络在处理一张很小的图片时(假设30*30像素)仍然需要50万个参数以及900个输入神经元。并且一旦图片变大了(例如500*500像素)，参数以及输入的数目就会达到非常高的数量级。

人工智能的进程就是不断发现问题、解决问题的过程。于是，科学们为了能简单的处理较大的图像，发明了卷积神经网络(CNNs，Convolutional Neural Networks)。一张图片中，两个距离较近的像素相比于距离较远的像素更为相似，这些靠近且相似的像素通常并不是图像的显著特征，于是卷积神经网络像拥有“过滤器”一样，排除大量的不重要的相似像素，同时每个神经元只需要负责处理一张图像的一个特定部分，从而减少图像处理的计算压力。

虽然还有许多问题尚未解决：如何对图像做更深入的理解？图像中物体之间的关系是什么？但是不可否认的是，图像识别技术发展至今，得到了令人刮目相看的进化，并且给人们的生活带来了多维度的提升。

人工智能有望真正改变我们每一个人的生活，而这样的改变正在发生，为了让人们的生活变得更美好，智视科技的图像识别技术正在加速研发，其基于智视科技的独特算法，具有小样本学习，实时持续学习、硬件资源消耗低三大优势，目前还在不断更新中。

【返回上页】

上一篇：推理——计算机智能化的变革键

下一篇：原来这么多神奇的事情都与图像识别有关，简直开挂般的存在！