图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别技术给视觉带来强有力的辅助和增强,给予我们一种全新的与外部世界进行交互的方式。我们可以通过搜索找到图片中的关键信息;可以随手拍下一件陌生物体而迅速找到与之相关的各类信息;也可以将人脸识别作为主要的身份认证方式……这些图像识别应用早已渗透我们日常生活的方方面面。
图像搜索
图片成为互联网中的主要信息载体,这促成了图像识别一个显而易见的应用——信息检索,仅使用一些描述性词语,可以轻松定位和选择感兴趣的图像。例如在使用Facebook时,当试图回想自己的美好记忆,你很难指出具体的事件,更不用说拍摄的人了。而图像搜索可以利用图理解大量信息,让你可以轻松地搜索到自己想要的东西。换句话说,如果你搜索「穿黑色衬衫的照片」,系统可以「看到」哪些照片中出现了黑色衬衫,并将相关搜索结果呈现在你的眼前,即使这些图片并没有被你贴上相应的标签。淘宝时我们使用的“相似款(拍照识别/扫描识别)”搜索功能,也是基于图像识别技术,当我们将鼠标停留在感兴趣的商品上后,就可以选择查看相似的款式;同时通过调整算法,还能够更好的猜测我们的意图,搜素结果即使不能提供完全匹配的商品,也会为我们推荐最为相关的商品,尽量满足购物需求。
人脸识别
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别实现了图像或视频中人脸的检测、人脸特征点的定位、以及人脸特征提取与比对。具体地,对于一张输入图像,首先检测出图像中的人脸,然后对人脸进行面部特征点的定位,并根据定位结果对人脸进行矫正,裁剪出人脸核心区域,最后提取人脸核心区域特征,与人脸数据库中的特征进行比对,得出识别结果。目前,人脸识别的应用场景主要分为三大类,第一种场景:1:1 的人证合一验证系统。典型的应用是:刷身份证读取卡内照片,将其与现场采集的用户人脸去做比对,看是否身份证的合法持有人;第二种场景:1:N静态照片比对系统。典型应用场景是公安人员对不明身份嫌疑人照片进行公安大库照片比对,以确定其身份;第三种场景:1:N+1动态人脸识别场景。区别于前面的1:N场景,这类场景是需要拒识非目标人的,所以是N+1。
文字识别OCR
OCR,即光学字符识别(Optical Character Recognition),是指光学设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,就是计算机对文字的阅读。语言和文字是我们获取信息最基本、最重要的途径。我们可以借助互联网和计算机轻松的获取和处理文字。但一旦文字以图片的形式表现出来,就对我们获取和处理文字平添了很多麻烦。这一方面表现为数字世界中由于特定原因被存储称图片格式的文字;另一方面是我们在现实生活中看到的所有物理形态的文字。所以我们需要借助OCR技术将这些文字和信息提取出来。例如,精准快速识别身份证、名片、营业执照、驾驶证等卡证类信息,甚至还能识别Google 街景图库的上千万个门牌号。
智能家居
当图像识别技术进一步融入人们的生活中,智能家居成为图像识别的一大应用领域。智能家居机器人可以通过图像识别技术对物体进行识别,并且实现对人的跟随。搭配上人工智能系统,它能分辨出你是它的哪个主人,并且能你进行一些简单的互动。比如检测到是家里的老人,它可能会为你测一测血压;如果是小孩子,它可能给你讲个故事。除此之外,智能电视可通过图像识别分析视频内容,并对内容相关的资料进行下一步操作,包括短视频剪辑、边看边买等。再比如在智能冰箱中,通过计算机视觉实现对冰箱内食品的分析,以及衍生出的用户健康管理和线上购物等功能,使人们的生活更智能化。对于女性而言,图像识别技术接地气。在浴室中的魔镜具备了智能试妆、面部健康分析等功能,还能实时记录用户在使用过程中产生的用户习惯,收集用户偏好,结合电商大平台,只要消费者对试妆的效果满意,还可以一键加入购物车购买,心仪的化妆品很快就会“飞”到消费者的手中。
随着现代科学技术的发展,人们生活的智能化水平越来越高,图像识别技术将是一个重要的发展趋势。近年来,尽管到图像识别技术突飞猛进,已取得阶段性成功,但在它进一步广泛应用之前,仍然有很多挑战需要我们去面对。
【返回上页】