首页>新闻中心>正文

搜索引擎更加智能化计算机视觉功不可没

2016-08-24 10:57


人工智能技术在计算机视觉以及图片处理领域的应用,已经拉开帷幕。2016年被称作人工智能元年,举世瞩目的人机大战让神经网络、深度学习等一系列技术术语为人所知。搜索引擎更加智能化,计算机视觉功不可没。而在细分领域,探索的触角还将伸向更多方向。

从Prisma到三值神经网络

最近非常火的修图应用Prisma就在计算机图形处理领域小试牛刀。它的神奇之处在于,在你的手机相册随便选择一张照片,Prisma能在十几秒内将其变成独具风格的艺术大师作品,无论你是想要“漫威风”还是想化身毕加索笔下的抽象派女郎。伴随Prisma的火爆,智能硬件对于图形图像等大量数据的即时处理被更多人关注。一个原本圈内人士才了解的技术名词——“三值神经网络”也开始从幕后走向台前并被网友关注,但由于Prisma计算复杂度很高,所以目前还只能放在云端。



    在“智能硬件”火热的今天,很多硬件水平还无法完全达到产品号称的“智能”,其中计算功耗是制约硬件智能化的一个很大的障碍。比如智能手机、嵌入式平台等很多基于人工智能的应用还只能放在云端,非常不灵活。计算机视觉对云计算和设备实时计算能力要求很高。虽然云计算可以将一部分计算转移到云端,但在需要处理高流量输入信号和要求高实时性的场合中,云计算的带宽、延迟和全时可用性都受到挑战,而无法完全替代本地计算。设计既能节省存储空间和计算资源,又具有高精度的模型,对于激活手机移动端、可穿戴设备等智能产品的性能具有迫切的需求。

很多大公司和科研机构都将深度学习模型压缩作为追逐的目标。二值神经网络可以大幅数据压缩但是二值神经网络损失的信息相对于浮点精度是非常大的。北京陌上花科技(衣+)在人工智能领域有着多年丰富的技术积累,衣+的深度学习专家针对二值神经网络的缺陷,经过数学上的理论论证,提出三值神经网络模型(TernaryWeightNetworks),继承了二值神经网络的优点同时模型的表达能力上大大提升,三值神经网络各方面指标达到了世界领先的水平。相对于二值神经网络,三值神经网络(TernaryWeightNetworks)在同样的模型结构下可以达到成百上千倍的表达能力提升。并且在计算时间复杂度上,三元网络和二元网络的计算复杂度是一样的。

三值神经网络,将在可穿戴设备、机器人、无人机、无人车、智能摄像头等领域获得巨大的应用,这是革命性的改变。这将极大提升智能眼镜/VR头盔、AR/VR购物、导航、游戏的应用体验。三值神经网络的问世,使智能设备的科幻魅力与现实零距离无缝对接。

搜索引擎智能化视觉搜索成主流

不仅智能硬件对计算机视觉和人工智能格外青睐,各大内容平台方也将计算机视觉和人工智能列为下一个企业发展战略方向,视觉搜索与识别技术成主流。2016年4月,优酷与衣+公司深入合作,上线视频边看边买产品。用户可以在观看节目和影视剧时,对视频中出现的明星同款、剧中同款、动漫周边、场景相关等商品“搬出屏幕”,真正实现边看边买的娱乐化购买体验。实现了计算机视觉在搜索引擎中的商业化应用。

边看边买产品,在优酷PC端和APP同步上线。PC端以播放器右侧的推荐位形式展现,用户可以直接购买推荐商品或通过截图的方式搜索视频中同款;APP端的体验则更直观,打开优酷视频,直接点击视频右下方的“购物车”图标,系统通过智能算法即可为您推荐出观看当前时间的同款商品。

人们常用的搜索引擎正在变得越来越聪明。人工智能将更好地服务用户,用技术改变世界。无论是语音还是图像识别搜索,智能搜索势必在未来改变人们的搜索习惯。

当前,主流搜索引擎厂商都在将用户日常使用的产品与人工智能进行深度融合。这依托于人工智能技术近年来的飞速发展,融合了语音搜索、图像识别后,各个搜索引擎也在用户体验上得以快速升级,逐渐向着智能化、服务化、个性化的“新搜索”迈进。

未来,智能手机只会是人们生活中的一个小设备,随着其他的智能设备日趋丰富,无论智能硬件,智能家居,无人汽车,还是智能机器人,都可以受惠于计算机视觉技术的提升,这是通向更人性更便捷的智能生活的必要技术。