机器人视觉系统使图像更加清晰

分享到:
点击量: 221530

  嵌入式机器人视觉系统的开发已经到达转折点。各种各样的设备不仅变得更加智能,而且变得更加了解在世界上所处的位置,伯克利设计技术有限公司(BDTI)总裁、*近成立的嵌入式视觉联盟(EVA)创始人Jeff Bier表示。

  这与成本迅速下降的传感器——特别是图像传感器以及分析这些数据的处理逻辑有很大的关系。BDTI公司花了很长时间来建立数字信号处理器基准,*终发现某段时期内总有一个主要的应用驱动力,至少目前为止是这样,Bier表示。“在20世纪90年代早期,主要驱动力是数字化无线技术;在20世纪90年代末期,是消费类数字音频;在21世纪初,是消费类数字视频。”他指出,“嵌入式视觉有望成为下一个重要的驱动力。”

  另外一个观点是,20世纪80年代和80年代以前是DSP的**化应用时代,而80年代以后的30年是DSP的工业与企业应用时代,比如生产线和计算机监控。

  下一个时代无疑是促进消费的时代,比如游戏和汽车的电传线控(drive-by-wire)等应用。随着应用处理器性能的提高和成本的下降,潜在应用将呈爆发式增长,Bier认为。视觉系统在**关键和救生应用中早有使用,例如汽车上的车道偏离告警和碰撞避免系统,能够防止溺水事故的游泳池告警系统等。

  Mobileye NV公司已经能够提供基于视觉的先进驾驶辅助系统。公司成立于1999年,成功开发出了运行在被称为EyeQ的专有处理器上的专有图像处理算法。EyeQ处理器*初是由意法半导体(ST)采用0.18um CMOS工艺为Mobileye公司制造的。芯片和软件算法首先被卖给宝马和沃尔沃等汽车OEM客户。

  大约2007年时,上述解决方案就成为了汽车配件市场产品。解决方案架构由2个32位ARM946E处理器内核、4个视觉计算引擎(VCE)、1个多通道DMA和多个外设组成。其中一个ARM946E用于管理4个VCE、多通道DMA以及其它外设。4个VCE和另外一个ARM946E执行诸如跟踪和图案分类等任务所要求的所有密集型视觉运算。

  Bier指出,对于从增强实景(augmented reality)到贴片机等无数应用来说,嵌入式视觉“不是必须发明的一个事物,而是已经有30或40年的实际学术研究成果可以借鉴。”《电子工程专辑》认为手势识别是值得期待的2011年十大技术之一,而微软的Kinect的出现势必打破机器人视觉格局。

  Kinect是Xbox 360的3D运动检测附加产品。Xbox解决方案使用可见光谱图像检测、红外检测和本地处理的组合来判断场景中的人物和深度,其硬件基本来自以色列公司PrimeSense。微软开发的识别软件则将信息融合进了游戏。

  今年6月,微软宣布推出兼容Windows软件开发套件的免费beta版本Kinect。开发人员、学术研究人员和爱好者都可以使用这种开发套件创建相关应用,并使用Kinect技术实现在Windows 7上运行的深度检测、人体运动跟踪以及语音和目标识别功能。

  嵌入式视觉联盟(EVA)的成立则强调了这个行业转折点的到来。

  Bier认为EVA联盟将发挥三重作用:提高人们对这种技术潜力的理解;分享实用的技术诀窍,包括经验证的解决问题的方法甚至算法和代码;提供一个感兴趣的各方都能联网参与的论坛。“标准化肯定需要,也许标准化就是EVA的*终目标之一。”Bier指出。

  在所有各种计算机设备中包含图像传感器将带来计算机视觉的“民主化”,使得每台笔记本电脑成为潜在的开发平台,Bier表示。“像OpenCV之类的东西对此起着推波助澜的作用。”他指出。OpenCV(针对开源计算机视觉)是一个主要用于实时计算机视觉的编程函数库。

  OpenCV库是Intel公司于1999年*早创建的,现在由机器人技术研究实验室和技术孵化企业Willow Garage有限公司提供支持,在开源伯克利软件发布许可条件下可免费使用。OpenCV包含500多个函数,包括通用图像处理、相机防抖、立体声和3D功能、检测、识别、适配、跟踪和其它机器学习函数。

  虽然OpenCV库*早是由Intel开发的,但OpenCV是一种交叉平台,拥有可在Windows、Linux、Android和MAC系统上运行的C++、C、Python以及不久后还将增加的Java界面。Willow Garage公司拥有内建OpenCV的机器人操作系统(ROS),也是PR2个人机器人的开发商。