汉阳新闻
林鍾宇教授,融合算法和深度学习方式,提升电脑视觉展望 | ||
---|---|---|
|
||
电脑视觉展望:算法方式和深度学习方式
算法方式的电脑视觉展望是发展了四五十年的传统研究方法。算法主要应用于通过相机对汽车行驶速度等准确的数字情况的认识。深度学习(Deep Learning)虽然也有很长的研究历史,但是最近利用比较活跃。深度学习用于从面部表情中认知人的感情等意义性信息解释。林教授并没有将此二者分开来看,而是研究了合并的方案。 ▲
使用深度学习方式,可以将被接受的形象周边空间复原为三维信息。输入影像和推定的距离信息(左)和三维复原结果(林锺宇教授提供)
自动驾驶汽车的电脑视觉展望
林教授的此次研究主要针对自动驾驶汽车和CCTV等利用的电脑视觉展望。为便于理解,林教授以自动驾驶汽车为例,对研究进行了说明。为了施行无人驾驶,需要能够识别并解释通过相机传来的信息的技术。行驶时需要立即将与前车的距离进行信息化。算法方式(Algorithm)就具有这一特点。将车辆行驶期间变化多端的周围空间视为三维也是核心技术之一。深层学习方式可以更有效地处理这类问题。若只靠算法方式或深度学习中的一个,则无法完成无人驾驶。
由于路况通过相机来识别,当瞬间物体重叠于其他物体而被遮挡或出现大的照度(受照明面的亮度尺度)变化时,可能会发生危险。这种情况下,属于传统方式的算法范式就会出现问题。林教授通过深入学习解决了这个问题。林教授的方法是追踪物体,学习外形信息,预测变形,从而实现对事物的解读。 ▲
算法方式有利于测量物体的速度和距离。深度学习方式是将正在运动的物体和静止的物体进行分类等,容易进行意义性分析。照片上显示运动物体,不显示静止物体。(林教授提供)
融合算法方式和深度学习方式的方法 深度学习方式的处理结果不是视觉形象,而是“信息(data)”。将视觉资料分成大的范畴,将传送描述物体特征的信息。算法方式的处理结果将留下用像素表现的形象。将以算法方式获得的像素形象与深度学习的结果信息进行搭配,这就是是林教授融合两个领域的方式。他说:“在物体追踪领域,很多人已经把算法和深度处理混合起来使用。” ▲
林锺宇教授告诉记者,电脑像人一样识别视觉信息,很不容易,现在仍然在进行技术尝试。
第二期研究 |
||
上一篇 | 汉阳大学-社会福利协会-斯坦福大学,共同探讨创造社会价值的全球合作 | |
下一篇 | 2019年第二次技术考试,我校排名全国第一位,合格人数18名 |