公告与问询 Hanyang University Shanghi Center

汉阳新闻

HOME   gt   公告与问询   gt   汉阳新闻
林鍾宇教授,融合算法和深度学习方式,提升电脑视觉展望
  • 관리자
  • |
  • 62
  • |
  • 2019-09-16 15:14:11
电脑视觉展望:算法方式和深度学习方式

 

算法方式的电脑视觉展望是发展了四五十年的传统研究方法。算法主要应用于通过相机对汽车行驶速度等准确的数字情况的认识。深度学习(Deep Learning)虽然也有很长的研究历史,但是最近利用比较活跃。深度学习用于从面部表情中认知人的感情等意义性信息解释。林教授并没有将此二者分开来看,而是研究了合并的方案。

使用深度学习方式,可以将被接受的形象周边空间复原为三维信息。输入影像和推定的距离信息(左)和三维复原结果(林锺宇教授提供)

 

自动驾驶汽车的电脑视觉展望

 

林教授的此次研究主要针对自动驾驶汽车和CCTV等利用的电脑视觉展望。为便于理解,林教授以自动驾驶汽车为例,对研究进行了说明。为了施行无人驾驶,需要能够识别并解释通过相机传来的信息的技术。行驶时需要立即将与前车的距离进行信息化。算法方式(Algorithm)就具有这一特点。将车辆行驶期间变化多端的周围空间视为三维也是核心技术之一。深层学习方式可以更有效地处理这类问题。若只靠算法方式或深度学习中的一个,则无法完成无人驾驶。

 

由于路况通过相机来识别,当瞬间物体重叠于其他物体而被遮挡或出现大的照度(受照明面的亮度尺度)变化时,可能会发生危险。这种情况下,属于传统方式的算法范式就会出现问题。林教授通过深入学习解决了这个问题。林教授的方法是追踪物体,学习外形信息,预测变形,从而实现对事物的解读。

算法方式有利于测量物体的速度和距离。深度学习方式是将正在运动的物体和静止的物体进行分类等,容易进行意义性分析。照片上显示运动物体,不显示静止物体。(林教授提供)

 

融合算法方式和深度学习方式的方法

 

深度学习方式的处理结果不是视觉形象,而是“信息(data)”。将视觉资料分成大的范畴,将传送描述物体特征的信息。算法方式的处理结果将留下用像素表现的形象。将以算法方式获得的像素形象与深度学习的结果信息进行搭配,这就是是林教授融合两个领域的方式。他说:“在物体追踪领域,很多人已经把算法和深度处理混合起来使用。”

林锺宇教授告诉记者,电脑像人一样识别视觉信息,很不容易,现在仍然在进行技术尝试。

 

第二期研究

 

“视觉展望模式基础空间状况认知基础技术研究”从20179月开始,历时两年。此次研究是“通过了解人类水平的综合影像来理解认知并预测情况”研究的第一期。通过第一期的研究,林教授和研究人员实现了目标功能的开发,并撰写了多篇论文。林教授表示:“使电脑像人一样识别视觉信息并不容易,目前仍然在进行技术性尝试。”林教授还将在第二期的研究中担任研究负责人,进行“以深度学习方式为基础的意义性理解基础技术研究”。

上一篇 汉阳大学-社会福利协会-斯坦福大学,共同探讨创造社会价值的全球合作
下一篇 没有下一篇文章
비밀번호 입력
비밀번호
확인
비밀번호 입력
비밀번호
확인
TOP
chat