#111723#<p>在本文中,来自加州大学河干分校机器工程系的研讨者通过利用光学旋涡证实了混杂盘算机视觉体系的可行性。该研讨为光子学在构建通用的小脑混杂神经收集和开辟用于大数据剖析的及时硬件方面的感化供给了新看法。
<p>从医学诊断到主动驾驶再到人脸辨认,图象剖析在古代技巧中无处不在。应用深度进修卷积神经收集的盘算机完全转变了盘算机视觉。但卷积神经收集(convolutional neural network,CNN)通过从预练习数据中进修来对图象停止分类,但是这些数据平日会记着或开展某些成见。另外,数据还易于遭到抗衡性攻打(以极轻微且几近发觉不到的图象歪曲呈现)的烦扰,从而致使做犯错误的决议。这些毛病限度了卷积神经收集的用处。 晋升图象处置算法能效和牢靠性的一种方式是将惯例盘算机视觉与光学预处置器联合起来。这类混杂体系能够用起码的电子硬件任务。因为光在预处置阶段便可实现数学函数而不会耗散能量,因而应用混杂盘算机视觉体系能够节俭大批时光和动力。这类新方式可能战胜深度进修的毛病,并充足应用光学和电子学的上风。
<p>往年 8 月份,在一篇宣布于 Optica 的论文中,加州大学河干分校机器工程系助理教学 Luat Vuong 和博士生 Baurzhan Muminov 通过利用光学旋涡(存在深色核心点的缭绕光波),证实了混杂盘算机视觉体系的可行性。光学旋涡能够比方为光绕着边沿和角落传布时发生的流体能源旋涡。
<p>论文链接: https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-9⑽79&id=437484 研讨标明,光学预处置能够下降图象盘算的功耗,而电子装备中的数字信号辨认相干性,供给优化并疾速盘算牢靠的决议阈值。借助混杂盘算机视觉,光学器件存在速率和低功耗盘算的上风,而且比 CNN 的时光本钱下降了 2 个数目级。通过图象紧缩,则有可能从存储和盘算庞杂性两方面大幅增加电子后端硬件。 Luat Vuong 表现:「本研讨中的旋涡编码器标明,光学预处置能够打消对 CNN 的需要,比 CNN 更具鲁棒性,而且可能泛化逆成绩的处理方式。
<p>比方当混杂神经收集进修手写数字的外形时,它能够重修之前从未见过的阿拉伯或日语字符。」 该论文还标明,将图象缩小为更少的高强度像素可能实现极弱光芒前提下的图象处置。该研讨为光子学在构建通用的小脑混杂神经收集和开辟用于大数据剖析的及时硬件方面的感化供给了新看法。 论文内容简述 深度进修卷积神经收集平日触及存在较高盘算本钱的多层、前向 - 后向传布呆板进修算法。以是,在本文中,研讨者展现了卷积神经收集的替换计划,该计划从其光学预处置、傅里叶编码形式中重修原始图象。该计划对盘算的需要少很多,而且存在更高的噪声鲁棒性,因而实用于高速和弱光照前提下的成像。 详细而言,该研讨引入带有微透镜阵列的旋涡相位变更,以及浅层麋集的「小脑」神经收集联合。单次编码孔径方式应用了傅里叶变更螺旋相位梯度的相关衍射、紧凑表征和边沿加强。应用旋涡编码能够练习小脑对图象停止去卷积操纵,其速率比应用随机编码计划快 5 至 20 倍,且在存在噪声的情形下取得了更大的上风。
<p>一旦练习实现,小脑便可以从 intensity-only 的数据中重修工具,从而处理了逆映照成绩,而无需在每个图象上履行迭代,也无需深度进修计划。通过旋涡傅立叶编码,研讨者在 15W CPU 上以每秒几千帧的速率重修以低光通量(5nJ / cm^2)照明的 MNIST Fashion 工具。终究,研讨者证实了应用旋涡编码器停止傅立叶光学预处置在到达类似正确率的情形下,速率比卷积神经收集快 2 个数目级。 旋涡的常识能够扩大为懂得恣意波型。当带有旋涡时,光学图象数据会以凸起表现并混杂光学图象差别部份的方法实现传布。研讨者指出,应用浅层「小脑」神经收集停止的旋涡图象预处置(仅需运转几层算法)便可以取代 CNN 施展感化。 Vuong 还表现:「光学旋涡的奇特上风在于其数学和边沿加强功效。在本文中,咱们证实了,光学旋涡编码器可能以相似于一种小脑神经收集从其光学预处置形式疾速重修原始图象的方法天生目的强度数据。」 方式
<p>
<p>图 1 描写了该研讨的成像计划,此中工具 F(r,Φ) 的多个图象被搜集到傅立叶域中:透过每个微透镜的光由差别的旋涡和透镜 mask 形式 M_m(r,Φ) 调制;摄像机检测到菲涅耳(Fresnel)传布、旋涡傅里叶变更(vortex-Fourier-transformed)强度形式的缩放模平方图象
<p>
<p>。 此中,m 是旋涡拓扑电荷,r 和Φ是实域柱面坐标,而 u 和 v 是傅里叶立体笛卡尔坐标。旋涡傅里叶强度形式 F^~ 会合在绝对较小的地区中,但跟着 m 的增添,平日会呈越来越宽的甜甜圈形(图 1(b))。工具「实域」中的旋涡相位在空间上编码并损坏了傅立叶变更强度形式的平移稳定性,如图 1(c) 所示。 另外,该研讨将一些小图象数据集视为工具输入,并比拟 F(r,Φ) 中的差别表征。对于每个正实值数据集图象 X,相位变更的映照以下公式所示:
<p>
<p>此中,α_0 是工具相位挪动的静态范畴。这类映照很便利,由于信号功率不随抉择的 X 转变。研讨者还斟酌了 X 闭塞或接收信号时不通明工具,即,这会发生类似的趋向。 归根结底,该研讨有三项重要翻新:(1)用旋涡透镜停止光谱特点的边沿加强;(2)在没有类似学得数据集的情形下对图象停止疾速逆重修;(3)取决于层激活的抗噪声才能。
<p>原文题目:光学预处置与盘算机视觉联合,UCR学者用旋涡实现混杂盘算机视觉体系
<p>文章出处:【微信大众号:新呆板视觉】欢送增加存眷!文章转载请注明出处。
<p>
更多内容阅读推荐: 中央空调怎么不制热 |