没有大量训练数据时怎么生成更多的数据

cslehe · 发表于 2021-4-10 18:31:35

#111723#在图象和物体辨认方面，盘算机表示优于人类。
像Google和Microsoft如许的至公司在图象辨认方面曾经超出了人类基准[1，2]。均匀而言，人类大概有5％的时光在图象辨认义务上犯了毛病。停止2015年，微软的图象辨认软件的毛病率到达4.94％，与此同时，谷歌发布其软件的毛病率下降到4.8％[3]
这是怎样做到的？
这能够通过在包括数百个工具种别、数百万个练习样本的ImageNet数据集上练习深度卷积神经收集来实现[1]。
百万练习数据！
比方，要教盘算机从多个角度辨认出一只猫猫，可能须要成千上万张涵盖差别角度的照片。
胜利练习盘算机视觉义务的深层卷积神经收集须要大批数据。这是由于这些神经收集存在多个暗藏的处置层，而且跟着层数的增添，须要进修的样本数也随之增添。假如没有充足的练习数据，则该模子常常会很好地进修练习数据，这称为适度拟合。假如模子过拟合，则其泛化才能很差，因而对未见的数据的表示很差。
然而，假如没有大批的练习数据怎样办？
对于咱们手头的全部图象辨认义务，并不是都市具有数百万个练习样本。对于某些义务，搜集成千上万个样本图象乃至是一个挑衅。对于医学图象而言平日是这类情形，比方用于乳房癌检测和定位的乳房X线拍照术，用于肺癌检测的胸部X射线或用于定位脑肿瘤的MRI扫描。
这能够归纳为一个成绩：当咱们只有无限的数据时，咱们怎样练习可能很好地实现这些义务的模子？
应用数据加强（data augmentation)天生更多练习数据
当咱们只有少许图象数据用于练习深度卷积神经收集时，咱们能够应用数据加强技巧从曾经具有的图象数据中天生更多练习数据。
数据加强是一种为原始图象天生多个图象的技巧。有几种差别的数据加强技巧，Mikolajczyk和Grochowski在他们的论文中[4]将这些技巧分为两个子种别：应用基础图象处置的数据加强和应用深度进修方式的数据加强。

多少变更
诸如翻转(Flip)，裁剪(Crop)，扭转(Rotation)和移位(Translation)之类的多少变更是一些常用的数据加强技巧。咱们将在本文中扼要探讨它们。
翻转

翻转是取恣意给定图象的镜像。它是最简略的加强技巧之一。图象能够程度或垂直翻转。然而，程度翻转在这二者之间更加罕见。
裁剪

裁剪是一种数据加强技巧，用于通过裁剪界限像夙来减小原始图象的巨细。裁剪时不会保存空间尺寸。在这类范例的数据加强中，不能保障转换后的图象与原始图象属于雷同的输出标签。
在下面的图象中，通过从阁下偏向裁剪像素，从原始图象天生了四个图象。裁剪图象的尺寸从256x256减小到227x277。
扭转

图象能够在轴上向左或向右扭转1到359度。1到20度之间的扭转称为稍微扭转，而且是用于加强原始图象的有效技巧。跟着扭转度的增添，转换后的数据可能没法保存其原始标签。
移位

翻译是一种将图象向左，向右，向上或向下平移的技巧。这是一种十分有效的转换技巧，能够防止数据中的地位偏向。移位图象时，残余空间将被添补为0，255或被随机噪声添补，从而保存了图象的原始巨细。
基于GAN的数据加强
天生抗衡收集（GAN）也称为GAN，是一种天生建模技巧，此中能够从数据会合创立人工实例，从而保存原始集的类似特点[9]。
GAN由两个彼此竞争的人工神经收集（ANN）构成，即天生器 generator 与辨别器 discriminator。天生器创立新的数据实例，而辨别器则评价它们的实在性[10]。
这是由GAN天生的人脸图象，这是在人脸上练习出来的。请留神，这些是分解的面貌，而不是实在的人。

这些是一些数据加强技巧，平日用于从无限的数据会合天生更少数据，从而能够练习出更无效的卷积神经收集。
Olaf和他的团队在练习数占有限的情形下，应用在图象上的平移、扭转和随机弹性变更等数据加强技巧练习U-net系统构造模子，并在2015年ISBI细胞追踪挑衅中以较大上风取得这些种别的冠军。
因而，下次在练习卷积神经收集时，请应用这些技巧来创立更少数据。
你平常应用了哪些数据加强技巧？鄙人面批评分享的主意。
更多内容阅读推荐：壁挂式洗衣机如何安装

账号		自动登录	找回密码
密码			立即注册