您的当前位置：首页正文

深度学习样例数据集快速生产与清洗方法——以水体为例

来源：伴沃教育

第3期2021年1月江苏科技信息

JiangsuScience&TechnologyInformationNo.3January，2021深度学习样例数据集快速生产与清洗方法

——以水体为例

刘昱君1，

（1.中国科学院地理科学与资源研究所，北京100101；

2.江苏省基础地理信息中心，江苏南京210013）

摘要：深度学习在遥感目标检测和分割领域已取得了长足的进步，但随着应用需求的日益增加，深度

学习样本库极度匮乏。而人工样例生产面临着标注标准不统一、不规范等许多难题。因此，高质量的样例是深度学习和模型学习的基础。文章以高质量水体数据集的制作为例，提出了一种通用型的样例快速生产及清洗方案，通过少量人工检测与模型训练相结合，达到高质量样例生产的目的。结果表明，该方法生产的数据集数据量大、精度高，可以在很大程度上缓解人工制作样本工作量大的难题，为深度学习在工程中的应用提供便利。关键词：深度学习；样例生产；迁移学习；水体提取中图分类号：TP391文献标志码：A

引言

近年来，深度学习已经如浪潮般席卷了科学研究的各个领域［1］，并在机器翻译、时间序列以及计算机视觉等领域取得了令人瞩目的成果。在地学领域，深度学习作为一种数据驱动的代表性方法，可以从大量的数据中学习到复杂的地学规律，为地学领域的研究方法带来了一场深刻的变革［2］。

然而，作为一种数据驱动的方法，庞大且优质的数据库是深度学习方法取得良好性能的前提。但是样本的生产费时费力，且因人而异，很难保证统一的质量，因此样本快速生产和清洗是模型训练前的必要环节，是深度学习遥感广泛的根本。目前人们过多地重视模型训练和泛化能力的提升，但样本的生产和清洗仍旧以传统的人工解译为主，对于动辄成千上万的样本数来说，人工解译效率低下且因人而异［3］。鉴于此，本研究设计了一种半自动的样本快速生产与清洗方法，旨在通过预训练模型对样例进行预测，辅助样例生产和清洗工作，减少人工解译和检查的时间，提高样例的质量。1研究方法1.1技术路线

本研究技术路线如图1所示。路线主要分为两

部分：模型训练、测试和样本清洗。首先人工挑选部分数据集划分为训练集、验证集，剩下的样本集作为测试集，几部分之间无重叠。使用样例辅助生产网络作为基础网络框架，经过自动分割测试和少量人工检查，实现深度学习样例数据集的快速生产与清洗。

图1样本快速生产及清洗技术路线

作者简介：刘昱君（1983—），男，江苏灌云人，高级工程师，博士；研究方向：深度学习遥感影像自动解

译技术。

-42-

江苏科技信息·应用技术

No.3January，2021样例辅助生产网络

地学目标的特点是多尺度嵌套。本文网络结构借鉴了U-Net经典的U型结构［4］，为了提高网络的适应能力，使用GoogLeNet的Incenption结构替代原U-Net编码路径中的双卷积结构，增强其在样本量较小时的特征捕捉能力；在解码路径上，使用密集连接的形式填充U型结构，使其可以实现多级的信息传递，增加感受野的多样性，使得解码时可以接收不同特征提取层次上的信息，以匹配地物多尺度嵌套的特性。

为解决遥感影像中背景地物占比过大的问题，本

］

研究采用了Focalloss［5（公式中记为L）作为模型代价函数。

L=-α（log（p）γ>=0t1-p）tt，

式中：pt表示样本分类正确的概率；αt为权重；（1-p）t为调制系数。

Focalloss通过减少背景的权重，使得模型在训练时更重视正样本，提高分类的准确性。针对水体，本研究采用Focalloss作为训练损失函数。2数据与实验2.1数据来源

本文研究区为江苏省常州市区域，遥感影像选用北京二号遥感卫星影像作为实验数据。为了快速地生产样例数据，首先采用了归一化水体指数产品作为初始数据集，由于水体光谱的复杂多样性以及建筑物植被阴影的影响，因此样本里存在许多诸如漏洞、漏提、阴影误提等多种问题。另外，地理国情监测数据通常为红绿蓝三波段影像，因此传统的波段指数等方法难以满足水体提取的需要，而深度学习可以直接从视觉特征入手捕获水体特征来完成水体提取。这就需要大量高质量的只含有RGB三波段的水体样例数据集。

2.2实验方案

首先将影像及其对应的阈值分割影像裁剪为256×256的样本，共计10956个样本；然后随机选择500个样本通过目视解译进行修正，用于模型的训练与验证，其中训练集与验证集的比例为0.6∶0.4；考虑到训练样本较少，在数据输入模型之前通过随机缩放、随机旋转、色彩抖动、增加阴影等方式进行数据增广。

使用Pytorch深度学习框架开发模型，使用自适应学习率的Adam（Adaptivemomentestimation）作为优化器，Batch为128。由于样本数量较少，模型执行500次迭代，保存在验证集上最优的模型作为测试模型。

2.3评价指标

本研究在训练时使用图像分割领域常用的总像素精度（Meanpixelaccuracy，MPA，公式中记为M）和

均交并比（Frequencyweightedintersectionoverunion，

FWIoU，公式中记为F）作为模型训练的评价参数。其计算公式如下：

∑∑p

ki=0j=0k

∑p

ki=0

∑∑∑p∑p+∑p

j=0k

i=0ij

i=0j=0

j=0

pii∑pij

-pii

pii表示预测正确的样本；式中：i表示第i类；∑pij表示

j=0

属于i类却预测为其他类的像素点数；∑pji表示本属

j=0

于其他类别却预测为i类的像素点数。

3结果与讨论3.1模型训练结果

图2为改进的多尺度U-Net++的训练曲线，可以看出，随着迭代次数的增加，模型的训练损失逐步下降，在大约300次迭代以后，模型的验证精度逐步处于一个相对稳定的状态，损失函数不再下降，精度也不再上升。表1是改进的多尺度U-Net++与传统U-Net的训练精度和验证精度的对比。可以看出，相比于U-Net，改进的多尺度U-Net++对模型效果的提升比较显著，训练精度提升了4.64%，验证精度提升了3.8%，证明了网络的多尺度信息对于模型精度的提升具有一定的作用。

图2改进的U-Net++模型训练曲线

3.2

样本生产及清洗结果模型训练完成后，使用模型依次预测生产的10456个样本，得到对应的预测标签图。将预测的标签图与北京二号遥感影像的二值化NDWI产品图做精度对比验证，将阈值大于0.95的样本数据作为A类数据，此类样本基本不存在分类问题，直接放入水体

-43-

模型训练精度与验证精度比较

验证精度

94.2396.51MPAFWIoU90.0393.83No.3January，2021（单位:%）MPA模型U-Net训练精度

FWIoU90.2394.87多尺度U-Net++

93.8196.07样例数据集中。图3A为FWIoU值位于0.90~0.95之

间的样本示意，此类样本主要是由于阈值的选择造成的样本空洞带来的问题，可通过模型预测样本与NDWI产品取并集后删除漂移块而生成，仅需要人工略加检查。图3B为FWIoU值位于0.75~0.90之间的样本示意，除水体指数的空洞外，还包含一定范围的漏提或者误提现象，因此需要人工仔细核对并适度修改样本。图3C为FWIoU值位于0.55~0.75之间的样

本示意，此部分样本主要体现水体指数在阴影和道路等地物上存在的误提问题，此部分样本可以由人工适当地选择修正或者直接删除。对于FWIoU低于0.55的样本，主要是由于NDWI阈值对于水体的绝对误提，此部分样本可以直接进行删除处理。各类别判别标准、所占比例和处理策略如表2所示。

［1为真彩色影像，2为水体指数二值化产品，3为模型预测产品（FWIOU，A为0.9284，B为0.7921,C为0.5752），

4为最终样本］

图3B类别（需修正）样本示意

表2

阈值0.90~0.950.75~0.900.55~0.750.55以下>0.95个数/个26052159327514171000样本生产和清洗统计所占比例/%24.9120.6531.3213.559.56类别ABC处理策略直接入库

自动修改，目视检查入库

人工修改后入库人工决定修改或删除

直接删除

-44-

No.3January，2021结合上述步骤，将生成的样本与原样本相匹配，

去除近红外波段，直接使用RGB波段影像和对应的标签数据构成新的基于北京二号遥感影像水体样例数据集，共计9145个样本。相比于原手工样本制作，仅有不到50%的样本数据需要人工略加修正，节约量投入近7成以上。且经过该方法生成的样例数据集涵盖场景丰富，减少了人工主观判断的影响，对于类似于水体等地物存在的“软边界”的精确提取具有重要的意义。目前，利用该方法生产的数据集已正式投入使用，为地理国情监测中自然水面的提取等工作提供了新的数据和方法支撑。4结论与展望

本研究针对当前基于深度学习的遥感图像解译与分类工作中存在的数据集制作工作量大、制作精度不高等问题，提出了一整套深度学习样例快速生产和清洗流程，并以北京二号遥感影像水体数据集的制作为例，验证了该流程可以在一定程度上辅助深度学习样例数据库的生产，大大减少了人工投入。在未来工作中，还将探索更多的有效方案，例如地理国情面、基础测绘面等数据辅助遥感样例数据集的生产，为智能化遥感图像解译的广泛应用提供丰富的

参考文献

［1］LECUNY，BENGIOY，HINTONG.Deeplearning［J］.Nature，2015（521）：436-444.［2］REICHSTEINM，CAMPS-VALLSG，STEVENSB，etal.Deeplearningandprocessunderstandingfordata-drivenearthsystemscience［J］.Nature，2019（7743）：195-204.

［3］CHENGG，HANJW，LUXQ.Remotesensingimagesceneclassification:benchmarkandstateoftheart［J］.ProceedingsoftheIEEE，2017（10）：1865-1883.［4］SUNWW，WANGRS.FullyconvolutionalnetworksforsemanticsegmentationofveryhighresolutionremotelysensedimagescombinedwithDSM［J］.IEEEGeoenceandRemoteSensingLetters，2018（15）：474-478.［5］LINTY，GOYALP，GIRSHICKR，etal.Focallossfordenseobjectdetection［J］.IEEETransactionsonPatternAnalysisandMachineIntelligence，2020（2）：318-327.

（编辑王永超）

Rapidproductionandcleaningmethodsofdeeplearningsampledatabases

LiuYujun1,2

（1.InstituteofGeographicSciencesandNaturalResourcesResearch,CAS,Beijing100101,China;

2.ProvincialGeomaticsCenterofJiangsu,Nanjing210013,China）

Abstract:Deeplearninghasmadegreatprogressinthefieldofremotesensingtargetdetectionandsegmentation,butwiththeincreasingdemandofapplication,thedeeplearningsampledatabasesareextremelyscarce.However,artificialsampleproductionfacesmanyproblemssuchasinconsistentandnon-standardmarkingstandards.Therefore,high-qualitysamplesarethefoundationofdeeplearningandmodellearning.Takingthemanufactureofhigh-qualitywaterdatabasesasanexample,ageneralsamplequickproductionandcleaningschemeisproposedinthispaper.Theresultsshowthatthedatabasesproducedbythismethodhavealargeamountofdataandahighprecision,whichcangreatlyalleviatethedifficultproblemofmanualsampleproductionandprovideconveniencefortheapplicationofdeeplearninginengineering.

Keywords:deeplearning;sampleproduction;transferlearning;waterextraction

-45-

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文