初始化图像转换是一个非常重要的工作,因为采集大量的图片样本是一个成本很高的工作,所以通过将PIL图片做各种变形转换,相当于我们又给样本集加入了很多样本。比如我们对原始图片进行放大,缩小,裁剪部分,旋转,变成黑白等等。
坐标在XML文档存储之后会存放在一个txt文件中,这实际上就是作为检测算法的一个重要的导出的信号。训练算法是需要把图输入给神经网络,网络训练完成后,在模型的输出端就会出现物体框的位置,就是上述的四个坐标。将样本标注好以后,样本不仅仅是采集的图片,它还包括输入和输出,输入是图像,输出的是txt文件。所以对于同一张图片,图的名称和标签的文件名以及放的txt文件要一一对应。如果是30号的样本,标签的文件名将会是30号,它对应的图像也将是30号文件。这样对于后面提取数据的时候,就可以从刚才对应的目录取文件和标注,数据进行训练也就会更加精准。
针对这个问题,我们提出用图片级别的弱标注去覆盖新的种类。例如从COCO拓展到COCO-STUFF,不需要再为新覆盖的91个种类提供强标注,只需要为每个样本标注图片级别的标签即可,而图片级别的标签是代价及其小的,可拓展性高的。如图1所示,原本的基础类别标注了“猫”“杯子”“床”等种类,但是没有标注“台灯”种类。在我们的学习模式种,如果要新去覆盖“台灯”这个种类,只需要为改图片标记“台灯”标注即可。这无疑极大地降低了拓展时的标注成本,使得语义分割模型对新类别有极大的拓展潜力。
为了提供更细粒度的监督,我们使用像素-像素相似度迁移来为新种类提供像素级的正则化项。如上图所示,由于所有训练样本都有类别标签,所以对于一个训练样本,可以找到与它包含相同基础种类、新种类的样本,作为参考样本。在两个图片上各自采样一些点,并且枚举构成一些像素点对。
毕业证样本网创作《安徽省离婚证样本图片(猎鹰3)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/681185.html