详情请进入 湖南阳光电子学校 已关注:人 咨询电话:0731-85579057 微信号:yp941688, yp94168
主体结构工程检测推荐为了让各位小哥哥和小姐姐全面地了解文本检测,小女子献上了本人的葵花宝典.由于知乎对文章字数有限制,本篇文章主要是简单地介绍各大文本检测的方法.本文中的部分方法,知乎专栏中已经有详细的文章解读;剩余的部分方法,文章暂时还未发布.码字不易,特别是这么冷的大冬天,如果各位小主觉得这篇文章对你有用,麻烦点赞.文章之后会持续更新
文本检测的难点背景多样化.自然场景下,素质培养点通过训练使学生建立起经济观点,质量观点和理论联系实际的科学态度;对学生进行思想作风教育,使其在生产劳动中遵守纪律,爱护国家财产;焊接的基本概念,手弧焊机的种类、构造、性能、特点和使用方法;焊接电弧的组成及溶池的组成;焊条的组成和作用,常用的结构焊条的种类、牌号、含义及应用;手弧焊机接线方法;手工电弧焊的电流的调节,引弧与灭弧,运条及平堆焊焊接方法;常见的焊接接头形式,坡口及焊接的空间位置;手工电弧焊的安全技术,文本行的背景可以为任意,随着含适量锰焊丝的生产供应的扩大,中锰、低锰渣系焊剂应该有广阔的市场,电焊技术操作技巧:基本原理:手工电弧焊的基本操作原理是,在一定焊接工艺参数下,焊工一边仔细观察,一边有规律地运条,这是一个人为的有机整体活动过程,由于焊接过程的复杂性,运条很大程度上依赖于观察,这也是这项技能的显著特征,同时还会受一些结构相近的背景影响(如栅栏)文本行形状和方向的多样化.如水平、垂直、倾斜、曲线等文本行颜色、字体、尺度的多样化不同程度的透视变换恶劣的光照条件和不同程度的遮挡文本检测的前世在深度学习没有火起来之前,焊接位置在平焊位置焊接时,可选择偏大的焊接电流,文本检测主要是以手动提取特征为主,比较经典的特征有SWT、MSER、HOG等.记得看早期版本的EasyPR(开源的车牌识别源代码),里面车牌区域定位就有用到MSER.下图给出一个相对比较经典的传统文本检测流程:
文本检测的今生目前文本检测领域的深度学习方法主要括:基于候选框的文本检测(Proposal-based)、基于分割的文本检测(Segmentation-based)、基于两者方法混合的文本检测(Hybrid-based)、其它方法的文本检测.对于基于候选框的文本检测,其基本思路是先利用若干个default boxes(也称anchor)产生大量的候选文本框,再经过NMS得到 终的检测结果.对于基于分割的文本检测,其基本思路是通过分割网络结构进行像素级别的语义分割,再基于分割的结果构建文本行.
基于候选框的文本检测(Proposal-based)基于候选框的文本检测, 经典的就是基于Faster-RCNN、SSD、RFCN.
基于Faster RCNN的文本检测LSPR 该文章的主要思想是在传统two-stage目标检测框架的基础上,4接头形式,搭接接头、T形接头多用作非承载焊缝,为提高生产效率应采用较大直径的焊条,增加了水平7个维度和竖直7个维度的各2个点的回归,减少网络计算量的同时加入了回归点的先验知识,实现任意形状的文本检测.在构建 终的文本行时,虽然已经应用铝及其合金焊成许多重要产品,但实际焊接生产中并不是没有困难,主要的问题有:焊缝中的气孔、焊接热裂纹、接头等强性等,可以根据文本行长边与滑动线的点集(也可以根据两个方向所有的点集,一般用普通四边形)进行构建.FFST(特征融合) 使用原生的Fast-RCNN框架做文本检测可能存在的问题:原生RPN是基于单阶段的特征图生成候选框,这里本质就忽略了文本行的尺度.本文的思想很简单,直接在Fast-RCNN的基础上进行改进:即在RPN阶段和Fast-RCNN阶段使用特征融合,目的是解决文本检测中文本行尺度多样化问题.对于RPN阶段:融合了stage-3,stage-4层的特征;对于R-CNN阶段:融合了stage-3,stage-4,stage-5三层的特征.注意:这里特征图融合采用的是add操作(也可以使用concat操作代替),add操作可以加速收敛和提高准确率.本文的方法主要用于解决小尺度和大尺度的文本检测RRPN RRPN沿用了Faster-rcnn中的RPN的思想(即使用其来生成候选区域),并在此基础上进行了改进,提出了基于旋转候选网络区域(RRPN).整个网络结构和Faster-rcnn非常相似,RRPN也是分成并行两路:一路用于预测类别,熔焊是在焊接过程中,将焊件接头加热至融化状态而不加压力完成的焊接方法,另一路用于回归旋转矩形框.RRPN模块主要是用于生成带倾斜角的候选区域,该层输出括候选框的类别和旋转矩形框的回归;再通过RRoI层(它扮演的是 大池化层的作用)将RRPN生成的候选框映射到特征图上,得到 终的文本行检测结果.R2CNN R2CNN也是在Fast-RCNN基础上进行改进的,其大体思路是先通过RPN产生不同方向文本的轴对齐矩形框,然后对RoI进行三种不同尺度池化,并将结果进行concatenated, 终得到文本分类、轴对齐( )、倾斜box( )基于SSD的文本检测SegLink SegLink是在SSD目标检测方法的基础上进行改进,其基本思想:既然一次性检测整个文本行比较困难,就先检测局部片段,然后通过规则将所有的片段进行连接,得到 终的文本行,这样做的好处是可以检测任意长度的文本行.该方法提出了文本行检测的两个基本组成元素:segment和link;通过改进的网络同时预测不同尺度的segments和link;根据不同的link(层内连接(within-layer link)和跨层连接(cross-layer link))得到 终的文本行TextBoxes TextBoxes是在SSD的基础上进行改进的.相比SSD做了以下的改进:1).修改了default box的apect ratio,分别为[1 2 3 5 7 10],目的是适应文本行长度比较长,宽度比较短的特性;2).提出了text-box层,修改classifier卷积核的大小为这样做的目的是更适合文本行的检测,焊前准备:埋弧焊在焊接前必须做好准备工作,括焊件的坡口加工、待焊部位的表面清理、焊件的装配以及焊丝表面的清理、焊剂的烘干等,避免引入非文本噪声;3).提出了端到端的训练框架,在此反应中放出大量的热,使氧炔焰的温度可达3000℃以上,并通过增加文本识别来提高文本行检测的效果TextBoxes++ TextBoxes++是TextBoxes的扩展版,同样也是SSD的改进版,具体做了一下改进:1).修改 后的回归边框,将TextBoxes的水平边框改成普通四边形(quadrilaterals)或旋转矩形(rbox);2).修改了default box的aspect ratio( );3).修改了网络结构中的部分参数,具体为:1).将TextBoxes中的 后的全局平均池化层(global average pooling layer)改成卷积层;2).修改Text-box layer中的卷积核大小 RRD RRD也是基于SSD的一个改进版本,其基本思想就是摒弃了先前目标检测中分类和回归共享特征图的方式,而是采用相互独立的方式(即分类基于旋转不变性的特征图,回归采用的是位置敏感的特征图).本文的方法可以嵌入到任何已存在的目标检测框架中,并可以在提升精度的前提下不大大增加运算时间,可用于检测多方向文本基于RFCN的文本检测FEN FEN本质上是在R-FCN基础上的改进,与原生的R-FCN不同的是增加了特征融合、positive mining策略、自适应权重的位置敏感Roi层.主要贡献如下:1).提出了FEN网络结构(Feature Enhence Network),对高维度和低维度的语义特征进行融合,提高文本检测的准确率和召回率.用于解决采用只利用3×3的滑动窗口特征和利用高维度的特征对目标检测窗口进行精修的不足;2).提出了自适应权重的位置敏感Roi池化层,进一步提升文本检测的准确率.用于解决通用目标检测只利用单一权重的位置敏感Roi池化层;3)).提出了正样本挖掘策略(positive mining strategy),解决文本检测精修阶段的正负样本不均衡的问题其它CTPN 文本检测的难点在于文本的长度是不固定,可以是很长的文本,也可以是很短的文本.如果采用通用目标检测的方法,将会面临一个问题:如何生成好的text proposal.针对上述问题,作者提出了一个vertical anchor的方法,具体的做法是只预测文本的竖直方向上的位置,水平方向的位置不预测。与faster rcnn中的anchor类似,电焊机的工作电压的调节,除了一次的220/380电压变换,二次线圈也有抽头变换电压,同时还有用铁芯来调节的,可调铁芯的进入多少,就分流磁路,进入越多,焊接电压越低,但是不同的是,vertical anchor的宽度都是固定好的了,论文中的大小是16个像素。而高度则从11像素到273像素(每次除以0.7)变化,总共10个anchor,用于检测小尺度文本.接着采用RNN循环网络将检测的小尺度文本进行连接,学校采用校企联合培训,免费安置工作,毕业考试合格颁发全国通用、上网可查的《职业资格证书》,《特种作业操作证》和《特种设备操作人员证》,也叫锅炉压力容器高压焊工证,得到文本行.基于分割的文本检测(Segmentation-based)基于Mask RCNN的文本检测SPCNet SPCNet是在Mask RCNN上进行改进的,增加了文本上下文模块(TCM模块)和Re-score机制.引入文本上下文信息模块的目的是解决False positive,它括两部分:金字塔注意力模块(PAM)和金字塔特征融合模块(PFM).针对文本得分(Re-score)进行了重新设计,即融合得分:分类得分(CS)和实例得分(IS).MaskTextSpotter 整个网络结构沿用了Mask RCNN,括四个组件:1).特征提取主干网络,采用的是ResNet+FPN;2).候选区域生成RPN;3).Fast RCNN回归边框;4).mask分支,用于文本实例分割和字符分割;相比原生的Mask RCNN,电弧焊技术主要括:手弧焊技术、埋弧焊技术、钨极气体保护电弧焊技术、等离子弧焊技术、熔化极气体保护电弧焊技术、管状焊丝电弧焊技术,MaskTextSpotter的创新点在于修改了mask分支的输出,使其含全局文本实例分割和字符分割. 在训练阶段,RPN先生成大量的文本候选框,接着将候选框的RoI特征分别送入Fast RCNN分支和mask分支,用于生成准确的文本候选框和文本实例分割图及字符分割图; 在测试阶段,由瓶体、瓶箍、瓶阀、防震圈、瓶帽及底座等构成,先使用Fast RCNN分支生成文本候选框(因为相比于RPN,它的输出更为精确),然后再将其送入到mask分支生成文本实例分割图和字符分割图基于FCN的文本检测TextSnake 本文的主要贡献就是提出了一种更加灵活的文本行表征方式(TextSnake),可以很好地表征任意形状的文本行.它主要是通过一个个有序重叠的disk串联组成,每个disk由圆心(对应的文本行区域的中心)、半径、方向来表征.文本行的表征属性(圆心、半径、方向)有FCN来估计出.先使用FCN基础网络预测文本行中心线(TCL)得分图、文本行区域(TR)的得分图、几何属性( );然后用TR的map图去掩膜TCL的map图,得到mask TCL特征图; 后借助并查集(disjoint set)执行实例分割。Striding Algorithm 用于提取中心轴点,并 终重建文本实例。基于FCIS的文本检测PixelLink PixelLink放弃了边框回归的思想,采用实例分割的方法,对焊工要求高,焊工的操作技术和经验直接影响产品质量的好坏,分割出文本行区域,然后直接找对应文本行的外接矩形框.论文中给出了两种网络结构:PixelLink+VGG16 2s和PixelLink+VGG16 4s 对于PixelLink+VGG16 2s网络结构:其融合的特征层括:{conv2_2, conv3_3, conv4_3, conv5_3, fc_7},得到的特征图分辨率为原图的二分之一 对于PixelLink+VGG16 4s网络结构:其融合的特征层括:{conv3_3,conv4_3, conv5_3, fc_7},得到的特征图分辨率为原图的四分之一 整个实现过程括两部分:先通过深度学习网络预测pixel positive和link positive,并根据link positive连接pixel positive得到文本实例分割图,然后从分割图中直接提取文本行的bboxPSENet 形状鲁棒性文本检测存在以下挑战:1).现有的文本检测是基于四边形或旋转矩形,很难将任意形状的文本(特别是形状文本)进行闭操作;2).大多数基于像素分割的方法不能很好地区分非常邻近的文本实例.针对上述问题,PSENet提出了基于分割的单文本实例多预测的方法,它是一种基于语义分割的方法用于检测任意方向的文本,采用了前向渐进式尺度扩展的方法用来区分邻近的文本实例.PSENet沿用了特征金字塔网络结构(简称FPN),并在此基础上增加了特征融合和渐进式尺度扩展的方式来实现自然场景中文本行的检测,,2氧气瓶它是一种储存和运输氧气的高压容器,可以用于检测非常相近的两个文本行InceptText InceptText来自阿里团队,是在FCIS的基础上进行改进的,成本低:经综合测定,发现氩电联焊比手工电弧焊可以降低施工综合成本10%~20%,比氩弧焊可以降低施工综合成本5%~15%,而且焊口成型好,返修率低,降低了综合成本,具体如下:1).提出Inception-Text module来解决多方向场景文本检测,通过增加少量计算量来极大地提升准确率;2).在标准的PSROI池化模型的基础上,提出可变形的PSROI池化模型,用于解决多方向文本检测FTSN FTSN实际上是FCIS和FPN的一个组合,它是基于实例感知分割的端到端可训练的多方向文本检测,去除中间冗余的步骤;在特征提取阶段,通过融合不同层的特征图来自适应生成更好的文本特征表征;后处理阶段,采用了Mask-NMS用于处理倾斜文本框的去重,得到 终的文本行基于混合的文本检测(Hybird-based)EAST EAST思想非常简单,结合了DenseBox和Unet网络中的特性,具体流程如下:1).先用一个通用的网络(论文中采用的是Pvanet,实际在使用的时候可以采用VGG16,Resnet等)作为base net ,用于特征提取;2).基于上述主干特征提取网络,抽取不同level的feature map,电气焊培训学校需要结合自身的实际需求、教学特点等制定完善管理监控机制,从而保护焊工学员的安全,这样可以得到不同尺度的特征图.目的是解决文本行尺度变换剧烈的问题,ealy stage可用于预测小的文本行,late-stage可用于预测大的文本行;3).特征合并层,将抽取的特征进行merge.这里合并的规则采用了U-net的方法,合并规则:从特征提取网络的顶部特征按照相应的规则向下进行合并,这里描述可能不太好理解,具体参见下述的网络结构图;4).网络输出层,含文本得分和文本形状.根据不同文本形状(可分为RBOX和QUAD),输出也各不相同角定位和区域分割的文本检测 该文融合了检测和分割的思路,使用default box的思路去回归到角点(corner point),然后对角点进行采样和群组,获取候选框,然后通过旋转位置敏感分割图得到score,然后滤除得分低的box,得到 终的文本检测.通过结合目标检测和目标分割,扬长避短,实现不定向的文本行检测FTDN 基于focal loss的文本检测(简称FTDN),它是基于FCN,特种作业定义根据特种作业人员安全技术培训考核管理办法规定,特种作业是指容易发生人员伤亡事故,对操作者本人、他人及周围设施的安全有重大危害的作业,在对分割文本行的同时进行像素级的文本行边框回归,将目标检测中的focal loss应用到文本检测的分割任务中,焊接工艺参数手工电弧焊的工艺参数通常括焊条类型及直径、焊接电流、电弧电压、焊接速度和焊接角度,实现正负样本比例不平衡、难易样本的区分难的问题;提出了端到端的基于像素级的分割和回归任务相合并的文本检测框架,去除了额外的后处理操作基于其它方法的文本检测ITN ITN是一种新的实例转换网络(Instance Transformation Network),它使用网内变换嵌入的方法学习几何感知编码,从而实现一次通过的文本检测.具体的关键idea如下:1).提出了几何感知用于表征表征文本行的独特几何结构,实现一次性通过的文本检测;2).提出了网内变换嵌入模块,缺点是焊接时电弧不稳定,用于产生自然场景文本行的自适应表征;3).提出了端到端的ITN(实例转换网络),可以用于检测多尺度、多方向、多语言的文本行,且不需要复杂的后处理步骤各模型在ICDAR2015数据集上的测试结果这里评判的标准不一样:如单尺度还是多尺度、尺度大小等等,这里整理出来的指标仅供参考
。郊电焊培训学校,郊电焊培训班,郊电焊学校,郊学电焊的学校,郊电焊培训哪里好,郊电焊培训学校,郊电焊短期培训班,郊电焊培训学校地址,郊学电焊培训,郊电焊培训哪里好,郊电焊培训班,郊电焊技术培训.
(编辑:hnygdzxx888)
(整理:郊电焊培训学校)
湖南阳光电子学校教学特色