单位文秘网 2021-07-24 08:15:43 点击: 次
摘 要: 针对规则碎纸片的拼接复原问题,本文通过在matlab平台下读取碎纸片图片的像素信息,得到图片的像素矩阵后并将之二值化,使用匹链追踪最大序列、不确定因素剔除等方法,分别建立了横纵切单面碎纸片复原、横纵切双面碎纸片复原等模型,仿真结果表示,对碎纸片又很好的恢复效果。
关键词:碎纸片拼接复原 二值化 匹链追踪 不确定法
中图分类号:G64 文献标识码:A 文章编号:1003-9082(2015)04-0325-02
引言
破碎文件的拼接在司法物证复原、历史文献修 复以及军事情报获取等领域都有着重要的应用。传 统拼接复原工作需由人工完成,准确率较高,但效率 很低。特别是碎片数量巨大时,人工拼接很难在短时 间内完成。随着计算机技术的发展,人们试图开发碎 纸片的自动拼接技术,以提高拼接复原效率。常规破 碎文字拼接技术一般利用碎纸片边缘的形状特征、 尖角特征、文字外形特征等几何特征,找寻相匹配的 碎纸片进行拼接。但这种依据边缘几何特征拼接的 方法并不适用于边缘形状相同且规矩的碎纸片拼 接。本文将研究规则单面横纵切碎纸片和双面横纵切碎纸片的拼接(详见 2013 年全国数学 建模 B 题)。
一、单面横纵切碎纸片的复原
1.建模思路
附件3和附件4中的碎片是由单面文件横纵切所得,碎片的数量较多,拼接的难度较大。碎片较小,从碎片边缘上的所获得的信息很少,使得碎片拼接的准确性降低很多,针对许多边缘上没有文字信息的碎片,可以辅助以人工拼接。
该两个附件中的碎片数量都为209,用不确定因素剔除法将所有碎片分为11类,每类碎片的数量应大于或等于19张。由匹链追踪法对各类碎片类间拼接得到11张新的碎片,再用匹链追踪法对新的11张碎片进行拼接复原后得到一张完整的图片。
2.左右边上碎片的查找
在matlab平台下分别将附件3和附件4中的209个碎片数据读入,二值化后存入包元数组A{i}(i=1,2,…,209)中,得到209个180行×72列的包元数组。通过碎片在包元数组中的数据特征找出左边和右边上留有空白的碎片,这些碎片中左右边空白宽度大于空白宽度平均值的碎片共22张碎片,分别为左边上的11张和右边上的11张碎片。
3.行分类之不确定因素剔除法
把209张碎片分为11行,每一行有19个碎片。对于11行碎片,找出最左边上11张碎片和最右边上11张碎片,确定属于同一行的左右边两个碎片,所有碎片中同一行内数据不全为1的行涂黑(如图1、图2),同一行中的两碎片必有共同的数据特征部分,称为确定因素,非共同数据特征部分则称为不确定因素,该共同数据特征也是该行中其他碎片的共同数据特征。保留确定因素部分数据,剔除不确定因素部分数据,对两碎片确定因素部分的相同部分取百分比(称为确定因素相似度),并设定阙值,大于这个阙值的归为同一类,可以得到每类的碎片个数≥19个。
二、双面横纵切碎纸片的复原
附件5中的碎片是由双面文件横纵切所得,碎片的数量相比附件3和附件4大大增加,除了虽贫的数量上增加以外,对于该附件中碎片的拼接复原与单面横纵切的解题思想很解题步骤完全一样,所以我们用单面横纵切碎片的拼接复原模型可以快速得出最后结果。
附件5中碎片正面和反面拼接顺序如表4和表5:
三、结束语
模型仅适用于规则黑白碎纸片的拼接,不适用于其他碎纸片的拼接,在一些特定时刻需要进行人工干预。模型从实际出发,针对中、英文,单、双面, 横纵切的碎片拼接复原给出了具体的解决方案, 具有一定的合理性,结构简单,且大量运用 Matlab编程,减少了计算,便于问题的解决和模型的建立。
参考文献
[1]贾海燕.碎纸自动拼接关键技术研究[D].长 沙:国防科学技术大学,2005.
[2]罗智中.基于文字特征的文档碎纸片半自动 拼接[J].计算机工程与应用,2012,(05):07-210.
[3]刘跃虎,王飞,刘晓东,等.一种特征矩阵的相 似性度量方法及其在图像检索中的应用[J].模式识 别与人工智能,2006,19(04):497-502.
[4]吴礼斌,闫云侠.经济数学实验与建模[M].天 津:天津大学出版社,2009.
[5]许志影,李晋平.MATLAB 及其在图像处理 中的应用 [J]. 计算机与现代化,2003,94(04): 64-65,69.
[6]周广芬,李鹏,杨久义.利用 MATLAB 图像 处理工具箱进行图形数字化的研究[J].河北科技大 学学报,2005,(04):309-311,321.
[7]高培旺.一种改进的单调增强单纯形算法[J].徐 州工程学院学报(自然科学版),2013,28(04):5-10,38.
[8]朱家明,王犁,童金萍,等.我国就业人数的主 要影响因素分析及前景预测[J].数学的实践与认识, 2010,40(15):57-70.
作者简介:张强(1989.2-),男,生于贵州省威宁彝族回族苗族自治县黑石头镇三河村,现就读于六盘水师范学院物理与电子科学系应用物理学专业2012级本科班。
陈毅(1990.5-),男,生于贵州省松桃苗族自治县太平营乡平干村,现就读于六盘水师范学院物理与电子科学系应用物理学专业2012级本科班。
申贵(1992.1-),男,生于贵州省遵义市吴川县泥高乡,现就读于六盘水师范学院物理与电子科学系应用物理学专业2012级本科班。
王立威(1985.11-),男,生于重庆市云阳县毛坝乡,现任六盘水师范学院教师,讲师职称,研究方向:智能计算与仿真应用。
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-133-71566-1.html
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用