敦煌遗书缀残中的相关残片检索技术研究及系统实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:coldcoffee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
敦煌遗书是指敦煌莫高窟中出土的一批具有重要研究价值的古代文籍。现今敦煌遗书由于出土时代对文物不重视等各类原因,散布在世界各地,不便于学者们的研究工作。2012年开始的国家重点项目敦煌遗书数据库的建设,使学者们能够更方便地在线对敦煌遗书进行研究。由于年代久远,敦煌遗书中存在大量残片残卷,其中许多是可以缀合的。但由于遗书整体数量众多,人工缀合费时费力。随着数字化技术的发展,利用图像检索技术帮助进行敦煌遗书缀残工作成为可能,这既是敦煌遗书相关研究的基本需求,也是敦煌遗书数据库项目的重要功能。在数字化敦煌遗书缀残工作中,核心问题是相关残片检索,即可以缀合的残片检索,这也是本文的主要研究课题。本文的研究工作主要内容如下:首先,针对遗书缀残的需求,确定了遗书残片的材质、边缘和字形三个主要特征,并提出了基于这三个特征组成的遗书残片图像特征模型。针对遗书残片图像颜色组成类别较为明确的特点,设计了筛选主次要颜色的方法,并利用主色调颜色直方图的思想设计了材质特征直方图表示材质特征。针对遗书缀残主要考虑残片图像左右边缘匹配程度的特点,提出了基于Canny算法的遗书残片左右边缘提取算法,并利用左右边缘点集表示边缘特征。研究并综合SURF算法和最大最小聚类算法,设计了字形特征提取算法,并利用每个字的特征点集表示字形特征。其次,研究了各个特征的差异度定义,并综合提出了遗书残片图像差异度定义以及基于遗书残片图像差异度的相关残片检索算法。研究了利用EMD距离定义材质差异度的方法。设计了统一图像边缘基准的方法,并利用统一基准后的Hausdorff距离定义边缘差异度。设计了建立字形方向向量直方图的方法,然后利用EMD距离定义字形差异度。并在以上三者基础上,提出了遗书残片图像的差异度定义,并提出了基于此差异度的相关残片检索算法。该算法输入一个残片图像集合,然后先将所有图像根据材质特征聚类,然后分别计算聚类中所有图像间综合差异度,并根据朝代信息进行过滤,最后输出残片集合中每一张残片的对应匹配残片。最后,针对国家重点项目敦煌遗书数据库的二期工作需求,本文设计了敦煌遗书数据库二期系统的主要模块,实现了其中的一系列高级功能。并将之前提出的相关残片检索算法应用到敦煌遗书数据库项目中,完成了相关残片浏览这个二期项目主要功能。
其他文献
随着我国家禽养殖业不断发展,消费者对羽毛产量及其品质的要求也在逐步提高。羽毛的形态、色泽、颜色等是反映鸡生长及健康状态的重要指标,羽毛质量与销售价格密切相关。影响
目的:研究分析急性脑梗死患者全脑血管造影致脑动脉狭窄的影响因素。方法:选取行全脑血管造影检查的急性脑梗死患者80例,对其脑动脉狭窄分布与影响因素之间的关系进行分析。
词汇是语言知识的重要组成部分,词汇教学对学生运用语言能力的形成至关重要。本文针对初中英语词汇教学中存在的问题,根据自己的教学实践和经验,指出英语词汇学习的重要意义,通过
目的:建立一种改良的hela细胞冻存和复苏的方法。方法:取生长状态良好的HELA细胞分别进行传统和改良方法冻存,于冻存后1年分别行传统和改良的复苏方法。用MTY法测细胞生长曲线,应
研究了胆甾醚类衍生物新的合成方法:以密闭反应釜合成法取代传统加热回流的方法。实验表明可降低原料叠氮乙醇的用量节约原料,而且其副反应少,产率较高(由60%提高到87%以上)。因
企业的设备管理工作是当今社会各界普遍重视的问题。设备管理工作是现代化企业管理的重要组成部分,也是决定企业生产能力和应变能力的关键所在。从理论和实践角度研究设备管
采用油酸钠-正戊醇-正庚烷-水组成的微乳液体系对水相中的Co2+进行萃取研究,考察了微乳液中油酸钠的浓度、料液与微乳液的体积比(R)、温度、接触时间等参数对萃取率的影响.实