非结构化数据本体及相关算法研究

被引量 : 0次 | 上传用户:tyllr82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着社交网络、云计算、大数据等概念及技术的出现,无时无刻都有大量的数据产生,其中以文本、图片、音频、视频等类型为代表的非结构化数据占总数据量的75%,且比值还在逐渐加大。同时,大数据背景下,数据的实时共享及分析将带来不可估量的经济价值,同时也极大地推动了社会的进步,而这一切的前提基础在于对数据的有效管理,其中对于非结构化数据进行合理的管理更加显得尤为重要。对于非结构化数据的管理一直以来是一大难题,主要体现在非结构化数据类型多样化,没有预定义规则对其进行描述;针对于不同的非结构化类型数据,具有不同的管理技术,难以统一表示。本文针对以上问题,主要围绕非结构化数据本体研究这一中心,从图像语义自动标注,到建立相关的非结构化数据本体模型,针对模型,提出了相关算法,最终实现对非结构化数据的有效存储及检索这一目的。为实现非结构化数据的语义特征自动获取及自动标注,提出了一种针对图像语义的自动标注方法,通过利用图像底层特征与其场景语义之间的映射关系,将底层特征转换为可实现比较的二进制字符串形式,从而以图像检索方式实现了图像语义的自动标注,实验结果表明,该方法是有效的。为实现非结构化数据的存储及检索,在建立非结构化数据本体模型中,从数据自身特征出发,将非结构化数据以其自身的基本属性、语义属性以及特征属性等信息进行描述,从而将对非结构化数据管理问题转化为针对于相对结构化的数据属性管理问题,进而引入合适的动态后继树索引模型,使得对于非结构化数据的管理方法,具有支持海量数据、动态更新实时性以及满足复杂检索条件的优势。最后通过几个复杂检索示例,验证了该方法在管理非结构化数据上的可用性。
其他文献
文章在调查的基础上,分析了黔南民族师范学院243名大学英语学习者学习动机、观念及学习策略的特点,提出了英语学习策略指导的必要性和紧迫性。
<正>据经济合作与发展组织(OECD)2019年3月7日消息,OECD于当日发布了《墨西哥学校质量和公平的坚实基础》(Strong Foundations for Quality and Equity in Mexican Schools)
婚前财产公证正在以缓慢的速度让世人知道它的存在,但真正可以接受它的人却微乎其微。至今,报纸上依旧报道着即将步入婚姻殿堂的情侣因为婚前财产公证而不欢而散。为什么这么
水利水电工程建设是一项系统和复杂的工作,在施工的过程中离不开爆破技术。在工程建设中,运用爆破技术具有重要的现实意义,它有利于保障施工进度,提高施工质量。文章结合水利
21世纪的现代城市消防已进入了一个以高科技装备为主的新火灾时代,现代火灾的扑救也不断出现着新的难题。隧道上层内有车辆起火,普通消防车太高开不进隧道;高架道路上车辆起
动物实验已经表明甲基苯丙胺(以下简称苯丙胺)滥用会伤害参与多巴胺传送功能的脑细胞.目前NIDA资助的研究工作对苯丙胺滥用者戒断一段时间后,其多巴胺神经递质的变化以及这种
失眠是临床常见的疾病,西医治疗失眠的药物副作用较明显,中医治疗失眠的方法多种多样,导师冶尕西主任医师将失眠的总病机归纳为阴阳不交、心神失养,治以调节阴阳、滋养气血、
<正>冀东皮影又称"乐亭影","滦州影"、"唐山皮影"等,相传由明万历年间(1573-1620)滦州安各庄秀才黄素志所创,迄今约有400年的历史。在漫长的流传岁月中,不断进化发展、变换形
目的:研究基于中医针灸治疗脑瘫患儿语言障碍的临床效果。方法:在我院收治的脑瘫患儿中随机选择36例作为研究对象,均来自2015年2月-2018年3月,分别作为对照组和实验组来进行
现代无线通信的频谱资源正在不断向更高频率扩展,有必要设计出能够兼容高频谱资源和现有通信频谱资源的双频通信系统。滤波器是通信系统中进行信号过滤的重要器件,双频带通滤