【摘 要】
:
HBase(分布式存储数据库)是大数据存储领域的热点技术,为信息化快速发展带来的存储问题提供了有效的解决方案。针对HBase检索低效以及企业对系统的低耦合、高扩展性需求,通过分析HBase检索困难的原因,设计一个索引中间件。利用Lucene(全文检索引擎工具)技术构建二级索引,以统一接口的形式提供服务。经过实验验证,索引中间件在保证写入需求的情况下,有效地改善了查询性能,在千万级数据量下仍然达到毫
论文部分内容阅读
HBase(分布式存储数据库)是大数据存储领域的热点技术,为信息化快速发展带来的存储问题提供了有效的解决方案。针对HBase检索低效以及企业对系统的低耦合、高扩展性需求,通过分析HBase检索困难的原因,设计一个索引中间件。利用Lucene(全文检索引擎工具)技术构建二级索引,以统一接口的形式提供服务。经过实验验证,索引中间件在保证写入需求的情况下,有效地改善了查询性能,在千万级数据量下仍然达到毫秒级检索,并且耦合性低,易于部署,可以快速整合到已有系统中,具有较强的泛用性。
其他文献
作为农业大国,我国在社会建设与经济发展中,农业产业都占据着重要的地位,近年来,对于实际开展的农业工作来说,每逢三夏三秋阶段,多数地区的农户为了抢收抢种,普遍会做出将作
一、农业经济管理对农村经济发展的促进作用rn农村经济建设过程中需要完整的保障制度,要明确农村经济发展存在的管理弊端,给农村经济发展提供安全保障.近几年农村实施的医疗
农业是我国的基础产业,农业的发展决定了我国的经济基础是否稳健,当前我国提出了建设新农村的任务,但是近些年来我国农业经济发展情况并不乐观,基于此,本文对农业经济管理中
摘要:诚信是中华民族优秀传统文化的道德精髓,是公民基本道德规范,是社会主义市场经济的重要基础,也是构建社会主义精神文明和提高社会文明程度的思想支撑。中国特色社会主义进入新时代,人的全面进步和社会的全面发展都离不开更高质量的诚信建设。建设诚信社会是促进社会治理现代化的内在要求,但部分个人、商业和政府仍存在一些与之不相匹配的诚信滑坡问题,社会诚信意识和信用水平亟待提高。本文认为,在推进诚信社会建设的进
麦穗数量检测对于作物表型参数计算、产量预测和大田管理都具有重要的意义。为了解决人工计数工作量大且容易出错的问题,提出了一种基于You Only Look Once (YOLO)的麦穗目标检测与计数方法。首先利用大量小麦图像对深度神经网络进行训练,然后利用神经网络对小麦图像进行麦穗目标检测与计数,最后对神经网络目标检测的准确率和召回率进行计算评估,并通过分析检测结果验证其鲁棒性。分析结果显示,所训练
保护生态环境是每个公民应尽的义务,其中我国森林保护计划中,生态公益林保护是重要组成部分之一.做好生态公益林工程保护管理,对于我国环保事业的长效健康发展有着十分积极的
本文立足粤港澳大湾区的战略定位和发展目标,在梳理国际一流湾区特征及趋势的基础上,通过查询美国、日本、香港、澳门、国家统计局、广东省统计局、有关国际组织官方网站和国
为了从大量微博信息中提取重要事件并预测发展趋势,基于微博的地理特征和时间特征,提出了一种对微博进行聚类和索引的多层次方法。该方法使用X均值聚类,根据用户输入的关键词建立索引,并根据索引自动评估聚类的数量。同时,基于情感特征对微博进行聚类,创建包含负面情感微博和正面情感微博的两个聚类。实验结果表明,所提索引机制不仅便于搜索,而且有利于检索任务。与其他微博聚类方法相比,所提方法在DBI指标和S系数两个
一直以来,如何准确便捷地监测能见度都是减少交通事故工作关注的重点所在,而传统的使用能见度仪检测能见度存在造价高、范围小等缺陷。随着深度学习研究的不断发展,使用深度学习估算能见度也变成现实。本文建立了一种VGGnet 16卷积神经网络模型,经过Dropout(丢弃层)和数据增强优化后,使用监控图像及其对应的能见度值对其进行训练。结果表明,优化后的模型能有效提升训练精度,在小数据集上也能实现非常好的能
文章研究了2012年原中国银监会颁布的《绿色信贷指引》对我国56家商业银行造成的政策冲击,考察了前者对商业银行风险承担的影响。通过DID和PSM-DID分析发现绿色信贷会增加商业银行风险承担,而边际动态检验法的实证结果显示绿色信贷对商业银行风险承担负向影响的速度逐渐变缓。为了排除商业银行规模对实证结果的影响,文章对样本进行异质性检验,结果显示绿色信贷会抑制国有商业银行风险承担,而其他类别银行风险承担增加。文章最后提出推动绿色信贷发展,防范银行风险的政策建议。