基于改进的词袋模型图像分类算法研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:archer_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类进入信息化社会,国际互联网的快速发展使得信息量以指数化的速度增长,互联网上大量未被分类的数字图像作为一个巨大的挑战摆在了人们面前,传统的人工手动图像标注和分类不仅在时间上而且在效率上都不再能够适应要求,这就需要自动的图像类别标注和分类方法来应对这一挑战。近年来,词袋算法在图像自动分类领域取得了巨大的成就,然而经典的词袋算法在特征提取和图像表示阶段仍然存在着一些不足,因此对于经典词袋算法的改进是本文的研究重点。  本文提出了一种基于改进的词袋模型图像分类算法,主要工作如下:  首先针对经典词袋算法对图像提取的SIFT特征数目不稳定的不足,对图像分块,对每个图像块提取SIFT特征能够提高SIFT特征稳定性;单一特征无法全面表征图像信息,本文结合SIFT特征和方向梯度直方图特征,将两种特征融合进行特征提取。  其次在获取图像的表示阶段,提出一种与距离次序有关的权重分配方法,使得到的图像表示更加准确,针对经典的词袋分类算法丢失了图像空间信息的这一不足,将与距离有关的权重分配与空间金字塔相结合,形成了新的词袋模型图像分类算法。  本文使用Caltech-101数据库和15Scenes数据库对所提出的图像分类算法进行验证,并与经典的方法进行了比较,实验结果表明在上述数据库上,本文算法的分类准确率较经典的算法准确率高。
其他文献
方位分辨率与测绘带宽是合成孔径雷达(SyntheticApertureRadar,SAR)最重要的性能指标。常规SAR特别是常规星载SAR,其方位分辨率与测绘带宽指标不能同时改善。为了从体制上解决
现代图像通信的要求是将图像信息清晰、正确的传送到目的端,而图像信息是高维信息,内容复杂,数据量大,如果直接将图像信号进行传输,由于带宽有限,可能造成图像失真,并且传输速度低。
本文对锁阳多糖成分及其药理活性进行了研究。文章采用腹腔两次注射STZ(150+40)mg/kg体重的方法制备糖尿病小鼠模型,然后用浓度为高(200mg/(kg·bw))、中(150mg/(kg·bw))、低
数年以前,基于HTTP的网络业务由若干服务提供商以中央集中的方式提供,鲜有分布式服务器的存在。通常的情况是,单一服务器提供独有的网络服务,并且固定在某个IP地址上。现如今
当无线网络的解决方案在企业和公共场合接入的市场上取得一定进展时,家庭网络市场仍没有找到一种合适的无线解决方案。家庭网络市场具有一定的特殊性,它需要同时满足高数据传输
本文针对华北高产粮区农业水、氮过度投入换取食物高产和农业经济增长的不可持续发展问题,建立了农业水、氮利用的生态学调控途径与管理政策的分析方法。以我国北方第一个吨粮
中文自动分词是汉语自然语言处理领域一项重要的基础性研究工作,而随着新词的不断出现,中文分词结果中出现过多的“散串”,影响了分词的准确率。因此,新词发现已经成为中文自动分
学位
近年来,自动人脸检测与识别在图像处理和计算机视觉领域引起许多学者的关注。这一课题在智能监视系统、虚拟现实、高级用户接口、表情分析和基于模型的图像编码等方面具有广阔
2006年初,中国科学院上海应用物理研究听低温超导高频腔技术重卢实验室从日本高能加速器研究机构引进一套退役的移动式氦液化器系统,用于为超导高频腔的垂直测试试验提供液氦。