论文部分内容阅读
在网络高度发达的今天,搜索技术能使人们快速的从海量的数据中找到有用的信息,因而在现代生活中扮演着越来越重要的角色。对于文本内容的搜索,已有非常成熟的技术,而对于多媒体内容的搜索,目前大多还停留在对文本属性和标注的搜索阶段,对于基于多媒体内容的搜索,人们还在积极的探索之中,
本文的工作是研究并开发了一套音乐搜索引擎系统。该系统提供多种搜索音乐的途径,不仅包括了按传统的按文本属性(如歌曲名,歌手,作者,歌词等)的搜索,还包括按音乐旋律的搜索。对于按旋律的搜索,本系统提供了两种输入旋律的界面,一是钢琴键盘弹奏输入,二是哼唱输入。
本文的主要工作和贡献包括:
1.设计并开发了完整的音乐搜索系统,该系统是基于Web界面的B/S结构,实现了音乐信息的收集,分析,索引以及在线搜索等所有环节。实现了文本,哼唱,弹奏三种用户搜索界面。
2.在音乐旋律索引环节,提出了“旋律片段”的方法,该方法可将音乐旋律的索引和搜索与文本的处理方式统一起来。基于“旋律片段”的音乐旋律倒排索引显著地提高了搜索的效率。
3.在哼唱旋律分析环节,改进了对于哼唱信号的分析方法,增强了哼唱旋律的识别的鲁棒性和准确度。
4.在数据抓取环节,开发了基于规则的Web定向数据抓取系统,该系统可以用最少的网络流量,高效准确地抓取Web网站的数据,并自动将数据分类格式化存储。
本系统基于Java平台开发,运行于Linux服务器,使用开源软件平台搭建系统的运行环境。最小化客户端具有良好的跨平台特性,可以运行于Windows和Linux系统以及经过较少的改动移植到嵌入式设备中。