基于音频语谱图像识别的广告检索技术

来源 :第十一届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:tprgaefe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着我国广播电视事业的快速发展,对广播电视进行广告监测的重要性越来越突出。本文提出了一种基于音频语谱图像识别的广告检索方法,该方法把每个广告片段的音频转换成语谱图像,并通过boosting训练算法,从中提取可区分的、适合索引的特征以训练分类器。检索时,通过特征对齐,采用基于EM的迭代方法识别最匹配的广告。 实验结果表明,该方法可以快速准确地从广播电视中检索到广告,而且具有很好的鲁棒性,基于该方法开发的广播 电视广告监测系统已经得到了实地应用。
其他文献
  研究表明,基于隐马尔可夫模型的语音合成(HMM-based speech synthesis)中结合整体方差(Global variance, GV)模型的参数生成方法对于克服生成语音参数中的过平滑现象有较
会议
  TANDEM技术是目前主流语音识别系统中提升性能的重要手段之一,它基于训练数据和其所对应的正确标注来训练神经网络的参数。本文提出了一种基于解码中竞争信息对传统TANDEM
  本文提出了一种基于HHT变换的语音信号端点检测方法。首先,对带噪语音信号进行EMD分解,去除受噪声影响最大的第1层和第2层IMF分量,并通过计算每一层IMF分量的均值和方差,挑选
2009年末的经济和政策环境与当前环境有一定相似之处:海外大规模宽松及国内促进经济增长的“一揽子计划”刺激下,海内外经济均有修复,原材料价格底部抬升,市场也在积极的货币
期刊
  本文通过逆滤波方法实现了连续语流的声门波提取,并利用音节能量质点处的NAQ(Normalized Amplitude Quotient)来代替音节的总体NAQ从而使其更稳健,参数表现更简洁。然后,分析
会议
近几年以来,试验机在我国得到了迅速的发展,静负荷试验机也实现了生产与应用.拉力、压力和万能试验机广泛的应用于各种金属以及非金属的拉长、伸缩、剪切和剥离等试验过程中,
建筑的主要基本功能是提供舒适、温馨的居住环境,抵御自然生态系统的负面影响.屋顶防水施工时要考虑很多细节,如果施工不严谨会影响施工质量.例如,屋顶的淹水或漏水都会影响
在许多西方人眼中,中国电影所承载的文化意义,远远要超越电影本身的内核。功夫,就是在这样的一个被文化渲染的影像载体中,被全世界人所熟知的。七十年代,李小龙那敏捷的身手,把带有东方传统哲学意义的“功夫”,推广到了海外。而八十年代至今,又是一个叫成龙的男子,把传统意义上的中国功夫以一种崭新的面貌,传播向五湖四海。可以说,他们是将世界电影的格局拉向“准功夫”时代的英雄,是以一种榜样姿态立足于世界舞台的精神
  在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。 本文提出了澄清式人机对话系统结构,用于实现语音识别错误恢复,实现
农村信用社是主要为农业、农民和农村经济发展服务的社区性金融机构.为适应新时期的需要,中国人民银行和农村信用社逐步探索形成了适合农村特点的小额信用贷款方式.这是中国