互联网信息内容管理若干技术研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zxebabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国际互联网作为一个全球性的信息资源网络,正在对经济、政治、文化、科技、军事等各个领域产生重大影响,深刻改变着人们的生产、工作和生活方式,对推动经济发展和社会进步起到了积极作用。同时巨大的开放信息源也使一些恶意的和不良的(反动、色情等)信息内容趁机而入,成为用户获取有效信息的严重障碍。世界各国对互联网治理工作越来越重视,研究开发智能、高效、实用的互联网信息内容管理技术是一项十分重要的课题。  本文综合运用粗糙集理论、机器学习、模式识别、数据挖掘、知识发现、中文信息处理、人工智能等学科的相关知识,通过分析各类不良信息的特征,结合现有的一些成熟先进的文本信息处理方法,深入研究了适合不良文本信息过滤的模型、文本预处理技术、文本特征选择技术、过滤算法以及相关应用等,设计实现了一个电信级网络信息内容监控系统。  本文所做的主要工作如下:  1.分析了国内外互联网内容管理技术发展现状;讨论了互联网信息内容管理技术框架;研究了多种信息获取、信息内容的分析、加工和处理、互联网信息内容服务等互联网信息内容管理相关关键技术  2.论述了信息抽取的概念,分析了信息抽取常用方法及发展趋势;分析了多种不同类型的Web信息抽取算法;研究了数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题。采用基于PAT-array的模式发现算法,结合基于本体的
其他文献
种子休眠和土壤存留是植物自身调节后代繁殖时间节律以适应生长环境的最重要方式。喀斯特是一种特殊的生境,在陆地生态系统中占有很大面积,植物种子休眠对这种生境适应的研究缺
目的:通过研究NCI-H508中双微体的分子结构来揭示双微体的发生模型。对扩增子和断裂点进行生物信息学分析,揭示双微体发生的分子机制。  方法:本研究组前期利用Affymetrix的Ge
金刚石具有独特的电学、光学、热学和物化稳定性能,基于金刚石薄膜的日盲型紫外光探测器的研究已成为该领域的研究热点。金刚石薄膜探测器性能很大程度上取决于薄膜质量、器件
为了保证列车在高速、大运行密度的条件下安全运输,铁道部制定了中国列车控制系统(CTCS)标准,并基于欧洲列车控制系统(ETCS)展开了对CTCS技术的研制和开发。本文在对CTCS中的
无运动部件变焦(optical zoom without macroscopic moving elements)是指在没有光学部件宏观上相对位移的前提下实现光学变焦的过程。作为一种新型的光学变焦技术,宏观运动部件的消除不但可以使其应用到对空间、功耗或稳定性有苛刻要求的场合,而且能够提升变焦的时效性,因此极大地拓展了变焦技术的应用范围。目前,美国、德国、法国、中国等均已开展了将无运动部件变焦应用于
目的:前列腺癌(prostatic carcinoma,PCa)是老年男性常见疾病,其发病率位居西方国家男性恶性肿瘤第二位。我国发病率呈上升趋势。肿瘤的转移及肿瘤细胞无限增殖是导致前列腺癌患
计算机技术飞速发展,互联网由单纯的“读”向“写”迈进,人们由被动地接收向主动创造互联网信息转变。个人移动通信设备日益普及,分布式网络应用程序需求不断扩展,基于PC机的
微Fabry-Perot腔可调谐滤波器在超光谱成像、密集波分复用的光通信系统中有广泛的应用前景。它克服了传统滤波器体积大、功耗高、价格昂贵等缺点,具有调制速度快、光谱调节范
随着科学技术的不断发展,产品的数字化、精确程度在很多系统中起着至关重要的作用。很多产品需要基于模数转换器(ADC)进行测量,将检测的模拟信号表示为数字信号,以便于更好地传
许多研究表明带有GC端粒的低聚核苷酸可以自重组形成G-DNA四链体。G-DNA四链体是DNA的一种二级结构,它存在于某些富含鸟嘌呤G的DNA序列中。G-四链体结构的形成能够维持基因组