基于正例和无标记样本的链接预测方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:wangtian575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
链接预测是根据网络中已知的结构,对其中缺失的链接进行预测。链接预测作为网络数据分析的重要研究内容,在探究网络演化规律、数据补齐等方面有重要的研究意义,在推荐系统、生物信息和科研合作等领域也有重要的应用价值。从监督学习的角度,链接预测可看做二分类问题。其中,以节点对为样本,存在链接的节点对为正例,不存在链接的节点对为负例,通过构造链接预测分类器解决链接预测问题。由于网络的大规模性和不确定性,其中大量观察不到链接的节点对更应该看做无标记样本,因此,如何从大量无标记样本中选择可靠负例成为构造链接预测分类器的难点。同时,传统的分类模型均建立在样本与总体是独立同分布的假设之上,而网络中的样本并不满足这一假设。本文研究内容将网络中可观察到链接的节点对作为正例,观察不到链接的节点对作为无标记样本,研究仅有正例和无标记样本的链接预测问题(基于正例和无标记样本的学习简称为PU学习)。本文旨在解决基于正例和无标记样本的链接预测中缺乏负例、网络中的样本与总体不满足独立同分布假设的问题。主要研究成果如下:首先,本文提出了基于PU学习的链接预测方法。该方法利用网络的社区结构信息和集成方法,主要解决如何从大量无标记样本中选择可靠负例以构造链接预测分类器的问题。通过在真实数据集上与已有选择可靠负例的方法比较,实验表明该方法选择的可靠负例能够构造出预测效果更好的链接预测分类器。其次,本文提出了基于PU学习和随机游走的链接预测方法。基于PU学习的链接预测方法所构造的链接预测分类器都是建立在样本与总体满足独立同分布的假设之上,而网络中的样本并不满足。针对上述问题,本文利用链接预测分类器以及网络的社区结构信息对叠加的随机游走指标进行改进,提出一种新的链接预测方法。实验表明,从整体的预测结果看来,该方法能够进一步提升链接预测的精度。综上,本文针对基于正例和无标记样本的链接预测中存在问题,提出了相应的解决办法,提高了链接预测的精度,为基于正例和无标记样本的链接预测问题提供了新的解决方法和思路。
其他文献
裸藻属是一类单细胞鞭毛藻,其叶绿体有3层被膜,具叶绿素a和b,被认为起源于某种单细胞绿藻的次级内共生。其中纤细裸藻(Euglena gracilis)的叶绿体对多种化学和物理因子敏感,如紫外线、持续高温、链霉素等都可以诱导藻株的褪色,使其成为褪色突变株。本实验用氧氟沙星处理纤细裸藻,获得了5个褪色突变株,利用已知的纤细裸藻叶绿体基因组设计引物,在5株褪色突变株中均发现了12个残留质体基因,分别为r
移动边界扩散问题的控制方程为热传导扩散方程,其求解域物理边界随着时间的变化而变化。按照对移动边界信息的了解可以分为两类:一类是移动边界的演化方式已知,求解场变量的
宁夏银川地区气候炎热,紫外线辐射强,过强的UV辐射给葡萄品质及葡萄的正常生长带来不利影响。本文探索了葡萄生长发育过程中UV辐射对葡萄叶片结构及果实中糖、酸、氨基酸、黄
甲醛(HCHO)是常见的挥发性有机物,是威胁人们身体健康的主要室内气体污染物之一。催化氧化技术目前被认为是可以最有效的消除甲醛污染的方法之一,其利用催化剂的作用,在室温下直接用空气中的氧气将甲醛完全氧化为二氧化碳和水。其中,负载贵金属催化剂由于其高的室温催化活性,可在室温下催化甲醛完全氧化,被认为是最具潜力的氧化消除甲醛的催化剂。多年以来,碱金属促进剂对催化剂性能的促进作用一直被广泛研究。对于负载
川牛膝是重要的川产道地大宗药材,市场上种质资源混杂,严重影响临床用药安全。本实验运用组织切片法和显微电镜观察法,鉴定正品川牛膝“宝膝1号”与伪品麻牛膝植株组织形态,
云计算具有强大的计算能力和存储空间,其依靠资源共享为企业和用户提供方便灵活的服务,并以最低的成本实现利益的最大化。虽然云存储给数据存储和使用带来方便,但存储在云服
近年来,禽白血病病毒J亚群(ALV-J)在全球范围内的爆发引发了大规模的禽类死亡,给禽类的养殖业发展带来巨大的经济损失。目前,还没有针对ALV-J的有效疫苗和治疗药物,因此,寻找简单、高效且灵敏度高的方法检测ALV-J变得至关重要。免疫传感分析是将免疫检测与合适的传感器相结合的一种检测技术,具有灵敏度高、响应速度快、简单易操作等优点,为禽白血病病毒的检测提供了有效的检测手段。在免疫传感器的构建中,
微流体运输技术在医疗、化学分析、生物工程等领域的应用广阔,发展迅速,同时对研究新型微流体转运技术也提出了更高的要求。蜜蜂作为典型的膜翅目访花昆虫,具有特殊的口器结构,可以高效的摄取粘性花蜜和其他高浓度溶液。蜜蜂口器以及摄蜜机理的研究,对微流体运输技术的研究提供新的思路,因此受到学者的广泛关注。前期的研究表明,短吻和长吻蜜蜂都可以通过口器结构的周期性伸缩变形,实现花蜜的输运。本文通过研究蜜蜂的摄蜜过
多光子成像是一种重要的成像技术,以其对生物体无损伤、穿透深度大等特点广泛应用于对活体生物样品的观察。在波长选择方面,用1700-nm波段作为激发光的多光子成像可以减少生
乳酸菌作为益生菌,广泛存在于自然环境和人体肠道内,具有多种益生功能,同时其在生长过程中代谢产生的胞外多糖(Exopolysaccharide,EPS)表现出独特的物理化学特性和生物学活性,使乳酸菌EPS成为研究者们关注的热点。本研究从传统四川泡菜中筛选出一株高产EPS的乳酸菌,并对其进行种属鉴定和产生的EPS的结构表征分析、体外抗氧化性和降血糖潜力等研究,其主要结果如下:(1)运用产粘菌落法和产多