论文部分内容阅读
RDF数据是语义网上的一种重要数据。它们之间的关系需要推理机进行推理才可以获得,但是由于语义网上的RDF数据量规模性较大,语义网上传统的推理机不能很好处理这种大规模数据。搜索和推理技术相结合是处理该问题的重要方法之一,首先从数据集中搜索出有用的数据,通过提高并行推理的数据输入速度而加快推理速度。即在搜索的机制下使用并行推理技术会大大的提高处理的效率。本文所做的具体工作如下。
1.提出了并行搜索策略,该策略使用搜索插件从数据集中并行查找。然后提出两种并行搜索模型,第一种模型的特点是使用相同的搜索插件,从而提高搜索数据的速度。第二种模型用不同的搜索插件和一个负责起整合作用的搜索插件,负责起整合作用的插件接收不同插件搜索的数据后找出最重要的数据。根据元搜索理论,被所有的搜索插件都搜索到的数据是最重要的数据。此策略不但可以提高推理速度,还可以提高推理的精度。另外负载平衡问题和通信问题也会影响并行推理的效率,本文设计了两种并行推理模型,分别使用了同种类型的推理机和不同种类型的推理机。采用算法分别解决了负载平衡问题和通信问题,提高了推理的速度。
2.对并行推理中单个推理机的推理速度进行优化,则可以提高并行推理的整体速度。所以本文对RDF推理规则进行了分类和顺序调整。然后采用传递性规则和自反性规则分别对RDF和OWL数据进行推理。因为OWL数据之间的关系相当复杂,现在可以推理出父类和子类之间的关系,相比较于OWL数据,RDF数据之间的关系则没有这么复杂,所以在使用Jena推理机对RDF数据集进行时推理出了父类,父类的子类和子类的子类之间的所有关系。
本文的研究意义在于把并行推理技术引进语义网中,通过对并行推理的研究,可以对群决策支持系统,智能决策支持系统等提供新的理论方法和技术。本文提出的两个实验可以作为语义网研究中并行推理的一个研究范例,并最终为并行推理向实用化发展提供可行途径。