论文部分内容阅读
软件构件库是软件复用中管理可复用构件的基础设施,它为基于构件的软件开发中的构件生产和构件复用两方面工作之间建立了桥梁。构件库中的构件是来自软件生命周期各个阶段的可复用产品。要减小复用成本,使复用者能较正确地理解构件,更好地复用构件,就需要对构件进行分类。
随着Internet技术的发展,在互连网上出现了越来越多可以被利用的构件。本文将构件类型主要定位在Web Services上。考虑到从互联网上可获取的WebServices数量巨大,并且Web Services描述文件WSDL 可以提供除文本信息以外其它信息(例如结构信息),现有的文本自动分类技术已经不能满足要求,因此,本文工作重点将放在如何设计并实现一种基于文本分类的可扩展WSDL 自动分类系统,将那些结构信息等也可以作为分类特征,并且可以选择不同的自动分类算法,从而对Web Services进行自动分类。
文中首先对研究背景和相似工作现状作了概括性介绍和分析,明确了本文需要解决的问题。然后通过对自动分类技术和可扩展架构的研究,提出了本系统详细的设计与实现方案。本文工作以北京大学软件工程国家工程研究中心所承担的国家十五期间“863”高技术课题:“基于Internet、以构件库为核心的软件开发平台”为背景,设计并实现了一种可扩展的构件自动分类工具。该工具可以对WSDL 文件实现两个功能层次上的分类:
●基于文本信息的分类(基本功能)●基于扩展的分类属性特征的分类(高级功能)该工具的功能通过数据标识功能模块、分类属性特征抽取功能模块、算法实现功能模块、结果分析功能模块、发回构件库功能模块来协同工作实现。
最后,本文通过实验的方式证明了可扩展 WSDL 自动分类工具的可用性与正确性。