基于仿射传播算法的城市航空便利性分析

来源 :硅谷 | 被引量 : 0次 | 上传用户:gwzdx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 通过识别一组代表点来聚类数据对于探测数据模式是非常重要的,随机抽取数据点集合后反复修正可以找到这些代表点。传统的聚类算法存在聚类速度慢、效果差的问题,Frey与Dueck在Science发表的仿射传播(Affinity propagation,簡称AP)算法对数据聚类的误差要小于其它方法,并且所用时间较短。本文将分析和对比K-means、AP算法两种聚类算法,并利用AP算法分析航空公司运营的国内城市航空便利性问题,城市的相似值用国内43个城市营运机场之间航班预估时间负值标记。
  关键词 聚类;仿射传播算法;K-means算法;航线
  中图分类号:TP391.41 文献标识码:A 文章编号:1671—7597(2013)051-072-03
  航空公司的航线网络对其盈利能力、运行效率和客户服务质量有着重要的影响。近些年,国内航空业务增长性趋势明显,各航空公司不断加强航线的拓展和航空枢纽的建设,航线网络越趋复杂,目前国内对航线网络的研究相对落后,缺乏对航线网络运行数据的定量分析,在航线的制定、评估和设计上仍以粗放的感性认识和经验判断为主。因此,以市场需求以及航空公司的机队规模、运力为参考,合理布局航线网络尤为重要。本文仅以航空公司生产排班计划为基础,采用先进的聚类算法,对城市航空便利性进行初步的探讨和分析。
  1 聚类算法
  聚类(Clustering)是指根据“物以类聚”的原理,将本身没有类别的数据聚集成不同的组,聚集后的一组数据对象称为类(Cluster),其结果需满足同一个类内的数据对象之间高度相似,并且不同类之间的数据对象有较高的差异性。
  聚类分析的算法可以分为:划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based Methods)。
  经典的K-means和K-centers都是划分法。
  1.1 K-means算法
  由于该算法的计算复杂度是O(nkt),其中n是对象的总数,k是预期结果聚类中心的个数,t是迭代的次数,通常k<  1.2 AP算法
  Affinity Propagation (AP) 算法是Brendan J. Frey和Delbert Dueck在Science杂志上提出的一种新的聚类算法。与k-means算法不同的是,AP算法无需事先设定k值,其核心思路是根据n个数据点之间的相似度进行聚类,数据点间的相似度既可以是对称的,也可以是不对称的,如在本文后续描述中的城市对间的距离(航班时间)就是不对称的。这些相似度组成n×n的相似度矩阵S。AP算法将所有的数据点都作为潜在的聚类中心,称之为exemplar,因此不需要事先指定聚类数目,而需要为每个点设置个实数值s(k,k),该值也被称作参考度p (preference),s(k,k)值较大的点更有可能选为中心点。中心点的数量受preference影响。若已知所有的点被选为中心点的概率相同,则可将所有点的preference设置为相同的值(不同的值可能会导致不同的聚类数量),该值可以为所有相似度的中值或者最小值。AP算法通过吸引度r (responsiility)和归属度a(availability)控制算法的收敛。r(i,k)是从点i发送到点k的数值消息,反映的是k点对i点的吸引程度。a(i,k)则从点k发送到点i的数值消息,反映的是i点对k点的归属程度。r(i,k)与a(i,k)越强,代表k点成为聚类中心的机会就越大,同时i点隶属于以k点为聚类中心的聚类的机会也越大。该算法就是通过不断的迭代过程来更新数据点之间的吸引度和归属度,逐步精炼产生m个高质量的聚类中心,同时将其余的数据点归类给这m个聚类中心,形成以这m个聚类中心为中心的聚类。
  基于来自邻居的正的响应度来评价k是否适于作中心点。
  3 结束语
  本文利用AP聚类算法对国航通航的国内43个城市航空便利性进行聚类分析,实验结果较客观的反映出各城市航空便利性的真实情况,进一步的研究分析可以考虑覆盖国内所有通航城市,并通过引入航班实际飞行时间数据以及调整s(i,i)值优化算法,提高算法的精确性。另外,也可通过采集和分析城市GDP数据、城市流动人口数据、客座率、航班生产成本数据、收入数据等,辅助航空公司航线分析与优化。
  参考文献
  [1]FREY B J,DUECK D.Clustering by passing messages between data point[J].Science,2007,315(5814):972-976.
  [2]王开军,张军英,李丹,等.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. [3]董俊,王锁萍,熊范纶.可变相似性度量的近邻传播聚类[J].电子与信息学报,2010,32(3):509-514.
  作者简介
  郑志敏(1980-),男,浙江温州人,主要从事信息技术研究和企业信息系统的开发。
  徐青(1979-),男,浙江杭州人,主要从事信息技术研究和企业信息系统的开发。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
摘 要 煤炭是国民经济发展和人民生活的重要基础,也是我国目前乃至今后相当长时期内的主要能源。随着煤矿信息化工作的深入,各种各样的自动化监控以及信息系统在矿井生产中的普遍应用。本文就煤矿安全信息化管理系统展开分析研究。  关键词 煤矿安全;信息化;管理系统;建设研究  中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)051-049-03  煤炭是国民经济发展和人民生活
摘 要 6LoWPAN可以动态分配16位的短地址,于是6LoWPAN工作组提出了适配层的分层路由算法(Hierarchical Routing),即HiLow算法。大部分情况下PAN Coordinator和Common Coordinator的能量、运算能力和存储空间都比普通节点丰富,为了充分运用PAN Coordinator和Common Coordinator的资源,使各节点的负载更加均衡,
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
摘 要 本文简要介绍了现代数字信息所具有的价值及保障其安全的意义,重点对计算机信息数据所面临的安全威胁以及信息数据各应用环节中的加密技术进行了分析和研究。  关键词 计算机信息;价值;安全威胁;加密技术  中图分类号:TP393 文献标识码:A 文章编号:1671—7597(2013)051-061-01  计算机技术及数字信息处理技术已经成为人们生活工作的主要信息沟通手段,应用这些技术可以有效的
摘 要 随着网络技术的升级和软件行业的飞速发展,盗版软件迅速在全球范围内蔓延开来,而正版软件的非法使用和盗版软件均严重制约了全球经济的发展和软件产业的深入发展。因此,加强软件保护技术的研发具有现实意义。自20世纪90年代末期以来,全球科学家均纷纷致力于混沌理论应用的研究,并基于此,提出了一种基于Logistic映射的排列软件水印方案。本文就该方案展开讨论。  关键词 Logistic映射;排列图;
摘 要 海塔盆地是大慶油田持续稳产的一个有力接替区块,2010年以前在该区施工3400 m左右的定向井钻井周期需要70天左右,严重影响勘探开发效率,通过影响钻井速度原因分析,进行了井身结构优化,并对各段井眼轨迹控制技术进行研究,优选高效个性化高效PDC钻头,在井深增加50 m的前提下,钻井周期缩短23d,机械钻速提高30.96%。  关键词 井身结构优化;轨迹控制;高效PDC钻头;原因分析  中图
摘 要 SF6断路器由于自身的显著优点被广泛的应用在电力系统网络当中,并成为系统构成的重要组成部分。SF6断路器在电网系统中的主要作用就是保护和控制电力输送系统的运行安全性和稳定性,从而确保电力输送的及时、安全、连续、可靠。本文对SF6断路器的相关信息进行简单的概述,并就其状态检修技术进行简单的分析和讨论,从而更好的推动和促进SF6断路器的应用推广情况。  关键词 SF6断路器;状态监测;检修技术
摘 要 随着信息技术的不断发展进步,我们已经进入了网络信息的时代。网络信息在人们生产和生活中发挥着巨大的作用,网络信息更新也达到前所未有的程度。本文对网络信息机房UPS供电系统的设计方案进行了研究,先分析了网络信息机房UPS供电系统的基本要求,然后再研究影响网络信息机房UPS供电系统容量的因素,最后论述UPS供电系统的设计方案,并且提出了自己的观点。  关键词 网络信息;机房;UPS;供电系统;容
摘 要 提出了一种基于CAN-bus的煤矿网络广播系统的设计方案。该系统具有数字化、全双工、组网简单等特点。在需要以太网传输的区域,系统可通过以太网(TCP /IP)光缆或电缆传输通讯;在需要电缆通讯的区域,系统可通过CAN-bus总线电缆传输通讯。实际测试结果表明,该系统具有分组管理、紧急广播、双向通信等功能,提高了应急救援的效率。  关键词 煤矿网络广播;语音通信;紧急广播  中图分类号:TP