论文部分内容阅读
随着经济的发展和技术的进步,人们的休闲时间与时俱增,恩格尔系数与时俱减,人们可支配收入大幅度增加,生活水平提高了,对旅游的需求也越来越大。旅游已经成为现代人生活中重要的部分,并且旅游者已不满足传统的旅游产品,越来越倾向于选择个性化的,具有鲜明特色的休闲度假旅游产品。旅游收入在国内生产总值中的占比越来越大,加快旅游业发展成为推动我国经济发展的重要方式之一。中国旅游业发展已进入爆发式增长期,大众旅游时代即将全面来临。京津旅游资源丰富,河北省旅游景点众多,但景点分布分散,开发程度有待提高的问题明显。随着京津冀一体化格局的不断演变,整合京津冀旅游资源,开发具有区域特色和发展潜力的旅游线路,延伸京津游客的旅游线路长度;引进京津的旅游接待能力、管理经验和雄厚的资金实力,必将有利于调整京津冀区域旅游集散结构,加速河北旅游业的开发,促进京津冀旅游一体化发展,形成三地共享的特色旅游品牌。运用全新的旅游线路开发思路,将文本相似度算法应用到旅游线路开发中,通过描述景点的文本信息,分析得出景点的特征,将具有相同特征的景点归为一类,结合地理位置的特征将同类型的景点设计在一条线路中形成特色旅游线路。线路开发具有可行性且具有现实意义。本文基于文本相似度算法,将京津冀90个特色景区的百度百科资料作为待处理文本,利用jieba分词对其进行了分词、去停用词、提取特征项、计算特征项权重的处理,继而用空间向量模型实现非结构化信息向数字化信息的转变,文章最后采用k-均值聚类方法,通过计算各文本间的相似度,确定类别数得出景点特征分类结果。继而将分类结果结合河北省各县市地理位置的特点,考虑旅游线路开发的原则和河北省旅游发展的优势,设计出了7条京津冀特色旅游线路,分别为:非遗文化、太行抗战史、皇家文化行、塞外踏春寻古迹、奥运塞北游、滨海康养游、赏燕赵风景品文化古迹。