【摘 要】
:
当前,求职的网站、APP种类多种多样,而这些招聘网站也带来数以万计的招聘信息。为了充分利用好这些招聘数据,深入挖掘出其潜在的价值,本文利用数据挖掘技术对网络招聘数据进行挖掘分析,并设计可视化系统展示数据分析结果。主要工作和创新如下:(1)针对网络招聘数据集的实时性和丰富性,本文采用网络爬虫技术获取智联招聘网站中的互联网行业数据,并对获取的数据集进行删除、转换等清洗以保证数据质量。(2)提出了一种的
论文部分内容阅读
当前,求职的网站、APP种类多种多样,而这些招聘网站也带来数以万计的招聘信息。为了充分利用好这些招聘数据,深入挖掘出其潜在的价值,本文利用数据挖掘技术对网络招聘数据进行挖掘分析,并设计可视化系统展示数据分析结果。主要工作和创新如下:(1)针对网络招聘数据集的实时性和丰富性,本文采用网络爬虫技术获取智联招聘网站中的互联网行业数据,并对获取的数据集进行删除、转换等清洗以保证数据质量。(2)提出了一种的DTH-Apriori算法(dataset compress、transaction compress and hash technology on apriori),该算法融合了数据集压缩、事务压缩和散列技术。并运用传统的Apriori算法、FP-growth算法和该优化的Apriori算法分别对互联网相关岗位的工资、学历要求等属性进行关联程度分析,实验结果不仅验证了岗位因素之间的强关联规则,也表明该优化算法速率具有一定的提高,且不易受最小支持度影响。(3)针对热门职位及技能对企业和高校的指导作用,本文对数据集中的招聘岗位和职业要求进行文本分析,获取互联网行业的Java、Web前端、算法、大数据、PHP五个热门职位和其技能关键词,并为求职者提供建议。(4)为了更好地展示网络招聘数据分析的效果,本文设计了一个集招聘数据爬取、查询、分析、结果可视化的分析系统。首先按照数据层、服务层、展示层设计系统的总体架构,并将其细化为数据的采集、处理、查询、分析、可视化五个功能模块。再调用Python的Django框架和My SQL数据库实现系统后端设计,并以ajax技术、Echarts库分别实现前后端交互和前端数据可视化。最后,系统完整实现,且以图表直观地展示了互联网行业的相关岗位招聘情况。
其他文献
随着新能源并网技术快速发展,光伏发电在电网系统中所占比率在逐年提高。但光伏输出功率存在较强的随机性和波动性,单一的储能器件不能够充分地体现储能优势来吞吐光伏输出的能量,采用混合储能系统合理分配各元件的输出功率是目前研究的重点及难点;同时,为提高并网效率,电网采用了大量的电力变换器,从而引起电网系统频率抗干扰能力及电压耐受能力变低,给电力系统并网的稳定运行带来另一突出问题。针对以上两个问题,通过对储
光学相干断层扫描血管造影(optical coherence tomography angiography,OCTA)是一种基于OCT功能的新兴成像技术,是当前眼科、心脑血管和多种脏器的重要临床研究及应用工具。OCTA技术能够在非侵入和无需注射造影剂的情况下,区分毛细血管级的血流灌注与静态组织。其发展的重要趋势是通过更高清的成像技术来观察早期视网膜病变特征。现有的商业化OCTA设备成像的定位、优化
随着计算机视觉技术的不断发展,目标检测技术已经广泛应用于自动驾驶、视频监控、人机交互、人脸检测等领域,受到学界与工业界的密切关注。传统的目标检测技术其特征多为手工设计,工作量巨大,算法鲁棒性较差,不能满足实际场景下的视频小目标检测需求。而基于深度学习的目标检测技术能够根据不同场景自适应提取图像特征,达到更好的检测效果。因此,研究基于深度学习的视频小目标检测技术具有极其重要的理论意义和应用价值。针对
针对目前高层楼宇火灾隐患监控不当、火灾发现不及时和救援不及时的情况,本文提出了一种基于物联网的的火灾探测报警(含预警)系统的设计方案。本系统通过利用传感器检测技术、单片机控制技术以及物联网技术,实现了对火灾的探测、预警、报警和喷淋。具体实现过程为:STM32F103C8T6用作主控芯片,选用ESP8266通信模块连接Wi Fi,与服务器建立通讯。节点端通过分析、处理烟雾传感器、温湿度传感器、CO传
超级电容器是一种具有快速充放电、高功率密度、超长循环寿命特性的新型储能器件,在电动汽车、微型智能电子设备、柔性和可穿戴电子器件等领域有着广阔的应用前景。目前,超级电容器的主要研究工作是优化提高电极材料的电化学性能。本文以镍钴硒化物为研究对象,利用简易两步水热法,探究硒化比例及镍钴比例对产物的微观形貌、结构组成、电化学性能的作用机制,阐明其电荷存储机理。以此优化出具有最佳电化学性能的镍钴硒化物电极材
随着人工智能技术不断发展,旅游智能问答系统作为旅游业人工智能化发展的标志之一,其在旅游领域的应用日益广泛。本文利用知识图谱和自然语言处理技术搭建了一个基于知识图谱的旅游问答系统,能够为用户提供简洁、准确的答案,并且能够在一定程度上提高信息检索的效率。本文的主要工作如下:(1)运用爬虫技术从各大旅游网站和百科网站上收集了关于贵州省旅游景点的相关数据信息,提出了基于地址属性的实体对齐方法,对各平台收集
目前,基于深度学习的眼底图像分析及眼部疾病检测技术被广大的学者研究及关注。视网膜血管为糖尿病性视网膜病变(Diabetic Retinopathy,DR)等眼科疾病的诊断提供了许多重要信息。从视网膜血管的分割结果能直观的看出患者眼部是否出现病变,从而减少医生对早期眼科疾病的误判;而DR的分级结果能让糖尿病患者清楚的了解自己眼底病变情况,以更好的配合医生进行相应治疗。然而,视网膜血管分割和DR分级不
交通标志识别系统(TSR,Traffic Sign Recognition)作为智能交通系统ITS的重要组成系统,在人工智能飞速发展的今天,在辅助驾驶、调节交通秩序、提高车辆通行效率、降低人为交通事故发生率等方面均发挥着正向积极作用。在实际的检测识别中,自然场景下交通标志检测识别易受光线明暗、场景复杂程度、外物遮挡、距离远近等因素影响,且交通标志的检测识别属于复杂场景下的小物体检测,在一张图像中的
作为土木工程领域现有研究热点之一,全寿命监测可以实现对桥梁结构进行整个生命周期的安全保障。而目前全寿命监测系统的现状是桥梁施工监控、交竣工验收和健康监测大多都是由三家不同的单位分别负责,互无交集,导致三个阶段的监测系统处于割裂状态,没有很好地得到结合。如何有效利用和衔接桥梁不同阶段的监测点与监测数据是全寿命监测模式的研究重点。本文以G320线花鱼洞大桥为依托工程,通过研究施工监控、交竣工验收以及健
由于图像具有很强的直观性和易懂性,使其成为人们感知与理解世界的主要信息来源。调查显示,人类超过82%的信息都是通过视觉获得的。但在物体成像的过程中,由于物体和图像采集设备发生相对位移致使图像退化,此谓“运动退化”。而清晰的图像是准确获取信息的关键,所以,研究运动模糊图像复原具有重要的意义。完成运动模糊图像的复原主要有两步:第一是模糊参数的估计,包括角度参数和尺度参数。第二是在完成参数估计的基础上对