论文部分内容阅读
就业问题一直是关乎国计民生的大事,也是多个研究领域中的热点问题,特别是今年受新冠疫情影响,就业问题备受社会各个群体的广泛关注。在互联网高度发达的今天,求职者通常会在Internet上搜寻就业信息,有招聘需求的公司也会在网络上发布用人需求信息。互联网上的海量岗位信息和数据,为就业市场的研究提供了重要数据来源。但是,在国外针对就业现状的相关研究中,利用互联网上的招聘数据进行研究和分析的工作也较少,主要是因为获取互联网上的就业数据难度较大,数据量也难以估算。与国外研究相比,国内利用网络数据对就业市场和就业现状的研究更少,在研究方法、技术手段等方面仍处在较为初级的水平,特别是在对IT行业的就业发展需求研究等方面缺乏深入的实验分析。针对就业数据维度多、IT行业就业趋势分析困难、就业前景未知等问题,本文分别采用主成分分析、时间序列分析和聚类分析几种方法开展了如下四个方面的研究工作:1.通过收集百度提供的百度指数对IT相关行业的因子进行主成分分析,研究影响互联网招聘的主要权重因素。2.分析对IT行业就业影响最大的几个主要成分,以它们为基础做出时间序列图,剔除多余变量后建立时间序列模型,得到IT行业的就业需求指数模型。用2019年的数据进行检验,发现数据拟合效果较好,进而预测未来2020年IT行业就业需求的发展规律与趋势。3.通过收集到的全国各省份IT行业平均薪资,对各省份数据进行聚类分析。首先进行系统聚类,由于距离划分的不同得到不同的聚类结果,得出它们共同点是三个地区都是单独一类;然后进行快速聚类,将全国31个省份地区划分为三个部分,最终分析得到它们是IT行业最发达的几个地区和欠发达的几个地区。4.综合考虑IT行业就业影响因子、就业回归模型以及各省行业发展问题,研究就业市场需求和变化趋势,为求职者提供科学的意见与建议。最后,本文以互联网行业为例开展了具体研究,对所提出的方法进行了实验验证和分析。