司马扶妖 - 有哪些网站用爬虫爬取能得到很有价值的数据? - 知乎

最近准备找工作,就想把拉勾网 的数据抓取了下来看看。

趁着五一有假有时间,写了这个爬虫把所有技术类的招聘信息爬了下来,闲着折腾一下。

答完准备发布才发现此页面已经有人回答过类似的爬取拉勾的数据的答案了,不过也回答一下吧。

用的是scrapy,总共约十万条数据(103167条数据),数据更新至4月30号。

如果有时间再把其他的数据都抓取下来。

分析结果页面:Crawllagou by ScarecrowFu

github:GitHub - ScarecrowFu/crawllagou

代码大致解释:爬下拉勾网数据进行分析--傅sir的个人主页|Alan_fu's Blog|程序设计

从结果来看,北京的需求量真的很大,几乎是排在第二的上海的两倍。同时也吸引了相应行业的人聚集,人的聚集又相应带动公司的聚集,两者相互影响使得北京成了互联网的主力军。广州的互联网行业比起北上深需求量低了不少。

需求最大的是本科以上,其次是大专。学历对于这行虽然不是决定性因素,但要入门还是必须的。

对经验要求,1-3年的占了大数,个人认为一来是这个阶段的人跳槽最多,二来是目前创业公司较多,两者造就这个比例。

阿里巴巴,这个不用说了。 良诺科贸不太清楚,位置在北京。而联想利泰则是联想集团成员企业,其前身是成立于1996年的联想集团研发部软件开发团队。

职位描述中,“团队”这个词出现的比重最大,我们的工作中离不开团队。与技能有关的依次是设计,测试,数据库,java,linux等等。

行业领域情况,移动互联网真的很火。。。

PHP是最好的语言??既然比java还多出20个?其实很多人都应该会python,可能是工作上作为主要开发语言的需求量不大,导致python的职位数量是倒数。

看情况北京的公司规模比其他城市都要大,总体来看,创业公司还是居多。

技术类工作薪酬普遍都比较高,这里没有做一个区间分析,有兴趣的可以分析一下,以后有时间我在重新做一做。

职位诱惑中,五险一金被提到的次数最多,这应该是标配才对,不是诱惑。。。

因为我在广州,所以把广州对python的经验要求和薪酬比例分析出来看看。


Original url: Access
Created at: 2018-11-23 15:34:10
Category: default
Tags: none

请先后发表评论
  • 最新评论
  • 总共0条评论