使用Python+selenium抓取职位和公司信息




做这个事情的目的是,想看下全国和江浙沪宁,招聘ceph、块存储相关职位的公司有哪些,再分析下其中哪些公司可以尝试联系起来,看看是否有兴趣用curve。

一开始想着用requests或者更专业的scrapy写爬虫脚本,但是试了requests库之后,发现啥也抓不到,被网站反爬虫了。。。

只能试着用selenium来弄,好几年没用它了,有点生了,折腾了大半天才算能凑合用。

selenium需要自己pip安装,chromedriver需要自己下载:https://sites.google.com/chromium.org/driver/home

输出结果大概长这样: