简历一般都是三方面:个人能力、项目经验、专业技术。爬虫技能通常都是技术广而不深,爬虫平台的管理重在维护,以及目标站的突破。另外还得有个加分项,是解决难点以及提高爬虫效率的关键因素。接下来就开始介绍一下,一个爬虫平台负责人的简历,应该是什么样的。1.工作项目工作项目有一个知名的大数据站做目标,例如12306、亚马逊、招标网等。至少得有一个关于多爬虫+平台部署和管理的分布式爬虫项目。这个项目必须写明,从开发到部署的大概流程,以及写明难点技术,例如1.目标站的反爬技术和突破方法2.解决增量问题3.具体的去重方法4.项目部署用到的具体硬件设备信息5.后续的爬虫维护和升级目标数据量在千万级别,且爬虫运行有完整的日志记录。关于大项目的内容就是这些,切记一定要自己从头到尾部署一遍,有很多细节,而且技术面试,专考细节。除了大项目之外,其他的中小项目,不需要太多,1到2个就可以了,重点是凸出项目的不同和难点。那种1-2天写的单机爬虫项目,大可不必写上去,简历是凸出你的优势,不是记录你的生活,不要刻意去填充简历内容。2.技术能力技术能力爬虫技能很广,但是都不深,大体掌握就可以了。必须掌握但不局限的计算机技术:操作系统及工具:Linux、常用命令、日志监控数据库:MySQL、Redis、MongoDB、Hadoop爬虫:scrapy、scrapyd、gerapy、spiderkeep爬虫管理系统等数据解析:正则表达式、xpath、css、beautifulsoup等编程语言:python、SQL、JavaScript网络:http基础、请求包、常见反爬、代理IP、Cookie池开发工具:git、svn这里的技术栈,是围绕python+scrapy写的,当然其他语言都是可以写爬虫的,换一下就行。大体框架是不变的,前端、后端、网络、数据库四大类,肯定是都需要写上的。另外,作为爬虫平台负责人,你对网络设备及价格肯定是要了解的。这里以云平台为例,你肯定需要自己买一点服务器,然后部署自己的网站或者爬虫项目,用于数据展示。个人购买和学习用,推荐如下云产品【价格仅供参考】:云服务器,2C4G3M,950¥/3年云数据库,2C4G200G,5000¥/3年com域名,200¥/3年3.个人情况个人情况对于自己的介绍,例如思维清晰、解决Bug能力强,其实都没什么用,主要还是看你工作时的能力,特别是你的工作实习期间。这里能展示的唯二,就是你目前的状态,例如:离职在家可以迅速到岗在职准备换工作离职中,一个月内到岗1还有一个就是你的年龄和个人态度,例如:拒绝996工作制接收单双周一个blog链接,常年写...