岗位职责1、从事网页及APP数据采集的技术研发工作;2、负责设计爬虫策略及反爬规则,提升数据采集效率、完整度和稳定性;3、负责智能采集系统设计与研发,如采集任务调度,页面解析和结构化抽取,海量数据存储和读取等。任职要求:1、至少1年以上爬虫后端开发经验;2、熟练掌握Python开发,扎实的编程功底,熟悉常用的数据结构和算法;3、熟悉各种爬虫技术:adsl拨号、正则表达式、脱壳技术、加密、图片破解、二维码识别、滑块验证码破解、httpClient、分布式爬虫调度、代理ip调度算法、配置化爬虫、授权爬虫;4、熟悉常见的反爬虫技术及其突破方案;5、熟悉Mysql和NoSql(MongoDB,Redis,Hbase等);6、有实体抽取,文本分类相关经验者优先
联系我时,请说是在58同城上看到的,谢谢!