岗位职责:1、从事网页及APP数据采集的技术研发工作;2、负责设计爬虫策略及反爬规则,提升数据采集效率、完整度和稳定性;3、负责智能采集系统设计与研发,如采集任务调度,页面解析和结构化抽取,海量数据存储和读取等任职资格:1、有爬虫开发经验或者后端开发经验;2、熟悉各种爬虫技术:adsl拨号、正则表达式、脱壳技术、加密、图片破解、二维码识别、滑块验证码破解、httpClient、分布式爬虫调度、代理ip调度算法、配置化爬虫、授权爬虫;3、熟悉常见的反爬虫技术及其突破方案;4、熟悉Mysql和NoSql(MongoDB,Redis,Hbase等);5、有实体抽取,文本分类相关经验者优先;
联系我时,请说是在58同城上看到的,谢谢!