互联网数据采集工程师（） - 北京计算机/互联网/通信招聘

职位详情

岗位职责1.遵照robots协议，参与全网爬虫系统建设；2.参与开发分布式的网络爬虫，共同解决实际开发过程碰到的各类问题（优化调度、并发、覆盖率等），提升数据抓取的效果和性能；3.参与网页抽取，网页质量技术算法的研究和开发，提升数据抓取的效率和质量；4.参与爬取数据的去重、解析入库、爬虫系统的监控和异常警报。任职要求1.爬虫实习经验，有过海量数据爬取存储经验为佳；2.了解主流爬虫框架工具，熟悉Http/Tcp等网络协议；3.了解常见反爬封禁策略，具备实战经验，了解浏览器内核相关优先；4.有搜索，大数据处理，内容质量等相关开发经验优先；5.熟悉各种大数据相关框架组件优先，如kafka，Hadoop/Spark，MapReduce，Hive等；6.了解NLP基本技术，实际使用过如Fasttext、N-gram、Bert、GPT等算法和模型者优先。
联系我时，请说是在58同城上看到的，谢谢！

马上申请

公司信息

武汉三快在线科技有限公司阳新路分公司

1至49人

企业认证

北京海淀区搜狐网络大厦3楼

免费申请职位

热门搜索
热门职位
热门城市
周边城市
推荐详情
专题推荐

·北京普工招聘 ·北京司机招聘 ·北京家政保洁招聘 ·北京餐饮招聘 ·北京物流招聘 ·北京人事招聘 ·北京超市招聘 ·北京钟点工招聘 ·北京保安招聘 ·北京客服招聘

58安全提醒

58严禁企业和求职者参与违法违规活动，包括但不限于传销刷单/刷钻、套路贷款等行为，一旦发现请立即进行举报，平台会进行严肃处理。投诉举报