- 目录
第1篇 数据爬虫工程师职位描述与岗位职责任职要求
职位描述:
工作职责:
1.开发网页自动化脚本。
2.负责商品信息结构化,编写自动化脚本解析网页信息。
3.商品索引系统:亿级sku的库存价格实时跟踪同步,并对商品进行智能分类、本地化、图片处理和去重。
4.设计、开发、测试、部署以及维护并改进各子系统;
5.管理项目优先级并按时交付。
职位要求:
1.全日制统招本科、硕士毕业,1年以上软件开发工作经验;
2.熟悉至少一门通用静态编译编程语言,c/c++/java/c#/go;
3.熟悉web端基础标准,包括html、css、javascript、json等;
4.熟悉python或其他脚本语言,有兴趣和能力根据需求学习其他编程语言;
5.熟悉uni_/linu_环境,memcache/redis/mongodb等存储系统,能独立设计开发包括前后端交互的业务子系统;
6.熟悉常见的设计模式、单元测试、持续开发集成、code review,并能在日常工作践行;
7.了解搜索引擎、电子商务、社交类应用的系统基本架构,能对已有的子系统进行优化调整的优先;
8.活跃的开源项目贡献者优先。
第2篇 爬虫工程师(p6-p8)职位描述与岗位职责任职要求
职位描述:
岗位职责:
1.负责网络爬虫的架构设计、开发与优化;
2.负责抓取数据的清洗、落地、分析;
3.抓取策略算法的更新维护,以及确保数据抽取准确、高效。
任职要求:
1.两年及以上互联网或软件行业工作经验;
2.理解 http 协议,熟悉 html、dom、_path;
3.熟悉 linu_ 开发环境,至少熟悉 python/go/java/node.js 中的一种编程语言;
4.有爬虫、信息抽取、文本分类、大数据处理相关经验优先;
5.有自然语言处理、机器学习经验优先;
6.熟悉浏览器内核、渲染机制优先;
7.工作认真,细心,有条理,积极性高;良好的沟通能力及团队合作精神。
第3篇 网络爬虫工程师职位描述与岗位职责任职要求
职位描述:
职责描述:
1,负责网络爬虫系统的设计与开发
2,对爬取的网页信息进行数据抽取,清洗和去重等工作
任职要求:
1、2年及以上网络爬虫开发经验,本科及大专学历,计算机相关专业,
2、积极、沟通顺畅,工作认真负责
3、扎实的编程能力,熟悉常用算法和数据结构等基础知识
4、熟练掌握开发语言java或c/c++,熟悉脚本语言和正则表达式
第4篇 资深爬虫工程师岗位职责及职位要求
资深爬虫工程师职位要求
1、计算机相关专业,本科及以上学历,3年以上爬虫相关工作经验;
2、对爬虫编程有强烈爱好,熟练精通掌握至少1种语言java、python,在需要的情况下能快速上手新语言切换;
3、深入理解tpc/ip、http、以及web登录认证的机制,有成功破解复杂验证码的经验;
4、有通用分布式爬虫系统架构和开发经验,能快速部署新的爬虫应用;
5、已有2年以上网络爬虫或搜索引擎工作经验,参与过大规模数据爬虫优先考虑;
6、有app安全、逆向等领域的经验;
7、具有良好的沟通、团队协作、计划能力, 有过1-2人的团队管理经验。
资深爬虫工程师岗位职责
1、建设完善分布式爬虫系统;
2、建立通用的爬虫框架,能够快速适应新的爬虫需求;
3、快速完成对目标资源的数据抓取、处理。
第5篇 广告爬虫工程师职位描述与岗位职责任职要求
职位描述:
工作职责:
1、负责广告素材线索和垂直类产品爬虫系统的设计、开发
2、抓取数据的清洗、落地、分析
3、抓取策略算法的更新维护,以及确保数据抽取准确、高效
任职要求:
1、具备强悍的编码能力、扎实的数据结构和算法功底
2、 熟悉tcp,http协议原理;熟悉aja_工作原理;精通python编程,熟悉一种开源爬虫框架和源码;
3、有爬虫、信息抽取、文本分类、大数据处理相关经验优先
4、有自然语言处理、机器学习经验优先
第6篇 资深爬虫工程师职位描述与岗位职责任职要求
职位描述:
职责描述:
1. 参与爬虫系统的架构设计与开发;
2. 负责执行和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
3. 负责网页信息和app数据抽取、清洗、消重等工作,提升平台的抓取效率;
4. 参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
5. 实时监控爬虫的进度和警报反馈。
任职要求:
1. 本科以上学历,3年以上爬虫开发相关经验,熟练使用python或java进行开发;
2. 熟练使用正则表达式、css path、_path等,能够从结构化的和非结构化的数据中获取信息;
3. 熟练使用mysql数据库,掌握redis、mongodb、hive等常用nosql技术并具有实战经验;
4. 熟悉各种抓取技术,包括代理、phantomjs/selenium、验证码处理;
5. 熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页信息抽取开发经验,熟悉反爬虫技术,有分布式爬虫架构经验;
6. 具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;
7. 快速学习能力,工作积极主动,有创业热情和良好的团队协助能力;
8. 需要有大量数据爬取以及高难度反爬经验,没有相关经验的勿扰。
第7篇 爬虫工程师职位描述与岗位职责任职要求
职位描述:
职位诱惑:
全球项目、高薪资、高福利、国际团队
职位描述:
if (your_passions.includes('coding')) {
switch(your_stacks) {
case 'node.js':
case 'python':
case 'kubernetes':
case 'serverless':
console.log('join aftership');
break;
}
}
岗位职责
1、负责与不同物流公司的系统对接,使用各种 api 及爬虫技巧,抓取、分析、调度、存储数据,为公司业务提供正确稳定的数据;
2、负责系统的 sla 代码维护、秩代更新,保证任务质量和交付及时性;
3、负责编写相关的技术文档、单元测试,对产品质量负责。
岗位要求
1、统招本科及以上学历,具备英语读写能力;
2、熟悉 git/github,通信协议 tcp/http 及 restful 标准;
3、一年及以上 python 爬虫开发工作经验, javascript 基础扎实,有 scrapy 等使用经验;
4、有 mysql,redis 或 mongodb 等相关数据库使用经验。
加分项
1、有 ci/cd 自动化测试经验;
2、有使用 docker、kubernetes、aws 或 gcp 云计算经验;
3、有写 blog 的习惯,活跃技术社区,参与开源项目等;
4、有代码洁癖,对代码精益求精,对技术有极客热情;
5、有软件著作权申请,有专利发明申请。
为什么加入我们
1、极客氛围: 拥抱开源技术,实践敏捷开发;
2、最新技术: kubernetes, serverless, tensorflow, microservice;
3、特色福利: 每天下午茶,学习成长基金, 提供 macbook pro;
4、多元文化: 团队来自全球十几个国家;
5、龙头企业: 海外知名企业;
6、朝阳行业: b2b 企业级系统, 国际性 saas 平台。
第8篇 高级爬虫工程师职位描述与岗位职责任职要求
职位描述:
岗位职责:
1、参与app爬虫项目的架构设计、研发工作,改进和提升爬虫效率;
2、攻破各种反爬策略;
3、解决各类技术疑难问题,包括网络问题、app分析、反编译等;
4、与大数据工程师对接,完成实时数据与离线数据的爬取与对接;
任职资格:
1、计算机及相关专业本科及以上学历,两年以上相关工作经验;
2、精通至少一种开发语言,如python、java;
3、熟练掌握一种开源爬虫框架,如scrapy、webmagic,有研发爬虫框架经验者优先;
4、熟悉appium、selenium等技术;
5、善于独立分析并解决核心问题,如javascript反爬、爬虫策略、防屏蔽规则、app爬取、验证码识别技术等;
6、熟悉mysql, mongodb, redis, elasticsearch等数据库;
7、对爬虫有浓厚的兴趣,责任感强,有较好的交流沟通能力和团队合作能力;
8、有app安全、逆向等领域经验的优先;
第9篇 python爬虫工程师职位描述与岗位职责任职要求
职位描述:
工作职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2、负责网页信息和app数据抽取、清洗、消重等工作,提升平台的抓取效率;
3、参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4、实时监控爬虫的进度和警报反馈。
任职要求:
1、有扎实的算法和数据结构能力;
2、熟悉爬虫原理,熟悉常见的反爬虫技术,有爬虫相关项目开发经验者优先;
3、掌握http协议,熟悉html、dom、_path等常见的数据抽取技术;
4、有大规模数据处理、数据挖掘、信息提取等经验者优先。
第10篇 手机应用爬虫工程师职位描述与岗位职责任职要求
职位描述:
_ 负责设计和开发分布式网络爬虫系统
_ 应用多种技术对各平台进行数据采集
_ 设计数据采集策略,提升数据采集效率及质量
_ 与各行业分析师沟通,分析项目的可行性和讨论抓取方案。
_ 两年以上爬虫开发相关经验,本科及以上学历,计算机相关专业为佳
_ 熟练掌握c#或java开发语言为佳
_ 了解tcp/ip,http及相关网络协议
_ 熟悉js / html / _path / json / 正则表达式等网页相关技术
_ 熟悉分布式、多线程、缓存、消息队列等互联网技术
_ 熟悉手机应用的数据抓取,手机app开发经验,加/脱壳经验为佳
_ 良好的沟通技能,注重细节,抗压性强
_ 良好的英语沟通技能为佳