GoForum🌐 V2EX

PureblueAI:知道 V2EX 藏龙卧虎,我司诚招 [初中级数据采集工程师(Web+Android)]

snakeninny · 2026-01-14 17:33 · 0 次点赞 · 2 条回复

特别说明

  • 我们为你提供从竞争白热化的移动互联网红海赛道,向 AI-native 应用全新蓝海领域转型的稀缺战略机遇。
  • 我们秉持结果导向,核心团队均由各领域资深专家领衔,从根源上杜绝 “外行指导内行” 的情况;管理上坚决摒弃微观管理( micro-manage ),充分赋予团队自主决策与执行空间。
  • 团队成员中既有退役军人,也有🌈伙伴;既有大专生,也有博士后。人员背景多元包容,招聘不设学历门槛,始终坚持唯才是举。
  • 此岗位为初中级数据采集工程师;我们也有中高级采集工程师的需求,见此帖

官网

https://www.pureblueai.com/

职位描述

  • 参与 Web 端与 Android 端数据采集任务的执行与优化,为后续数据应用及 AI 模型训练提供基础数据支撑。
  • 基于 Python 生态爬虫框架(如 Scrapy 、Requests 、Playwright )开发 Web 端基础爬虫逻辑,负责常规页面及简单动态渲染页面的抓取与数据解析,实现结构化数据的提取。
  • 负责 Android 端主流 APP 的数据采集相关工作,包括 APP 界面元素识别、数据交互逻辑分析,使用 UiAutomator 等工具编写自动化采集脚本。
  • 初步分析 Web 端 HTTP/HTTPS 协议及 Android 端网络请求,协助完成简单的数据加密逻辑破解、参数验证分析等工作。
  • 协助研究 Web 及 Android 端基础反爬/反作弊策略,参与 IP 代理、浏览器指纹伪装、APP 端简单风控对抗等方案的落地执行,提升采集成功率。
  • 协同团队完成数据采集流程的规范化梳理,保障采集数据的完整性与准确性,配合完成数据格式标准化处理。
  • 跟进采集过程中的问题,及时反馈并协助排查解决,积累双端数据采集的实战经验。

岗位要求

  • 1-3 年数据采集相关经验,具备 Web 爬虫或 Android 自动化/逆向相关实操案例(应届优秀毕业生或有相关项目经验者可放宽)。
  • 熟悉 Python 编程语言,能够熟练使用至少 1 种 Python 爬虫框架( Scrapy/Requests 等)及数据解析工具( BeautifulSoup 、lxml );了解基本的 Python 编程规范。
  • 具备 Android 开发或逆向基础:了解 Android Framework ,对 AccessibilityService 原理及 UI 渲染机制有初步认知;熟悉 Smali 指令、Arm64 指令集者优先。
  • 能够使用 UiAutomator 编写 Android 端自动化脚本,有 Xposed 插件开发经验者优先;了解 Android 端 APP 的安装、调试及日志分析基础方法。
  • 具备基础的网络协议分析能力:了解 HTTP/HTTPS 协议基本原理,能够使用 Charles/Fiddler 等工具进行简单抓包分析;了解 Android 端网络请求流程者优先。
  • 具备一定的逆向思维,有 Web 端简单反爬(如请求频率限制、基础参数加密)或 Android 端 APP 基础逆向、风控对抗经验。
  • 了解 Redis 、MongoDB 等基础中间件的基本使用,对分布式数据采集有初步概念者优先。
  • 具备良好的学习能力、沟通协作意识,有较强的责任心和执行力,能够配合团队完成攻坚任务,抗压能力强。

工作地址

北京市海淀区清华同方科技广场 D 座 20 层 或 北京市朝阳区锐创国际中心 A 座 12 层

薪资

15 ~ 25k * 13 薪

联系方式

@pureblueai.com" target="_blank">yinglu@pureblueai.com 或 本站私信

2 条回复
zhybb2010 · 2026-01-14 17:38
#1

做这种业务跟百度的莆田医院一个性质,污染训练数据,阻碍社会发展。 你们公司就不怕生儿子没屁眼么?

snakeninny · 2026-01-14 17:48
#2

@zhybb2010 脏的看啥都是脏的

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: snakeninny
发布: 2026-01-14
点赞: 0
回复: 0