Engenheiro de Dados Sênior – Especialista em Crawlers e Orquestração

Posted 65ds ago

Employment Information

Education
Salary
Experience
Job Type

Report this job

Job expired or something wrong with this job?

Job Description

Senior Data Engineer leading data ingestion using Python and AWS at Cortex. Implementing complex data pipelines and optimizing data flow in cloud environments.

Responsibilities:

  • Desenvolver e manter crawlers/bots de alta performance e resilientes para extração de dados em larga escala.
  • Projetar e implementar pipelines de dados complexos utilizando Databricks (Spark) para processamento em lote e streaming.
  • Garantir a saúde e a dependência dos fluxos de dados através de ferramentas de orquestração avançadas.
  • Gerenciar e otimizar recursos dentro do ecossistema AWS, garantindo escalabilidade e custo-benefício.
  • Implementar técnicas de tratamento de erros, contorno de bloqueios (proxies, captchas) e validação de qualidade dos dados coletados.

Requirements:

  • Domínio profundo de Python (focado em bibliotecas de scraping como Scrapy, Playwright, Selenium ou Beautiful Soup).
  • Experiência sólida com Databricks e Apache Spark (PySpark).
  • Experiência com serviços como AWS S3, Lambda, Glue, Athena, EC2 e EKS.
  • Conhecimento avançado em ferramentas como Airflow, Dagster ou Prefect.
  • Experiência com bancos SQL e NoSQL, além de entendimento de Data Lakehouses (Delta Lake).
  • Familiaridade com Docker, Kubernetes e pipelines de CI/CD.
  • Conhecimento em técnicas de evasão de bot-detection e gestão de redes de Proxy (diferencial).
  • Experiência com ferramentas de monitoramento (Prometheus, Grafana ou ELK) (diferencial).
  • Contribuições para projetos Open Source ou comunidades de dados (diferencial).

Benefits:

  • Vale Refeição e Alimentação;
  • Gympass/TotalPass;
  • Vittude;
  • Auxílio home-office;
  • Plano de Saúde e Plano Odontológico (odonto é opcional);
  • Auxílio creche (até os 6 anos completos da criança);
  • Licença-Maternidade, Paternidade e Adotante Estendidas (#todasasfamíliasimportam);
  • Seguro de Vida;
  • Day Off de Aniversário (Um dia de folga para tirar no dia ou durante o mês do seu aniversário.);
  • Dia da Família (Um dia de folga para mamães e papais tirarem entre os meses de maio e agosto e aproveitar como quiserem.);
  • Pausa Mental (Uma semana corrida de folga em dezembro para que descansem e recarreguem as baterias.