Estágio em Engenharia de Dados

São Carlos/SP
25 a 30 horas semanais
Início: Dezembro/2019 a Fevereiro/2020
Valor: R$1.500 a R$2.000/mês (ref. 30 horas)

Birdie é uma startup criada em Palo Alto, na Califórnia, no início de 2018 e que tem sem time de tecnologia orgulhosamente baseado no Brasil. Atualmente, os times no Brasil estão distribuídos entre São Paulo e São Carlos e nos EUA, Palo Alto e Miami. A empresa conta com um time de especialistas em Data Science e Machine Learning para buscar e estruturar informações de todos os cantos da internet para montar uma gigante base de conhecimentos de produtos e suas opiniões.

Estamos coletando e processando milhões de opiniões de diversos países (avaliações de consumidores, reviews técnicos, unboxing, entre outros) descritas majoritariamente em linguagem natural. Nós processamos, armazenamos e precisamos disponibilizar uma grande quantidade de dados que são estruturados utilizando diversas técnicas de Aprendizado de Máquina e Processamento de Linguagem Natural (PLN) em nosso pipeline para extrair informações estruturadas úteis.

Procuramos por estagiários que queiram se juntar ao time para construir aplicações web que consumam nossos dados e crie soluções que apoiem grandes marcas a tomarem melhores decisões em áreas como marketing, consumer analytics, product development, entre outras. Você irá trabalhar no time de desenvolvimento de produto que inclui outros profissionais de desenvolvimento e de UX design e fará interface com o time de de engenharia e ciência de dados. Cito aqui alguma das tecnologias de nossa stack atual:

• Python, Node.js, PHP
• HTML, CSS, JavaScript
• Vue.js, Nuxt
• Google Cloud Platform
• Postgresql, Mysql
• Gitlab CI/CD
• Docker / Kubernetes

Principais responsabilidades

Desenvolver e manter coletores (crawlers) de dados escaláveis tanto em termos de diferentes fontes quanto em quantidade de dados coletados, pré-processados e armazenados.
Pesquisar, avaliar, utilizar e divulgar as melhores práticas para construir pipeline de dados (ETL) escaláveis na nuvem.
Apoiar no desenvolvimento e na disponibilização de modelos de Aprendizado de Máquina construídos pelo time.
Desenvolvimento endpoints para disponibilização dos dados processados para o time de desenvolvimento de produtos.

Requisitos mínimos

Ser aluno de graduação de algum curso relacionado à Tecnologia de Informação.
Ter disponibilidade de pelo menos 25 horas semanais para estágio.

Habilidades / Conhecimentos desejáveis

Experiência em linguagem Python;
Conhecimento em mais uma das outras tecnologias citadas em nosso stack.

Diferenciais

Conhecimento em três ou mais tecnologia citadas em nosso stack ou em outras tecnologias relacionadas à ETL.

Está interessado? Venha conversar com a gente.

Aplique para esta vaga

Alguma dúvida? Quer saber mais?

jobs@birdie.ai
birdie.ai