Estágio Data Science (Machine Learning ou NLP)

São Carlos/SP
25 a 30 horas semanais
Início: Dezembro/2019 a Fevereiro/2020
Valor: R$1.500 a R$2.000/mês (ref. 30 horas)

Birdie é uma startup criada em Palo Alto, na Califórnia, no início de 2018 e que tem sem time de tecnologia orgulhosamente baseado no Brasil. Atualmente, os times no Brasil estão distribuídos entre São Paulo e São Carlos e nos EUA, Palo Alto e Miami. A empresa conta com um time de especialistas em Data Science e Machine Learning para buscar e estruturar informações de todos os cantos da internet para montar uma gigante base de conhecimentos de produtos e suas opiniões.

Estamos coletando e processando milhões de opiniões de diversos países (avaliações de consumidores, reviews técnicos, unboxing, entre outros) descritas majoritariamente em linguagem natural. Precisamos processar esses dados utilizando técnicas de Aprendizado de Máquina e Processamento de Linguagem Natural (PLN) para extrair informações estruturadas úteis desse tipo de dados.

Procuramos por estagiários que queiram se juntar ao time para trabalhar com esse tipo de aplicação no mundo de Ciência de Dados. Você irá compor um papel fundamental no time para adaptar e utilizar ferramentas de Aprendizado de Máquina e PLN para diversas línguas (mas principalmente Português, Inglês e Espanhol)  focadas nas necessidades do projeto, tais como extrair sentenças e suas anotações morfo-sintáticas, extrair sentimentos e aspectos de reviews, classificar ofertas e outros tipos de documentos, entre outras aplicações. Cito aqui parte do stack de tecnologia e das macro tarefas em Aprendizado de Máquina que você poderá trabalhar ao realizar estágio conosco:

• Python
• Scrapy
• Scikit Learn, Spacy, NLTK, PyTorch, TensorFlow, entre outras ...
• Google Cloud Platform
• Postgresql
• Docker, Gitlab CI/CD
• Text Classification
• Aspect-Based Sentiment Analysis
• Aspect Clustering

Você irá fazer parte um time multi-disciplinar que compõem diferentes partes do projeto desde a coleta e estruturação de diferentes tipos dados sobre produtos até a criação de experiência (UX) web com usuários.

Principais responsabilidades

Pesquisar, adaptar e avaliar ferramentas consideradas estado-da-arte em Aprendizado de Máquina e PLN para as diferentes línguas suportadas pelo projeto.
Integrar ao nosso pipeline de dados e disponibilizar os melhores algoritmos e ferramentas desenvolvidas em formato de micro-serviço com apoio do time de Engenharia de Dados.
Criar crawlers específicos ou genéricos para diversas fontes de interesse.

Requisitos mínimos

Ser aluno de graduação de algum curso relacionado à Tecnologia de Informação.
Ter disponibilidade de pelo menos 25 horas semanais para estágio.

Habilidades / Conhecimentos desejáveis

Experiência em linguagem Python.
Conhecimento em mais uma das tecnologias citadas em nosso stack.

Diferenciais

Alguma experiência anterior relacionada à Aprendizado de Máquina ou PLN.
Conhecimento em três ou mais tecnologias citadas em nosso stack.

Está interessado? Venha conversar com a gente.

Aplique para esta vaga

Alguma dúvida? Quer saber mais?

jobs@birdie.ai
birdie.ai