Pós-graduação em Ciência de Dados

Este curso combina teoria e prática com foco em inovação e na resolução de problemas.

Sobre o curso

A pós-graduação em Ciência de Dados visa formar especialistas e líderes na área, promovendo uma educação de excelência em ciência de dados, combinando teoria e prática com foco em inovação e na resolução de problemas. A coordenação do curso é responsável pelo planejamento e gestão acadêmica, monitorando a qualidade de ensino, avaliação e atualização de conteúdo. O corpo docente é composto por especialistas experientes na área de dados, e cada disciplina conta com monitor para suporte acadêmico.

18 meses | Online | 400 h/a

Público-alvo
Profissionais graduados em qualquer área do conhecimento que desejem aprimorar as habilidades para comunicação eficaz, visualização de dados, análise e interpretação de informações, e decisões estratégicas baseadas em dados, aplicáveis em diversas áreas.

Grade curricular

Aqui você está no controle da sua formação

MÓDULO I
Lógica de programação.
Introdução à linguagem Python.
Manipulação de dados com DataFrames, JSON, visualização de dados e princípios de ETL.
Estrutura de consultas SQL, subconsultas, funções de janela e operações de união de tabelas.
Aprendizado supervisionado e não supervisionado, algoritmos baseados em árvores e técnicas de agrupamento.
Medidas de dispersão, associações entre variáveis, probabilidade, inferência estatística e identificação de outliers.
Etapas de um projeto de ciência de dados, engenharia de atributos, treinamento de algoritmos de machine learning e interpretação de erros.

MÓDULO II
Introdução ao versionamento de código com Git.
Fundamentos do versionamento.
Gerenciamento de ambientes virtuais com pyenv e IDEs.
Boas práticas para desenvolvimento e versionamento.
Modelos de negócio.
Métricas para análise de modelos de negócio.
Projeto profissional em ciência de dados.
Análise descritiva e exploratória dos dados.
Treinamento e ajuste de parâmetros de algoritmos de regressão.
Métricas de avaliação para modelos multi-classes.
Treinamento e ajustes de algoritmos para dados desbalanceados.
Publicação do modelo em produção.

MÓDULO III
Introdução à computação em nuvem na AWS.
Serviços da Cloud AWS e Sagemaker.
Introdução ao conceito de MLOps.
Uso do MLFlow para gestão de modelos.
Desenvolvimento, experimentação e publicação de modelos.
Monitoramento de desempenho em produção.
Aplicação do método SHAP para interpretabilidade de modelos.
Implementação de modelos com Regressão Logística, XGBoost e Árvores Aleatórias.
Métricas de desempenho (Curva ROC, Precisão e Recall).
Publicação de modelos em produção com Docker e Streamlit.
Técnicas de clusterização e análise exploratória.
Treinamento e ajuste de parâmetros em algoritmos de clusterização.
Introdução à Cloud GCP e seus serviços para ciência de dados.
Desenvolvimento de projetos de dados e transformação em produtos.
Fluxo de integração e entrega contínua (CI/CD) com Github Actions.
Consumo de modelos de machine learning no Looker.

Conheça seu corpo docente

Professores

Meigarom Lopes
Bruno César Pasquini
Matheus de Oliveira Alves
Edneide Ramalho
Caetano Bernal
Willian Uhlmann
Jonas Barletta
Thales Henrique

Certificação

Centro Universitário UNIFAAT (Instituição Educacional Atibaiense Ltda.). Portaria nº 258, de 22 de março de 2018. / Portaria nº 1.850, de 24 de outubro de 2019. Conceito MEC: Nota 4.