Contexto e Motivação
No cenário atual, decisões estratégicas são cada vez mais orientadas por dados. Com isso, compreender padrões salariais entre diferentes funções na área de tecnologia é fundamental para organizações e profissionais. Este projeto teve como objetivo analisar se há uma diferença salarial significativa entre Analistas de Dados e Cientistas de Dados, aplicando técnicas estatísticas rigorosas para validação dos resultados.
Objetivo da Análise
Verificar se existe uma diferença estatisticamente significativa na remuneração média entre Analistas e Cientistas de Dados.
Ferramentas e Tecnologias Utilizadas
Python (Pandas, Matplotlib): análise exploratória de dados, manipulação de datasets e visualizações.
SQL no Databricks: extração e preparação de dados específicos para análise estatística.
Jamovi: execução de testes de hipóteses e validação estatística.
Metodologia e Preparação dos Dados
Dados sintéticos foram obtidos do Kaggle (link: dataset).
Verificação da consistência do dataset: tipos de dados corretos, ausência de valores nulos ou duplicados.
Criação de dataframe específico com SQL para concentrar informações sobre Analistas e Cientistas de Dados, preparando os dados para testes estatísticos.