A ciência de dados se materializa no código. A habilidade de escrever código reproduzível, robusto e escalável é imprescindível para o sucesso de um projeto de ciência de dados – e é absolutamente crucial para quem trabalha com código de produção. Este livro prático preenche a lacuna entre a ciência de dados e a engenharia de software e explica de forma clara como aplicar as melhores práticas da engenharia de software à ciência de dados.
Exemplos são fornecidos em Python, extraídos de pacotes populares como o NumPy e o pandas. Caso queira escrever um código de ciência de dados melhor, este guia apresenta os tópicos essenciais que, muitas vezes, não são abordados nas aulas introdutórias de ciência de dados ou de programação, incluindo como:
• Compreender estruturas de dados e programação orientada a objetos
• Documentar seu código de forma clara e habilidosa
• Empacotar e compartilhar seu código
• Integrar código de ciência de dados a uma base de código maior
• Aprender a escrever APIs
• Criar código seguro
• Aplicar práticas recomendadas a tarefas comuns, como testes, tratamento de erros e registro em logs
• Trabalhar de modo mais eficaz com engenheiros de software
• Escrever código mais eficiente, de fácil manutenção e robusto em Python
• Implantar seus projetos de ciência de dados em produção
• E muito mais.
Informática e Tecnologia