Skip to content

soterolab/curso-analise-dados

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Capa de Forms (1)

Que bom que você chegou aqui!

Esse é o repositório do nosso curso e aqui você encontra todo o material que vamos estudar para desenvolver nosso conhecimento em Análise de Dados com a linguagem Python.

“ensinar não é transferir conhecimento, mas criar as possibilidades para a sua produção ou a sua construção” - Paulo Freire (Pedagogia da Autonomia, Pág 20).

Quais ferramentas iremos usar?

1) GitHub - https://github.com/

O que é?  É uma ferramenta usada para publicar, compartilhar e versionar arquivos, como textos e códigos. O GitHub se utiliza do Git para permitir o versionamento de arquivos. É esse versionamento que permite que a gente dê ctrl+z nos projetos, sistemas, textos, sites e etc.

Por que usar o GitHub? Porque essa é uma ferramenta muito importante no desenvolvimento de software e muitas vezes é usada para avaliação em processos seletivos.

Caso não tenha, já corre e cria uma conta no GitHub: https://github.com/

2) Jupyter Notebook - https://jupyter.org/

O que é? Uma forma de construir códigos interativos, onde podemos visualizar e executar código, texto, gráficos e animações. Vamos usá-la para programar em Python.

Os textos no Jupyter Notebook são escritos em Markdown! Markdown é um linguagem usada para facilitar a formatação de textos em sites. Acesse aqui um Guia de comandos/sintaxe Markdown

Por que usar o Jupyter Notebook? Porque esse formato nos permite explorar e descrever tudo o que vamos fazendo passo a passo. E isso facilita o compartilhamento das nossas ideias com outras pessoas.

3) Google Colab - https://colab.research.google.com/

O que é? É uma ferramenta que permite que qualquer pessoa com uma conta do google escreva e execute código Python pelo navegador, e ele se baseia no Jupyter Notebook.

Por que usar o Google Colab? Porque isso remove complexidade no nosso estudo, pois não vamos precisar nos preocupar em instalar as ferramentas. Ter um navegador e uma conta no google serão os únicos requisitos necessários para praticarmos as atividades.

Quando não usar o Google Colab? Quando a sua atividade incluir dados que não sejam públicos, que devem ser protegidos pela LGPD e/ou sejam informações confidenciais da sua empresa ou organização.

Descrição do Conteúdo Programático:

  • O que é Análise de Dados e como está relacionada com os empregos na área de Tecnologia da Informação;
  • Estruturas e operações em análises de dados;
  • Análise de dados numéricos;
  • Análise de dados textuais (Tópicos e práticas de Processamento de Linguagem Natural (PLN))

Glossário e Conceitos Chave

O termo Documentação dentro da área de tecnologia significa um local que reúne todas as informações sobre como usar a ferramenta em questão. Seja ela uma linguagem de programação, biblioteca - qualquer coisa que você está querendo saber como funciona.

Guia de estilo para Python:

São recomendações sobre como escrever o nosso código de forma que ele fique mais organizado e inteligível por outras pessoas.

Biblioteca (No contexto de Programação)

Uma forma de entendermos o termo Bibliotecas na área de programação é pensá-lo como uma caixinha que reúne ferramentas que nós gostaríamos de utilizar para resolver um problema. Sendo que nós não vamos precisar construir essa ferramenta porque ela já foi feita e muito bem testada por outras pessoas - vamos poder simplesmente reusar aquilo.

Framework

E podemos entender Framework da mesma forma que entendemos Biblioteca. Só que o framework é uma caixa beeeeem maior e que nos permite fazer coisas mais complexas.

Sintaxe e Semântica:

Em programação a Sintaxe representa as regras que a gente precisa seguir para que a nossa mensagem seja entendida pelo nosso ouvinte. Então se vamos escrever um programa em Python, temos que respeitar a Sintaxe do Python. Se queremos escrever um texto em Markdown, vamos precisar seguir a Sintaxe do Markdown.

Já a Semântica da linguagem de programação trata do significado das expressões usadas na respectiva linguagem, é o que vai garantir que o print() deve imprimir a variável que lhe foi passada ao invés elevar ela ao quadrado, por exemplo. Semântica também é a relação entre o que gostaríamos que o código fizesse e o que de fato escrevemos para ele fazer.

Indicações de Materiais

Análise, Ciência e Visualização de Dados

About

Repository for learning of data analysis with Python and library Pandas.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •