
Tecnisys celebra contribuição do Profissional de Tecnologia da Informação para a sociedade
7 de novembro de 2022
Tecnisys reúne seus colaboradores em sua tradicional festa de fim de ano
6 de janeiro de 2023Como mergulhar, ou melhor, como desbravar um novo Universo chamado Ciência de Dados? Por onde começar?
Com o advindo do Big Data e sua expansão que começou a abranger uma gama infinita de informações estruturadas ou não, gerou oportunidades para que as empresas buscassem amplamente insights nos mais diversos cenários do mundo corporativo e diante dessa busca incessante criou-se a necessidade de novos perfis alinhados ao mercado emergente por dados. Fez necessário então alguém que desvendasse esses dados e os transformassem em informações preparadas para as tomadas de decisões, entrou então em cena a figura do Cientista de Dados.
De acordo com Diego Wesllen da Silva, gerente de Analytics do Itaú, “a Ciência de Dados surge de forma natural no cotidiano empresarial, principalmente em um cenário onde as decisões de negócios são baseadas em dados”.
Recentemente Anjul Bhambhri, Ex Vice-Presidente de Big Data da IBM e atual Vice-Presidente da Adobe, disse que:
“Um Cientista de Dados representa uma evolução do papel de Analista de Negócios ou Analista de Dados. Estes profissionais possuem uma base sólida normalmente em ciência da computação, aplicações, modelagem, estatísticas, análises e matemática.”
Qual a definição de cientista de dados?
Podemos iniciar definindo que são especialistas que possuem habilidades em nível técnico para resolver problemas com alto grau de complexidade. Sendo responsável por atividades de coletar, gerenciar e transformar dados das mais diversas fontes e extrair assim informações que serão usadas em modelos de tomada de decisão. Possuem também habilidades de inter-relacionar estes dados, fazendo que ganhem mais valor agregado e os tornem mais valiosos para as empresas.
Atualmente e devido a onda crescente da área é comum nos deparar com uma enxurrada de informações das mais diversas possíveis sobre qual caminho seguir para se tornar um cientista de dados. Porém, podemos deixar claro que não há caminho fácil, pois é necessário disciplina e uma rotina de estudo bem consistente, para que se possa aprender as mais diversas técnicas e ferramentas que são usadas por profissionais desta área.
André Filipe, graduado em Computação na Universidade Federal do ABC, Professor do Insper, Mestre na UFABC e Doutor na Escola Politécnica na USP, recentemente disse:
“É necessário estar disposto a trabalhar em equipe, conhecer as principais ferramentas da área e ir além delas, desenvolver um pensamento estruturado, compreender o domínio do problema, saber organizar sua rotina, fazer uso de técnicas de storytelling para mostrar os resultados e sempre ler bons livros.”
Sendo assim, por onde começar?
Iremos abordar passos fundamentais para quem almeja iniciar na área.
Área de atuação:
Visto que ciência de dados é uma área bastante abrangente, podendo ser aplicada em qualquer área da vida humana, isso inclui Física, Biologia, Mercado Financeiro, Logística, Medicina, as mais diversas Engenharias e demais áreas. É importante saber que cada área dessas têm suas especificidades e diante disso devemos ter domínio de conhecimento diante de cada cenário. Isto porque uma solução abordada em determinado departamento não irá funcionar em outro.
Portanto, é necessário que o cientista de dados desenvolva a capacidade de transformar problemas de negócio em problemas de ciência de dados.
Programação:
É fundamental para o profissional cientista de dados que tenha a capacidade de manipular dados com um computador. Diante disso, é necessário aprender uma linguagem de programação como R, Python, Julia, Scala, Java, são alguns exemplos que ajudarão ao profissional aplicar os mais diversos testes estatísticos e apresentar dados em gráficos e em visualizações, onde poderá interligar diferentes cenários.
Banco de Dados:
O processo de análise consiste na interação de fontes de dados dos mais diversos tipos, que podem ser oriundas de banco de dados relacionais, banco de dados, NoSQL, ambientes Big Data como Data Lake, Hadoop, entre outras. Com isso é preciso conhecer os termos, conceitos e diferenças entre bancos e como utilizar a linguagem SQL (Structured Query Language) para as mais diversas consultas
Matemática e Estatística:
Ter conhecimento dessas duas áreas é parte fundamental para trabalhar como cientista de dados, isto porque ajuda na elaboração de algoritmos ligados a inteligência artificial e modelos estatísticos. Então preciso ter formação nesta área? Não, o que precisa é ter uma compreensão dos termos que estas áreas possuem e como aplicá-los. Claro que a formação traz uma compreensão mais sólida, porém não preciso que você aprenda todos os assuntos ligados, mas que compreenda como usar e aplicar.
Para todos que querem iniciar na carreira recomenda-se aprender Estatísticas codificando, de preferência em Python ou R, para que assim você possa aplicar os conceitos e termos usados.
Big Data:
A matéria prima de consumo do cientista de dados é o Big Data, por isso é fundamental que o profissional entenda como é a estrutura e funcionamento do ambiente Big Data para que possa aplicar técnicas e colher as informações. Dessa forma o cientista de dados precisa conhecer bem como está armazenado os dados. Diante disso é preciso ter conhecimento na composição do Ecossistema Hadoop e como estão interligados.
Colocar em prática:
A solução das atividades do cientista de dados envolve as seguintes macros atividades: coletar dados, organizá-los, transformá-los, visualizá-los, modelá-los e, finalmente, comunicar os resultados.
Fonte: https://www.gupy.io/blog-do-emprego/como-se-tornar-cientista-de-dados
Contudo sabemos que as atividades não ocorrem linearmente, pois sempre existem pontos e ações de ida e vinda que se interconectam durante o processo de atividades em que uma tende a demandar mais tempo na sua execução.
O que deve ser considerado ao construir projetos é que é uma excelente forma de pôr a mão na massa diante dos conhecimentos adquiridos e os integrá-los de forma concisa.
Dessa forma podemos elencar algumas funções típicas de um cientista de dados:
• Coletar grandes quantidades de dados não-estruturados e transformá-los em um formato mais utilizável;
• Resolver problemas de negócios usando técnicas orientadas por dados;
• Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python;
• Ter uma sólida compreensão de estatística, incluindo testes e distribuições;
• Estar sempre atualizado sobre técnicas analíticas, como machine learning, deep learning e análise de texto;
• Procurar por ordem e padrões nos dados, além de identificar tendências que podem ajudar no resultado financeiro de uma empresa.
Ufa, se chegamos até esse ponto já podemos compreender melhor porque o Cientista de Dados é uma profissão em franca ascensão o que também explica porque sua remuneração está entre as maiores em qualquer pesquisa, porém entendemos também que a caminhada é longa e árdua, portanto existem diversas armadilhas que não podemos cair como de acharmos que o aprendizado é fácil e rápido, que devemos aprender muitos conceitos ao mesmo tempo sem ir consolidando o que já estudado, de começar por problemas muitos complexos, ou mesmo de apenas focarmos em programação, o importante é irmos atingindo nossos platôs de conhecimento de forma sustentável e progressiva que certamente o seu sucesso será um case. Let’s go to the future!
Fontes:
Data Science Academy: Cientista de Dados – Por Onde Começar em 8 Passos.Disponível em:
https://blog.dsacademy.com.br/cientista-de-dados-por-onde-comecar-em-8-passos/. Acesso em: 28/09/2022.
INSPER: Como Iniciar Uma Carreira Em Ciência De Dados? Disponível em: https://www.insper.edu.br/noticias/ciencia-de-dados-iniciar-carreira/ . Acesso em 28/09/2022.
Gupy: Como se tornar cientista de dados? . Disponível em: https://www.gupy.io/blog-do-emprego/como-se-tornar-cientista-de-dados . Acesso em 28/09/2022