Pronto, sejam bem-vindos, sejam bem-vindas à nossa aula exclusiva do CR_IA, só para alunos, só para você que é membro da nossa plataforma. Hoje vamos falar um pouco sobre como o ChatGPT, ou a inteligência artificial de forma geral – mas estamos focando mais no ChatGPT especificamente aqui, em outras ferramentas – vai te ajudar com análise de dados especificamente.
Fizemos uma pesquisa recente com nosso público do CR_IA e muitos de vocês pediram mais conteúdos sobre análise de dados e produtividade. Então, cá estamos justamente para fazer isso.
A dinâmica desta aula será um pouco mais solta. Quero mostrar a lógica do que eu faria e como pensaria na hora de usar essas ferramentas para fazer análise de dados ou ajudar com análise de dados de alguma forma.
Quando falamos de análise de dados aqui, isso pode significar muitas coisas. Estamos focando basicamente numa situação em que você tem uma planilha, uma quantidade grande de informações específicas, que talvez sejam muitas, e você quer tirar informações dela o mais rápido possível, chegando a conclusões rapidamente e com certa qualidade, algo que demoraria muito mais tempo se você não usasse inteligência artificial para isso.
Eu acredito que análise de dados é basicamente a base da inteligência artificial. A gente vê isso no comportamento da IA, porque muitos desses modelos generativos, seja para criação de imagens, textos, vídeos, músicas, sempre são treinados com grande quantidade de dados. Por exemplo, eles veem milhares de fotos de cachorros, identificam o que é um cachorro, entendem quais são os dados que caracterizam um cachorro para poderem prever e gerar a imagem dele quando você pede.
Então, quando falamos de análise de dados em tempo real com IA, muito disso é o modelo entendendo o que você espera a partir das ordens dadas antes.
Aqui quero destacar duas ferramentas específicas — existem milhares — mas vamos focar no ChatGPT e no Claude. Existe integração do Google Spreadsheets com IA, por exemplo, para você interagir com seus dados direto na planilha, mas aqui vamos focar nessas duas.
Quantos de vocês já usaram o Claude? A Ana deu uma aula sobre ele essa semana que está bem legal, se ainda não assistiu, fique de olho, o link estará nas aulas relacionadas. O Claude é parecido com o ChatGPT, só que tem algumas funções diferentes que vou mostrar aqui.
Ambas as ferramentas, tanto na versão gratuita quanto na paga, são multimodais. Ou seja, conseguem lidar com vários tipos de arquivos. Antes, no ChatGPT, você só conseguia interagir por texto, agora pode mandar imagem, PDF, arquivos CSV, XLS, vários arquivos que elas conseguem analisar junto com você.
Isso expande muito nossa área de atuação. Com uma ferramenta só podemos fazer muitas coisas e analisar várias informações diferentes.
O ChatGPT na versão que vou usar aqui — a versão “for all” que provavelmente é a que todo mundo tem acesso agora — também permite o envio de vários arquivos, mais perguntas e mais informações em geral. Quem paga tem acesso a recursos ainda maiores.
Eu estava acostumado a usar mais o Claude para arquivos grandes, por isso parei um pouco de usar o ChatGPT para isso. Mas para essa aula estava usando o ChatGPT e fiquei impressionado com a quantidade de informação que ele agora consegue lidar.
Um ponto importante: tenha cuidado com contas feitas por essas ferramentas, principalmente se as análises dependerem de números, somas, valores exatos. Muitas LLMs — esses chatbots — ainda erram em contas matemáticas. Eles dão uma base boa, mas é fundamental você verificar as contas.
Nos testes que fiz, todos os resultados foram corretos, mas é sempre bom lembrar: a inteligência artificial ajuda, mas o poder da informação final está com você. Às vezes a gente se acomoda, mas nunca confie 100% sem verificação.
Para esta aula, trouxe três tabelas em XLS que estão disponíveis no link que compartilhei. Se você está assistindo gravado, o link está nos assets da aula, pode baixar, fazer junto comigo e usar essas mesmas tabelas.
São três tabelas que peguei no site Kaggle — um site que talvez vocês não conheçam — onde você pode encontrar muitos datasets interessantes para usar como exemplo, educação, estudos, etc.
Vocês podem buscar por “Brasil” no Kaggle, por exemplo, e encontrar tabelas como a do Brasileirão, que vou usar hoje.
Essa tabela do Brasileirão tem todos os gols de 2003 até 2023, são mais de 8 mil linhas, muita informação.
Quando passo essa tabela para o ChatGPT, ele cria um código na hora baseado no CSV que mandei para fazer cálculos, somas, análises.
Por exemplo, perguntei quais times mais marcaram gols nesse período.
O ChatGPT criou uma linha de código para rodar em cima do arquivo CSV e obteve o total de gols por clube: Flamengo 590 gols, Palmeiras 581, Atlético Mineiro, Santos, São Paulo, Fluminense, Corinthians, etc.
Ele soma os gols totais de cada time para responder.
Aqui é interessante entender que diferente de buscas na internet, quando você passa um arquivo CSV para ele e pede uma análise, ele cria um código para responder à pergunta.
Assim, você sabe que existe um código (que pode ser em Python) rodando em cima dos seus dados para te entregar as respostas.
Depois dessa soma total, você pode fazer mais perguntas, como quais jogadores mais marcaram, qual foi o jogo com mais gols, e o ChatGPT irá interpretar e responder.
Por exemplo, pergunta sobre o jogo com mais gols, ele aponta a partida com 10 gols entre Goiás e Bahia.
Também temos um arquivo complementar com todos os jogos para mais detalhes.
O legal é que com arquivos grandes como esse, de 8 mil linhas, conseguimos tirar informações simples com perguntas simples.
Minha recomendação: sempre refaça as contas para verificar. Peça para ele fazer a análise outra vez para conferir os dados.
Fiz isso e as informações bateram com os dados originais; por exemplo, os gols do Flamengo e Palmeiras conferiram com a tabela.
Você pode perguntar outras coisas para testar os limites do ChatGPT na análise, como quais times têm a maior média de gols por partida ou como essa média de gols mudou ao longo das temporadas.
Fiz um teste AB com duas respostas dele e bateu certinho: quase 2 gols de média por partida para o Flamengo, por exemplo.
Eu não entendo muito de futebol, mas achei o processo interessante.
Quando a gente tem arquivo longo em linhas, mas com poucas colunas, dá para trabalhar bem.
Se o arquivo tiver muitas colunas, fica mais complexo, mas vamos tratar disso mais na frente.
Agora vamos para a criação de gráficos.
Você pode pedir para o ChatGPT criar gráficos interativos, por exemplo, com os 10 times que mais marcaram gols.
Ele vai criar um código em Python para gerar o gráfico.
O gráfico pode ser baixado como PNG, pronto para usar em apresentação ou onde quiser.
Você pode até mudar as cores dele antes de baixar.
É muito legal a quantidade de coisas que você pode fazer direto no ChatGPT.
Eu vou mostrar um exemplo com dados dos 200 filmes com maior bilheteria nos Estados Unidos no ano passado.
Nessa tabela têm rank, título, número de salas de cinema, arrecadação, data de lançamento e distribuidor.
Pedi para criar um gráfico que mostra o total arrecadado por cada distribuidor em 2023. O maior é a Disney, seguida pela Universal.
Mesmo com dados um pouco confusos, é possível fazer análises e gerar gráficos interativos, inclusive baixar em HTML.
Por exemplo, a Cleide perguntou sobre o arquivo HTML para download que o ChatGPT gerou.
Você pode pedir o arquivo em PNG se quiser uma imagem.
Se paga pelo ChatGPT, tem acesso a recursos maiores, mas às vezes precisa forçar ele para fazer no formato que você quer, como XLS ou CSV.
Às vezes ele não entrega exatamente como você pediu, então vale pedir para reformular.
Esses são os chamados “prompts imediatos”, quando você tem a ideia e já pede para ele fazer.
É importante estruturar melhor a conversa para facilitar a geração de informações.
Agora um truque: vamos sair do ChatGPT e ir para o Claude.
Vou pegar aqui a tabela dos top filmes e pedir para o Claude criar um dashboard para analisar as informações da melhor forma possível, com gráficos interativos, sistema de buscas, tabelas e o que mais achar relevante.
Mesmo pedindo muita coisa, ele vai gerar um código em React, que é uma linguagem de programação.
Como a tabela é muito grande, ele começou fazendo para os cinco primeiros filmes e depois vai ajustar para os dez primeiros.
Notei que o código usou uma biblioteca de ícones não disponível no Claude, pedi para corrigir isso e incluir o top 10.
O Claude gera o código e mostra para a gente o que ele está criando.
O dashboard tem barra de pesquisa, gráfico de barras, tabela de estatísticas e tabelas de dados.
Isso pode ser muito útil para criar dashboards personalizados rapidamente.
Você pode publicar o dashboard, compartilhar o link com seu cliente ou equipe, para acessar direto com visualização interativa.
Você pode ainda pedir para rearranjar elementos, mudar a ordem das tabelas, e adaptar o que precisar, tudo via linguagem natural.
O Claude foi lançado no Brasil há menos de um mês, e as possibilidades são impressionantes.
O ChatGPT pode criar códigos, mas você precisa saber rodá-los.
Com o Claude, você tem uma experiência mais direta e um pouco mais fácil para criação visual e interativa.
Até aqui mostrei como podemos usar código para análises, criar gráficos e fazer dashboards com essas ferramentas.
Tem muito o que testar e explorar.
Agora vamos para o terceiro ponto: insights.
Vamos descobrir juntos o que podemos fazer.
Eu estava usando outro dado antes, mas baixei um dataset do Kaggle que parece ser do iFood ou algo parecido — ele tem vários dados e uma legenda que explica o significado de cada coluna.
Vou juntar essa legenda ao arquivo CSV para o ChatGPT entender melhor as colunas.
Isso é uma vantagem do multimodal: podemos enviar legendas, arquivos, e deixar a análise mais clara.
Pedi para o ChatGPT apontar 10 informações relevantes que consegue tirar da planilha.
Ele respondeu coisas como: a renda anual dos clientes varia bastante, muitos clientes têm filhos pequenos ou adolescentes, isso pode influenciar na categoria de produtos comprados, entre outras observações sobre gastos, descontos, visitas à web etc.
Então posso pedir análises específicas, como quais categorias de produto têm maiores gastos em média, e ele responde: vinhos, carnes, frutos do mar, doces, entre outros.
Aqui fica claro que não sabemos exatamente a origem do dado — tem uma coluna "produto de ouro" que não faz sentido no contexto, mas tudo bem.
Posso pedir para transformar essa análise em tabela, e ele gera uma tabela para baixar em CSV.
Também pedi para ele me dar 10 oportunidades de ação baseadas na tabela.
Ele fez uma análise combinando os dados e uma base criativa, sugerindo ações como segmentação por renda, campanhas personalizadas para clientes com famílias, ofertas exclusivas para produtos premium e outras estratégias de marketing.
Você pode pedir mais insights ou dados para embasar suas decisões, como criar campanhas focadas em famílias, comparando clientes com filhos e sem filhos.
Por exemplo, pedi para ele criar um gráfico comparando esses dois grupos.
Isso é ótimo porque o ChatGPT pode ser um assistente para trabalhar junto com você nessas análises, cruzando informações complexas e dando ideias.
Mesmo que os dados sejam um pouco confusos, como no nosso exemplo, a dinâmica funciona.
Quero abrir espaço para perguntas sobre o que mostrei até aqui e como podemos trabalhar com dados usando essas ferramentas.
[Interação com alunos]
Felipe comentou que é lento, está acostumado a ir rápido, e trabalhou com Excel, principalmente em listas longas, como as de municípios de Minas Gerais, com mais de 800 linhas.
Ele perguntou como eu resolveria um problema: ele tem uma lista de pessoas que participaram de um curso com oito aulas e precisa extrair da planilha apenas os que participaram de seis encontros ou mais para dar certificado.
Perguntei se usaria o ChatGPT para conversar e pedir ajuda com a fórmula no Excel, ou faria direto no Excel.
Respondi que tentaria as duas coisas para aprendizado: pedir a fórmula no ChatGPT e jogar a tabela para ele indicar o que pode ser feito.
Como o ChatGPT é muito bom com fórmulas do Excel, isso dá uma liberdade bacana para replicar depois, sem precisar pensar de novo.
Essa é uma ótima forma de começar e também para garantir que as respostas são confiáveis, pedindo o mesmo em duas conversas diferentes para garantir que a lista esteja correta.
Se estiver sem tempo, jogue direto no ChatGPT e peça para ver qual fórmula ele sugere.
Eu uso o ChatGPT muito para fórmulas no Excel, mesmo sendo de humanas, gosto muito dessa ferramenta.
Alguém tem mais perguntas?
Vou finalizar a aula por aqui.
Pronto.