Em 2006, o matemático britânico Clive Humby, cunhou a frase que ecoou no Vale do Silício e mundo afora: “dados são o novo petróleo”. Quase duas décadas depois, um estudo da MIT Sloan School of Management quantificou esse pensamento e determinou que empresas que usam estratégias baseadas em dados se beneficiaram de uma produtividade 4% maior e lucros 6% maiores.
Foi juntando todos esses pontos que o professor de Wharton, Michael Roberts, resolveu desenhar um curso sob medida para o mercado financeiro, construindo uma ponte entre análise de dados e aplicabilidade. A duração é de um ano.
As aulas do curso "Data Science for Finance" – o nome não poderia ser mais literal – têm vagas esgotadas, e não atrai a atenção só de universitários, não. "Grandes empresas nos procuram oferecendo dados e palestras, eles querem muito interagir com os nossos alunos", contou o docente em entrevista exclusiva ao NeoFeed.
Roberts, que é PhD pela Berkeley, foi reconhecido pela Wharton como um dos melhores professores, em 2015, e teve carta branca para desenhar a aula como bem entendesse. Foram dois anos inteiro formatando o curso, mas o empenho valeu a pena. "No começo, só estudantes de engenharia e finanças se interessavam pelas aulas, mas agora esse leque abriu muito", disse ele.
Em sala de aula, o professor Roberts analisa casos reais, com dados reais, e mostra aos alunos como interpretar todas essas informações para buscar estratégias responsáveis e um melhor retorno financeiro.
Quem passa por sua sala de aula aprende a dominar o "idioma" da tecnologia e ganha também fluência na aplicabilidade. Ao NeoFeed, o professor traduziu o que tudo isso significa.
Como surgiu a ideia deste curso?
Eu diria que comecei a pensar a respeito deste curso há uns quatro anos. Naquela época, pesquisava sobre algo que hoje é conhecido como ciência de dados. Mesmo no comecinho da minha vida acadêmica, uns 30 anos atrás, já estudava esse assunto e sentia que faltava um lugar na sala de aula para explorar o meu campo de atenção. Aí veio essa onda da ciência de dados e mudou tudo o que a gente sabe no setor financeiro. Isso me inspirou a desenhar um curso focado em ciência de dados voltado exclusivamente para o mercado financeiro. A partir daí tive a benção da administração da faculdade e total liberdade para montar a grade curricular que vemos hoje.
Como esse curso se diferencia dos demais? Quer dizer, por que esse curso tão específico era tão necessário?
Essa é uma excelente questão, porque os dados estão, literalmente, por todas as partes. Quando falamos em análise de dados, de decisões baseadas em dados, tudo se volta para a informação. E essas informações estão mudando o mundo ao nosso redor, seja no setor de marketing até o RH. O mercado financeiro, então, nem se fala. Mas em vez de tentar reformular toda a grade curricular do curso de finanças, que é um verdadeiro sucesso, só queria que uma única aula focasse no contexto dos dados em finanças. Digo isso porque, quanto mais penso a respeito, mais tenho certeza de que não existe sequer uma aplicação financeira que não use dados. Eles estão por toda parte e acho que essa aula é só o começo de algo maior.
"Não existe sequer uma aplicação financeira que não use dados. Eles estão por toda parte e acho que essa aula é só o começo de algo maior"
Você teve a ideia há quatro anos, mas as aulas começaram mesmo há dois anos – bem no meio da pandemia. Você teve que mudar alguma coisa por conta disso?
Ah, sim, mas foi tranquilo. Todo o curso gira ao redor do que chamamos de "laboratório de dados", que é uma espécie de estudos de caso, onde os alunos são convidados a usar a análise de dados para montar alguns quebra-cabeças reais. Como era de se esperar, tudo isso se adaptou muito bem no modelo virtual: compartilhava a minha tela com os alunos, que codificavam o que era necessário junto comigo. Claro que a dinâmica do presencial não é totalmente traduzida para o modelo online, mas acho que nos saímos bem – e o feedback que recebemos dos alunos foi excelente, com poucas sugestões de mudanças.
Onde os alunos coletam os dados usados em sala de aula, e como essas informações estão sendo usadas?
Para responder a essa pergunta, deixe-me dar um passo para trás. Tudo o que fazemos em sala de aula é motivado por uma pergunta prática. Queremos tentar jogar luz e resolver um problema que seja relevante para quem toma decisões. Digo isso para explicar que levo para os laboratórios de dados situações reais que tive acesso em situações profissionais, ou que um dos professores/palestrantes convidados teve acesso em sua carreira e gentilmente compartilhou conosco.
E como os alunos trabalham com eles?
Os alunos têm de pensar em todo o fluxo de trabalho de um cientista de dados, mas num contexto particular, relacionado ao problema. Isso significa que precisamos de dados para apoiar a pesquisa, e fazemos isso na internet mesmo. A gente vasculha toda a internet, mas também temos acesso às informações compartilhadas pelas empresas em questão ou, como falei, através dos palestrantes e convidados. Além disso, a Wharton dispõe de um mega repositório de dados, ao qual temos acesso. O governo também tende a colaborar bastante conosco, então pegamos dados de todas as fontes possíveis.
Quais são algumas das questões que são respondidas em sala de aula? Quais os problemas que o curso resolve?
Um dos meus prediletos, que também é um dos favoritos dos alunos, é a questão do fundo que administra pensões. Um grande fundo, responsável por pensões de cidadãos americanos, precisa ouvir pitches de investidores e decidir se aloca ou não dinheiro nestes investimentos. Um dos pitches apresentados é de um fundo hedge muito conhecido e muito bem-sucedido, e que foi generoso o suficiente para permitir que o fundo das pensões acessasse os dados que tinha em mãos. Aí os alunos recebem esses dados, analisam a performance do fundo hedge, e precisam decidir se alocam ou não parte do capital do fundo de pensões ali.
Tem alguma armadilha?
O que os alunos não sabem é que o fundo hedge é o fundo do Bernie Madoff, que fazia parte do Esquema Ponzi. Então, quando trago esse briefing para a sala de aula, vejo um monte de alunos dizendo coisas como "este é o maior investimento que já vimos! Vamos dar a eles 25% da nossa alocação". Ao mesmo tempo, outros alunos argumentam "não sei, isso simplesmente não parece certo". Há quem diga até que isso é uma loucura. A discussão é maravilhosa e esse é apenas um exemplo de como usamos a análise de dados para administrar fundos de pensão de gestores de investimentos; como eles podem fazer diligências adequadas, vasculhando os dados para entender se alocam ou não fundos.
Algum exemplo seja talvez mais tangível?
Sim, outro que eu gosto muito é da joalheria. Uma joalheira se especializou em peças com diamantes, e o proprietário queria descobrir quais diamantes, a preços de atacado, lhe favoreciam mais. Basicamente, ela quer encontrar diamantes de boa qualidade, a um preço atraente. Paralelo a isso, ela também queria descobrir a margem de lucro de seus concorrentes. Os alunos tiveram, então, que fazer uma verdadeira varredura para levantar o preço dos diamantes no atacado e, então, criaram um modelo de learning machine com esses dados.
E como é aplicado?
O algoritmo desenhado por eles leva em consideração os quatro fatores principais do diamante: corte, clareza, quilate e cor. Isso ajuda a proprietária a identificar a melhor opção e economizar. Esse mesmo modelo é usado para tentar revelar as margens de preço dos concorrentes, uma vez que temos os preços de varejo. Esse é um projeto divertido, porque é o oposto da alocação de investimento. É um pequeno negócio, com apenas três lojas, mas é incrivelmente beneficiado pelo que fazemos, já que a proprietária das lojas usa esses dados para tomar melhores decisões.
O sucesso do estudo desses casos já chamou a atenção de gente fora de sala?Alguma empresa ou empresário os procurou querendo contratar algum dos seus alunos, ou pelo menos tentar emplacar um caso de estudo junto aos universitários?
A gente só trabalha com caso real, eu estou mantendo os envolvidos no anonimato aqui por motivos óbvios, mas tudo isso aconteceu mesmo. Agora, respondendo diretamente a sua pergunta, muitos dos nossos alunos são, sim, contratados por fundos hedge e bancos. Acho que tem duas coisas interessantes em jogo aqui. A primeira é que eu recebo um grande volume de e-mails de alunos dizendo que estão utilizando o que aprenderam em sala de aula em seus empregos, seja isso numa posição júnior ou não. A aplicabilidade do meu conteúdo me traz uma satisfação enorme. Agora, falando da parte do empregador, me alegro em ver o interesse de grandes empresas em interagir conosco em sala de aula. Essas companhias querem nos fornecer dados e participar do laboratório; querem palestrar junto aos alunos. Esse curso é um fenômeno.
"Fundos de hedge usam dados para balizar suas decisões há anos. Diria, inclusive, que esses fundos são uma companhia de TI tanto quanto são uma companhia financeira"
Você acha que os seus alunos seriam capazes de, por exemplo, reconhecer casos clássicos, como a Theranos, de Elizabeth Holmes, que levantou milhões de dólares diante de uma promessa impossível de ser cumprida? Esse fiasco teria sido evitado se os envolvidos tivessem os dados e os conhecimentos certos?
O cientista em mim quer ser muito cuidadoso e dizer "possivelmente". Mas acho que no caso da Theranos, ninguém realmente tinha acesso aos dados. Assim, não estou convencido de que a falcatrua pudesse ter sido descoberta por alguém de fora da empresa.
Acha que os dados podem mudar a tendência de investimentos? Quer dizer, a gente tem visto alguns aportes agressivos em startups que ainda não param de pé. Acredita que isso possa mudar, por conta da análise de dados?
Fundos de hedge usam dados para balizar suas decisões há anos. Diria, inclusive, que esses fundos são uma companhia de TI tanto quanto são uma companhia financeira. O mesmo vale para companhias de private equity, grandes bancos e venture capital. Todos eles dedicam uma parte substancial de seu orçamento ao departamento de tecnologia, porque dados importam e muito. A grande questão é: venture capital analisam dados de startups, que, na maioria dos casos, têm uma curta história de vida e de operação. Ou seja, os dados disponíveis são parcos.
E os aportes agressivos?
Esse fenômeno que estamos vendo e vivendo, de abundância de capital em negócios arriscados, diz muito mais sobre o nosso contexto atual, de juros baixos e de inflação alta, em que os investidores estão procurando retornos mais atraentes. Como você sabe, a única forma de fazer isso é arriscando, né? Se é ou não um risco que vai valer a pena, vai de cada caso. Mas isso é realmente o que está acontecendo agora. Os dados estão lá, eles nos ajudarão a entender se as decisões que tomamos fazem sentido ou não.
Se análise de dados é uma forma de interpretação, podemos presumir que erros são parte do jogo?
Sim. Inclusive, uma das grandes lições que eu quero que os alunos levem para a vida é essa: você pode fazer os dados "falarem" o que você quiser, mesmo que não seja certo. O desafio do curso é mostrar a complexidade de analisar os dados, porque para interpretá-los, é preciso reconhecer suas limitações. Às vezes, você quer responder a uma questão, mas os dados que você têm às mãos não lhe permitem fazê-lo. Essa é uma habilidade importante: a capacidade de reconhecer o que você pode fazer com os dados e também o que não pode.
E é aí que entra a questão dos dados enviesados. Como podemos assegurar que os dados e as análises sejam os mais neutros possíveis?
Acho que aqui a parte financeira desempenha um papel disciplinar importante, porque se nós errarmos, vai custar um dinheirão para a empresa. Por isso, há um grande incentivo para que os dados sejam tratados com muita cautela, porque vira um efeito dominó: dados errados e análises erradas são a base de uma tomada de decisão errada, o que certamente levará a um prejuízo financeiro. Mesmo que você tenha uma boa intenção… digamos que você tem um projeto, e usa dados para justificar e executar o seu projeto. Depois de repetidas vezes, alguém vai entender que a sua metodologia, para tirar ideias do papel, está com a "pontaria fraca", para dizer o mínimo.
"Dados errados e análises erradas são a base de uma tomada de decisão errada, o que certamente levará a um prejuízo financeiro"
Sei que esse curso está ativo há pouco tempo, dois anos, mas queria saber se você notou alguma diferença no tipo de aluno que se interessa por essas aulas?
Estamos recebendo um conjunto muito mais amplo e diversificado de alunos. Inicialmente, o interesse era de estudantes de finanças e engenharia, meio que estudantes de duas graduações que queriam entrar em coisas mais técnicas. No ano passado, tivemos mais estudantes de finanças convencionais, além de engenheiros, cientistas da computação e programadores que queriam ver do que se tratava. E eu acho que a diversidade vai realmente continuar a crescer, porque o que os alunos estão percebendo é que os empregos tradicionais de Wall Street, banco de investimento, private equity é sobre análise de dados.
E como incentivar essa diversidade de público?
O que estou tentando fazer com o curso é encontrar esse ponto de equilíbrio entre os doutorandos em estatísticas, que estão executando os programas e analisando os dados, e vendedores que estão apenas lidando com os clientes, mas não sabem muito sobre os dados. Meus alunos podem conversar com os dois, podem fazer essa ponte entre técnica e aplicação.
Podemos dizer que eles são "tradutores de dados"?
Isso, acho que o termo é exatamente esse: tradutores.
Como você enxerga o futuro desse curso?
Acho que sempre vai ser um curso dinâmico, que muda anualmente para acompanhar o seu tempo. Mas, da minha parte, eu quero injetar mais análise de dados em alguns dos nossos outros cursos, que ainda não contam com isso.