Aprenda a ensinar as máquinas

Saiba o que é e quando usar técnicas de aprendizado de máquina supervisionadas e não supervisionadas

Uma das principais dúvidas que ouço nas aulas de Inteligência Artificial (IA) é sobre o que é e quando usar técnicas de aprendizado de máquina supervisionadas e não supervisionadas. Estes termos implicam que são modelos diferentes. Fazendo uma metáfora, imagine alunos sendo supervisionados por um professor que passa um objetivo ou alvo específico e mostra diversos exemplos para que eles consigam ter um direcionamento de como aprender a executar sua tarefa, para melhor atingir o alvo. No não supervisionado, o professor dá exemplos, mas não indica o alvo a ser atingido. Os alunos estão livres para tirar suas conclusões a partir dos exemplos.

Essas técnicas endereçam resolução de problemas diferentes. Qual usar dependerá do objetivo do negócio. De maneira geral, as técnicas supervisionadas buscam responder uma questão específica e quão mais prescritivo o caso, mais adequadas elas serão. Um exemplo simples: analisar um vídeo gerado por um drone, para identificar danos em uma cerca de proteção. Você tem dados (frames do vídeo) e um alvo específico. Já o não supervisionado o objetivo é mais aberto, como entender melhor segmentos de mercado.

Como exemplos teríamos para supervisionados de classificação, usos para detecção de fraudes, identificação de imagens, diagnósticos médicos e retenção de clientes. Para supervisionados de regressão podemos citar previsão de crescimento de população, previsão do tempo e expectativa de vida. Já para não supervisionados de dimensionalidade citaríamos descoberta de novas estruturas moleculares e para não supervisionados de “clustering” ou agrupamento, os famosos sistemas de recomendação. Como as técnicas não supervisionadas são exploratórias, não tem respostas certas ou erradas. Já para os supervisionados, você tem como buscar respostas certas, que podem ser medidas, como o grau de acerto de diagnósticos de imagens médicas.

A tabela abaixo pode ajudar na compreensão:

	*Supervisionado*	*Não supervisionado*
Propósito	Responder a questões específicas	Descobrir padrões em conjunto de dados
Técnicas	Classificação e regressão	Clustering/Dimensionalidade
Produto gerado	Resultados prescritivos	Identificação de padrões
Exemplos	Imagens: cliente tem pacote de determinada marca detergente em seu carrinho?	Identificar segmentos de clientes com características similares
Ação direta	Fazer promoção como um desconto para o detergente	Não, mas desenvolver ações posteriores para atingir aqueles segmentos de clientes identificados

Mas, toda esta discussão só tem sentido se houver um real problema de negócio a ser resolvido. Assim, antes de qualquer ação que pretendemos executar com técnicas de IA é compreender a natureza do problema ser resolvido. Talvez não precise de IA, pois a tecnologia não é a panaceia para ser aplicada em tudo. Uma vez que consideramos IA como essencial para a solução, vamos entender e compreender os dados que serão necessários para que os algoritmos funcionem.

Os dados são a matéria-prima a partir da qual a solução será construída. Por exemplo, imaginemos que vamos buscar resolver um problema claro de negócios: reduzir o “churn rate” ou taxa de desconexão de operadoras de celulares. Significa entender porque os clientes cancelam as linhas e agir, de forma preventiva, para que isto não aconteça. Temos que buscar os dados que se relacionem com o problema, como utilização no tempo dos clientes (provavelmente se ele vai se desconectar, tende a diminuir seu uso com o tempo), ligações para o SAC, se as demandas foram atendidas, tempo de resolução, etc. Identificar as variáveis que serão úteis demanda conhecimento do negócio e também criatividade.

Esse conjunto de dados pode estar espalhado por diversas bases de dados e devem ser preparadas. A preparação dos dados é uma tarefa essencial e muitas vezes trabalhosa. Os dados podem estar em formatos diferentes, necessitando limpeza e conversões.

Agora, temos condições de criar os modelos. Entram as questões supervisionadas e não supervisionadas. Mas, além desta primeira classificação, existem grande número de algoritmos e técnicas de refinamento que vão exigir dos profissionais conhecimentos específicos. Aí que “pega” o conhecimento matemático. O modelo tem que ser treinado, ajustado e refinado e seus resultados avaliados. Por exemplo, podemos identificar padrões e correlações que não fazem sentido. Precisamos ter confiança que não temos anomalias.

A IA é uma ferramenta muito poderosa, mas não existe solução plug-and-play

Diferentemente da computação programática onde o software responde diretamente ao desenvolvedor que coloca todas as instruções em linhas de código e caso a resposta não seja correta, você depura e conserta o código, a IA interpreta dados com seus algoritmos e daí toma suas decisões. No não supervisionado, não sabemos se está certa ou errada, pois a resposta pode ser algo que nós humanos não havíamos percebido e a máquina identificou como um padrão e gerou sua decisão a partir desta constatação. A máquina pode gerar resultados surpreendentes, que nós jamais imaginaríamos.

Só depois de termos confiança é que devemos colocar o sistema de IA em operação. De maneira geral, a aplicação de IA faz parte de um processo maior. Por exemplo, vamos voltar à identificação do “churn rate” de clientes de celulares. Não adiantará nada identificarmos quais clientes terão alta probabilidade de cancelarem suas assinaturas se os processos de negócio não forem modificados para que as causas que os levaram a cancelar sejam eliminadas.

Além disso, apesar da implantação ser bem-sucedida, o processo muitas vezes retorna à fase de compreensão do negócio. O sistema de IA pode gerar novos conhecimentos e insights sobre o problema do negócio e demanda a necessidade de uma segunda iteração, para produzir uma solução melhorada. Também novas variáveis podem começar a ser coletadas e o processo se reinicia.

Assim, ao contrário de um típico sistema de TI como ERP, que uma vez colocada em produção, fica em paz, uma solução de IA tem que ser continuamente refinada e reavaliada. É um processo cíclico e que deve ser flexível o suficiente para rever as etapas anteriores com base nas descobertas feitas, sem ter que reinventar a roda. Deve ter atalhos para as fases anteriores e não refazê-los por inteiro.

Vamos criar um caso concreto. Aplicação de IA para analisar imagens usadas em radiologia, para detectar uma doença como câncer de mama. Uma aplicação fantástica, que não apenas resolve problemas reais, como ajuda a salvar vidas. Mas os desafios são imensos quando saímos da ideia para a realidade. Primeiro muitos hospitais têm equipamentos antigos, e incompatíveis entre si, gerando imagens de baixa qualidade.

Para o treinamento do sistema (usaremos técnicas supervisionadas, para lembrar...) precisamos que as imagens sejam rotuladas para que o algoritmo aprenda a identificar as células cancerosas. Precisamos que radiologistas anotem nas imagens onde estão as células cancerosas. Estas anotações são usadas como output enquanto as imagens são usadas como input, para que o sistema aprenda a reconhecer onde está o câncer. Precisamos de volumes muito grandes de imagens. Um desafio: além do hospital específico, temos outras fontes? Bem, onde os problemas acontecem? Os radiologistas nem sempre acertam na rotulação.

Algumas estimativas apontam que os médicos têm acurácia entre 50% e 70%, dependendo do seu nível de experiência e cansaço ao analisar as imagens. Com isso a rotulação sai com erros. Dois radiologistas podem chegar a conclusões diferentes ao analisar a mesma imagem. Os hospitais usam equipamentos diferentes e as imagens refletem também hábitos dos radiologistas como posicionamento e ângulo que usam o scanner.

Uma máxima antiga de TI continua valendo: “garbage-in, garbage-out”. Nenhum modelo, por mais sofisticado que seja, resistirá a dados errôneos. Assim rotulações erradas irão comprometer o resultado, inutilizando o sistema. Ter dados corretos, no caso, rotulando corretamente, é como converter petróleo em gasolina. A gasolina é que vai movimentar o motor, não o petróleo.

Ultrapassando as barreiras dos dados, chegamos a outras: humanas. Se os radiologistas olham com receio a solução de IA, o muro será quase intransponível. Eles devem ver a IA como sua auxiliar no seu estafante trabalho de analisar diariamente várias imagens. O processo tem que ser implementado aos poucos, para ganhar sua confiança.

Primeiro, quando a IA identificar um possível câncer, apenas mude a prioridade da imagem na fila a ser analisada pelo radiologista, sem avisá-lo. A rotulação que ele fará ajudará a melhorar o algoritmo. É um reforço no seu treinamento. Em uma etapa posterior, alerte-o e ele prestará mais atenção à imagem, rotulando-a com mais cuidado, o que vai melhorar mais ainda o aprendizado do algoritmo. E, um dia, quando a confiança estiver elevada, passe para o radiologista apenas os casos onde sua intervenção será necessária.

IA muitas vezes se relaciona com substituição de humanos por máquinas e a empresa deve ter uma política clara e transparente em relação ao futuro

Bem, e agora que a primeira iniciativa de IA decolou? Lembro que criar uma iniciativa isolada de IA é até relativamente fácil (??!!), desde que as etapas vistas anteriormente sejam atendidas. Mas a dificuldade está em permear IA pela organização. Um projeto, mesmo que bem-sucedido, terá pouco resultado na corporação como um todo.

Como tornar IA ubíqua na empresa? Destaco três variáveis críticas: trabalho colaborativo, com equipes multidisciplinares; adoção de cultura data-driven; e estrutura organizacional ágil e flexível. Um outro aspecto importante: transparência. IA muitas vezes se relaciona com substituição de humanos por máquinas e a empresa deve ter uma política clara e transparente em relação ao futuro, quando IA estiver sendo usada intensivamente.

Um outro aspecto importante e que deve ser analisado caso a caso é a organização de IA: como estruturar IA dentro da organização. Não existe receita de bolo. Cada empresa deve definir sua organização de acordo com sua maturidade no uso de IA, nível de sofisticação de suas aplicações e mesmo complexidade de seu modelo de negócios.

O que podemos aprender com tudo isso? Primeiro IA é uma ferramenta muito poderosa, mas não existe solução plug-and-play. Exige talentos e dados adequados. Demanda esforço e investimento. Mas, é uma jornada que vale a pena!

*Cezar Taurion é Partner e Head of Digital Transformation da Kick Corporate Ventures e presidente do i2a2 (Instituto de Inteligência Artificial Aplicada). É autor de nove livros que abordam assuntos como Transformação Digital, Inovação, Big Data e Tecnologias Emergentes. Professor convidado da Fundação Dom Cabral. Antes, foi professor do MBA em Gestão Estratégica da TI pela FGV-RJ e da cadeira de Empreendedorismo na Internet pelo MBI da NCE/UFRJ.