A inteligência artificial está em todo lugar nos dias de hoje, mas os fundamentos de como essa nova e influente tecnologia funciona podem ser difíceis de entender. Dois dos campos mais importantes no desenvolvimento da IA são o “aprendizado de máquina” e seu subcampo, “aprendizado profundo”, embora os termos às vezes sejam usados de forma intercambiável, levando a certo nível de confusão. Aqui está uma explicação rápida dessas duas disciplinas importantes e de como elas estão contribuindo para a evolução da automação.
Primeiramente, o que é IA? Defensores da inteligência artificial dizem que esperam um dia criar uma máquina que possa “pensar” por si mesma. O cérebro humano é um instrumento magnífico, capaz de fazer cálculos que superam em muito a capacidade de qualquer máquina existente atualmente. Os engenheiros de software envolvidos no desenvolvimento da IA esperam eventualmente criar uma máquina que possa fazer tudo o que um humano pode fazer intelectualmente, mas também superá-lo. Atualmente, as aplicações de IA nos negócios e no governo se resumem em grande parte a algoritmos preditivos, do tipo que sugerem sua próxima música no Spotify ou tentam vender um produto semelhante ao que você comprou na Amazon na semana passada. No entanto, os evangelistas da IA acreditam que a tecnologia, eventualmente, será capaz de raciocinar e tomar decisões muito mais complicadas. É aí que entram o ML e o DL.
Aprendizado de máquina, explicado. O aprendizado de máquina (ou ML) é uma ampla categoria de inteligência artificial que se refere ao processo pelo qual programas de software são “ensinados” a fazer previsões ou “decisões”. Um engenheiro da IBM, Jeff Crume, explica o aprendizado de máquina como uma “forma muito sofisticada de análise estatística”. De acordo com Crume, essa análise permite que as máquinas façam “previsões ou decisões com base em dados”. Quanto mais informações forem alimentadas “no sistema, mais ele é capaz de nos fornecer previsões precisas”, diz ele.
Ao contrário da programação geral, em que uma máquina é projetada para completar uma tarefa muito específica, o aprendizado de máquina gira em torno do treinamento de um algoritmo para identificar padrões nos dados por si só. Como mencionado anteriormente, o aprendizado de máquina abrange uma ampla variedade de atividades.
Aprendizado profundo, explicado. O aprendizado profundo é aprendizado de máquina. É uma daquelas subcategorias mencionadas anteriormente do aprendizado de máquina que, como outras formas de ML, se concentra em ensinar a IA a “pensar”. Ao contrário de algumas outras formas de aprendizado de máquina, o DL busca permitir que os algoritmos façam grande parte de seu trabalho. O DL é alimentado por modelos matemáticos conhecidos como redes neurais artificiais (ANNs). Essas redes buscam emular os processos que ocorrem naturalmente no cérebro humano, como tomada de decisões e identificação de padrões.
A principal diferença entre ML e DL. Uma das maiores diferenças entre o aprendizado profundo e outras formas de aprendizado de máquina é o nível de “supervisão” fornecido a uma máquina. Em formas menos complicadas de ML, o computador provavelmente está envolvido em aprendizado supervisionado – um processo em que um humano ajuda a máquina a reconhecer padrões em dados rotulados e estruturados, melhorando assim sua capacidade de realizar análises preditivas.
O aprendizado de máquina depende de grandes quantidades de “dados de treinamento”. Esse tipo de dados é frequentemente compilado por humanos por meio da rotulagem de dados (muitos desses humanos não são muito bem pagos). Através desse processo, é construído um conjunto de dados de treinamento, que pode então ser alimentado no algoritmo de IA e utilizado para ensiná-lo a identificar padrões. Por exemplo, se uma empresa estivesse treinando um algoritmo para reconhecer uma marca específica de carro em fotos, ela forneceria ao algoritmo enormes quantidades de fotos desse modelo de carro que foram rotuladas manualmente pela equipe humana. Um “conjunto de dados de teste” também é criado para medir a precisão dos poderes preditivos da máquina, uma vez que foi treinada.
Quando se trata de DL, por outro lado, uma máquina se envolve em um processo chamado “aprendizado não supervisionado”. O aprendizado não supervisionado envolve uma máquina usando sua rede neural para identificar padrões em dados não estruturados ou “brutos” – que são dados que ainda não foram rotulados ou organizados em um banco de dados. Empresas podem usar algoritmos automáticos para processar grandes quantidades de dados desorganizados e assim evitar grandes quantidades de trabalho humano.
Como as redes neurais funcionam. As ANNs são compostas por o que são chamados de “nós”. De acordo com o MIT, uma ANN pode ter “milhares ou até mesmo milhões” de nós. Esses nós podem ser um pouco complicados, mas a explicação simplificada é que eles – assim como os nós no cérebro humano – transmitem e processam informações. Em uma rede neural, os nós são organizados em uma forma estruturada chamada “camadas”. Portanto, as redes de “aprendizado profundo” envolvem múltiplas camadas de nós. A informação flui através da rede e interage com seus vários ambientes, o que contribui para o processo de tomada de decisão da máquina quando submetida a um estímulo humano.
Outro conceito chave nas ANNs é o “peso”, que um comentarista compara aos sinapses em um cérebro humano. Pesos, que são apenas valores numéricos, são distribuídos por toda a rede neural de uma IA e ajudam a determinar o resultado final desse sistema de IA. Os pesos são entradas informativas que ajudam a calibrar uma rede neural para que ela possa tomar decisões. A imersão profunda do MIT em redes neurais explica da seguinte forma:
“A cada uma de suas conexões de entrada, um nó atribuirá um número conhecido como ‘peso’. Quando a rede está ativa, o nó recebe um item de dados diferente – um número diferente – sobre cada uma de suas conexões e multiplica isso pelo peso associado. Em seguida, ele soma os produtos resultantes, resultando em um único número. Se esse número estiver abaixo de um valor de limite, o nó não passa dados para a próxima camada. Se o número exceder o valor de limite, o nó “dispara”, o que, nos atuais redes neurais, geralmente significa enviar o número – a soma dos inputs ponderados – ao longo de todas as suas conexões de saída.”
Em resumo: redes neurais são estruturadas para ajudar um algoritmo a chegar a suas próprias conclusões sobre os dados que lhe foram fornecidos. Com base em sua programação, o algoritmo pode identificar conexões úteis em grandes porções de dados, ajudando os humanos a tirarem suas próprias conclusões com base em sua análise.
Por que o aprendizado de máquina é importante para o desenvolvimento da IA?
O aprendizado de máquina e o aprendizado profundo ajudam a treinar máquinas para realizar atividades preditivas e interpretativas que antes eram exclusivas dos humanos. Isso pode ter muitos aspectos positivos, mas o lado negativo óbvio é que essas máquinas podem (e, sejamos honestos, vão) inevitavelmente ser usadas para fins nefastos, não apenas úteis – coisas como sistemas de vigilância do governo e privados, e a automação contínua da atividade militar e de defesa. Mas, elas também são, obviamente, úteis para sugestões de consumo ou codificação e, em seu melhor momento, para pesquisas médicas e de saúde. Como qualquer outra ferramenta, se a inteligência artificial tem um impacto bom ou ruim no mundo em grande parte depende de quem a está usando.