A inteligência artificial está em toda parte nos dias de hoje, mas os fundamentos de como essa nova tecnologia influente funciona podem ser difíceis de compreender. Dois dos campos mais importantes no desenvolvimento da IA são “aprendizado de máquina” e seu subcampo, “aprendizado profundo”, embora os termos às vezes sejam usados de forma intercambiável, o que pode levar a certo nível de confusão. Aqui está uma explicação rápida do que essas duas disciplinas importantes são e como estão contribuindo para a evolução da automação.
Primeiramente, o que é IA? Defensores da inteligência artificial dizem que esperam criar um máquina que possa “pensar” por si só algum dia. O cérebro humano é um instrumento magnífico, capaz de fazer cálculos que superam em muito a capacidade de qualquer máquina existente atualmente. Os engenheiros de software envolvidos no desenvolvimento da IA esperam eventualmente criar uma máquina que possa fazer tudo o que um ser humano pode fazer intelectualmente, mas também superá-lo. Atualmente, as aplicações da IA em negócios e governo se resumem amplamente a algoritmos preditivos, do tipo que sugerem sua próxima música no Spotify ou tentam vender um produto semelhante ao que você comprou na Amazon na semana passada. No entanto, os evangelistas da IA acreditam que a tecnologia, eventualmente, será capaz de raciocinar e tomar decisões muito mais complexas. É aí que o ML e o DL entram em cena.
Aprendizado de máquina, explicado – Aprendizado de máquina (ou ML) é uma categoria ampla de inteligência artificial que se refere ao processo pelo qual programas de software são “ensinados” a fazer previsões ou “decisões”. Um engenheiro da IBM, Jeff Crume, explica o aprendizado de máquina como uma “forma muito sofisticada de análise estatística”. Segundo Crume, essa análise permite que as máquinas façam “previsões ou decisões com base em dados”. Quanto mais informações são inseridas “no sistema, mais ele é capaz de nos fornecer previsões precisas,” diz ele.
Ao contrário da programação geral, onde uma máquina é projetada para completar uma tarefa muito específica, o aprendizado de máquina gira em torno do treinamento de um algoritmo para identificar padrões nos dados por si só. Como mencionado anteriormente, o aprendizado de máquina engloba uma ampla variedade de atividades.
Aprendizado profundo, explicado – O aprendizado profundo é o aprendizado de máquina. É uma daquelas subcategorias mencionadas anteriormente do aprendizado de máquina que, como outras formas de ML, se concentra em ensinar a IA a “pensar”. Ao contrário de algumas outras formas de aprendizado de máquina, o DL procura permitir que os algoritmos realizem grande parte de seu trabalho. O DL é alimentado por modelos matemáticos conhecidos como redes neurais artificiais (ANNs). Essas redes buscam imitar os processos que ocorrem naturalmente no cérebro humano, como tomada de decisão e identificação de padrões.
A principal diferença entre ML e DL – Uma das maiores diferenças entre aprendizado profundo e outras formas de aprendizado de máquina é o nível de “supervisão” que uma máquina tem. Em formas menos complicadas de ML, o computador provavelmente está envolvido em “aprendizado supervisionado” — um processo no qual um ser humano ajuda a máquina a reconhecer padrões em dados estruturados e rotulados, melhorando assim sua capacidade de realizar análises preditivas.
O aprendizado de máquina depende de enormes quantidades de “dados de treinamento”. Esses dados são compilados frequentemente por humanos por meio da rotulagem de dados (muitos desses humanos não são muito bem pagos). Através desse processo, um conjunto de dados de treinamento é construído, que pode então ser alimentado para o algoritmo de IA e usado para ensiná-lo a identificar padrões. Por exemplo, se uma empresa estivesse treinando um algoritmo para reconhecer uma marca específica de carro em fotos, ela alimentaria o algoritmo com grandes quantidades de fotos desse modelo de carro que foram rotuladas manualmente pela equipe humana. Um “conjunto de dados de teste” também é criado para medir a precisão dos poderes preditivos da máquina, uma vez que tenha sido treinada.
Quando se trata de DL, enquanto isso, uma máquina se envolve em um processo chamado “aprendizado não supervisionado.” O aprendizado não supervisionado envolve uma máquina usando sua rede neural para identificar padrões em dados não estruturados ou “brutos” — que são dados que ainda não foram rotulados ou organizados em um banco de dados. As empresas podem usar algoritmos automatizados para vasculhar grandes quantidades de dados não organizados e, assim, evitar grandes quantidades de trabalho humano.
Como as redes neurais funcionam – As ANNs são compostas por o que são chamados de “nodos”. Segundo o MIT, uma ANN pode ter “milhares ou até milhões” de nós. Esses nós podem ser um pouco complicados, mas a explicação simplificada é que eles — como os nós do cérebro humano — transmitem e processam informações. Em uma rede neural, os nós são organizados em uma forma organizada chamada “camadas”. Assim, as redes de “aprendizado profundo” envolvem múltiplas camadas de nós. A informação se move através da rede e interage com seus vários ambientes, o que contribui para o processo de tomada de decisão da máquina quando submetida a um estímulo humano.
Outro conceito chave nas ANNs é o “peso”, que um comentarista compara aos sinapses no cérebro humano. Pesos, que são apenas valores numéricos, são distribuídos por toda a rede neural de uma IA e ajudam a determinar o resultado final desse sistema de IA. Os pesos são entradas informativas que ajudam a calibrar uma rede neural para que ela possa tomar decisões. A análise aprofundada do MIT sobre redes neurais explica assim:
“A cada uma de suas conexões de entrada, um nó atribuirá um número conhecido como “peso”. Quando a rede está ativa, o nó recebe um item de dados diferente — um número diferente — sobre cada uma de suas conexões e o multiplica pelo peso associado. Em seguida, adiciona os produtos resultantes, levando a um único número. Se esse número for abaixo de um valor de limiar, o nó não envia dados para a próxima camada. Se o número exceder o valor do limiar, o nó “dispara”, o que nos sistemas neurais atuais geralmente significa enviar o número — a soma das entradas ponderadas — ao longo de todas suas conexões de saída.”
Em resumo: as redes neurais são estruturadas para ajudar um algoritmo a chegar a suas próprias conclusões sobre os dados que lhe foram fornecidos. Com base em sua programação, o algoritmo pode identificar conexões úteis em grandes quantidades de dados, ajudando os humanos a tirar suas próprias conclusões com base em sua análise.
Por que o aprendizado de máquina é importante para o desenvolvimento da IA? O aprendizado de máquina e de profundidade ajudam a treinar máquinas para realizar atividades preditivas e interpretativas que anteriormente eram apenas domínio de humanos. Isso pode ter muitos benefícios, mas a desvantagem óbvia é que essas máquinas podem (e, sejamos honestos, vão) inevitavelmente ser usadas para coisas nefastas, não apenas úteis — coisas como sistemas de vigilância do governo e privados, e a contínua automação de atividades militares e de defesa. Mas, eles também são, obviamente, úteis para sugestões de consumidores ou codificação e, na melhor das hipóteses, para pesquisa médica e de saúde. Como qualquer outra ferramenta, se a inteligência artificial tem um impacto bom ou ruim no mundo depende em grande parte de quem está usando.