Paulo Sobral
19 de maio de 2024
Inteligência Artificial

Aprendizado de Máquina vs. Aprendizado Profundo: Qual a Diferença?

A inteligência artificial está em todos os lugares nos dias de hoje, mas os fundamentos de como essa nova tecnologia influente funciona podem ser confusos. Dois dos campos mais importantes no desenvolvimento de IA são “aprendizado de máquina” e seu subcampo, “aprendizado profundo”. Aqui está uma explicação rápida do que essas duas disciplinas importantes são e como estão contribuindo para a evolução da automação.

Primeiro, o que é IA?

Vale a pena lembrar o que é a IA. Os defensores da inteligência artificial dizem que esperam criar um máquina que possa “pensar” por si mesma. O cérebro humano é um instrumento magnífico, capaz de fazer cálculos que superam em muito a capacidade de qualquer máquina atualmente existente. Os engenheiros de software envolvidos no desenvolvimento de IA esperam eventualmente criar uma máquina que possa fazer tudo o que um humano pode fazer intelectualmente, mas também superá-lo. Atualmente, as aplicações de IA nos negócios e no governo se resumem em grande parte a algoritmos preditivos, do tipo que sugerem sua próxima música no Spotify ou tentam vender um produto semelhante ao que você comprou na Amazon na semana passada. No entanto, os evangelistas da IA acreditam que a tecnologia, eventualmente, será capaz de raciocinar e tomar decisões muito mais complicadas. É aí que entram o ML e o DL.

Aprendizado de máquina, explicado

O aprendizado de máquina (ou ML) é uma categoria ampla de inteligência artificial que se refere ao processo pelo qual os programas de software são “ensinados” a fazer previsões ou “decisões”. Um engenheiro da IBM, Jeff Crume, explica o aprendizado de máquina como uma “forma muito sofisticada de análise estatística”. De acordo com Crume, essa análise permite que as máquinas façam “previsões ou decisões com base em dados”. Quanto mais informações são inseridas “no sistema, mais capaz é de nos dar previsões precisas”, diz ele.

Ao contrário da programação geral em que uma máquina é projetada para completar uma tarefa muito específica, o aprendizado de máquina gira em torno de treinar um algoritmo para identificar padrões nos dados por si só. Como mencionado anteriormente, o aprendizado de máquina engloba uma ampla variedade de atividades.

Aprendizado profundo, explicado

O aprendizado profundo é o aprendizado de máquina. É uma das subcategorias de aprendizado de máquina mencionadas anteriormente que, como outras formas de ML, se concentra em ensinar a IA a “pensar”. Ao contrário de outras formas de aprendizado de máquina, o DL busca permitir que os algoritmos façam grande parte do seu trabalho. O DL é impulsionado por modelos matemáticos conhecidos como redes neurais artificiais (ANNs). Essas redes procuram imitar os processos que ocorrem naturalmente no cérebro humano – coisas como tomada de decisão e identificação de padrões.

A diferença chave entre ML e DL

Uma das maiores diferenças entre o aprendizado profundo e outras formas de aprendizado de máquina é o nível de “supervisão” que uma máquina recebe. Em formas menos complicadas de ML, o computador provavelmente está envolvido em aprendizado supervisionado – um processo no qual um humano ajuda a máquina a reconhecer padrões em dados rotulados e estruturados, melhorando assim sua capacidade de realizar análises preditivas.

O aprendizado de máquina depende de grandes quantidades de “dados de treinamento”. Esses dados são frequentemente compilados por humanos por meio da rotulagem de dados (muitos desses humanos não são muito bem remunerados). Por meio desse processo, é criado um conjunto de dados de treinamento, que pode então ser alimentado para o algoritmo de IA e usado para ensiná-lo a identificar padrões. Por exemplo, se uma empresa estivesse treinando um algoritmo para reconhecer uma marca específica de carro em fotos, ela alimentaria o algoritmo com grandes lotes de fotos desse modelo de carro que foram manualmente rotuladas pela equipe humana. Um “conjunto de dados de teste” também é criado para medir a precisão dos poderes preditivos da máquina, uma vez que foi treinada.

Quando se trata de DL, enquanto isso, uma máquina se envolve em um processo chamado “aprendizado não supervisionado”. O aprendizado não supervisionado envolve uma máquina usando sua rede neural para identificar padrões no que é chamado de dados não estruturados ou “brutos” – que são dados que ainda não foram rotulados ou organizados em um banco de dados. As empresas podem usar algoritmos automatizados para filtrar grandes quantidades de dados desorganizados e, assim, evitar grandes quantidades de mão de obra humana.

Como funcionam as redes neurais

As ANNs são compostas por “nós”. De acordo com o MIT, uma ANN pode ter “milhares ou até milhões” de nós. Esses nós podem ser um pouco complicados, mas a explicação simplificada é que eles – assim como os nós no cérebro humano – transmitem e processam informações. Em uma rede neural, os nós são organizados de forma organizada, referida como “camadas”. Assim, as redes de “aprendizado profundo” envolvem múltiplas camadas de nós. As informações trafegam pela rede e interagem com seus vários ambientes, contribuindo para o processo de tomada de decisão da máquina quando submetido a um estímulo humano.

Outro conceito-chave em ANNs é o “peso”, que um comentarista compara aos sinapses no cérebro humano. Os pesos, que são apenas valores numéricos, são distribuídos por toda a rede neural de uma IA e ajudam a determinar o resultado final desse sistema de IA. Os pesos são entradas de informações que ajudam a calibrar uma rede neural para que ela possa tomar decisões. A investigação profunda do MIT sobre redes neurais explica assim:

Para cada uma de suas conexões de entrada, um nó atribuirá um número conhecido como “peso”. Quando a rede está ativa, o nó recebe um item de dados diferente – um número diferente – em cada uma de suas conexões e multiplica pelo peso associado. Em seguida, ele soma os produtos resultantes, resultando em um único número. Se esse número estiver abaixo de um valor de limite, o nó não envia dados para a próxima camada. Se o número exceder o valor de limite, o nó “dispara”, o que nos atuais redes neurais significa enviar o número – a soma das entradas ponderadas – ao longo de todas as suas conexões de saída.

Em resumo: as redes neurais são estruturadas para ajudar um algoritmo a chegar às suas próprias conclusões sobre os dados que lhe foram fornecidos. Com base em sua programação, o algoritmo pode identificar conexões úteis em grandes lotes de dados, ajudando os humanos a tirarem suas próprias conclusões com base em sua análise.

Por que o aprendizado de máquina é importante para o desenvolvimento da IA?

O aprendizado de máquina e profundo ajudam a treinar as máquinas para realizar atividades preditivas e interpretativas que antes eram apenas domínio dos humanos. Isso pode ter muitos aspectos positivos, mas o lado negativo óbvio é que essas máquinas podem (e, sejamos honestos, irão) inevitavelmente ser usadas para coisas nefastas, não apenas úteis – como sistemas de vigilância governamentais e privados e a contínua automação de atividades militares e de defesa. Mas, também, são obviamente úteis para sugestões ao consumidor ou codificação e, em seu melhor estado, pesquisa médica e de saúde. Como qualquer outra ferramenta, se a inteligência artificial tem um impacto bom ou ruim no mundo depende em grande parte de quem a está utilizando.

Paulo Sobral

Especialista em segurança digital, ajudo você a se proteger contra hackers, malwares e outras ameaças virtuais. Compartilho notícias, dicas e as melhores práticas para manter seus dados seguros e sua vida online protegida.