Paulo Sobral
19 de maio de 2024
Inteligência Artificial

Machine Learning vs. Deep Learning: Qual a Diferença?

A inteligência artificial está em todos os lugares nos dias de hoje, mas os fundamentos de como essa nova e influente tecnologia funciona podem ser confusos. Dois dos campos mais importantes no desenvolvimento de IA são “aprendizado de máquina” e seu subcampo, “aprendizagem profunda”. Aqui está uma explicação rápida do que essas duas importantes disciplinas são e como estão contribuindo para a evolução da automação.

Primeiramente, o que é IA?
Vale a pena lembrar o que a IA realmente é. Defensores da inteligência artificial dizem que esperam um dia criar uma máquina que possa “pensar” por si mesma. O cérebro humano é um instrumento magnífico, capaz de fazer cálculos que superam em muito a capacidade de qualquer máquina atualmente existente. Engenheiros de software envolvidos no desenvolvimento de IA esperam em última instância fazer uma máquina que possa fazer tudo o que um humano pode fazer intelectualmente, mas também superá-lo. Atualmente, as aplicações de IA em negócios e governo se resumem em grande parte aos algoritmos preditivos, do tipo que sugerem sua próxima música no Spotify ou tentam vender um produto similar ao que você comprou na Amazon na semana passada. No entanto, os evangelistas da IA acreditam que a tecnologia eventualmente será capaz de raciocinar e tomar decisões muito mais complicadas. É aí que o ML e DL entram em cena.

Aprendizado de máquina, explicado
A aprendizado de máquina (ou ML) é uma categoria ampla de inteligência artificial que se refere ao processo pelo qual programas de software são “ensinados” a fazer previsões ou “decisões”. Um engenheiro da IBM, Jeff Crume, explica o aprendizado de máquina como uma “forma muito sofisticada de análise estatística”. Segundo Crume, essa análise permite que as máquinas façam “previsões ou decisões com base em dados”. Quanto mais informações são inseridas no sistema, mais capaz ele é de nos fornecer previsões precisas, diz ele.

Ao contrário da programação geral, em que uma máquina é projetada para concluir uma tarefa muito específica, o aprendizado de máquina gira em torno do treinamento de um algoritmo para identificar padrões em dados por si só. Como mencionado anteriormente, o aprendizado de máquina abrange uma grande variedade de atividades.

Aprendizagem profunda, explicada
A aprendizagem profunda é aprendizado de máquina. É uma dessas subcategorias mencionadas anteriormente do aprendizado de máquina que, assim como outras formas de ML, concentra-se em ensinar a IA a “pensar”. Ao contrário de algumas outras formas de aprendizado de máquina, a DL busca permitir que os algoritmos façam a maior parte do seu trabalho. DL é alimentado por modelos matemáticos conhecidos como redes neurais artificiais (ANNs). Essas redes buscam imitar os processos que ocorrem naturalmente no cérebro humano, como tomada de decisões e identificação de padrões.

A diferença chave entre ML e DL
Uma das maiores diferenças entre deep learning e outras formas de aprendizado de máquina é o nível de “supervisão” que uma máquina recebe. Em formas menos complicadas de ML, o computador provavelmente está envolvido em aprendizado supervisionado – um processo em que um humano ajuda a máquina a reconhecer padrões em dados rotulados e estruturados e, assim, melhorar sua capacidade de realizar análises preditivas.

O aprendizado de máquina depende de enormes quantidades de “dados de treinamento”. Esses dados são frequentemente compilados por humanos por meio da rotulagem de dados (muitos desses humanos não são remunerados muito bem). Através desse processo, é construído um conjunto de dados de treinamento, que pode então ser alimentado ao algoritmo de IA e usado para ensiná-lo a identificar padrões. Por exemplo, se uma empresa estava treinando um algoritmo para reconhecer uma marca específica de carro em fotos, ela alimentaria o algoritmo com grandes quantidades de fotos desse modelo de carro que foram rotuladas manualmente por funcionários. Um “conjunto de dados de teste” também é criado para medir a precisão dos poderes preditivos da máquina, uma vez que foi treinada.

Quando se trata de DL, enquanto isso, uma máquina se envolve em um processo chamado “aprendizado não supervisionado”. O aprendizado não supervisionado envolve uma máquina usando sua rede neural para identificar padrões no que é chamado de dados não estruturados ou “brutos” – que são dados que ainda não foram rotulados ou organizados em um banco de dados. As empresas podem usar algoritmos automatizados para vasculhar grandes quantidades de dados desorganizados e, assim, evitar grandes quantidades de trabalho humano.

Como funcionam as redes neurais
As ANNs são compostas por “nós”. De acordo com o MIT, uma ANN pode ter “milhares ou até milhões” de nós. Esses nós podem ser um pouco complicados, mas a explicação simplificada é que eles – como os nós do cérebro humano – transmitem e processam informações. Em uma rede neural, os nós são organizados em uma forma organizada chamada “camadas”. Assim, as redes de “aprendizado profundo” envolvem múltiplas camadas de nós. A informação flui pela rede e interage com seus vários ambientes, o que contribui para o processo de tomada de decisão da máquina quando sujeita a um comando humano.

Outro conceito-chave em ANNs é o “peso”, que um comentarista compara aos sinapses de um cérebro humano. Os pesos, que são simples valores numéricos, são distribuídos por toda a rede neural de uma IA e ajudam a determinar o resultado final desse sistema de IA. Os pesos são entradas de informação que ajudam a calibrar uma rede neural para que ela possa tomar decisões. A investigação aprofundada do MIT sobre redes neurais explica da seguinte forma:

“Para cada uma de suas conexões de entrada, um nó atribuirá um número conhecido como “peso”. Quando a rede está ativa, o nó recebe um item de dados diferente – um número diferente – em cada uma de suas conexões e o multiplica pelo peso associado. Em seguida, ele adiciona os produtos resultantes juntos, produzindo um único número. Se esse número estiver abaixo de um valor de limite, o nó não passa dados para a próxima camada. Se o número exceder o valor limite, o nó “dispara”, o que nos atuais redes neurais geralmente significa enviar o número – a soma das entradas ponderadas – ao longo de todas as suas conexões de saída.”

Em resumo: as redes neurais são estruturadas para ajudar um algoritmo a chegar às suas próprias conclusões sobre os dados que lhe foram fornecidos. Com base em sua programação, o algoritmo pode identificar conexões úteis em grandes quantidades de dados, ajudando os humanos a tirarem suas próprias conclusões com base em sua análise.

Por que o aprendizado de máquina é importante para o desenvolvimento da IA?
O aprendizado de máquina e o aprendizado profundo ajudam a treinar máquinas para realizar atividades preditivas e interpretativas que anteriormente eram exclusivas dos humanos. Isso pode ter muitos pontos positivos, mas o lado negativo óbvio é que essas máquinas podem (e, sejamos honestos, irão) inevitavelmente ser usadas para coisas nefastas, não apenas úteis – coisas como sistemas de vigilância governamentais e privados e a automação contínua de atividades militares e de defesa. Mas, elas também, obviamente, são úteis para sugestões ao consumidor ou codificação e, no seu melhor, para pesquisa médica e de saúde. Como qualquer outra ferramenta, se a inteligência artificial tem um impacto positivo ou negativo no mundo em grande parte depende de quem a está utilizando.

Paulo Sobral

Especialista em segurança digital, ajudo você a se proteger contra hackers, malwares e outras ameaças virtuais. Compartilho notícias, dicas e as melhores práticas para manter seus dados seguros e sua vida online protegida.