A inteligência artificial está em todos os lugares nos dias de hoje, mas os fundamentos de como esta nova tecnologia influente funciona pode ser difícil de compreender. Dois dos campos mais importantes no desenvolvimento de IA são “aprendizado de máquina” e seu subcampo, “aprendizado profundo”, embora os termos às vezes sejam usados de forma intercambiável, levando a um certo nível de confusão. Aqui está uma explicação rápida do que são essas duas disciplinas importantes e como estão contribuindo para a evolução da automação.
Primeiramente, o que é IA?
Os defensores da inteligência artificial dizem que esperam, algum dia, criar uma máquina que possa “pensar” por si mesma. O cérebro humano é um instrumento magnífico, capaz de realizar cálculos que superam em muito a capacidade de qualquer máquina existente atualmente. Os engenheiros de software envolvidos no desenvolvimento da IA esperam eventualmente fazer uma máquina que possa fazer tudo o que um humano pode fazer intelectualmente, mas também superá-lo. Atualmente, as aplicações de IA em negócios e governo se resumem principalmente a algoritmos preditivos, os tipos que sugerem sua próxima música no Spotify ou tentam vender um produto semelhante ao que comprou na Amazon na semana passada. No entanto, os evangelistas da IA acreditam que a tecnologia, eventualmente, será capaz de raciocinar e tomar decisões muito mais complicadas. É aí que o ML e DL entram.
Aprendizado de máquina, explicado
O aprendizado de máquina (ou ML) é uma categoria ampla de inteligência artificial que se refere ao processo pelo qual programas de software são “ensinados” a fazer previsões ou “decisões”. Um engenheiro da IBM, Jeff Crume, explica o aprendizado de máquina como uma “forma muito sofisticada de análise estatística”. Segundo Crume, essa análise permite que as máquinas façam “previsões ou decisões com base em dados”. Quanto mais informações são alimentadas “no sistema, mais capaz ele é de nos dar previsões precisas”, segundo ele.
Ao contrário da programação geral onde uma máquina é projetada para completar uma tarefa muito específica, o aprendizado de máquina gira em torno de treinar um algoritmo para identificar padrões em dados por si só. Como mencionado anteriormente, o aprendizado de máquina engloba uma ampla variedade de atividades.
Aprendizado profundo, explicado
O aprendizado profundo é aprendizado de máquina. É uma das subcategorias de aprendizado de máquina mencionadas anteriormente que, como outras formas de ML, se concentra em ensinar IA a “pensar”. Ao contrário de algumas outras formas de aprendizado de máquina, o DL busca permitir que os algoritmos façam a maior parte do trabalho. O DL é alimentado por modelos matemáticos conhecidos como redes neurais artificiais (ANNs). Essas redes buscam emular os processos que ocorrem naturalmente no cérebro humano, como tomada de decisão e identificação de padrões.
A principal diferença entre ML e DL
Uma das maiores diferenças entre o aprendizado profundo e outras formas de aprendizado de máquina é o nível de “supervisão” fornecido a uma máquina. Em formas menos complicadas de ML, é provável que o computador esteja envolvido em aprendizado supervisionado – um processo no qual um humano ajuda a máquina a reconhecer padrões em dados rotulados e estruturados, melhorando assim sua capacidade de realizar análises preditivas.
O aprendizado de máquina depende de grandes quantidades de “dados de treinamento”. Esses dados são frequentemente compilados por humanos por meio da rotulagem de dados (muitos desses humanos não são muito bem pagos). Por meio desse processo, é construído um conjunto de dados de treinamento, que pode então ser alimentado no algoritmo de IA e usado para ensiná-lo a identificar padrões. Por exemplo, se uma empresa estivesse treinando um algoritmo para reconhecer uma marca específica de carro em fotos, ela alimentaria o algoritmo com enormes quantidades de fotos desse modelo de carro que foram rotuladas manualmente pela equipe humana. Um “conjunto de dados de teste” também é criado para medir a precisão dos poderes preditivos da máquina, uma vez que foi treinada.
Quando se trata de DL, no entanto, uma máquina se envolve em um processo chamado “aprendizado não supervisionado”. O aprendizado não supervisionado envolve uma máquina usando sua rede neural para identificar padrões no que é chamado de dados não estruturados ou “brutos” – que são dados que ainda não foram rotulados ou organizados em um banco de dados. As empresas podem usar algoritmos automatizados para separar grandes quantidades de dados desorganizados e, assim, evitar grandes quantidades de trabalho humano.
Como funcionam as redes neurais
ANNs são compostas por “nós”. De acordo com o MIT, uma ANN pode ter “milhares ou mesmo milhões” de nós. Esses nós podem ser um pouco complicados, mas a explicação simplificada é que eles – assim como os nós do cérebro humano – transmitem e processam informações. Em uma rede neural, os nós são organizados de forma estruturada, referida como “camadas”. Assim, as redes de “aprendizado profundo” envolvem várias camadas de nós. A informação flui pela rede e interage com seus vários ambientes, o que contribui para o processo de tomada de decisão da máquina quando submetida a um comando humano.
Outro conceito-chave em ANNs é o “peso”, que um comentarista compara com as sinapses de um cérebro humano. Pesos, que são apenas valores numéricos, são distribuídos por toda a rede neural de uma IA e ajudam a determinar o resultado final desse sistema AI. Os pesos são entradas informativas que ajudam a calibrar uma rede neural para que ela possa tomar decisões. A análise detalhada do MIT sobre redes neurais explica da seguinte forma:
“A cada uma de suas conexões entrantes, um nó atribuirá um número conhecido como ‘peso’. Quando a rede está ativa, o nó recebe um item de dados diferente – um número diferente – sobre cada uma de suas conexões e multiplica-o pelo peso associado. Em seguida, ele adiciona os produtos resultantes juntos, produzindo um único número. Se esse número estiver abaixo de um valor de limiar, o nó não passa dados para a próxima camada. Se o número exceder o valor de limiar, o nó “dispara”, o que nos atuais redes neurais significa geralmente enviar o número – a soma das entradas ponderadas – ao longo de todas as suas conexões de saída.”
Em suma: as redes neurais são estruturadas para ajudar um algoritmo a chegar a suas próprias conclusões sobre os dados que lhe foram fornecidos. Com base em sua programação, o algoritmo pode identificar conexões úteis em grandes quantidades de dados, ajudando os humanos a tirar suas próprias conclusões com base em sua análise.
Por que o aprendizado de máquina é importante para o desenvolvimento da IA?
O aprendizado de máquina e profundo ajudam a treinar máquinas para realizar atividades preditivas e interpretativas que antes eram exclusivas de humanos. Isso pode ter muitos pontos positivos, mas o lado negativo óbvio é que essas máquinas podem (e, sejamos honestos, irão) inevitavelmente ser usadas para fins nefastos, não apenas úteis – coisas como sistemas de vigilância governamental e privada, e a contínua automação de atividades militares e de defesa. Mas, elas também são, obviamente, úteis para sugestões ao consumidor ou codificação e, no seu melhor, pesquisa médica e de saúde. Como qualquer outra ferramenta, se a inteligência artificial tem um impacto bom ou ruim no mundo depende, em grande parte, de quem a está usando.