Ouça em: Apple Podcasts | Spotify | Pandora
Este é o texto completo da temporada 7, episódio 6 – “O algoritmo: Cartas de recomendação” – do podcast Quartz Obsession.
Gabriela: Quero ser um pouco metalinguística aqui, ouvintes. Por algum motivo, você abriu uma ferramenta de streaming digital e me encontrou. Ou melhor, minha voz apresentando este podcast. Talvez você esteja no seu computador e alguém que você conhece compartilhou este link em uma de suas redes sociais. Talvez você seja um fã que nos segue e seu telefone lhe enviou um novo episódio.
Talvez. Você estava em uma plataforma onde costuma ouvir outras coisas, audiolivros, álbuns, episódios de rádio, e nosso pequeno programa apareceu na sua tela. Sugestão de audição. Shows que você pode gostar. Recomendado para você. Em algum lugar nas profundezas da sua tela, alguém ou algo tem determinado silenciosamente o que você vai querer ouvir em seguida.
Tudo bem, Bruce, você já precisa ouvir minha voz o dia todo no escritório e nas chamadas do Zoom. Como você se sentiria se o algoritmo o trouxesse para este episódio?
Bruce: Eu sentiria que acertou, que me conhece muito bem. Adoro falar sobre algoritmos com os editores do Quartz.
Gabriela: Sou Gabriela Riccardi, a apresentadora da Temporada 7 do Quartz Obsession, onde estamos analisando de perto as tecnologias e ideias que definem nossas vidas.
Então, prepare-se para aprender sobre aprendizado de máquina, porque hoje estou falando com Bruce Gill, do Quartz, sobre algoritmos.
Quando falamos de algoritmos, pelo menos aqui, estamos falando de algoritmos de recomendação, a peculiar e ampla sequência de números encarregada de descobrir o que você gosta e ditar como se torna tudo o que você vê online. Com isso em mente, Bruce, me explique, como você entrou no mundo dos algoritmos?
Onde encontramos algoritmos de recomendação em nossa vida diária?
Bruce: Minha relação com o algoritmo foi, na maior parte, bastante positiva. Sou uma pessoa bastante indecisa por natureza. Adoro a ideia de ter algo me ajudando a decidir o que comer. Como o Grubhub, por favor me dê recomendações. Netflix, me diga o que é bom para assistir. Spotify, me dê suas playlists personalizadas.
Mas devo dizer que algo era um pouco diferente no TikTok. E acho que muitas pessoas tiveram uma experiência semelhante onde parecia que ele te conhecia demais. E no começo achei isso incrível. Era uma constante sequência de conteúdo divertido e bom.
O que fez parecer que era bom demais? Que tipo de coisas ele estava oferecendo para você?
Era apenas muitas coisas que não tenho certeza de como sabia que eu gostaria ou apreciaria. Obviamente, houve algumas coisas padrão, se você me conhece. Clipes de RuPaul’s Drag Race. Havia alguns vídeos de ASMR. Adoro ver pessoas tocando em coisas ou cortando sabonete.
Não sei por quê.
Gabriela: Isso satisfaz a coceira no seu cérebro. Às vezes é inexplicável.
Bruce: Exatamente. E outra coisa estranha que notei foi que ele meio que me contou um pouco sobre minha história. Mostrava memes de tempos antigos, que eu costumava assistir com minha família quando era criança.
E eu fiquei tipo, como isso entrou aqui? Porque não era algo que eu estava procurando no TikTok. Eventualmente, notei que era quase muito eficiente, onde eu passava horas. Isso afetava meu sono. Acabei removendo o aplicativo do meu telefone, apenas por preferência pessoal, e uma vez que comecei a aprender mais sobre esses algoritmos, parecia um pouco enganoso, como um pequeno trapaceiro que conhece mais sobre seus interesses do que você provavelmente sabe sobre si mesmo.
Gabriela: Todos nós ouvimos isso comumente, como se mergulhássemos em uma nova plataforma social ou em um ecossistema digital diferente, e de repente ela nos mostra todas essas coisas que ela conhece sobre nós. Fazemos piadas que nossos telefones e nossos dispositivos estão nos ouvindo, mas às vezes é tão inquietante. Parece que muitas pessoas estão chegando a essas conclusões hoje, que o algoritmo se sofisticou tanto que está te dizendo sobre você de uma forma que você nem consegue falar sobre si mesmo.
Tudo bem, Bruce, vamos apenas simplificar isso para uma compreensão básica. O que exatamente é um algoritmo?
O que é um algoritmo?
Bruce: Então, um algoritmo em seu termo mais amplo é apenas um processo ou um conjunto específico de instruções que, quando seguidas ou executadas, resultam em um resultado desejado. Muitas vezes as pessoas gostam de descrever como uma receita para resolver um problema.
Eles geralmente são usados para resolver problemas matemáticos, mas agora, com computadores, são usados para resolver quase tudo.
Gabriela: Então, voltamos, todos nós aprendemos talvez na escola primária ou na escola secundária, a ideia da fórmula. Pelo menos nas minhas aulas, aprendi sobre o PEMDAS, que é a ordem das operações para como juntar números para que cheguem às suas conclusões lógicas.
Os algoritmos são versões muito, muito, muito mais sofisticadas, mais evoluídas disso. Mas em seu nível básico, são apenas fórmulas ou instruções. Então, voltemos por um momento. Quando as pessoas começaram a usar algoritmos pela primeira vez? Como surgiu essa ideia de um algoritmo?
Quais são as origens dos algoritmos?
Bruce: Os algoritmos são uma ideia bastante antiga. Alguns dos algoritmos mais antigos registrados foram escritos em tabuletas de argila em 2000 a.C. na Babilônia. Os matemáticos gregos, como o famoso algoritmo euclidiano. Este remonta a 300 a.C.
Gabriela: Oh meu Deus.
Bruce: Loucura. Eles são como um algoritmo para encontrar o maior denominador comum entre dois números não nulos. E é basicamente um algoritmo muito simples onde você faz muitos problemas de divisão até encontrar o maior denominador comum ou maior fator de dois números.
Gabriela: Certo.
Bruce: Tenho certeza de que as pessoas estão familiarizadas com isso desde a escola primária. Acho que é uma das primeiras fórmulas ou equações de fatoração que aprendemos de volta na aula de matemática.
Gabriela: Como passamos de tempos literais, Euclides, matemática antiga, coisas escritas em tabuletas, para o século 21 de hoje?
Quais são os algoritmos fundamentais?
Bruce: Uma vez que os computadores entraram em cena, eles facilitaram para as pessoas executarem algoritmos maiores e mais complexos, e eles são usados para todo tipo de coisa, para classificar grandes conjuntos de dados. Há dois algoritmos que gosto de pensar como os algoritmos fundamentais para esses algoritmos mais recentes de recomendação do TikTok, o Google PageRank e o Netflix Prize. Eles são realmente os primeiros com os quais as pessoas começaram a interagir. Vamos começar com o Google, porque acho que é algo que usamos todos os dias e para ouvir suas origens.
É meio louco também. O algoritmo original do Google foi escrito em 1998 por esses dois estudantes universitários. Eles foram para Stanford, Sergey Brin e Lawrence Page. Eles o escreveram como parte de um artigo acadêmico enquanto estavam na universidade. E a ideia era trazer ordem à web. Naquela época, os mecanismos de pesquisa não eram tão úteis quanto são agora.
Ainda estavam tentando dar aos usuários os resultados de pesquisa mais relevantes e úteis. Portanto, esses dois estudantes universitários tiveram a ideia de como garantir que, ao pesquisar algo no Google, você obtivesse informações confiáveis e não apenas um blog aleatório de alguém.
Gabriela: Então você está me dizendo que Larry Page e Sergey Brin construíram o Google a partir de um trabalho acadêmico, apenas um artigo acadêmico, que gerou tantas maneiras pelas quais navegamos na internet hoje.
E também um verbo literal que acho que todo mundo tem no vocabulário, “googlar algo”. Acabei de te ouvir dizer, você sabe, como moldou até nossa linguagem. Sim.
Bruce: É tão interessante pensar em como, agora que meio que reclamamos sobre o algoritmo, eles foram tão úteis e revolucionários para a maneira como todos nós navegamos na internet hoje.
Gabriela: Então me conte como o PageRank funcionava uma vez que saiu do papel acadêmico e era realmente uma ferramenta existente.
Bruce: Então, agora o algoritmo do Google é muito mais complexo, mas naquela época a ideia deles era classificar essas páginas com base no número de links e na qualidade dos links. Portanto, cada página recebe uma classificação com base em quantas outras páginas estão linkando para elas e também leva em conta a classificação de página dessas páginas.
Portanto, se você tiver essas páginas de alta qualidade citando você, sua classificação aumenta.
Gabriela: É assim que conseguimos que o New York Times, o Chicago Tribune, o Washington Post e o LA Times flutuem no topo dos resultados de pesquisa do Google, em oposição ao meu blog de notícias. com. us. co. uk. gov. Não sei, opinião aleatória de alguém na internet.
Isso não será classificado tão alto porque é uma fonte menos confiável. Não faz parte deste ecossistema que se recomenda coisas uns aos outros.
Bruce: Exatamente.
Como a Netflix construiu algoritmos de recomendação?
Gabriela: Me conte sobre o segundo algoritmo fundamental.
Bruce: Acho que este foi um grande avanço nos algoritmos de recomendação.
Em 2006, quando a Netflix nem era um serviço de streaming, era um serviço de aluguel de DVD, eles lançaram um concurso chamado Netflix Prize, no qual ofereciam 1 milhão para quem conseguisse melhorar seu software de recomendação em 10%. 10 por cento.
Não soa como muito. Vale um milhão de dólares?
Gabriela: Não parece tanto. Vale um milhão de dólares?
Bruce: Sim, mas levou as pessoas pelo menos dois anos para alcançar essa marca.
Gabriela: Uau. OK. Então claramente este é um obstáculo maior do que meu instinto me diz. OK. Então me conte, como eles chegaram lá ao longo de dois anos?
Bruce: O que a Netflix fez foi tornar público todos esses dados sobre como os usuários estão classificando os filmes.
Então havia cem milhões de classificações. de 17.770 filmes de cerca de 480 clientes. Portanto, a tarefa era usar esses dados para criar um algoritmo que previria se alguém gostaria de um filme com base em suas classificações anteriores, não apenas suas classificações, mas as classificações de todos neste conjunto de dados. Então, todos que usam a Netflix.
E então 30.000 pessoas se inscreveram para participar disso. E depois houve muitos mais. Fóruns e postagens de discussão e pessoas compartilhando suas ideias e, sabe, as pessoas começaram a pensar se as classificações mais recentes são mais precisas do que as feitas há meses atrás. Há uma hora do dia em que alguém fez uma classificação. Isso afeta o pensamento e eles começaram a adicionar essas coisas aos cálculos em seus algoritmos e todos construíram sobre o trabalho de cada um. Havia um concorrente chamado Simon Funk que foi muito influente.
Ele foi uma das principais pessoas a primeiro blogar e tornar seu código público para que as pessoas pudessem trabalhar com base no dele. E, basicamente, a grande inovação que ele teve foi o uso dessa técnica matemática chamada decomposição em valores singulares.
Gabriela: Isso soa muito além de mim, mas me conte mais.
Bruce: Basicamente, é uma maneira de automatizar a busca por similaridades entre filmes e usuários que gostam desses filmes.
Portanto, todas essas classificações são apenas números, então o algoritmo pode descobrir que esses grupos de pessoas parecem gostar desses tipos de filmes. Portanto, ele cria compartimentos para você. E isso poderia ser gêneros. Há um certo tipo de pessoa que gosta de filmes de ação, ou há um certo tipo de pessoa que gosta dos filmes de Tom Hanks.
O algoritmo aprendeu que se você gosta de comédias românticas, pode descobrir que outras pessoas que gostam de comédias românticas não são realmente fãs de ficção científica. E assim, ele sabe para não recomendar nenhum filme de ficção científica.
Gabriela: É muito interessante ouvir isso. Parece que ao tornar público este tesouro de dados de usuário.
Quero dizer, obviamente estamos em uma fase muito inicial em que a privacidade do usuário não é realmente. Como quente, mas em um tópico como hoje, a privacidade do usuário é uma preocupação muito grande, mas através desse efeito de crowdsourcing. Muitas pessoas estavam testando várias entradas. Acho fascinante que a hora do dia em que você está navegando na Netflix pode afetar a escolha que você faz sobre o que vai transmitir.
O que você quer colocar de manhã? Talvez você esteja tomando café da manhã versus o que você está colocando apenas antes de ir dormir à noite. Gostaria de algo mais energizante de manhã e relaxante à noite ou talvez, você sabe, como vice-versa. É fascinante pensar sobre isso.
Bruce: A Netflix anonimizou os dados para o prêmio Netflix, mas as pessoas conseguiram descobrir quem eram esses usuários conectando os dados com páginas do IMDB. E isso acabou encerrando o concurso da Netflix. Eles haviam planejado um segundo, mas acabaram cancelando esses planos devido a preocupações com privacidade.
Gabriela: Oh, wow. O que é antigo é novo de certa forma. Preocupações com dados naquela época, preocupações com dados agora, preocupações com privacidade naquela época, preocupações com privacidade agora. Parece que, no caso do PageRank, isso foi projetado para trazer ordem e simplificar as coisas. Páginas, sites, recebem mais links, têm uma classificação mais alta. A classificação continua subindo se as páginas às quais você está vinculado tiverem uma classificação alta.
É meio um sistema de organização muito hierárquico. Este exemplo da Netflix Prize parece ser realmente baseado em conteúdo, personalidade, perfil e por isso é uma complexidade expansiva que estabelece diferentes conexões preferenciais. Totalmente interessante.
Estou curiosa, quais são as diferentes formas como os algoritmos estão sendo usados bem aqui e agora? Como eles evoluíram desde o PageRank ou um concurso financiado por crowdfunding para vencer a Netflix em seu próprio algoritmo?
Como os algoritmos mudaram nas últimas décadas?
Bruce: Há muito mais dados agora. Há muitas maneiras de rastrear pessoas. Você sabe, a Netflix, naquele exemplo, dependia de usuários classificando filmes.
Era cem milhões de classificações. Mas agora que a Netflix é um serviço de streaming, ela pode realmente rastrear o que você está assistindo. Você nem precisa classificar algo para ser puxado para este algoritmo.
Gabriela: O que você acha do impacto que os algoritmos de recomendação têm em nós culturalmente? Você pode me contar um pouco, Bruce, sobre como eles moldam e nos influenciam de maneiras que talvez não reconheçamos?
Como os algoritmos moldam e nos influenciam de maneiras que talvez não reconheçamos?
Bruce: Voltando à nossa conversa anterior, o TikTok é um exemplo claro de como a cultura está sendo moldada por esses algoritmos. É também um dos algoritmos de recomendação mais poderosos. Se você olhar para o design, é meio que a plataforma de aprendizado de máquina perfeita e isso, você sabe, como um algoritmo está aprendendo ao coletar mais dados e melhorar por conta própria, porque nesta plataforma você tem cerca de um bilhão de usuários assistindo a todos esses clipes de dois minutos.
Cada deslize ou cada minuto que você continua assistindo a um vídeo é outro ponto de dados para ele saber o que recomendar a você em seguida. E foi sobre isso que eu estava falando antes, quando disse que me senti meio enganado. Pode haver