O que começou como um projeto de ‘hackathon’ de 24 horas no fim de semana passado pode capacitar a comunidade de código aberto para revolucionar a indústria de óculos inteligentes. Cinco membros da equipe construíram um par de óculos inteligentes de $20, apelidado de Open Glass, que conecta o que você vê e ouve a um chatbot de inteligência artificial, como o Llama 3 da Meta.
Scott Fitsimones dirigiu para o centro de San Francisco no sábado de manhã para encontrar Nik Shevchenko, sem saber que passaria as próximas 24 horas em um ‘hackathon’ de inteligência artificial construindo um novo dispositivo com ele. Na época, Fitsimones pensava que estava pegando um pingente de inteligência artificial feito por Shevchenko, a quem descreve como líder do crescente movimento de wearables de inteligência artificial de San Francisco. No final do fim de semana, a equipe deles venceu o ‘hackathon’ e tinha aproximadamente 1.500 pessoas em uma lista de espera para encomendar seus óculos inteligentes de código aberto.
“Eu não tinha ideia sobre esse ‘hackathon’, e foi apenas muito serendipitoso”, disse Fitsimones. “E então, você sabe, acho que começamos apenas a improvisar e construir sobre o protótipo inicial.”
Por sua parte, Shevchenko entrou no ‘hackathon’ sabendo que queria construir o elemento de hardware para algum tipo de óculos inteligentes, de acordo com seus colegas de equipe (Shevchenko não respondeu ao pedido de entrevistas do Gizmodo). Ele foi acompanhado por Stepnan Korshakov, que resolveu os desafios de software mais difíceis do projeto. Esses dois recrutaram Fitsimones, Shreeganesh Ramanan e Jatin Gupta para formar uma equipe vencedora.
Em uma sala grande e arejada com vista para as águas azuis e montanhas verdes da Baía de San Francisco, engenheiros de software codificavam em sofás fofos com pilhas de La Croix ao lado. O Cerebral Valley hospeda ‘hackathons’ como esse com frequência, reunindo a próspera cena de startups de inteligência artificial de San Francisco. Shevchenko foi um dos poucos a usar uma caneta de solda em vez de um laptop, enquanto o resto da equipe seguia em frente com o software. Em determinado momento tarde no sábado, Shevchenko deixou o evento para imprimir em 3D o case do computador Open Glass.
Depois de aproximadamente um dia de hacking, Shevchenko e a equipe apresentaram orgulhosamente um par de óculos de sol baratos com uma caixa preta saindo do lado direito. Os óculos tinham uma câmera que tirava uma foto a cada cinco segundos e um microfone que transcrevia constantemente o áudio. Isso cria um banco de dados de fotos e texto para refletir o que seus olhos e ouvidos captam. Pressione um botão no lado dos óculos e você pode pedir ao chatbot Llama 3 da Meta para responder perguntas sobre sua própria vida.
“Qual era o nome daquela pessoa?”, “Onde deixei minhas chaves?”, e “Quantas calorias estão nestas frutas?” foram algumas das perguntas respondidas pelo AI durante a demonstração. A tecnologia tem aplicações úteis para muitas pessoas, mas pode se destacar especialmente ao ajudar alguém com baixa visão ou audição ruim.
A equipe de Shevchenko ganhou o primeiro prêmio no ‘hackathon’, apesar de um bug nas habilidades de conversão de fala para texto dos óculos durante a demonstração. Eles receberam elogios dos executivos da Meta e da Groq, bem como do CEO da Hugging Face, Clem Delangue, que julgou os projetos finais. Em questão de horas, a mente empreendedora de Shevchenko entrou em ação e ele criou uma lista de espera para encomendar uma versão do protótipo.
“Woah woah woah, são 1.300”, disse Korshakov ao telefone comigo na segunda-feira, ao descobrir quantas pré-encomendas eles tinham recebido. “Pessoas em todo o mundo querem construir coisas com isso. Agora eles têm alguma forma de possuir e contribuir para o sucesso deste projeto.”
Embora outros óculos inteligentes estejam disponíveis no mercado hoje – como os Ray-Bans da Meta – eles não são de código aberto nem tão baratos. O Open Glass oferece um kit relativamente barato que permite aos desenvolvedores escolher quais LLWs querem usar e decidir o que desejam que os óculos façam. Por exemplo, nem todos os pares de Open Glass precisam tirar fotos ou gravar áudio constantemente. Isso oferece uma opção acessível e hackeável para óculos inteligentes, um formato que anteriormente era bastante caro e limitado em relação ao que se poderia fazer.
“Você pode conectá-lo ao OpenAI, pode conectá-lo ao Gemini”, disse Ramanan em uma entrevista por telefone. “É muito sobre ter a habilidade de misturar e combinar todas as melhores opções e então criar suas próprias aplicações e estruturas interessantes.”
Os óculos inteligentes ainda não atingiram o mesmo sucesso que outros wearables. No entanto, o avanço de modelos de inteligência artificial multimodais torna este um momento emocionante para os óculos inteligentes. É fácil imaginar como o novo GPT-4 Omni da OpenAI, que pode processar vídeo, áudio e texto simultaneamente, poderia ser usado em óculos como este. Até o Google mostrou um protótipo dos novos Google Glasses em uma demonstração de sua última inteligência artificial na terça-feira. O Open Glass espera que dar à comunidade de código aberto acesso a essa tecnologia permita uma maior inovação no setor.
Uma coisa que tem prejudicado os óculos inteligentes são as preocupações com a privacidade. Os Ray-Bans da Meta não estão constantemente gravando áudio e vídeo para usar sua vida como um banco de dados, e isso provavelmente é algo bom. Mas existe uma comunidade crescente de fanáticos por gadgets de inteligência artificial no Vale do Silício interessados na ideia de gravar constantemente suas vidas para criar o assistente pessoal definitivo. Anéis, pingentes e agora óculos estão surgindo de startups em San Francisco, todos fascinados por esse potencial.
Embora a abertura da tecnologia permita que os desenvolvedores inovem nessas ideias de uma forma mais caseira, ainda existem importantes preocupações a serem abordadas com privacidade e custos. Essas questões são importantes, mas não são exatamente o foco para os desenvolvedores nas fases iniciais dessa tecnologia. O que é mais importante para eles é torná-la útil.
Algumas pessoas não técnicas podem comprar o Open Glass para simplesmente usar um par barato de óculos inteligentes. A equipe ainda está finalizando o produto, mas parece que ele virá com grandes modelos de linguagem embutidos e um aplicativo móvel que o acompanha. O preço real do dispositivo também está sujeito a alterações, embora todo o código-fonte esteja disponível gratuitamente no GitHub.
A história do Open Glass é um testemunho da próspera cultura de startups de inteligência artificial em San Francisco. A comunidade de código aberto poderia desbloquear avanços-chave em tecnologias estagnadas como os óculos inteligentes. Mais pragmaticamente, também poderia oferecer às pessoas não técnicas um par de óculos inteligentes pelo preço de um ingresso de cinema.