Microsoft Diz Ter Lançado 30 Ferramentas de IA Responsáveis no Último Ano

A Microsoft compartilhou suas práticas responsáveis de inteligência artificial do ano anterior em um relatório inaugural, incluindo o lançamento de 30 ferramentas de IA responsável que possuem mais de 100 recursos para apoiar a IA desenvolvida por seus clientes. O Relatório de Transparência de IA Responsável da empresa foca em seus esforços para construir, apoiar e expandir produtos de IA de forma responsável, e é parte dos compromissos da Microsoft após assinar um acordo voluntário com a Casa Branca em julho. A Microsoft também afirmou que aumentou sua equipe de IA responsável de 350 para mais de 400 pessoas – um aumento de 16,6% – no segundo semestre do ano passado.

“As a company at the forefront of AI research and technology, we are committed to sharing our practices with the public as they evolve,” disse Brad Smith, vice-presidente e presidente da Microsoft, e Natasha Crampton, diretora de IA responsável, em uma declaração. “Este relatório nos permite compartilhar nossas práticas em amadurecimento, refletir sobre o que aprendemos, traçar nossos objetivos, nos responsabilizar e conquistar a confiança do público.”

A Microsoft afirmou que suas ferramentas de IA responsável são destinadas a “mapear e medir os riscos da IA”, e em seguida gerenciá-los com mitigadores, detecção e filtragem em tempo real, e monitoramento contínuo. Em fevereiro, a Microsoft lançou uma ferramenta de “red teaming” de acesso aberto chamada Python Risk Identification Tool (PyRIT) para IA generativa, que permite aos profissionais de segurança e engenheiros de aprendizado de máquina identificar riscos em seus produtos de IA generativa.

Em novembro, a empresa lançou um conjunto de ferramentas de avaliação de IA generativa no Azure AI Studio, onde os clientes da Microsoft constroem seus próprios modelos de IA generativa, para que os clientes pudessem avaliar seus modelos para métricas de qualidade básicas, incluindo “fundamentação – ou o quão bem a resposta gerada por um modelo se alinha com seu material de origem”. Em março, essas ferramentas foram expandidas para abordar riscos de segurança incluindo conteúdo odioso, violento, sexual e autolesivo, assim como métodos de jailbreaking, como injeções de prompts, que é quando um modelo de linguagem grande (LLM) recebe instruções que podem fazê-lo vazar informações sensíveis ou espalhar desinformação.

Apesar desses esforços, a equipe de IA responsável da Microsoft teve que lidar com inúmeros incidentes com seus modelos de IA no ano anterior. Em março, o chatbot de IA da Microsoft, Copilot, disse a um usuário que “talvez você não tenha nada pelo que viver”, após o usuário, um cientista de dados na Meta, perguntar ao Copilot se ele deveria “simplesmente acabar com tudo”. A Microsoft disse que o cientista de dados tentou manipular o chatbot para gerar respostas inadequadas, o que o cientista de dados negou. No ano passado, o gerador de imagens do Bing da Microsoft permitia que os usuários gerassem fotos de personagens populares, incluindo Kirby e Spongebob, colidindo aviões nas Torres Gêmeas. Depois que seu chatbot do Bing AI (o antecessor do Copilot) foi lançado em fevereiro do ano passado, um usuário conseguiu fazer com que o chatbot dissesse “Heil Hitler”.

“Não há linha de chegada para a IA responsável. E embora este relatório não tenha todas as respostas, estamos comprometidos em compartilhar nossas aprendizagens precocemente e frequentemente e em participar de um diálogo robusto sobre práticas de IA responsável”, escreveram Smith e Crampton no relatório.