A Microsoft Afirma Que Lançou 30 Ferramentas de IA Responsável No Último Ano

A Microsoft compartilhou suas práticas responsáveis ​​de inteligência artificial do ano passado em um relatório inaugural, incluindo o lançamento de 30 ferramentas de IA responsáveis ​​com mais de 100 recursos para apoiar a IA desenvolvida por seus clientes. O Relatório de Transparência de IA Responsável da empresa foca em seus esforços para construir, apoiar e expandir produtos de IA de maneira responsável, e faz parte dos compromissos da Microsoft após assinar um acordo voluntário com a Casa Branca em julho. A Microsoft também afirmou que expandiu sua equipe de IA responsável de 350 para mais de 400 pessoas – um aumento de 16,6% – no segundo semestre do ano passado. Essas ferramentas de IA responsável da Microsoft pretendem “mapear e medir riscos de IA”, em seguida, gerenciá-los com mitigação, detecção e filtragem em tempo real e monitoramento contínuo. Em fevereiro, a Microsoft lançou uma ferramenta de red teaming de acesso aberto chamada Python Risk Identification Tool (PyRIT) para IA generativa, que permite aos profissionais de segurança e engenheiros de aprendizado de máquina identificar riscos em seus produtos de IA generativa. Em novembro, a empresa lançou um conjunto de ferramentas de avaliação de IA generativa no Azure AI Studio, onde os clientes da Microsoft constroem seus próprios modelos de IA generativa, para que os clientes possam avaliar seus modelos em relação a métricas básicas de qualidade, incluindo ancoragem – ou o quão bem a resposta gerada de um modelo se alinha com seu material de origem. Em março, essas ferramentas foram expandidas para abordar riscos de segurança, incluindo conteúdo odioso, violento, sexual e prejudicial a si mesmo, bem como métodos de jailbreaking como injeções de texto, que é quando um modelo de linguagem grande (LLM) recebe instruções que podem fazê-lo vazar informações confidenciais ou espalhar desinformação. Apesar desses esforços, a equipe de IA responsável da Microsoft teve que lidar com inúmeros incidentes com seus modelos de IA no ano passado. Em março, o chatbot de IA Copilot da Microsoft disse a um usuário “talvez você não tenha nada para viver”, depois que o usuário, um cientista de dados na Meta, perguntou ao Copilot se ele deveria “simplesmente acabar com tudo”. Microsoft afirmou que o cientista de dados tentou manipular o chatbot para gerar respostas inadequadas, o que o cientista de dados negou. Em outubro passado, o gerador de imagem do Bing da Microsoft permitia que os usuários gerassem fotos de personagens populares, incluindo Kirby e Spongebob, voando aviões para as Torres Gêmeas. Depois que seu chatbot de IA Bing (o antecessor do Copilot) foi lançado em fevereiro do ano passado, um usuário conseguiu fazer o chatbot dizer “Heil Hitler.” “Não há linha de chegada para IA responsável. E, embora este relatório não tenha todas as respostas, estamos comprometidos em compartilhar nossas aprendizagens cedo e frequentemente e envolver-nos em um diálogo robusto sobre práticas de IA responsáveis,” escreveram Smith e Crampton no relatório.