Sony lança novo conjunto de dados de benchmark de IA para ajudar modelos de visão computacional a reduzir o preconceito

Em resposta ao problema comum de preconceito nos atuais modelos visuais de inteligência artificial, a equipe de IA da Sony lançou recentemente um novo conjunto de dados chamado "Fair Human-Centric Image Benchmark (FHIBE)", com o objetivo de promover a padronização de testes de imparcialidade e coleta de dados éticos.

Todas as imagens deste conjunto de dados foram coletadas com meu consentimento, abrangendo 81 países e regiões ao redor do mundo. Contém um total de 10.318 imagens e 1.981 assuntos independentes. Cada imagem é equipada com anotações detalhadas, incluindo informações profissionais, como definições de bordas, máscaras de segmentação e parâmetros de câmera, para facilitar aos desenvolvedores a realização de avaliações detalhadas do modelo.

Alice Xiang, chefe de governança global de IA da Sony AI, disse que um mal-entendido no campo da visão computacional é que os modelos podem refletir objetivamente a realidade devido à sua dependência de dados e algoritmos. Na verdade, o viés de dados no processo de treinamento do modelo afetará diretamente o desempenho real. Por exemplo, na China, alguns sistemas de reconhecimento facial de telemóveis já tinham rostos asiáticos insuficientes nos dados de formação, fazendo com que os membros da família desbloqueassem acidentalmente o dispositivo e concluíssem pagamentos, causando assim riscos de segurança. Além disso, os modelos visuais existentes também tiveram problemas como classificar erroneamente as médicas como enfermeiras ou reforçar inadvertidamente estereótipos ocupacionais, raciais e de género.

Anteriormente, a maioria dos conjuntos de dados de visão computacional usados para avaliar a imparcialidade não obtinha o consentimento dos sujeitos e até rastreava imagens diretamente de plataformas da Internet, o que desencadeou muitas disputas de direitos autorais e privacidade. Em contraste, toda a recolha de dados da FHIBE tem registos totalmente públicos de processos de consentimento e compensação, e é considerada como tendo estabelecido um novo padrão ético para a indústria.

Com base no teste FHIBE, a equipe de IA da Sony descobriu que a precisão de alguns modelos diminuía ao lidar com pronomes de gênero designados (como “Ela/Ela”) devido à diversidade de estilos de cabelo. O modelo também pode associar injustificadamente atividades criminosas a determinados grupos étnicos na tarefa de reconhecimento da ocupação. A equipe enfatizou que o FHIBE pode ajudar os desenvolvedores a descobrir e corrigir esses desvios em tempo hábil, promover a indústria a prestar mais atenção à ética e à justiça na coleta de dados e incentivar o pessoal de P&D a investir mais recursos na melhoria da inovação da camada de dados.

Actualmente, embora o nível federal dos EUA ainda não tenha introduzido políticas que apoiem especificamente a ética e a justiça da IA, a Lei da IA da UE e os regulamentos relevantes em alguns estados dos EUA começaram a exigir a revisão do preconceito algorítmico em áreas de alto risco. O Grupo Sony adotou o conjunto de dados FHIBE no processo de avaliação de ética da IA e analisa proativamente a justiça dos seus modelos de negócios em conformidade com o código de ética da IA.

Alice Xiang acredita que o “niilismo de dados” é cada vez mais prevalente na indústria, e a prática da FHIBE mostra que a tecnologia de IA pode ser desenvolvida inteiramente com base em dados consentidos e compensados. Embora a escala actual do FHIBE ainda seja pequena e não seja suficiente para apoiar a formação em big data, a sua importância é fornecer demonstrações de métodos para a indústria e chamar mais atenção para a inovação da camada de dados, que ainda é uma questão importante que precisa de ser resolvida no actual campo da IA.