O cientista-chefe da OpenAI tem um plano para encontrar maneiras de controlar a superinteligência artificial

De acordo com notícias de 15 de dezembro, já quando a OpenAI foi fundada, ela prometia construir inteligência artificial que beneficiaria toda a humanidade, mesmo que essas inteligências artificiais fossem mais inteligentes do que os seus criadores. Desde a estreia do ChatGPT, as ambições comerciais da OpenAI tornaram-se gradualmente mais proeminentes. Recentemente, a empresa anunciou a criação de uma nova equipe de pesquisa dedicada ao estudo da futura superinteligência artificial, e já começou a alcançar alguns resultados.

Leopold Aschenbrenner, pesquisador da OpenAI, destacou: “A Inteligência Artificial Geral (AGI) está se aproximando rapidamente e veremos modelos superinteligentes que têm grandes capacidades, mas também podem ser muito perigosos, e ainda não encontramos uma maneira de controlá-los”. Participou da equipe de pesquisa “Superalignment” (Superalinhamento) criada em julho deste ano. A OpenAI disse que dedicará um quinto de seu poder de computação disponível ao projeto “Super Alignment” para explorar como garantir a segurança e controlabilidade da superinteligência artificial.

A OpenAI publicou recentemente um artigo de pesquisa descrevendo os resultados de um experimento. O experimento foi projetado para testar uma maneira de um modelo de IA mais pobre guiar um modelo de IA mais inteligente sem perder inteligência. Embora a tecnologia envolvida ainda não exceda a destreza humana, a experiência foi concebida para um tempo futuro em que os humanos terão de trabalhar com sistemas de inteligência artificial mais inteligentes do que eles próprios.

Em experimentos, os pesquisadores da OpenAI examinaram um processo chamado supervisão, que é usado para ajustar sistemas como o GPT-4 para torná-los mais úteis e menos prejudiciais. GPT é o grande modelo de linguagem por trás do ChatGPT. Atualmente, isso envolve humanos informando ao sistema de IA quais respostas são boas e quais são ruins. À medida que a inteligência artificial avança, os pesquisadores estão explorando como automatizar esse processo para economizar tempo. Além disso, isso ocorre porque eles acreditam que, à medida que a IA se torna mais poderosa, os humanos podem não ser capazes de fornecer feedback útil.

Em experimentos controlados, os pesquisadores usaram o gerador de texto GPT-2 da OpenAI, lançado pela primeira vez em 2019, para ensinar GPT-4 e testaram duas soluções alternativas. Uma abordagem é treinar modelos maiores de forma incremental para reduzir a perda de desempenho em cada etapa; outro é um ajuste algorítmico no GPT-4 que permite que modelos mais fortes sigam a orientação de modelos mais fracos sem prejudicar seu desempenho. A segunda abordagem revelou-se mais eficaz e, embora os investigadores reconheçam que estes métodos não garantem que o modelo mais forte funcionará perfeitamente, podem servir como ponto de partida para futuras investigações.

“É ótimo ver a OpenAI abordando proativamente o problema do controle da superinteligência, um desafio que exigirá anos de trabalho árduo”, disse Dan Hendryks, diretor do Center for Artificial Intelligence Safety, uma organização sem fins lucrativos com sede em São Francisco dedicada a gerenciar os riscos da inteligência artificial.

Aschenbrenner e dois outros membros da equipe do Super Alinhamento, Collin Burns e Pavel Izmailov, disseram em entrevistas que foram encorajados pelo importante primeiro passo para domar a potencial inteligência superartificial. Izmailov fez uma analogia: “É como um aluno do sexto ano, embora saiba menos matemática do que um estudante universitário de matemática, ainda é capaz de comunicar aos estudantes universitários o que pretendem alcançar, e é isso que procuramos”.

A equipe do Super Alignment é co-liderada por Ilya Sutskever, cientista-chefe e cofundador da OpenAI. Sultzkefer foi um dos membros originais do conselho que votou no mês passado pela demissão do CEO Sam Altman. No entanto, mais tarde ele reverteu sua decisão e ameaçou renunciar se Altman não fosse reintegrado. Sutskefer é coautor do artigo mais recente, mas a OpenAI se recusou a fazê-lo discutir o projeto.

No mês passado, Altman chegou a um acordo com a OpenAI, a maior parte do conselho de administração renunciou e o futuro de Sultzkefer na OpenAI também está cheio de incertezas. Ainda assim, Aschenbrenner disse: “Estamos muito gratos a Sutzkefer, que foi a força motriz por trás deste projeto”.

No campo da inteligência artificial, os investigadores da OpenAI não são o primeiro grupo a tentar utilizar a tecnologia existente para testar o que poderia ajudar a domar futuros sistemas de inteligência artificial. No entanto, tal como acontece com estudos anteriores em laboratórios empresariais e académicos, não podemos ter a certeza de que as ideias que funcionam em experiências bem concebidas serão práticas no futuro. Os pesquisadores farão com que um modelo de IA mais fraco treine um modelo de IA mais forte, uma capacidade que eles chamam de "um componente-chave na resolução do problema mais amplo de 'superalinhamento'".

Este experimento de alinhamento de IA também levanta uma questão fundamental: até que ponto o sistema de controle pode ser confiável? No cerne da nova tecnologia da OpenAI está a ideia de que um sistema de IA mais poderoso pode decidir por si mesmo que orientação de um sistema mais fraco pode ignorar, uma escolha que pode fazer com que ignore informações importantes que podem impedi-lo de agir de forma insegura no futuro. Para que tal sistema seja eficaz, é necessário fazer progressos no sentido de proporcionar consistência. “Em última análise, você precisa de um alto nível de confiança”, enfatizou Burns.

Stuart Russell, professor da Universidade da Califórnia, Berkeley, que estuda segurança de IA, disse que a ideia de usar modelos de IA menos poderosos para controlar modelos mais poderosos já existe há algum tempo. Mas ele também salienta que até agora não está claro se os métodos usados para ensinar o comportamento da IA são viáveis porque ainda não permitem que os modelos atuais funcionem de forma confiável.

Enquanto a OpenAI dá os primeiros passos para controlar a inteligência artificial mais avançada, a empresa está ansiosa por ajuda externa. A OpenAI anunciou que fornecerá US$ 10 milhões em subsídios a pesquisadores externos em parceria com o ex-CEO do Google, Eric Schmidt, para incentivar o progresso em áreas como regulamentação fraca a forte, interpretabilidade de modelos avançados e fortalecimento de modelos com instruções projetadas para quebrar limitações. Os pesquisadores envolvidos na redação do novo artigo disseram que a OpenAI também realizará uma conferência sobre “superalinhamento” no próximo ano.

Como cofundador da OpenAI e colíder da equipe Hyper-Alignment, ele lidera muitos dos esforços técnicos mais importantes da empresa. Ao mesmo tempo, ele é um dos principais especialistas cada vez mais preocupados em como controlar a inteligência artificial à medida que ela se torna mais poderosa. Desde o início deste ano, a questão de como controlar a futura tecnologia de inteligência artificial ganhou nova atenção, em grande parte devido à influência do ChatGPT. Sulzkefer estudou para seu doutorado sob a orientação do pioneiro em redes neurais profundas Geoffrey Hinton. Este último deixou o Google em maio deste ano em meio a avisos de que a inteligência artificial parecia estar se aproximando dos níveis humanos em algumas tarefas. (pequeno)