A Biblioteca da Escola de Direito de Harvard anunciou hoje o lançamento da Iniciativa de Dados Institucionais, uma iniciativa de pesquisa por meio da qual a Biblioteca da Escola de Direito de Harvard trabalhará com bibliotecas, museus, agências governamentais e outras instituições para publicar suas coleções em forma de dados. Esses dados podem ser usados ​​para diversos fins, incluindo treinamento de modelos de inteligência artificial.

A Iniciativa de Dados Institucionais (IDI) se concentrará primeiro no refinamento de 1 milhão de livros de domínio público digitalizados pelas Bibliotecas de Harvard. Também trabalhará com a Biblioteca Pública de Boston para disponibilizar milhões de páginas de jornais históricos como dados. Embora estes conjuntos de dados sejam de texto longo, o IDI procura colaborar com outras instituições para desenvolver dados numa variedade de formatos, incluindo dados científicos e biomédicos.

O lançamento do IDI é apoiado pela Microsoft e OpenAI. Para financiamento de longo prazo, o IDI planeja fazer parceria com diversas instituições de caridade e apoiadores da indústria.

O vice-presidente e conselheiro geral adjunto da Microsoft, Burton Davis, expressou as seguintes opiniões sobre o IDI:

"A Microsoft tem orgulho de apoiar o estabelecimento da Iniciativa de Dados Institucionais, que trabalhará para aumentar o acesso ao conhecimento e aos dados de alta qualidade para todos os criadores de IA. Estamos empenhados em permitir o acesso generalizado aos dados e capacitar um ecossistema de IA mais inclusivo. Desde 2020, temos trabalhado para eliminar a divisão de dados e garantir que cada organização tenha acesso aos dados de que necessita para inovar e alcançar mais, o que é fundamental para o crescimento de uma economia de IA vibrante e competitiva."

A Microsoft sempre acreditou que todos podem beneficiar da colaboração em torno de dados abertos e disponíveis. Na verdade, já em 2020, a Microsoft lançou um movimento de dados abertos através do qual organizações de todos os tamanhos podem aceder aos dados necessários para desenvolver aplicações de inteligência artificial.

O Diretor de Propriedade Intelectual e Conteúdo da OpenAI, Tom Rubin, disse o seguinte sobre o lançamento do IDI:

"As instituições acadêmicas têm sido parceiras importantes na pesquisa e no avanço da IA, e a Iniciativa de Dados Institucionais da Universidade de Harvard é um forte exemplo. O domínio público desempenha um papel vital na disseminação do conhecimento e da criatividade, e a OpenAI está entusiasmada em apoiar este esforço. Estamos inspirados pela liderança do Professor Zittrain neste importante projeto, e estamos ansiosos para ver o impacto que ele terá".

Ao fornecer grandes conjuntos de dados facilmente acessíveis, a IDI está a contribuir para o avanço da tecnologia de inteligência artificial e para a sua acessibilidade a todos.