Pesquisadores britânicos desenvolveram um novo banco de dados acessível ao público que esperam ver diminuir com o tempo. Isso porque o banco de dados reúne milhares de proteínas pouco estudadas, codificadas por genes do genoma humano, cuja existência é conhecida, mas cujas funções são em sua maioria desconhecidas.
O banco de dados, denominado "unknome", é o resultado da pesquisa de Matthew Freeman, da Dunn School of Pathology da Universidade de Oxford, Reino Unido, e de Sean Munro, do Laboratório MRC de Biologia Molecular em Cambridge, Reino Unido, e seus colegas. Eles estudaram algumas das proteínas do banco de dados e descobriram que a maioria contribui para funções celulares importantes, incluindo desenvolvimento e resistência ao estresse.
A sequenciação do genoma humano mostrou claramente que o genoma humano codifica milhares de possíveis sequências de proteínas cujas identidades e funções permanecem desconhecidas até hoje. As razões para isto são multifatoriais, incluindo uma tendência para concentrar o escasso financiamento da investigação em alvos conhecidos e a falta de ferramentas, incluindo anticorpos, para estudar a função destas proteínas nas células.
Mas os autores acreditam que ignorar estas proteínas é arriscado porque é provável que algumas proteínas, talvez muitas, desempenhem papéis importantes em processos celulares chave e possam fornecer informações e servir como alvos para intervenção terapêutica.
Para facilitar a exploração mais rápida desta classe de proteínas, os autores criaram o banco de dados Unknome, que atribui a cada proteína uma pontuação de “conhecimento” que reflete informações na literatura científica sobre função, conservação entre espécies, compartimentalização subcelular e outros elementos.
Segundo esse sistema, existem milhares de proteínas com “grau conhecido” próximo de zero. Estes incluem proteínas de organismos modelo, bem como proteínas do genoma humano. O banco de dados é aberto a todos e personalizável, permitindo que os usuários forneçam suas próprias ponderações para diferentes elementos e, assim, gerem seu próprio conjunto de pontuações de conhecimento para priorizar suas próprias pesquisas.
Para testar a utilidade da base de dados, os autores selecionaram 260 genes em humanos que possuem genes semelhantes em moscas e têm uma pontuação de conhecimento de 1 ou menos em ambas as espécies, indicando que quase nada se sabe sobre eles. A eliminação completa de muitos desses genes é incompatível com a vida das moscas; O nocaute parcial ou específico do tecido revelou que a maioria dos genes contribui para funções importantes que afetam a fertilidade, o desenvolvimento, o crescimento dos tecidos, o controle da qualidade das proteínas ou a resistência ao estresse.
As descobertas mostram que, apesar de décadas de investigação detalhada, milhares de genes de moscas continuam por compreender, mesmo ao nível mais básico, e o mesmo é claramente o caso do genoma humano. “Estes genes não caracterizados não devem ser ignorados”, disse Munro. “Nosso banco de dados fornece uma plataforma poderosa, versátil e eficiente para identificar e selecionar genes importantes de função desconhecida para análise, acelerando assim o fechamento da lacuna de conhecimento biológico representada por genomas desconhecidos”. "
Munro acrescentou: "Os papéis de milhares de proteínas humanas permanecem obscuros, mas a investigação tende a concentrar-se naquelas que já são bem compreendidas. Para ajudar a resolver este problema, criámos uma base de dados 'Unknome', que classifica as proteínas de acordo com o quão bem são conhecidas, e depois rastreia funcionalmente um subconjunto destas proteínas misteriosas para mostrar como a ignorância impulsiona a descoberta biológica."