Cientistas reconstroem cenas visuais com alta precisão e convertem a atividade cerebral do rato em filmes

Pela primeira vez, os cientistas reconstruíram com sucesso um videoclipe de 10 segundos de um rato usando apenas a sua atividade cerebral, abrindo uma nova janela para a compreensão de como o cérebro codifica e processa a experiência visual. Esta conquista vem de uma equipe de pesquisa liderada pela University College London (UCL). O artigo relevante foi publicado recentemente na revista "eLife".

Nos últimos anos, o campo da neurociência continuou a se concentrar em como o cérebro humano “emenda” o mundo que vemos a partir dos sinais recebidos pelos olhos. Estudos anteriores mostraram principalmente imagens ou vídeos a voluntários em equipamentos de imagem, como ressonância magnética funcional, e depois tentaram decodificar informações visuais da atividade cerebral até um único pixel. Este trabalho dá continuidade a esse objetivo geral, mas optou por rastrear a atividade do córtex visual por meio do registro em nível unicelular em camundongos para obter uma imagem mais detalhada da representação visual do cérebro.

Usando apenas dados de atividade do córtex visual dos ratos, a equipe foi capaz de reconstruir videoclipes dos ratos visualizados anteriormente com qualidade surpreendente. O primeiro autor do artigo, Joel Bauer, do UCL Sainsbury Wellcome Centre, disse que queria encontrar uma maneira mais geral e realista de explorar como o cérebro dá sentido ao que vê. Muitos métodos existentes só podem fazer inferências com base em condições ou estímulos específicos e são difíceis de generalizar para cenas visuais mais naturais e complexas, enquanto novos métodos tentam capturar diretamente o que o cérebro está representando e compará-lo com a realidade.

Em termos de tecnologia específica, a equipe de pesquisa adotou um “modelo de codificação neural dinâmica”. O modelo, originalmente desenvolvido por outra equipe para a competição Sensorium de 2023, foi usado para prever a intensidade da atividade de cada neurônio enquanto os ratos assistiam a um filme, levando em consideração fatores como os movimentos espontâneos do animal e o diâmetro da pupila. A equipe da UCL melhorou ainda mais o modelo com base no mesmo conjunto de dados: eles compararam dois tipos de atividade neuronal – a atividade prevista pelo modelo quando os ratos olhavam para uma “tela em branco” e a atividade real medida pela tecnologia de imagem microscópica. Este método de imagem pode identificar com precisão quais neurônios são ativados em momentos específicos com base em alterações nas concentrações locais de cálcio dentro da célula.

À medida que o modelo é executado, os pesquisadores partem de um “filme em branco” e usam o algoritmo para ajustar continuamente cada pixel até que o vídeo gerado seja estatisticamente altamente consistente com o vídeo que os ratos realmente assistiram. Depois de completar o treinamento, o modelo poderia reconstruir um videoclipe de cerca de 10 segundos de duração com base na atividade cerebral de ratos assistindo a um novo vídeo. Vale ressaltar que esses vídeos utilizados para reconstrução não participaram do treinamento do modelo, o que reflete melhor a versatilidade do método.

Ball observou que o detalhe dos vídeos reconstruídos melhorou significativamente após a adição de dados de mais neurônios individuais, ressaltando a importância de obter dados neurais mais abrangentes. Para avaliar a reconstrução, a equipe usou uma métrica de correlação de pixels, comparando cada pixel de cada quadro do filme original com o pixel correspondente no filme reconstruído. Os resultados mostram que as diferenças de espaço e tempo entre os dois são relativamente limitadas, indicando que este tipo de “tradução de filmes” baseada na atividade cerebral pode atingir uma precisão muito elevada.

No futuro, os pesquisadores planejam coletar dados cerebrais com maior resolução e cobertura mais ampla para apoiar uma reconstrução visual mais clara e ampla da cena. Em termos de aplicação, eles esperam particularmente usar esta tecnologia para explorar o “desvio percepção-realidade”: isto é, por que e como a representação visual no cérebro se desvia da imagem objetiva à nossa frente. Ball destacou que os humanos não têm uma “cópia do mundo” completamente real no cérebro. A informação visual é amplificada, comprimida ou distorcida seletivamente durante a transmissão e o processamento. Este desvio não é um simples erro, mas um mecanismo funcional utilizado pelo cérebro para interpretar e melhorar a informação percebida.

Este estudo sobre a reconstrução visual de filmes em ratos estabelece as bases para trabalhos semelhantes em animais mais complexos e até mesmo em humanos no futuro. Com o desenvolvimento contínuo da tecnologia de imagem, modelos computacionais e métodos de análise de dados, os cientistas poderão obter uma compreensão mais profunda de como “vemos” o mundo, e espera-se que forneçam novo suporte teórico para o diagnóstico e tratamento de deficiências visuais, interfaces cérebro-computador e sistemas imersivos de percepção artificial.