Imagine que há dois pilotos em um avião, um humano e um computador. Ambas as pessoas estão com a “mão” no controle, mas estão sempre focadas em coisas diferentes. Se todos estiverem focados na mesma coisa, os humanos podem assumir o volante. Mas se os humanos se distraírem ou perderem alguma coisa, os computadores rapidamente assumem o controle. Combinar a intuição humana com a precisão da máquina cria uma relação mais simbiótica entre o piloto e a aeronave.
Com o Air-Guardian, um programa de computador pode rastrear o olhar de um piloto humano (usando tecnologia de rastreamento ocular) para entender melhor no que o piloto está prestando atenção. Isso ajuda o computador a tomar decisões melhores com base no que o piloto está fazendo ou pretende fazer. Crédito da foto: AlexShipps/MITCSAILviaMidjourney
Este é o sistema “SkyGuardian” desenvolvido por pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT. Os pilotos modernos precisam lidar com grandes quantidades de informações provenientes de múltiplos monitores, especialmente em momentos críticos. O Air-Guardian pode atuar como copiloto ativo; é uma parceria entre humanos e máquinas que se baseia fundamentalmente na compreensão da atenção.
Mas como exatamente isso determina a atenção? Para os humanos, utiliza o rastreamento ocular, enquanto para os sistemas neurais, depende de um conceito chamado “mapas de saliência”, que identificam a direção da atenção. Esses mapas podem servir como guias visuais, destacando áreas-chave em uma imagem para ajudar a compreender e interpretar o comportamento de algoritmos complexos. A Air-Guardian utiliza estes marcadores de atenção para identificar sinais precoces de riscos potenciais, em vez de intervir apenas quando ocorre uma violação de segurança, como é o caso dos sistemas tradicionais de condução autónoma.
O impacto generalizado do sistema vai além da aviação. Mecanismos de controle cooperativo semelhantes poderão um dia ser usados em carros, drones e no campo mais amplo da robótica.
Lianhao Yin, pós-doutorado no MIT CSAIL e primeiro autor de um novo artigo sobre o Air-Guardian, disse:"Uma característica interessante de nossa abordagem é sua diferenciabilidade. Nossa camada de cooperação e todo o processo ponta a ponta são treináveis. Escolhemos especificamente o modelo de rede neural profunda causal contínua por causa de suas propriedades dinâmicas no mapeamento da atenção. Outra característica única é a adaptabilidade. O sistema Air-Guardian não é rígido, pode ser ajustado de acordo com a situação real, garantindo uma cooperação equilibrada entre humanos e máquinas. "
Testes e resultados de campo
Nos testes de campo, tanto o piloto quanto o sistema tomaram decisões com base nas mesmas imagens brutas ao navegar para um waypoint alvo. O sucesso do Air-Guardian é medido pelas recompensas cumulativas obtidas durante o voo e pelo caminho mais curto até o waypoint. O Guardian reduz o nível de risco de voar e aumenta a taxa de sucesso de navegação até o ponto alvo.
Ramin Hasani, membro do instituto de pesquisa CSAIL do MIT e inventor da Rede Neural Líquida, acrescentou: "Este sistema representa uma abordagem centrada no ser humano para a inovação na aviação de IA. Nosso uso da Rede Neural Líquida fornece uma abordagem dinâmica e adaptativa para garantir que a IA não simplesmente substitua o julgamento humano, mas o complemente, melhorando assim a segurança e a colaboração nos céus".
Fundamento técnico e perspectivas futuras
A verdadeira força do Air-Guardian reside na sua tecnologia subjacente. Ele usa uma camada de colaboração baseada em otimização que aproveita a atenção visual humana e de máquina, bem como uma rede neural de tempo contínuo (CfC) líquida e fechada conhecida por decifrar relações de causa e efeito, para analisar imagens recebidas em busca de informações importantes. Complementarmente, o algoritmo VisualBackProp identifica o foco do sistema na imagem, garantindo uma compreensão clara do seu mapa de atenção.
Para ser amplamente utilizada no futuro, a interface homem-máquina precisa ser melhorada. O feedback sugeriu que um indicador, como um gráfico de barras, poderia fornecer uma representação mais visual de quando o sistema de monitoramento começa a assumir o controle.
SkyGuard anuncia uma nova era de céus mais seguros, fornecendo uma rede de segurança confiável para aqueles momentos em que a atenção humana vacila.
"O sistema SkyGuard destaca a sinergia entre a experiência humana e o aprendizado de máquina, promovendo o objetivo de usar o aprendizado de máquina para aprimorar as capacidades do piloto e reduzir erros operacionais em cenários desafiadores", disse Daniela Rus, professora de Engenharia Elétrica e Ciência da Computação Andrew (1956) e Erna Viterbi no MIT, diretora do CSAIL e autora sênior do artigo.
“Um dos resultados mais interessantes do uso de métricas de atenção visual neste trabalho é o potencial para os pilotos humanos intervirem mais cedo e melhorarem a interpretabilidade”, disse Stephanie Gil, professora assistente de ciência da computação na Universidade de Harvard. “Isto mostra um grande exemplo de como usar a inteligência artificial para trabalhar com humanos, reduzindo o limiar para alcançar a confiança ao alavancar mecanismos naturais de comunicação entre humanos e sistemas de inteligência artificial”.