Passaram-se apenas 5 dias desde que o DeepSeek V4 foi lançado e há novas ações quase todos os dias. Ontem, os pesquisadores previram que as capacidades multimodais estavam chegando e hoje já existe um teste em escala de cinza. Muitas pessoas descobriram que a página da web DeepSeek adicionou um modo de reconhecimento de imagem, o que significa que ele pode compreender as informações da imagem. Embora esta capacidade não melhore diretamente o desempenho de programação e raciocínio da IA, será muito conveniente de usar. Se você encontrar problemas na vida diária, poderá fazer upload de capturas de tela diretamente e deixar o DeepSeek analisá-las sozinho. É mais fácil do que descrever o problema sozinho.

Os internautas que alcançaram a escala de cinza também usam informações de imagem profissional.Por exemplo, usei imagens de tomografia computadorizada tiradas pelo hospital para verificar as capacidades de reconhecimento de imagem do DeepSeek e fiquei chocado com os resultados.

A imagem CT enviada por @brick, um internauta da comunidade Linux.do, é de um artigo profissional. Depois de analisado pelo DeepSeek, ele pode determinar com precisão o conteúdo da imagem e realizar análises profissionais.Vários resultados foram finalmente produzidos, dando possíveis direções para a doença, incluindo vários tipos diferentes de possibilidades de pneumonia.

Há uma conclusão clara no artigo onde esta imagem de tomografia computadorizada está localizada. Em comparação, pode-se ver que a análise do DeepSeek ainda é muito confiável e pode assumir o papel de um médico de IA nesse aspecto.

No entanto, afinal, IA é IA. Pode ajudar todos a analisar a situação. Esses exames médicos importantes e a confirmação de doenças exigem análise e confirmação por parte de hospitais e médicos.

Se não for uma doença grave, você pode usar a IA para ser um médico para problemas médicos comuns. Existem também muitos aplicativos de IA treinados por grandes modelos médicos profissionais. Basta utilizá-los para julgar problemas e dar sugestões ao enfrentá-los. Não há necessidade de ir ao hospital e fazer fila para pequenos problemas.

Voltando à questão do DeepSeek, eles também realizaram pesquisas multimodais antes, e a tecnologia de OCR de código aberto atingiu até o nível mais alto do mundo. Portanto, também vale a pena esperar pelos recursos visuais, que podem melhorar ainda mais a faixa de capacidade e o limite de uso do modelo grande DeepSeek V4.