América Latina. A Fujitsu desenvolveu uma tecnologia de reconhecimento de expressão facial alimentada por IA que detecta mudanças sutis na expressão facial com um alto grau de precisão. A nova tecnologia foi desenvolvida em colaboração com a Escola de Ciência da Computação da Universidade Carnegie Mellon (UE).
Um dos obstáculos à tecnologia de reconhecimento de expressão facial é a dificuldade de fornecer grandes quantidades de dados necessários para treinar modelos de detecção para cada pose facial, pois os rostos geralmente são capturados com uma grande variedade de poses em aplicações do mundo real. Para resolver o problema, a Fujitsu desenvolveu uma tecnologia para adaptar diferentes processos de normalização para cada imagem facial.
Por exemplo, quando o ângulo do rosto do sujeito é oblíquo, a tecnologia pode ajustar a imagem para se parecer mais com a imagem frontal do rosto, permitindo que o modelo de detecção seja treinado com uma quantidade relativamente pequena de dados. A tecnologia pode detectar com precisão mudanças emocionais sutis, incluindo risos desconfortáveis ou nervosos, confusão, etc., e também quando o rosto do sujeito se move em um contexto real.
A Fujitsu prevê que a nova tecnologia será usada em uma variedade de aplicações do mundo real, incluindo facilitar a comunicação para melhorar o engajamento dos funcionários e também para otimizar a segurança para motoristas e trabalhadores em uma fábrica.
Para "ler" as emoções humanas de forma mais eficaz, é fundamental capturar as mudanças faciais sutis associadas às emoções, como compreensão, perplexidade e estresse. Para isso, os desenvolvedores têm confiado cada vez mais nas Unidades de Ação (UA), que expressam as "unidades" de movimento correspondentes a cada músculo da face com base em um sistema de classificação anatômica. Por exemplo, a UA tem sido utilizada por profissionais de áreas tão variadas quanto pesquisa psicológica e animação.
A UA é classificada em cerca de 30 tipos com base nos movimentos de cada músculo facial, incluindo os das sobrancelhas e bochechas. Ao integrar esses UA em sua tecnologia, a Fujitsu foi pioneira em uma nova abordagem para descobrir até mesmo mudanças sutis na expressão facial. Para detectar a UA com mais precisão, as técnicas de aprendizagem profunda subjacentes requerem grandes quantidades de dados. No entanto, em situações do mundo real, as câmeras normalmente capturam rostos em vários ângulos, tamanhos e posições, dificultando a preparação de dados de aprendizagem em larga escala correspondentes a cada estado visual/espacial. Portanto, as imagens capturadas pela câmera afetam negativamente a precisão da detecção.
Tecnologias desenvolvidas
Em colaboração com a Escola de Ciência da Computação da Universidade Carnegie Mellon, a Fujitsu Laboratories, Ltd. e a Fujitsu Laboratories of America Inc. desenvolveram uma tecnologia de reconhecimento de expressão facial baseada em IA que pode detectar UA com alta precisão, mesmo com dados de treinamento limitados.
1. Processo de normalização para ajustar o rosto para melhor semelhança da imagem frontal
2. Análise de regiões significativas que afetam a detecção de UA para cada UA.
Para enfrentar esse problema, são analisadas as áreas que têm influência significativa na detecção da UA da imagem facial capturada e o grau de rotação, ampliação e redução são ajustados, nesse ponto. Usando diferentes processos de padronização para cada UA individual, a tecnologia desenvolvida pode detectar a UA com mais precisão.
Resultados
Esta tecnologia alcançou uma alta taxa de precisão de detecção de 81%, mesmo com dados limitados de treinamento. Essa tecnologia também é mais precisa do que outras existentes, de acordo com a conclusão de vários benchmarks da tecnologia de reconhecimento de expressão facial (Reconhecimento e Análise de Expressão Facial 2017).