Rastreamento facial

 

Rastreamento facial é um ramo da visão computacional, que envolve a execução de cálculos em dados de imagem facial. Este tipo de software desempenha um papel distinto no futuro das aplicações de AR e VR e irá influenciar o futuro do e-Commerce, segurança, vídeo game e indústrias de comunicações.

Pesquisas tem visto um sucesso considerável na evolução com nosso próprios algoritmos de rastreamento facial. Nosso software suporta rastreamento facial característica com sensores RGB, bem como configurações de sensor de profundidade futuro, conhecidas como RGB-D. A inclusão de dados de profundidade é um desenvolvimento importante no rastreamento facial, como permite robustas 3 reconstruções tridimensionais de rostos humanos, bem como a oclusão. Oclusão permite que conteúdo tais como chapéus, óculos e jóias para ser processado corretamente atrás ou ao redor da face quando um usuário vira sua cabeça. Isto dá aos consumidores uma experiência convincente e realista para amostragem em uma variedade de produtos de desgastadas.

Aumentos do ideais para o rosto humano devem mudar e se adaptar em conformidade com as variações na expressão facial de um usuário. Isto é necessário quando o rastreamento facial é usado para jogos, em filme ou mesmo avaliação do produto na indústria de cosméticos. Tecnologia do IT pesquisas aborda esse requisito com suporte para rastreamento facial característica, disponível em hardware móvel atual geração.

A capacidade de criar 3D, reconstruções de alta fidelidade de rostos humanos abrirá novas portas para mais visceral comunicação de longa distância, melhoria de pré-visualização de produto, aumento de imersão para vídeo-games, medidas de segurança reforçadas, bem como outras áreas de aplicação.

Próxima sensores de geração

 

A evolução da visão de computador é depende do avanço do hardware sensorial. Historicamente, o uso de módulo da câmera de um dispositivo inteligente tem sido o principal foco da visão de computador móvel; no entanto, diferentes tipos de sensores permitem interações e experiências mais sofisticadas. Com esses objetivos em mente, pesquisas tem integrado 'Térmica Touch' em seu portfólio de tecnologias – um sistema que pode identificar os objetos que tocamos através de sentindo o calor neles por nossos dedos. Os usuários podem manipular conteúdo virtual em uma cena através de interação física com o mundo real, criando uma interface única entre os dois.

Outra tecnologia emergente que está causando um impacto em visão computacional é sensores de profundidade, ou configurações de "RGB-D". Profundidade de detecção diretamente resolve o problema de determinar o objeto de distâncias dentro de uma cena e pode ser integrado com informação visual existente para gerar precisão e escala-corrigir reconstruções de ambientes em tempo real. Isto tem usos muito tangíveis para montagem de equipamentos de pré-visualização, produto, juntamente com o gesto e rastreamento facial. Além disso, os sensores RGB-D permitem oclusão de conteúdo virtual atrás de objetos reais que estão mais perto do telespectador, uma conquista importante que faz AR de praticamente todas as experiências mais realistas e integrado em ambientes reais.

Estimativa de iluminação

 

A fim de atingir níveis convincentes de realismo com experiências de realidade aumentada, é crucial imitar as condições de iluminação do ambiente em que reside o conteúdo. Como seres humanos, estamos cientes de objetos que não se comportam corretamente com relação à iluminação e esses objetos são imediatamente percebidos como antinatural. As sombras de objetos virtuais devem projetar-se na mesma direção como as sombras de objetos reais nas suas imediações e assim, da mesma forma, para luz refletida.

Tecnologia de iluminação coerente do IT pesquisas pode estimar as condições de iluminação de uma cena em tempo real e por sua vez, traduzir essas condições para objetos virtuais dentro da cena. O resultado é uma experiência de realidade aumentada, na qual o conteúdo virtual parece natural, com condições de iluminação consistentes com a dos arredores. Tecnologia de iluminação dinâmica de pesquisas opera em tempo real para refletir a mudança das condições de iluminação de um ambiente de mundo real.

SLAM

 

Um requisito importante na aplicação de visão computacional envolve ser capaz de observar e entender a ambientes desconhecidos. Isso se torna especialmente importante quando se quer aumentar a informação dentro de um ambiente que é completamente novo. Simultânea de localização e mapeamento (SLAM) é uma técnica que permite que um dispositivo para localizar-se em um ambiente desconhecido, enquanto ao mesmo tempo criando um mapa de referência do local.

Em pesquisas desenvolvemos nossas próprias versões do SLAM, que são

precisão – mesmo com dispositivos móveis padrão. IT pesquisas SLAM permite que conteúdo aumentando dentro de ambientes desconhecidos, ou o que é conhecido como "3D markerless tracking". Com SLAM ambientes ou objetos podem ser reconstruídos uma vez, em seguida, guardado para mais tarde ser usado em várias aplicações como desejado. Isto tem vantagens exclusivas quando desafiados com a criação de experiências de realidade aumentada para ambientes internos, quando outras configurações de rastreamento não são suficientes para a extração do recurso.

Busca visual

 

Tecnologia de busca Visual contínua do IT pesquisas maciçamente escalas de reconhecimento de imagem processos usando servidores de nuvem poderosa de pesquisas, possibilitando grande escala de aplicações de realidade aumentada.

Bancos de dados de milhões de imagens podem ser verificados rapidamente uma correspondência com uma imagem enviada do lado do cliente. O resultado é uma solução de busca visual que permite aumentar de itens em nosso entorno em grande escala: na embalagem do produto, manuais técnicos, a arte-final. Esta tecnologia também serve como uma solução de gerenciamento de dados, descarregamento de imagem combinando dados e conteúdo do dispositivo e para a nuvem. Isto contribui para a melhor vida da bateria e uma carga de trabalho mais leve para a CPU.

Tracking de objeto 3D

 

Pesquisas lidera a indústria em tecnologia de rastreamento de objeto 3D. Através de uma combinação de recurso rastreamento, odometria visual e rastreamento baseado na borda, nossa tecnologia é capaz de controlar e aumentar os objetos do mundo real, em vez de configurações de marcador 2D simplista.

Rastreamento de objeto 3D abre novas oportunidades em realidade aumentada: componentes de máquinas podem ser anotados com informações digitais, bens de consumo pode ser aumentados com informações adicionais do produto ou promoções e entretenimento digital pode ser misturado naturalmente ao mundo real.

Pesquisas tem mais recentemente integrados tanto baseado em recursos rastreamento e monitoramento baseado na borda um sistema altamente robusto, conhecido como rastreamento híbrido. Esta configuração proporciona ainda maior precisão e robustez, combinando a força de ambas as abordagens.

Análise social e multimídia


Conteúdo multimídia está sendo produzido e compartilhado através da Internet a um ritmo sem precedentes. Por exemplo, mais de 1 milhão de imagens são compartilhadas diariamente e 100 milhões de horas de vídeo são compartilhados a cada ano. Com essa investida de dados, a capacidade de entender automaticamente o conteúdo de imagens e vídeos é fundamental para permitir aplicações tais como a recuperação baseada em conteúdo similar item de pesquisa, pesquisa de conteúdo Personalizada, proteção de privacidade e modelagem do fluxo de conteúdo multimídia em redes sociais. Tais capacidades podem fornecer soluções custo-eficiente para a coleta de informações sobre o conteúdo viral (por exemplo, memes), comentários dos clientes sobre novos produtos e eventos de geo-política ou militares ao redor do mundo, que anteriormente não foi possível sem grupos de pesquisa e inteligência dedicados.

Pesquisas está a desenvolver um conjunto de ferramentas de análise de multimídia em larga escala que concentrar-se na compreensão de conteúdo visual, pesquisa baseada em conteúdo, proteção de privacidade on-line e modelagem de rede. Estas ferramentas de software a incorporar as últimas técnicas de estado-da-arte em análise para detectar objetos, cenas, atividades, texto em cena e sinais de áudio de multimídia incorporados em irrestrita de imagens e vídeos. Estas técnicas são usadas em conjunto para analisar e detectar padrões de interesse em dados. O desenvolvimento de um conselheiro de privacidade, que alerta os usuários quando imagens com material potencialmente sensíveis à privacidade são sobre a inadvertidamente ser compartilhado na web é um exemplo de um em andamento projetos de pesquisas. Nossas ferramentas demonstraram alta precisão em dados em grande escala, o mundo real e podem ser adaptadas para domínios de aplicativos diversos. Além disso, pesquisas IT têm integrado a ferramentas avançadas de visualização e interação que permitem uma experiência de pesquisa integrada em navegadores da web e melhorar a precisão da busca pela incorporação de feedback de relevância dos usuários.



Arquitetura de sistema para pesquisa de grandes arquivos multimídia através da extração de recursos visuais e sonoros. Resultados da pesquisa são refinados
através do feedback do usuário iterativo.
 

Resultados de busca refinada para "flash mob".
 

Resultados de pesquisa com base em estilos visualmente semelhantes.

Reconhecimento de atividade e análise do comportamento


Pesquisas IT possui expertise no desenvolvimento de soluções para identificar atividades e compreender comportamentos baseados na interação de pessoas e veículos com o meio ambiente. O conceito subjacente é reconhecer padrões de comportamento baseados em estáticos e dinâmicos descritores probatório contidos dentro o vídeo como localização, objetos e atividades sendo executadas. Nossas soluções são com base em representações matemáticas, poderosas e demonstradas em diversos e desafiadores cenários do mundo real tais como vídeos de vigilância e futebol de rua.

Esses recursos, além de avanços para o atual estado-of-the-art em reconhecimento de vídeo, são necessários para superar um desafio-chave na compreensão do vídeo: o reconhecimento de qualquer evento e o objeto em um ilimitado número de estilos, qualidades e cenas.

 


Reconstrução 3D de vídeo


Vídeo sensores de área ampla podem gerar vários gigabytes de dados brutos a um segundo e centenas de terabytes sobre uma missão, criando uma necessidade de métodos eficientes de comprimir esses dados para downlink e arquivamento. Existem técnicas de compressão padrão disponíveis, mas nenhum que utilizam o fato de que o mundo é estático em 3D. Com este conceito, pesquisas IT está desenvolvendo técnicas para aumentar significativamente a compressão de vídeo wide area usando modelos 3D.

Para compactar o vídeo de tal maneira, o passo inicial é separar o primeiro plano e plano de fundo e distinguir os elementos dinâmicos da cena. Para determinar quais elementos dinâmicos precisam ser representado, é fundamental considerar o curto, longo e muito longo prazo mudanças que afetarão a cena. Determinando quais elementos devem ser representados, o foco pode ser em substituir o fundo com um modelo 3D para ativar a compactação. Este modelo 3D contém aparência dependente do tempo dados, necessários para compreender plenamente a cena e ponto de vista. Através deste tipo de compressão, há um significativo ganho armazenamento e eficiência, necessário para os cada vez mais grandes conjuntos de dados a ser ingeridos.

 

Vídeo baseado em conteúdo e recuperação de imagens


Pesquisas desenvolveu recursos significativos na recuperação de imagens baseada em conteúdo de múltiplos programas DARPA e AFRL. Podemos ingerir, pré-processo, estabilizar um feed de vídeo de entrada e identificar e caracterizar objetos em movimento, tanto a desmontagem e a veículos. Descritores de vídeo mais complexos, tais como descritores de movimento (incluindo movimento cinemático, deformável e articulado), os descritores de aparência (incluindo a cor e forma) e descritores de comportamento (como correr, carregar, veículo u-turn e muitos outros) caracterizar mais profundo conteúdo semântico.

Esta análise semântica permite ao vivo alertando para o pessoal de operações especiais e pode dar o sinal inesperada ou suspeita de atividade em um fluxo de vídeo, que pode ser fundamental para o sucesso da missão. Além disso, avançados forenses recursos permitem retroativo de recuperação das atividades de interesse de grandes conjuntos de dados.

IT pesquisas já começou a colocar suas capacidades de análise de imagem e vídeo em Forge.mil como parte da imagem de pesquisas do IT e a exploração e recuperação Toolkit (KWIVER), com direitos ilimitados para o governo. Os recursos na forja. mil atualmente incluem o código fonte completo por isso WAMI em tempo real de pesquisas sistema de rastreamento. Planeamos adicionar os recursos em KWIVER e esperamos construir uma comunidade de desenvolvimento duradouro do governo e colaboradores comerciais.


Resultados da pesquisa de amostra para consulta "Mostrar todas as pessoas que estão carregando."

Análise de vídeo Wide area


Pesquisas está desenvolvendo um sistema de software capaz de automaticamente e interativamente descobrir inteligência acionável de imagens de movimento de área ampla (WAMI) de ambientes complexos de urbanos, suburbanos e rurais. Dentro WAMI, os elementos de informação primária estão se movendo entidades no contexto de estradas, edifícios e outros recursos de cena. Essas entidades, enquanto explorável, freqüentemente gerar faixas fragmentadas em ambientes urbanos complexos devido a oclusões, paradas e outros fatores. Sistema de software do IT pesquisas usa soluções algorítmicas para associar faixas e, em seguida, identificar e integrar os eventos locais para detectar ameaças potenciais e realizar a análise forense.

Este sistema de software significativamente aumenta a capacidade de um usuário final para descobrir inteligência romance usando modelos de atividades, normalidade e contexto. Uma vez que a grande maioria dos eventos é normal e não uma ameaça, os modelos devem Cruz integrar eventos singulares para descobrir relações e anomalias que são indicativos de comportamento suspeito ou com previamente aprendidas - ou definidas - ameaça atividade.

O avançado sistema melhora a capacidade do analista para manipular dados WAMI florescente e reduz o tempo necessário para realizar muitas tarefas de exploração atual, aumentando muito a capacidade de analisar e utilizar os dados para análise forense.

 


 

Compreensão de cena


Compreensão da cena no vídeo é um problema emergente para vigilância visual e o problema de compreensão de vídeo. Pesquisas está trabalhando para criar soluções nesta área, incluindo o reconhecimento de objetos funcionais. Reconhecimento de objetos funcionais é a capacidade de definir objetos com finalidades específicas, tais como um carteiro e entrega caminhão que são definidos mais por suas ações e comportamentos do que pela aparência. Estamos a desenvolver uma abordagem para a aprendizagem baseada em conteúdo e reconhecimento da função de dado faixas de vídeo-derivado de objetos em movimento. Em particular, nós determinamos que comportamentos semânticos dos motores podem ser capturados de forma independente da localização, atribuindo-lhes com características que codificam suas relações e ações com relação a contextos de cena, que são regiões de cena local com diferentes funcionalidades tais como portas e lugares de estacionamento que objetos em movimento, muitas vezes, interagir com. Baseado sobre essas representações, modelos funcionais são aprendidos de exemplos e romance instâncias são identificadas de dados invisíveis depois.

 

Rastreamento e detecção de movimento


Pesquisas IT está desenvolvendo ferramentas que concentram-se na detecção de objetos em movimento e arquivados e streaming de vídeo a segui-los. Os elementos de informação primária em tais dados de vídeo estão se movendo entidades no contexto de estradas, edifícios e outros recursos de cena. Essas entidades freqüentemente gerar faixas fragmentadas em ambientes urbanos complexos devido a oclusões, paradas e outros fatores. IT pesquisas é desenvolver soluções algorítmicas para associar faixas e, em seguida, identificar e integrar os eventos locais para detectar ameaças potenciais e realizar a análise forense.

Os algoritmos desenvolvidos contribuem para um sistema de software que aumenta drasticamente a capacidade de um usuário final para descobrir inteligência romance usando modelos de atividades, normalidade e contexto. Como a grande maioria dos eventos é normal e não uma ameaça, os modelos Cruz-integram eventos singulares para descobrir relações e anomalias que são indicativas de comportamento suspeito ou correspondência anteriormente aprendidas ou definido atividade ameaça.

 

 

Nossos parceiros

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Entre em contato conosco!

Boletim informativo

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us