Ansikts Tracking

 

Ansikts Tracking er en gren av Computer visjon som innebærer kjører beregninger på ansikts bildedata. Denne typen programvare spiller en bestemt rolle i fremtiden av AR og VR programmer og vil påvirke fremtiden for e-handel, sikkerhet, videospill og forbindelser industrier.

IT forskere har sett stor suksess i utviklingen med våre egne facial tracking-algoritmer. Vår programvare støtter ansikts funksjonen sporing med RGB sensorer som fremtidige dybden sensor konfigurasjoner, kjent som RGB-D. Inkludering av dybde er en viktig utvikling i ansikts tracking, som gjør at robust 3 dimensjonale rekonstruksjoner av menneskelige ansikter samt okklusjon. Okklusjon kan innholdet som hatter, briller og smykker til gjengis riktig bak eller rundt ansiktet når brukeren slår hodet. Dette gir forbrukeren en overbevisende og realistisk opplevelse for prøvetaking på en rekke hodet slitt produkter.

Ideell augmentations for menneskelig ansikt bør endre og tilpasse seg i samsvar med variasjoner i en brukers ansiktsuttrykk. Dette er nødvendig når ansikts tracking brukes for spill, film eller selv produktevaluering i kosmetikkindustrien. IT undersøkelser teknologi løser dette kravet med støtte for ansikts funksjonen sporing, tilgjengelig på dagens generasjon mobile maskinvare.

Muligheten til å lage 3D, Hi-Fi rekonstruksjoner av menneskelige ansikter vil åpne nye dører for mer visceral langdistanse kommunikasjon, forbedring av produktet pre-visualisering, økt nedsenkning til video-spill, styrket sikkerhetstiltak, samt andre bruksområder.

Neste generasjon sensorer

 

Utviklingen av datamaskinen visjon er betinget av fremme av sensoriske maskinvare. Historisk har bruk av en smart enhet Kameramodul vært Hovedfokuset for mobil datamaskin visjon; Imidlertid, ulike typer sensorer stand mer sofistikert erfaringer og interaksjoner. Med disse målene i sinnet, IT undersøkelser har integrert "Termisk Touch" i sin portefølje av teknologi-system som kan identifisere objektene vi touch gjennom sensing varmen igjen på dem av fingrene. Brukere kan manipulere virtuelle innhold i en scene gjennom fysisk interaksjon med den virkelige verden, å skape et unikt grensesnitt mellom to.

En annen ny teknologi som gjør en innvirkning i datamaskinen visjon er dybde sensorer, eller "RGB-D" konfigurasjoner. Dybde sensing direkte løser problemet med å bestemme avstander objektet i en scene, og kan integreres med eksisterende visuell informasjon til å generere nøyaktig og skala-korrekt rekonstruksjoner av miljøer i sanntid. Dette har veldig konkret bruker for produktet pre-visualisering, utstyr montering, gest og ansikts tracking. I tillegg RGB-D sensorer aktiverer okklusjon av virtuelle innhold bak virkelige objekter som er fremviseren, et viktig resultat som gjør nesten alle AR opplevelser mer realistisk og integrert i ekte miljøer.

Belysning estimering

 

For å oppnå overbevisende nivåer av realisme med Augmented Reality erfaringer, er det avgjørende å etterligne belysningen av miljøet der innholdet ligger. Som mennesker, vi er svært oppmerksom på objekter som ikke fungerer riktig med hensyn til belysning og objektene oppfattes umiddelbart som unaturlig. Skyggene av virtuelle objekter skal prosjektet i samme retning som skygger av virkelige objekter i sin nærhet, og tilsvarende så for reflektert lys.

IT undersøkelser sammenhengende lysteknologi kan beregne belysningen av en scene i sanntid og igjen vil oversette disse forholdene på virtuelle objekter i scenen. Resultatet er en Augmented Reality opplevelse der virtuelle innholdet vises naturlig, lysforhold konsekvent med det omgivelsene. IT undersøkelser dynamisk belysning teknologi opererer i sanntid å reflektere skiftende lysforhold av virkelige verden miljø.

SLAM

 

Et viktig krav i datamaskinen visjon programmet innebærer å observere og forstå ukjent terreng. Dette blir spesielt viktig når man ønsker å supplere informasjonen i et miljø som er helt nytt. Samtidig lokalisering og kartlegging (SLAM) er en teknikk som gjør at en enhet å lokalisere seg i et ukjent miljø, samtidig som du oppretter en referanse kart de omgivelsene.

På IT undersøkelser har vi utviklet egne versjoner av SLAM som er

nøyaktighet-selv med standard mobile enheter. IT undersøkelser SLAM kan forsterke innhold i ukjent terreng, eller det som kalles "3D markerless oppsporer". Med SLAM kan miljøer eller objekter bli rekonstruert én gang, deretter lagret for senere bruk i så mange programmer som ønsket. Dette har unike fordeler da utfordret å utvidet virkelighet opplevelser for innendørs miljøer, når andre sporing konfigurasjoner ikke er tilstrekkelig for egenskapsuttrekking.

Visuelt søk

 

IT undersøkelser kontinuerlig visuell søketeknologi skalerer massivt bildet anerkjennelse prosesser bruker det forskeres kraftige cloud-servere, slik at stor skala Augmented Reality-programmer.

Databaser av millioner av bilder kan kontrolleres raskt for en match med en bilde sendt fra klienten. Resultatet er en visuell søkeløsning som gir forsterke elementer i våre omgivelser i stor skala: fra produktpakken, til tekniske manualer, kunstverk. Denne teknologien fungerer også som en dataadministrasjon løsning, avlaste bildet data og innhold fra enheten og til skyen. Dette bidrar til bedre batterilevetid og en lettere arbeidsbelastningen for CPU.

3D-objekt sporing

 

IT undersøkelser fører industrien i 3D-objektet tracking-teknologi. Gjennom en kombinasjon av funksjonen sporing, visuell odometry og kant-baserte sporing er vår teknologi tilbake og øke objekter, i stedet for enkle 2D markør konfigurasjoner.

3D-objekt sporing åpner nye muligheter i Augmented Reality: maskiner komponenter kan være merket med digital informasjon forbruksvarer kan utvides med mer produktinformasjon eller kampanjer og digital underholdning kan blandes naturlig i den virkelige verden.

IT forskere har nylig integrert både funksjonen-basert sporing og kant-baserte sporing i en svært robust system kjent som hybrid sporing. Denne konfigurasjonen gir enda høyere nøyaktighet og robusthet ved å kombinere styrken av begge tilnærminger.

Multimedia samfunnsanalyse


Multimedieinnhold blir produsert og delt via Internett til en enestående pris. For eksempel mer enn en million bilder deles hver dag og 100 millioner timer video deles hvert år. Med denne onslaught av data er muligheten til å automatisk forstå innholdet i bilder og videoer avgjørende for å aktivere applikasjoner som innholdsbaserte henting, lignende elementet søk, personlig innhold søk, personvern, og modellering flyten av multimedia innhold på sosiale nettverk. Slike evner kan gi kostnadseffektive løsninger for innsamling av informasjon om viral innhold (f.eks memes), tilbakemeldinger om nye produkter og geo-politiske eller militære arrangementer over hele verden, som ikke tidligere har vært mulig uten dedikert forskning og intelligens grupper.

IT forskere utvikler en rekke store multimedia analyseverktøy som fokus på visuelt innhold forståelse, innhold søk, online personvern og nettverk modellering. Disse analysevareverktøy innlemme de nyeste state-of-the-art teknikkene i multimedia analyse av objekter, scener, aktiviteter, i scenen tekst og lydsignaler innebygd i ubegrenset bilder og videoer. Disse teknikkene brukes i fellesskap å analysere og oppdage mønstre av interesse i dataene. Utviklingen av en privat rådgiver, som varsler brukerne når bilder med potensielt personvern-følsom materiale er om å bli utilsiktet delt på nettet er et eksempel på en av Undersøkelsenes pågående prosjekter. Våre verktøy har vist høy nøyaktighet på store, reelle data, og kan tilpasses til diverse programdomener. I tillegg IT forskning verktøy har integrert avansert visualisering og samhandling som tillater en sømløs søkeopplevelse på nettlesere og forbedre nøyaktigheten av søk ved å innlemme brukernes relevans tilbakemeldinger.



Systemarkitektur for søk av stor multimedia arkiver via utvinning av visuelle og lyd funksjoner. Søkeresultatene er raffinert
gjennom iterativ tilbakemeldinger.
 

Raffinert søkeresultater for "flash mob."
 

Søkeresultater basert på visuelt lignende stiler.

Aktivitet anerkjennelse og atferdsanalyse


IT undersøkelser har kompetanse i å utvikle løsninger for å identifisere aktiviteter og forstå basert på samspillet av folk og kjøretøy med miljøet. Underliggende konseptet er å gjenkjenne atferdsmønstre basert på statiske og dynamiske evidentiell beskrivelsene i videoen som plassering, objekter og aktiviteter utføres. Våre løsninger er basert på kraftige, matematiske representasjoner og vist i varierte og utfordrende virkelige verden scenarier som gaten overvåking og fotball videoer.

Disse funksjonene, i tillegg til automatisk til den gjeldende state-of-the-art i video anerkjennelse, er nødvendig å overvinne en viktig utfordring i video forståelse: anerkjennelse av noen hendelse og objekt i et ubegrenset antall stiler, kvaliteter og scener.

 


3D rekonstruksjon fra Video


WAN video sensorer kan generere flere gigabyte videoen litt og hundrevis av terabyte over et oppdrag, skaper et behov for effektive metoder for å komprimere dataene for nedlastingshastighet og arkiv. Det finnes standard komprimeringsteknikker, men ingen som utnytter det faktum at verden er statisk i 3D. Dette konseptet har IT forskere utvikler teknikker for å betydelig øke komprimeringen av WAN-video med 3D-modeller.

For å omslag videoen på en slik måte, er det første trinnet å skille forgrunnen og bakgrunnen og skille dynamisk scenen elementer. Bestemme hvilke dynamiske elementer må være representert, er det avgjørende å vurdere kort-, lang og meget langsiktige endringer som vil påvirke scenen. Ved å bestemme hvilke elementer må være representert, kan fokus på å erstatte bakgrunnen med en 3D-modell aktivere komprimering. Denne 3D-modellen inneholder synspunkt og tidsavhengige utseende data som er nødvendig for å fullt ut forstå scenen. Gjennom denne typen komprimering er det en betydelig gevinst lagring og effektivitet, nødvendig for stadig større datasett blir ingested.

 

Innhold-basert Video og bilde henting


IT forskere har utviklet betydelige evner i innhold-basert image henting fra flere DARPA og AFRL. Vi ingest, skal ikke stabilisere en innkommende video feed og identifisere og karakterisere flytte objekter, både demonteringer og kjøretøy. Mer komplekse video beskrivelser, som bevegelse beskrivelser (inkludert Kinematisk deformerbare og artikulert bevegelse), utseende beskrivelser (inkludert farge og form) og atferd beskrivelser (som kjører, bærer, kjøretøy u-sving, og mange andre) karakterisere dypere semantiske innhold.

Semantiske analysen gjør live varsler spesielle ops personell og kan stikkordet uventet eller mistenkelig aktivitet i en videodatastrøm, som kan være avgjørende for oppdraget suksess. Videre, avanserte rettsmedisinske evnene kan tilbakevirkende henting av aktiviteter av interesse fra store datasett.

IT forskning har begynt å sette sine bilde og video analyse evner på Forge.mil som en del av IT undersøkelser bilde og Video utnyttelse og henting Toolkit (KWIVER), med ubegrensede rettigheter til regjeringen. Funksjonene på Forge. mil for øyeblikket inkluderer hele kildekoden for forsknings sanntid WAMI sporingssystem. Vi planlegger å legge til egenskapene i KWIVER og håper å bygge en varig utviklingen samfunnet fra regjeringen og kommersielle samarbeidspartnere.


Eksempel søkeresultater for spørringen "Vis alle personer som bærer."

WAN-Video analyse


IT forskere utvikler et programvare-system i stand til å automatisk og interaktivt oppdage praktisk intelligens fra WAN motion bilder (WAMI) av komplekse urban, forstadsområder og landlige omgivelser. I WAMI går primærinformasjonen elementene enheter i sammenheng med veier, bygninger og andre scenen funksjoner. Disse enhetene, gi mens utnyttes, ofte fragmentert spor i komplekse urbane miljøer occlusions, stopper og andre faktorer. IT forskning programvaresystemet bruker algoritmisk løsninger å knytte spor og identifisere og integrere lokale arrangementer å merker muligheter trusseler og utfør rettsmedisinske analyser.

Denne programvaresystem betydelig forsterker en sluttbrukers evne til å oppdage romanen intelligens bruker modeller av aktiviteter, normalitet og sammenheng. Siden de aller fleste av hendelser er normalt og utgjør ingen trussel, må modeller cross-integrere entall hendelser for å utforske relasjoner og uregelmessigheter som indikerer mistenkelig atferd eller samsvarer med tidligere lært - eller definert - trussel aktivitet.

Avanserte systemet forbedrer analytiker evne til å håndtere voksende WAMI data og reduserer tiden det tar å utføre mange gjeldende utnyttelse oppgaver, kraftig forbedre evnen til å analysere og bruke dataene for rettsmedisinske analyser.

 


 

Scenen forståelse


Scenen forståelse i videoen er et voksende problem for visuell overvåking og video forståelse problemet. IT forskere arbeider med å lage løsninger på dette området, inkludert funksjonelle objektet anerkjennelse. Funksjonelle objekter anerkjennelse er muligheten til å definere objekter med bestemte formål som en stolpe og levering lastebil som er definert mer av sine handlinger og atferd enn av utseende. Vi utvikler en tilnærming for innhold-basert læring og anerkjennelse av funksjonen av bevegelige objekter gitt video-avledet spor. Spesielt har vi bestemt at semantisk atferd av movers kan hentes på en måte som location-uavhengige av tilskrive dem med funksjoner som kodes deres relasjoner og handlinger med hensyn til scenen sammenhenger, som lokale scenen regioner med ulike funksjonaliteter som døråpninger og parkeringsplasser som objekter som beveger seg ofte kommuniserer med. Basert på disse faktaopplysningene, funksjonelle modeller er lært fra eksempler og romanen tilfeller identifiseres fra usett data etterpå.

 

Bevegelsespåvisning og sporing


IT forskere utvikler verktøy som fokuserer på oppdage flytte objekter og spore dem i arkiverte og streaming video. Primærinformasjonen elementene i slike videodata flytter enheter i sammenheng med veier, bygninger og andre scenen funksjoner. Disse enhetene gi ofte fragmentert spor i komplekse urbane miljøer occlusions, stopper og andre faktorer. IT forskere utvikler algoritmisk løsninger å knytte spor og identifisere og integrere lokale arrangementer å merker muligheter trusseler og utfør rettsmedisinske analyser.

Utviklet algoritmer bidra til et programvaresystem som drastisk forsterker en sluttbrukers evne til å oppdage romanen intelligens bruker modeller av aktiviteter, normalitet og sammenheng. De aller fleste av hendelser er normalt og utgjør ingen trussel, modellene tvers integrere entall hendelser for å utforske relasjoner og uregelmessigheter som mistenkelig oppførsel eller kamp tidligere lært eller definert trussel aktivitet.

 

 

Våre partnere

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Ta kontakt med oss!

Nyhetsbrev

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us