Facial Tracking

 

Facial Tracking er en gren af Computer Vision, som indebærer kører beregninger på ansigtet billeddata. Denne type software spiller en klar rolle i fremtiden af AR og VR-applikationer og vil påvirke fremtiden for e-handel, sikkerhed, videospil og kommunikationsindustrien.

IT forsker har set stor succes i udvikling med vores egne ansigtstræk tracking algoritmer. Vores software understøtter facial funktionen sporing med RGB-sensorer samt fremtidige dybde sensor konfigurationer, kendt som RGB-D. Optagelse af dybdedata er en vigtig udvikling i ansigtet tracking, da det giver robust 3 dimensionelle rekonstruktioner af menneskelige ansigter samt okklusion. Okklusion tillader indhold såsom hatte, briller og smykker skal gengives korrekt bag eller omkring ansigtet når en bruger slår hovedet. Dette giver forbrugerne en overbevisende og realistiske oplevelse for prøvetagning på en lang række hoved slidte produkter.

Ideel forstærkningssystemer for menneskelige ansigt bør ændre og tilpasse efter variationer i en brugers ansigtsudtryk. Dette er nødvendigt, når ansigtet tracking bruges til gaming, i filmen eller endda produktevaluering i kosmetikindustrien. IT forsker teknologi løser dette krav med understøttelse af facial funktionen sporing, tilgængelig på nuværende generation mobile hardware.

Evnen til at skabe 3D, high fidelity rekonstruktioner af menneskelige ansigter vil åbne nye døre til flere visceral langdistance kommunikation, forbedring af produkt pre-visualisering, øget fordybelse for video-spil samt styrket sikkerhedsforanstaltninger og andre anvendelsesområderne.

Næste Generation sensorer

 

Udviklingen af Computer Vision er betinget af fremme af sensoriske hardware. Historisk set, har brug af et smart enhedens kameramodul været fokuseret på mobile Computer vision; Men, forskellige typer af sensorer aktiverer mere sofistikerede erfaringer og interaktioner. Med disse mål for øje, IT forsker har integreret "Termisk Touch" i deres portefølje af teknologier – et system, der kan identificere objekter rører vi gennem sensing varmen tilbage på dem af vores fingre. Brugere kan manipulere virtuelle indhold i en scene gennem fysiske interaktion med den virkelige verden, skaber en enestående grænseflade mellem to.

En anden ny teknologi, der gør en indvirkning på Computer Vision er dybde sensorer, eller "RGB-D" konfigurationer. Dybde sensing direkte løser problemet med bestemmelse af objektet afstande inden for en scene, og kan integreres med eksisterende visuel information til at generere nøjagtige og skala-korrekte rekonstruktioner af miljøer i realtid. Det har meget konkrete anvendelser for produktet pre-visualisering, udstyr montering, gestus og facial tracking. Derudover RGB-D sensorer aktiverer okklusion af virtuelle indhold bag virkelige objekter, der er tættere på seeren, et vigtigt resultat, der gør stort set alle AR oplevelser mere realistisk og integreret i virkelige omgivelser.

Belysning beregning

 

For at opnå en overbevisende grad af realisme med Augmented Reality oplevelser, er det afgørende at efterligne lysforholdene i det miljø, hvor indholdet er placeret. Som mennesker, vi er meget bevidst om objekter, der ikke opfører sig korrekt med hensyn til belysning og disse objekter er umiddelbart opfattes som unaturlige. Skyggen af virtuelle genstande bør projekt i samme retning som skyggerne af virkelige objekter i deres nærhed, og ligeledes så for reflekteret lys.

IT forsker sammenhængende belysningsteknologi kan estimere lysforholdene i en scene i realtid og igen oversætte disse betingelser på virtuelle objekter i scenen. Resultatet er en Augmented Reality oplevelse hvor den virtuelle indhold vises naturlige, med lysforhold overens med omgivelserne. IT forsker dynamisk belysning teknologi fungerer i realtid at afspejle skiftende lysforhold i en real-verden miljø.

SLAM

 

Et vigtigt krav i Computer Vision anvendelse indebærer, at kunne observere og forstå ukendte miljøer. Dette bliver især vigtigt, når man ønsker at forøge oplysninger inden for et miljø, der er helt nye. Simultan lokalisering og kortlægning (SLAM) er en teknik, der tillader en enhed til at lokalisere sig i en ukendt miljø, samtidig med at den skaber en reference kort i disse omgivelser.

På IT forsker har vi udviklet vores egen versioner af SLAM, som er

nøjagtighed-selv med standard mobile enheder. IT forsker SMÆKKE muliggør forbedringen indhold i ukendte miljøer, eller hvad er kendt som "3D markerless tracking". Med SLAM kan miljøer eller objekter rekonstrueres én gang, derefter gemmes til senere brug i så mange applikationer som ønsket. Det har unikke fordele når udfordret med at skabe augmented reality oplevelser for indendørs miljøer, når andre tracking konfigurationer ikke er tilstrækkelige til funktionen udvinding.

Visuelle søgninger

 

IT forsker løbende visuel søgeteknologi skalerer massivt billedet anerkendelse processer ved hjælp af det forskers kraftfulde cloud servere, gør det muligt for store skala Augmented Reality applikationer.

Databaser af millioner af billeder kan hurtigt kontrolleres for en kamp med et billede sendt fra klientsiden. Resultatet er en visuel søgeløsning, der tillader forstærke elementer i vores omgivelser på en stor skala: fra emballage, tekniske manualer på illustrationer. Denne teknologi fungerer også som et data management løsning, aflastning billede matchende data og indhold ud af enheden og i skyen. Dette bidrager til bedre batterilevetid og en lettere arbejdsbyrde for CPU.

3D objekt Tracking

 

IT forsker fører industrien i 3D objekt tracking teknologi. Gennem en kombination af funktionen sporing, visuelle odometry og kant-baseret sporing er vores teknologi i stand til at spore og forøge virkelige objekter, i stedet for simple 2D markør konfigurationer.

3D objekt tracking åbner nye muligheder i Augmented Reality: maskiner komponenter kan være annoteret med digital information, forbrugsvarer kan blive udvidet med yderligere produktinformation eller kampagner og digital underholdning kan være blandet naturligt ind i den virkelige verden.

IT forsker har senest integreret både feature-baseret sporing og kant-baseret sporing i en meget robust system kendt som hybrid tracking. Denne konfiguration giver endnu større nøjagtighed og robusthed ved at kombinere styrken af begge tilgange.

Multimedia samfundsanalyser


Multimedieindhold bliver produceret og delt via internettet med hidtil uset hast. For eksempel, mere end en million billeder deles hver dag og 100 millioner timers video deles hvert år. Med dette stormløb af data er evnen til at automatisk forstår indholdet af billeder og videoer kritisk for at aktivere applikationer såsom hentning af indhold-baserede, lignende vare søgning, personlige indhold søgning, beskyttelse af privatlivets fred, og modellering strømmen af multimedia indhold på sociale netværk. Sådanne kapaciteter kan levere omkostningseffektive løsninger for at indsamle oplysninger om viral indhold (fx memes), kunde-feedback på nye produkter, og geo-politiske eller militære begivenheder rundt om i verden, som ikke tidligere har været mulig uden dedikeret forskning og efterretninger grupper.

IT forsker er ved at udvikle en suite af store multimedie analyseværktøjer, der fokuserer på visuelle indhold forståelse, indhold-baseret søgning, online beskyttelse, og netværk modellering. Disse softwareværktøjer indarbejde de nyeste state-of-the-art teknikker i multimedie analyse til at registrere objekter, scener, aktiviteter, i scene tekst og lyd signaler indlejret i Ufikseret billeder og videoer. Disse teknikker anvendes i fællesskab til at analysere og detektere mønstre af interesse i data. Udvikling af en hemmelig rådgiver, som advarer brugerne, når billeder med potentielt følsomme personlige materiale om deles uforvarende på nettet er et eksempel på en af det forskers igangværende projekter. Vores værktøjer har demonstreret høj nøjagtighed på storstilet, virkelige data og kan tilpasses til forskellige anvendelsesområder. Derudover IT forsker værktøjer har integreret Avanceret Visualisering og interaktion, der tillader en problemfri søgeoplevelsen på web-browsere og forbedre søgning nøjagtighed ved at indarbejde brugernes relevans feedback.



Systemarkitektur for søgning af store multimedia Arkiv gennem udvinding af visuelle og auditive funktioner. Søgeresultaterne er raffineret
gennem iterativ brugerfeedback.
 

Raffineret søgeresultater for "flash mob."
 

Søgeresultater baseret på visuelt lignende stilarter.

Aktivitet anerkendelse og adfærdsanalyse


IT forsker har ekspertise i at udvikle løsninger for at identificere aktiviteter og forstå adfærd baseret på samspillet mellem mennesker og køretøjer og miljøet. Den underliggende koncept er at anerkende opførsel mønstre baseret på statisk og dynamisk bevismæssige deskriptorer indeholdt i videoen som beliggenhed, objekter og aktiviteter, der udføres. Vores løsninger er baseret på stærke, matematiske fremstillinger og demonstreret i forskelligartede og udfordrende virkelige verden scenarier som gaden overvågning og fodbold videoer.

Disse kapaciteter, ud over forskuddene til nuværende state-of-the-art video anerkendelse, er nødvendigt at overvinde en af hovedudfordringerne i video forståelse: anerkendelse af enhver begivenhed og objekt i et ubegrænset antal af stilarter, kvaliteter og scener.

 


3D rekonstruktion fra Video


WAN video sensorer kan generere flere gigabytes af rå video data et sekund og hundredvis af terabytes over en mission, skaber behov for effektive metoder til at komprimere dataene til downlink og arkiv. Der findes standard komprimeringsteknikker, men ingen der udnytter det faktum, at verden er statisk i 3D. Med dette koncept, IT forsker udvikle teknikker til at øge komprimeringen af wide area video ved hjælp af 3D-modeller.

Hvis du vil komprimere video på en sådan måde, er det første skridt at adskille forgrunds- og baggrundsfarverne og skelne dynamisk scene elementer. Ved afgørelsen af hvilke dynamiske elementer skal være repræsenteret, er det kritisk at overveje kort-, lang- og meget langsigtede ændringer, som vil påvirke scenen. Ved at bestemme, hvilke elementer skal være repræsenteret, kan fokus være om udskiftning af baggrunden med en 3D model for at aktivere komprimering. Denne 3D model indeholder synspunkt og tidsafhængig udseende data, der er nødvendige for fuldt ud at forstå scenen. Gennem denne form for komprimering er der en betydelig opbevaring og effektivitet gevinst, nødvendige for den stadig større datasæt der indtages.

 

Indhold-baseret Video og billede hentning


IT forsker har udviklet betydelig kapacitet i indhold-baserede billede hentning fra flere programmer, DARPA og AFRL. Vi indtager, forbehandle, og stabilisere et indgående video feed og derefter identificere og karakterisere bevægelige objekter, både afbryder og køretøjer. Mere komplekse video deskriptorer, som forslaget deskriptorerne (herunder kinematiske, deformerbare og artikuleret bevægelse), udseende deskriptorer (herunder farve og form) og adfærd deskriptorer (såsom løb, transporterer, køretøj u-turn, og mange andre) karakteriserer dybere semantiske indhold.

Denne semantiske analyse gør det muligt for live alarmering til særlige ops personale og kan cue uventede eller mistænkelig aktivitet i en video-stream, der kan være kritisk for missionens succes. Yderligere, avancerede retsmedicinske funktioner tillade tilbagevirkende hentning af aktiviteter af interesse fra store datasæt.

IT forsker er begyndt at sætte sit billede og video analyse kapaciteter på Forge.mil som en del af IT forsker billede og Video udnyttelse og hentning Toolkit (KWIVER), med ubegrænsede rettigheder til regeringen. Kapaciteter på Forge. mil omfatter i øjeblikket den fulde kildekode for det forskers real-time WAMI tracking system. Vi planlægger at tilføje kapaciteter i KWIVER og håbe på at opbygge en varig udvikling samfund fra regeringen og kommercielle samarbejdspartnere.


Prøven søge resultater for forespørgslen "Viser alle personer, der transporterer."

Wide area Video analyse


IT forsker er ved at udvikle en softwaresystem kan automatisk og interaktivt at opdage handlingsrettede intelligens fra WAN bevægelse billedsprog (WAMI) af komplekse byer, forstæder og landlige miljøer. Inden for WAMI flytter primære oplysninger elementer enheder i forbindelse med veje, bygninger og andre scene funktioner. Disse enheder, give mens udnyttelige, ofte fragmenterede spor i komplekse bymiljøer på grund af tillukning, stopper, og andre faktorer. IT forsker softwaresystem bruger algoritmisk løsninger til at knytte spor og derefter identificere og integrere lokale arrangementer for at afsløre potentielle trusler og udføre retsmedicinske analyser.

Denne softwaresystem øger markant en slutbrugers evne til at opdage roman intelligens ved hjælp af modeller af aktiviteter, normalitet og kontekst. Da størstedelen af begivenheder er normale og udgør ikke nogen trussel, skal modellerne cross-integrere enestående begivenheder for at opdage relationer og uregelmæssigheder, der er vejledende for mistænkelig adfærd eller matche tidligere lærte - eller defineret - trussel aktivitet.

Det avancerede system forbedrer en analytiker evne til at håndtere spirende WAMI data og reducerer den tid, der kræves til mange aktuelle udnyttelse opgaver, høj grad øge evnen til at analysere og anvende data retskemisk analyse.

 


 

Scene forståelse


Scene forståelse i videoen er en spirende visuelle overvågning og video forståelse problem. IT forsker arbejder på at skabe løsninger på dette område, herunder funktionelle objekt anerkendelse. Funktionelle objekter anerkendelse er evnen til at definere objekter med særlige formål som en postbud og levering lastbil, der er defineret mere af deres handlinger og adfærd end af udseende. Vi er ved at udvikle en strategi for indhold-baseret læring og anerkendelse af funktionen af bevægelige objekter givet video-afledte spor. Især har vi besluttet at semantisk opførsel af movers kan blive fanget i en placering-uafhængig måde ved at tillægge dem med funktioner, som indkode deres forbindelser og handlinger i forhold til scene sammenhænge, som er lokale scene regioner med forskellige funktionaliteter som døråbninger og parkeringspladser, som bevægelige objekter ofte interagerer med. Baseret på disse repræsentationer, funktionelle modeller er lært fra eksempler og roman forekomster er identificeret fra usete data bagefter.

 

Motion Detection og sporing


IT forsker udvikler værktøjer, der fokuserer på afsløring flytning af objekter og spore dem i arkiverede og streaming video. De primære oplysninger elementer i sådanne videodata flytter enheder i forbindelse med veje, bygninger og andre scene funktioner. Disse enheder giver ofte fragmenterede spor i komplekse bymiljøer på grund af tillukning, stopper, og andre faktorer. IT forsker udvikler algoritmisk løsninger til at knytte spor og derefter identificere og integrere lokale arrangementer for at afsløre potentielle trusler og udføre retsmedicinske analyser.

De udviklede algoritmer bidrage til et software-system, der drastisk øger en slutbrugers evne til at opdage roman intelligens ved hjælp af modeller af aktiviteter, normalitet og kontekst. Som det store flertal af begivenheder er normale og udgør ikke nogen trussel, modellerne cross-integrere enestående begivenheder for at opdage relationer og uregelmæssigheder, der er vejledende for mistænkelig adfærd eller match tidligere lærte eller defineret trussel aktivitet.

 

 

Vores partnere

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Komme i kontakt med os!

Nyhedsbrev

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us