Tekst kategorisering

Tekst kategorisering, der virker sprogligt ved at klassificere verber, Substantiver, adjektiver... i sammenhæng, ikke bare isoleret søgeord


Tjenesten kategorisering er bygget ved hjælp af vores NaturalExtractor teknologi. Det klassificerer tekst i forskellige kategorier efter et foruddefineret taksonomi.


Et typisk eksempel på kategorisering i dette domæne er:

  • "Begreber"skærm","sag","dække", kameraet", "batteri" alle tilhører kategorien produkt som navneord kun. Sætninger som "Jeg elsker skærmen på min nye Kindle brand" eller "Jeg har købt et stort nyt cover til min iPad" ville være classifiedas tilhører kategorien produkt men sætninger som "Jeg hader det, når de skærmen min iPad på sikkerhed" eller "Jeg håber, de kommer til at dække den nye Galaxy Tab i næste uges anmeldelse" ikke.


For en pålidelig kategorisering, bruger vores service først dyb sproglig analyse til at registrere objekter, begreber og verber (fx "Barack Obama", "global opvarmning", "stigning i priser", "tog"). Den sproglige repræsentation af teksten er derefter kontrolleres mod en ordbog, der gemmer taksonomien. Når et ord eller en sætning i teksten svarer til en ordbog indrejse, tildeles kategori for at indrejse til teksten.


Vi kan også hjælpe dig bootstrap din ordbog oprettelsesprocessen for enhver domæne


Denne proces er baseret på betydningen af ordene bruges og stole ikke på simpel søgeordsmatchning. Sproglige variationer, der ændrer former af ord, men ikke ændrer deres centrale betydning håndteres korrekt. Dette omfatter sproglige fænomener som morfologiske variation (forskellige former for et verbum efter humør, anspændt, køn, antal og person) og syntaktiske regler såsom phrasal verber ("Apple tager føre over Google", "Apple overtager italienske software start-up").


Tjenesten kategorisering arbejder med en brugerangivet taksonomi, men ofte er der ingen præ-eksisterende ordbogen eller synonymordbogen af kategorier, som nemt kan integreres. I så fald har vi en enkel løsning for dramatisk reducere tidsforbruget og omkostningerne ved at oprette en. Vores koncept og enhed udvinding tjenester kan bruges til at analysere dokumenter tilhører destinationsdomænet for at boot-strap taksonomi byggeprocessen. Ved at udtrække de mest relevante begreber, enheder og verber fra et korpus af dokumenter kan processen til tildeling af ord til kategorier reduceres væsentligt.

Vores partnere

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Komme i kontakt med os!

Nyhedsbrev

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us