Tekst kategorisering

Tekst kategorisering som fungerer språklig ved å klassifisere verb, substantiv, adjektiver... i sammenheng, ikke bare isolert søkeord


Tjenesten kategorisering er bygget ved hjelp av vår NaturalExtractor teknologi. Det klassifiserer tekst i forskjellige kategorier med hensyn til en forhåndsdefinert taksonomi.


Være et typisk eksempel på kategorisering i dette domenet:

  • Begrepene "skjermen", "case", "cover", "kamera", "batteri" alle tilhører produktkategori som substantiver bare. Setninger som "Jeg elsker skjermen på min nye tenne ild" eller "Jeg har kjøpt en stor ny cover for iPad min" ville være classifiedas tilhører produktkategorien men setninger som "Jeg hater det når de skjermen iPad min sikkerhet" eller "Jeg håper de kommer til å dekke den nye Galaxy Tab i neste ukes review" ikke.


For en pålitelig kategorisering prosess, bruker tjenesten først språklige analysering for å oppdage enheter, konsepter og verb (f.eks "Barack Obama", "global oppvarming", "øke i priser", "tok"). Språklige representasjon av teksten deretter kontrollert mot en ordbok som lagrer taksonomien. Når et ord eller uttrykk i teksten tilsvarer en Ordlisteoppføring, tilordnes kategorien for oppføringen for teksten.


Vi kan også hjelpe deg bootstrap din ordbok prosessen for alle domener


Denne prosessen er basert på betydningen av ordene som brukes og stole ikke på enkel søkeordmålretting. Språklige varianter som endre form av ord, men ikke endre mening deres kjernen håndteres riktig. Dette inkluderer språklige fenomener som morfologiske variasjon (ulike former for et verb etter humør, spent, kjønn, tall og person) og syntaktiske regler som phrasal verb ("Apple tar føre over Google", "Apple tar over italienske programvare oppstart").


Tjenesten kategorisering fungerer med en brukerangitt taksonomi, men ofte det er ingen eksisterende ordlisten eller synonymordboken for kategorier som lett kan integreres. I dette tilfellet har vi en enkel løsning for å dramatisk redusere tid og kostnader for å skape en. Våre konsept og enheten utvinning tjenester kan brukes å analysere dokumenter til måldomenet for boot-stropp taksonomi byggeprosessen. Ved å trekke ut mest relevante konseptene, enheter og verb fra et korpus av dokumenter kan prosessen med å tilordne ord til kategorier reduseres betydelig.

Våre partnere

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Ta kontakt med oss!

Nyhetsbrev

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us