Text kategorisering

Text kategorisering som fungerar språkvetenskapligt genom att klassificera verb, Substantiv, adjektiv... i sammanhanget, inte bara isolerade sökord


Tjänsten kategorisering är byggt med vår NaturalExtractor-teknik. Det klassificerar text i olika kategorier enligt en fördefinierad taxonomi.


Ett typiskt exempel på indelning i denna domän skulle vara:

  • De begrepp "skärm", "fall", "täcka", "kameran", "batteri" alla tillhör produktkategorin som Substantiv bara. Meningar som "Jag älskar skärmen på min nya Kindle Fire" eller "Jag har köpt ett stort nytt omslag för min iPad" skulle vara classifiedas som tillhör den berörda produktkategorin men meningar som "Jag hatar när de skärm min iPad på security" eller "Jag hoppas att de kommer att omfatta nya Galaxy Tab i nästa veckas översyn" inte.


För en tillförlitlig kategorisering process, använder vår tjänst först djup språklig analys för att upptäcka enheter, begrepp och verb (e.g. "Barack Obama", "global uppvärmning", "öka priser", "tog bort"). Den språkliga framställningen av texten kontrolleras sedan mot en ordlista som lagrar taxonomin. När ett ord eller en fras i texten motsvarar en ordbok post, tilldelas kategorin för motsvarande post i texten.


Vi kan också hjälpa dig bootstrap din ordbok skapandeprocessen för valfri domän


Denna process är baserad på innebörden av de ord som används och förlitar sig inte på enkla sökordsmatchning. Språkliga variationer att ändra formerna för ord men inte ändrar deras core menande hanteras korrekt. Detta inkluderar språkliga fenomen som morfologisk variation (olika former av ett verb enligt humör, spänd, kön, antal och person) och syntaktiska regler såsom phrasal verb ("Apple tar leda över Google", "Apple tar över italienska programvara start-up").


Kategoriseringen tjänsten fungerar med ett användarangivet taxonomi, men ofta finns det ingen befintlig ordlista eller synonymordlistan för kategorier som lätt kan integreras. I så fall har vi en enkel lösning för att dramatiskt minska tiden och kostnaden för att skapa en. Våra koncept och enhet utvinning tjänster kan användas att analysera dokument som tillhör måldomänen för boot-bandet taxonomi byggprocessen. Genom att extrahera den mest relevanta begrepp, enheter och verb från en Korpus av dokument kan processen att tilldela kategorier ord minskas betydligt.

Våra partners

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Kontakta oss!

Nyhetsbrev

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us