Text kategorizácia

Text kategorizáciu, ktorá funguje jazykovo klasifikácii slovesá, podstatné mená, prídavné mená... v kontexte, nie len izolované kľúčové slová


Kategorizácia služieb je postavený pomocou našej technológie NaturalExtractor. Klasifikuje textu do rôznych kategórií podľa preddefinovaných taxonómie.


Typickým príkladom kategorizácie v tejto oblasti bude:

  • Pojmy "obrazovku", "prípad", "pokrytie", "kamera", "batérie" všetky patria do danej kategórie výrobku ako podstatné mená iba. Vety ako "Milujem obrazovky na môj nový Kindle Fire" alebo "Som kúpil veľký nový kryt pre môj iPad" by classifiedas patriace do danej kategórie výrobku ale vety ako "Neznášam, keď oni obrazovky môj iPad bezpečnosť" alebo "Dúfam, že idú na pokrytie nový Galaxy Tab v budúcom týždni review" nemajú.


Pre spoľahlivé kategorizácia proces našich služieb najprv používa hlboké jazykovej analýzy zistiť subjektov, koncepcie a slovesá (napr "Barack Obama", "globálne otepľovanie", "zvýšenie cien", "sundal"). Jazykové vyjadrenie text sa potom overí slovník ukladajúci taxonómie. Keď slovo alebo frázu v texte zodpovedá záznamu slovník, kategóriu pre tento záznam je priradený text.


Tiež vám môžeme pomôcť bootstrap proces vytvárania vášho slovníka pre každú doménu


Tento proces je založený na význam slov používaných a nespolieha na jednoduché kľúčové slová zodpovedajúce. Jazykové varianty, ktoré zmena formy slov, ale nie meniť ich základný význam sú spracované správne. To zahŕňa jazykových javov, ako sú morfologické variácie (rôzne formy slovesa podľa nálady, napätá, pohlavie, číslo a osoby) a syntaktické pravidlá ako Frázové slovesá ("Apple má viesť cez Google", "Apple preberá start-up Talianska softvér").


Kategorizácia služieb spolupracuje s užívateľom zadané taxonómie, ale často nie je existujúcou slovník alebo slovník synoným kategórií, ktoré možno ľahko integrovať. V takomto prípade máme jednoduché riešenie pre dramaticky znižuje čas a náklady na vytvorenie jedného. Náš koncept a subjekt extrakcie služby možno analyzovať dokumenty patriace do cieľovej domény, aby topánka popruh taxonómie stavebného procesu. Tým, že získa najviac relevantné koncepcií, subjektom a slovesá z korpusu dokumenty proces prideľovania slová do kategórie sa dá významne znížiť.

Naši partneri

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Ozvite sa nám!

Newsletter

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us