Kategorizace textu

Členění textu, která funguje lingvisticky klasifikaci slovesa, podstatná jména, Přídavná jména... v kontextu, nikoli jen izolovaná klíčová slova


Služba třídění je zkonstruován s použitím technologie naší NaturalExtractor. Klasifikuje textu do různých kategorií podle předdefinované taxonomie.


Typickým příkladem kategorií v této doméně by:

  • Pojmy "screen", "případ", "obal", "kamera", "baterie", všechny patří do kategorie výrobků jako pouze podstatná jména. Věty jako "Miluji obrazovku na můj nový Kindle Fire", nebo "Koupil jsem skvělý nový obal pro mé iPad" by být klasifikovány jako patřící do kategorie výrobků, ale věty jako "Nesnáším, když obrazovky svůj iPad na zabezpečení" nebo "Doufám, že to chtějí pokrýt nové Galaxy Tab v příští týden review" nemají.


Pro spolehlivé roztřídění procesu, naše služba nejprve hluboké jazykové analýzy zjišťuje pomocí entity, pojetí a slovesa (například "Barack Obama", "globální oteplování", "zvýšení cen", "sundal"). Jazykové vyjádření textu je pak porovnáván s slovník, který ukládá taxonomie. Když slovo nebo fráze v textu odpovídá položce slovník, kategorie pro tuto položku je přiřazena k textu.


Můžeme také pomoci vám zaváděcí proces tvorby vašeho slovníku pro každou doménu


Tento proces je založen na význam slov, používá a není závislý na jednoduché klíčové slovo odpovídající. Jazykové varianty, které změna formy slov, ale nemění jejich základní význam jsou zpracovány správně. To zahrnuje jazykové jevy morfologické odchylky (různé formy slovesa podle nálady, napjatý, pohlaví, číslo a osobu) a syntaktických pravidel frázová slovesa ("Apple má vést přes Google", "Apple přebírá italské zřizovací").


Kategorizace služba funguje s uživatelem zadané taxonomie, ale často neexistuje žádný pre-existující slovník nebo tezaurus kategorií, které lze snadno integrovat. V tom případě máme jednoduché řešení pro dramaticky snižuje čas a náklady na jeho zavedení. Naše koncepce a entit extrakce služby lze použít analyzovat dokumenty patřící k cílové doméně, aby boot popruh procesu budování taxonomie. Extrahování nejdůležitější pojmy, subjekty a slovesa z corpus dokumentů lze výrazně snížit proces přiřazování slov do kategorie.

Naši partneři

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Spojte se s námi!

Bulletin

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us