Tekst kategorizacija

Tekst kategorizacija koji radi jezički do nazivajući po padežima, nouns, prideva … u kontekstu, ne samo izolovani keywords


Kategorizacija služba je sagrađena korišćenjem našim NaturalExtractor tehnologija. Svrstavaju tekst u različitim kategorijama prema unapred definisanim taxonomy.


Tipičan primer kategorizacija u tom domenu bi bilo:

  • Na koncepti "ekran", "slučaj", "pokriti", "kamera", "baterija" sve pripada kategoriji PROIZVOD kao nouns samo. Kazne kao "Ja volim ekran na moj novi procveta vatru" ili ", kupio sam veliki novi naslovnu stranu za moj iPad" bi classifiedas pripadaju kategoriji PROIZVOD, ali kazne se sviđa "Mrzim kad su prikazana moj iPad na bezbednost" ili "Nadam se da će pokriti nove galaksije račun u sledeće nedelje procene" ne.


Za proces pouzdan kategorizacija, naša služba je prvi put koristi duboko jezičke analizu otkriti entiteta, koncepata i po padežima (e.g. "Barak Obama", "globalnog zagrevanja", "povećanje cena", "skinuo"). Lingvistički zastupljenost tekst onda proverio protiv rečnik da je prodavnice u taxonomy. Kada je reč ili rečenica u tekst odgovara ulasku rečnik, u kategoriji za prijem u tu će biti dodeljena je tekst.


Mi smo takođe može da pomogne ti bootstrap tvoje procesa stvaranja rečnik za svaki domen


Taj proces je zasnovan na značenje reči koristi i ne da se oslanjaju na jednostavan keyword odgovara. Jezičke varijacije to promeniti oblika reči, ali neće promeniti svoje znacenje jezgro pravilno. To uključuje jezičke fenomeni kao što su morphological varijacije (različitih oblika glagol prema raspoloženje, napet, Pol, broj i osoba) i syntactic pravila, kao što su phrasal po padežima ("jabuka zauzima vode preko Gugl", "Jabuka preuzela italijanski softver Startni").


Kategorizacija služba funkcioniše sa korisnik nabavio taxonomy, ali često postoji unapred postojećih rečnik ili thesaurus od kategorija koja se može lako da bude integrisana. U tom slučaju moramo jednostavno rešenje za drastično smanjenje vreme i troškovi za stvaranje jedan. Naše koncept i entitetskih vađenje usluga može da se koristi da analizira dokumenata koji pripadaju meta domen u red da boot-kopčom proces izgradnje taxonomy. Do vaditi najviše relevantne koncepti, entiteta i po padežima iz corpus dokumenata proces dodeljivanje reči kategorijama može biti znatno smanjen.

Naši partneri

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Stupiti u nama!

Biltena

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us