Text categorització

Categorització de text que funciona lingüísticament per classificar els verbs, Substantius, adjectius... en context, no només aïllat paraules clau


El servei de classificació es construeix utilitzant la nostra tecnologia de NaturalExtractor. Text classifica en diferents categories segons una taxonomia predefinides.


Un exemple típic de categorització en aquest camp serien:

  • Els conceptes "pantalla", "cas", "coberta", "càmera", "pila" tots pertanyen a la categoria de producte com Substantius només. Frases com "M'encanta la pantalla en el meu nou Kindle foc" o "M'he comprat una gran coberta nova per al meu iPad" seria classifiedas que pertany a la categoria de producte però frases agrada "Odio quan que la pantalla meu iPad en seguretat" o "Espero que anem a cobrir la nova Galaxy Tab en la revisió de la propera setmana" no ho fan.


Per a un procés de categorització fiable, el nostre servei primer utilitza profund anàlisi lingüística per detectar entitats, conceptes i verbs (p. ex. "Barack Obama", "escalfament global", "augmentar a preus", "va enlairar-se"). La representació lingüística del text es comprova llavors contra un diccionari que emmagatzema la taxonomia. Quan una paraula o frase en el text correspon a una entrada de diccionari, s'assigna la categoria per a aquella entrada al text.


També podem ajudar-li arrencar el seu procés de creació de diccionari per a qualsevol domini


Aquest procés es basa en el significat de les paraules utilitzades i no dependre de concordança de paraula clau simple. Variacions lingüístiques que canviar les formes de paraules però no alteren el seu significat bàsic són manipulats correctament. Això inclou fenòmens lingüístics com la variació morfològica (formes del verb segons estat d'ànim, tensos, gènere, nombre i persona) i regles sintàctiques com phrasal verbs ("pren Poma portar sobre Google", "Presa de Poma més start-up italiana programari").


El servei de classificació funciona amb una taxonomia aportat l'usuari, però sovint no hi ha cap diccionari preexistent o tesaurus de categories que es pot integrar fàcilment. En aquest cas tenim una solució senzilla per reduir dràsticament el temps i el cost de creació d'un. Els nostres serveis extracció concepte i entitat es pot utilitzar per analitzar documents pertanyents al domini de destinació per tal d'arrencada-corretja el procés de construcció de taxonomia. Per extreure els conceptes més rellevants, les entitats i els verbs d'un corpus de documents del procés d'assignar paraules a categories pot ser reduït significativament.

Els nostres socis

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Contacti amb nosaltres!

Butlletí

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us