Categorización de texto

Categorización de texto que trabaja lingüístico por clasificar los verbos, sustantivos, adjetivos... en contexto, no sólo palabras aisladas


El servicio de clasificación ha sido construido utilizando nuestra tecnología de NaturalExtractor. Texto clasifica en distintas categorías según una taxonomía predefinida.


Un ejemplo típico de categorización en este ámbito sería:

  • La pantalla"conceptos", "caso", "cover", "cámara", "batería" pertenecen a la categoría de productos como sólo los sustantivos. Frases como "Me encanta la pantalla de mi nuevo Kindle Fire" o "He comprado una gran cubierta nueva para mi iPad" sería classifiedas perteneciente a la categoría de producto pero frases como "Odio cuando ellos la pantalla mi iPad en seguridad" o "Espero que van a cubrir el nuevo Galaxy Tab en revisión la semana que viene" no lo hacen.


Para un proceso de categorización confiable, nuestro servicio utiliza primero profundo análisis lingüístico para detectar las entidades, conceptos y verbos (e.g. "Barack Obama", "calentamiento global", "aumento de los precios", "despegó"). La representación lingüística del texto es entonces comparada con un diccionario que almacena la taxonomía. Cuando una palabra o frase en el texto corresponde a una entrada de diccionario, la categoría de esa entrada se asigna al texto.


También podemos ayudarle a iniciar su proceso de creación de diccionario para cualquier dominio


Este proceso se basa en el significado de las palabras usadas y no confiar en la palabra clave simple coincidencia. Variaciones lingüísticas que cambian las formas de palabras pero no altera su significado de núcleo son manejadas correctamente. Esto incluye fenómenos lingüísticos como variación morfológica (diferentes formas de un verbo según el humor, tenso, género, número y persona) y reglas sintácticas como "phrasal verbs" ("toma Apple conduce a Google", "Toma de Apple sobre la puesta en marcha de software italiano").


El servicio de categorización trabaja con una taxonomía suministrados por el usuario, pero a menudo no hay Diccionario preexistente o Tesauro de categorías que se pueden integrar fácilmente. En ese caso tenemos una solución simple para reducir drásticamente el tiempo y costo de crear uno. Nuestros servicios de extracción de concepto y entidad pueden utilizarse para analizar los documentos pertenecientes al dominio de destino con el fin de elástico de bota el proceso de construcción de la taxonomía. Extrayendo los conceptos más relevantes, las entidades y los verbos de un corpus de documentos se puede reducir significativamente el proceso de asignación a las categorías de palabras.

Nuestros socios

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Póngase en contacto con nosotros!

Boletín de noticias

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us