Catégorisation de texte

Catégorisation de texte qui fonctionne sur le plan linguistique, en classant les verbes, noms, adjectifs... dans le contexte, non seulement isolement Mots-clés


Le service de catégorisation est construit à l'aide de notre technologie NaturalExtractor. Il classe le texte en différentes catégories selon une taxinomie prédéfinie.


Un exemple typique de catégorisation dans ce domaine serait :

  • "L'écran" concepts", case", « couvrir », « appareil photo », « batterie », que tous appartiennent à la catégorie de produit comme substantifs seulement. Des phrases comme « J'aime l'écran sur mon nouveau Kindle feu » ou « J'ai acheté une nouvelle grande couverture pour mon iPad » serait classifiedas appartenant à la catégorie de produit mais de phrases comme « Je déteste quand ils l'écran mon iPad à la sécurité » ou « J'espère qu'ils vont couvrir le nouveau Galaxy Tab en examen la semaine prochaine » ne sont pas.


Pour un processus de catégorisation fiable, notre service utilise d'abord une analyse linguistique profonde à détecter des entités, des concepts et des verbes (par exemple « Barack Obama », « réchauffement climatique », « hausse des prix », « décolle »). La représentation linguistique du texte est ensuite vérifiée contre un dictionnaire qui stocke la taxonomie. Lorsqu'un mot ou une phrase dans le texte correspond à une entrée de dictionnaire, la catégorie pour cette entrée est assignée au texte.


Nous pouvons également vous aider à amorcer le processus de création de votre dictionnaire pour n'importe quel domaine


Ce processus repose sur le sens des mots utilisés et ne s'appuie pas sur le simple mot clé correspondant. Variations linguistiques que changent la forme de mots, mais ne modifient pas leur sens de base sont gérées correctement. Il s'agit de phénomènes linguistiques telles que la variation morphologique (différentes formes d'un verbe selon l'humeur, tendue, genre, nombre et personne) et des règles syntaxiques comme les verbes à particule ("prend Apple avance sur Google", "Mise en service du logiciel italien reprend Apple").


Le service de catégorisation fonctionne avec une taxonomie fourni par l'utilisateur, mais souvent il n'y a aucun dictionnaire préexistante ou Thésaurus des catégories qui peuvent être facilement intégrés. Dans ce cas, nous avons une solution simple pour réduire considérablement le temps et le coût de création d'un. Nos services d'extraction concept et entité peuvent être utilisés pour analyser les documents appartenant au domaine cible afin de bootstrap le processus de construction de taxonomie. Le processus d'attribution des mots aux catégories peut être significativement réduit en extrayant les concepts plus pertinents, les entités et les verbes d'un corpus de documents.

Nos partenaires

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Prendre contact avec nous !

Bulletin d'information

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us