Classificazione del testo

Classificazione del testo che funziona linguisticamente classificando i sostantivi, verbi, aggettivi... nel contesto, non solo isolato Parole chiavi


Il servizio di categorizzazione è costruito utilizzando la nostra tecnologia di NaturalExtractor. Classifica testo in diverse categorie secondo una tassonomia predefinita.


Un tipico esempio di categorizzazione in questo dominio sarebbe:

  • I concetti "dello schermo", "caso", "coprire", "fotocamera", "batteria" appartengono tutti alla categoria del prodotto come sostantivi solo. Frasi come "Mi piace lo schermo sul mio nuovo Kindle Fire" o "Ho comprato una grande nuova copertina per il mio iPad" sarebbe classifiedas appartenente alla categoria prodotto ma frasi come "Odio quando essi schermo mio iPad a sicurezza" o "Spero che andranno a coprire il nuovo Galaxy Tab nella recensione della settimana prossima" non lo fanno.


Per un processo di categorizzazione affidabile, il nostro servizio utilizza prima profonda analisi linguistica per rilevare l'entità, concetti e verbi (per esempio "Barack Obama", "riscaldamento globale", "aumento dei prezzi", "tolse"). La rappresentazione linguistica del testo è quindi controllata contro un dizionario che memorizza la tassonomia. Quando una parola o frase nel testo corrisponde a una voce del dizionario, la categoria per tale voce viene assegnata al testo.


Possiamo anche aiutarvi a avviare il processo di creazione del dizionario per qualsiasi dominio


Questo processo si basa sul significato delle parole usate e non si basa sulla parola chiave semplice corrispondenza. Variazioni linguistiche che cambia le forme delle parole ma non modificano il loro significato di nucleo sono gestiti correttamente. Questo include i fenomeni linguistici quali variazioni morfologiche (forme differenti di un verbo secondo l'umore, teso, genere, numero e persona) e le regole sintattiche quali verbi frasali ("prende Apple portano sopra Google", "Apple assume start-up software italiano").


Il servizio di classificazione funziona con una tassonomia fornito dall'utente, ma spesso non non c'è nessun dizionario preesistente o thesaurus di categorie che possono essere facilmente integrati. In tal caso abbiamo una soluzione semplice per ridurre drasticamente il tempo e il costo della creazione di uno. I nostri servizi di estrazione concetto ed entità possono essere utilizzati per analizzare i documenti appartenenti al dominio di destinazione in ordine di boot-strap il processo di costruzione della tassonomia. Estrapolando i concetti più rilevanti, gli enti e verbi da un corpus di documenti del processo di assegnazione di parole a categorie può essere notevolmente ridotto.

I nostri partner

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Entrare in contatto con noi!

Newsletter

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us