Κείμενο κατηγοριοποίηση

Κατηγοριοποίηση κείμενο που λειτουργεί γλωσσολογικά κατατάσσοντας ρήματα, ουσιαστικά, επίθετα... στο πλαίσιο, όχι μόνο απομονωμένες λέξεις-κλειδιά


Η υπηρεσία κατηγοριοποίηση είναι χτισμένο με την τεχνολογία NaturalExtractor μας. Ταξινομεί κείμενο σε διαφορετικές κατηγορίες, σύμφωνα με μια προκαθορισμένη ταξινόμηση.


Ένα τυπικό παράδειγμα της κατηγοριοποίησης σε αυτόν τον τομέα θα ήταν:

  • "Το έννοιες"οθόνη","υπόθεση", κάλυψη", "κεκλεισμένων των θυρών", "μπαταρία" όλα ανήκουν στην κατηγορία του ΠΡΟΪΌΝΤΟΣ ως γλώσσα μόνο. Φράσεις όπως "I love την οθόνη μου νέα Kindle φωτιά" ή "Έχω αγοράσει μια μεγάλη νέα κάλυψη για iPad μου" θα ήταν classifiedas που ανήκουν στην κατηγορία ΠΡΟΪΌΝΤΟΣ αλλά φράσεις όπως "Μισώ όταν που προβάλλουν το iPad μου στο ασφαλείας" ή "Ελπίζω ότι πρόκειται να καλύψει το νέο Galaxy Tab σε αναθεώρηση της επόμενης εβδομάδας" δεν το κάνουν.


Για μια κατηγοριοποίηση αξιόπιστη διαδικασία, μας υπηρεσία χρησιμοποιεί πρώτα βαθιά γλωσσική ανάλυση για την ανίχνευση οντότητες, έννοιες και Ρήματα (π.χ. «Barack Obama","υπερθέρμανση του πλανήτη","αύξηση των τιμών","απογειώθηκε"). Η γλωσσική αναπαράσταση του το κείμενο ελέγχεται στη συνέχεια έναντι ένα λεξικό που αποθηκεύει την ταξινόμηση. Όταν μια λέξη ή φράση στο κείμενο που αντιστοιχεί σε μια καταχώρηση λεξικό, η κατάταξη στην κατηγορία για το ότι η είσοδος είναι στο κείμενο.


Μπορούμε επίσης να σας Μπουτστράπ σας διαδικασία δημιουργίας λεξικό για κάθε τομέα


Η διαδικασία αυτή βασίζεται στην έννοια των λέξεων που χρησιμοποιούνται και δεν βασίζεται σε απλή λέξη-κλειδί αντιστοίχισης. Γλωσσικές παραλλαγές που αλλάζει την μορφή των λέξεων, αλλά δεν αλλάζουν τους νόημα αντιμετωπίζονται σωστά. Αυτό περιλαμβάνει γλωσσικών φαινομένων όπως μορφολογικών διακύμανσης (διαφορετικές μορφές ενός ρήματος ανάλογα τα κέφια, τεταμένη, γένος, αριθμό και πρόσωπο) και συντακτικών κανόνων όπως Περιφραστικά Ρήματα ("Apple παίρνει οδηγήσει πάνω από το Google", "Apple αναλαμβάνει λογισμικό ιταλικής εκκίνησης").


Η κατηγοριοποίηση υπηρεσία λειτουργεί με μια ταξινόμηση που παρέχεται από το χρήστη, αλλά συχνά δεν υπάρχει προϋπάρχουσα λεξικό και θησαυρός των κατηγοριών που μπορούν εύκολα να ενσωματωθούν. Στην περίπτωση αυτή έχουμε μια απλή λύση για τη μείωση δραματικά το χρόνο και το κόστος της δημιουργίας ενός. Μας έννοια και οντότητα εξόρυξης υπηρεσίες μπορούν να χρησιμοποιηθούν για την ανάλυση των εγγράφων που ανήκουν στο τομέα προορισμού για ιμάντας εκκίνησης τη διαδικασία οικοδόμησης της ταξινόμησης. Αφαιρώντας τις πιο σχετικές έννοιες, οντότητες και ρήματα από ένα σώμα των εγγράφων μπορεί να μειωθεί σημαντικά η διαδικασία τοποθέτησης λέξεις στις κατηγορίες.

Συνεργάτες μας

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

ΕΠΙΚΟΙΝΩΝΗΣΤΕ ΜΑΖΙ ΜΑΣ

Ενημερωτικό δελτίο

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us