Text-Kategorisierung

Text-Kategorisierung, die sprachlich funktioniert durch die Klassifizierung von Verben, Substantive, Adjektive... in Zusammenhang, nicht nur isoliert Schlüsselwörter


Der Kategorisierung-Service baut auf unsere NaturalExtractor-Technologie. Es stuft Text in verschiedenen Kategorien nach einer vordefinierten Taxonomie.


Ein typisches Beispiel für die Kategorisierung in diesem Bereich wäre:

  • Die Konzepte "Screen", "Fall", "cover", "Kamera", "Batterie" alle als Substantive nur zu der Kategorie gehören. Sätze wie "Ich den Bildschirm auf meinem neuen Kindle Fire Liebe" oder "Ich ein tolle neues Cover für mein iPad gekauft habe" wäre Classifiedas der Kategorie gehören, aber Sätze wie "Ich hasse es, wenn sie meine iPad an Sicherheit Bildschirm" oder "Ich hoffe, sie werden die neue Galaxy-Registerkarte in der nächsten Woche von der Überprüfung zu decken" nicht.


Für eine zuverlässige Kategorisierung-Prozess, verwendet unser Service zunächst tiefe linguistische Analyse, um Einrichtungen, Konzepte und Verben zu erkennen (z.B. "Barack Obama", "globale Erwärmung", "Anstieg der Preise", "abgeflogen"). Die sprachliche Darstellung des Textes ist ein Wörterbuch überprüft, in der die Taxonomie gespeichert. Wenn ein Wort oder eine Phrase im Text einen Wörterbucheintrag entspricht, wird der Text die Kategorie für diesen Eintrag zugewiesen.


Wir helfen Ihnen Ihr Wörterbuch-Erstellungsprozess für jede Domain bootstrap auch


Dieser Prozess basiert auf die Bedeutung der Wörter verwendet und nicht auf einfaches Keyword matching angewiesen. Sprachliche Varianten, die die Formen der Wörter zu ändern, aber verändern nicht ihre zentrale Botschaft werden korrekt behandelt. Dazu gehören sprachliche Phänomene wie morphologische Variation (verschiedene Formen eines Verbs nach Stimmung, angespannt, Geschlecht, Zahl und Person) und syntaktischen Regeln wie Phrasal Verbs ("Apple nimmt führen über Google", "Apple übernimmt italienischen Software Start-up").


Der Kategorisierung-Dienst funktioniert mit einer vom Benutzer angegebene Taxonomie, aber oft gibt es keine bereits vorhandenen Wörterbuch oder den Thesaurus von Kategorien, die leicht integriert werden kann. In diesem Fall haben wir eine einfache Lösung für drastisch reduziert den Zeit- und Kostenaufwand für die Schaffung eines. Unser Konzept und Entität Extraktion-Service können verwendet werden, um Dokumente gehören der Zieldomäne zu Boot-Armband der Taxonomie-Bauprozess zu analysieren. Indem die wichtigsten Konzepte, Entitäten und Verben aus ein Korpus von Dokumenten extrahieren kann der Vorgang des Zuweisens Worte Kategorien deutlich reduziert werden.

Unsere Partner

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Kontaktieren Sie uns!

Newsletter

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us