Текст категоризация

Текст категоризация, който работи езиково от класифициране на глаголите, съществителните, прилагателните... в контекст, не само изолирани ключови думи


Услугата на категоризация е изградена с помощта на технологията ни NaturalExtractor. Тя класифицира текст в различни категории според предварително дефинирана класификация.


Типичен пример за категоризация в този домейн ще бъде:

  • Понятията "екран", "случай", "покрива", "камера", "батерия" принадлежат към категорията на продукта като съществителни само. Изречения като "Обичам екрана на моя нов запаля огън" или "Аз съм купил един голям нов капак за моя iPad" ще бъде classifiedas, принадлежащи към категорията на продукта, но изречения като "Аз го мразя, когато те екран моя iPad сигурност" или "Надявам се, те ще покриват нови Galaxy Tab в следващата седмица преглед" не.


За надеждна категоризация процес, нашата услуга Първо използва дълбоко лингвистичен анализ за откриване на лица, концепции и глаголи (например "Барак Обама", "глобално затопляне", "повиши цените на", "Свали"). Езиково представяне на текста след това се проверява срещу речник, който съхранява класификацията. Когато една дума или фраза в текста отговаря на запис в речника, категорията за този запис е присвоен на текста.


Ние също така може да ви помогне да bootstrap процеса за създаване вашия речник за всеки домейн


Този процес се основава на смисъла на думите, използвани и не разчита на прости съвпадението. Езикови вариации, които променят формата на думи, но не променят значението си ядро се обработват правилно. Това включва езикови явления като морфологични изменения (различни форми на глагола според настроението, напрегната, пол, брой и лице) и синтактични правила като фразови глаголи ("Apple се водят над Google", "Apple поема италиански софтуер стартиране").


Категоризация услугата работи с потребителски дефинирана класификация, но често няма предварително съществуващите речник и синонимен речник на категории, които могат лесно да бъдат интегрирани. В този случай имаме едно просто решение за драстично намаляване на времето и разходите за създаването на такава. Нашата концепция и организация добива услуги може да се използва за анализ на документи, принадлежащи на целевия домейн за да boot-каишка процеса на изграждане на класификацията. Чрез извличане на най-подходящите понятия, обекти и глаголи от корпус от документи в процеса на възлагане на думи за категории могат да бъдат значително намалени.

Нашите партньори

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Свържете се с нас!

Бюлетин

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us