Категоризация текста, которое работает лингвистически, классифицируя глаголы, существительные, прилагательные, в контексте, не только изолированные ключевые слова
Классификация услуг построен с использованием нашей технологии NaturalExtractor. Он классифицирует текст в различных категорий согласно заранее таксономии.
Типичный пример классификации в этой области будет:
- Понятия «экран», «дело», «Обложка», «Камера», «батарея» все принадлежат к категории продуктов, как только существительные. Предложения, как «Я люблю экран на мой новый разжечь огонь» или «Я купил большой новой обложкой для моего iPad» будет classifiedas, относящиеся к категории продукта, но предложения, как «Я ненавижу, когда они с экрана iPad на безопасности» или «Я надеюсь, они будут охватывать новый Galaxy Tab в обзоре на следующей неделе» не надо.
Для надежной классификации процесса, наша служба сначала использует глубокий лингвистический анализ для выявления сущности, концепции и глаголов (например «Barack Obama», «глобальное потепление», «увеличение цены», «взлетел»). Лингвистическое представление текста, затем проверяются словарь, который хранит таксономии. Когда слово или фразу в тексте соответствует записи словаря, категория для этой записи присваивается текст.
Мы также можем помочь вам загрузочный процесс создания вашего словаря для любого домена
Этот процесс основан на смысл слова, используемые и не полагаться на простых ключевых слов. Лингвистические вариации, которые изменить формы слов, но не изменяют их основной смысл обрабатываются корректно. Это включает в себя языковые явления, как морфологические вариации (различные формы глагола согласно настроение, напряженной, пол, номер и человек) и синтаксические правила, например фразовые глаголы («Apple принимает привести над Google», «Apple принимает над итальянской программного обеспечения запуска»).
Классификация одежды работает с пользователем таксономии, но часто нет уже существующие словарь или тезаурус категорий, которые могут быть легко интегрированы. В этом случае у нас есть простое решение для значительно сокращает время и стоимость создания одного. Наши услуги извлечения понятие и сущность может использоваться для анализа документов, принадлежащих к целевой домен в целях загрузки ремешок таксономии строительного процесса. Путем извлечения наиболее актуальные понятия, сущности и глаголы из совокупности документов процесс присвоения слов категорий может быть значительно меньше.