Categorização de texto

Categorização de texto que funciona linguisticamente classificando verbos, substantivos, adjetivos... no contexto, não apenas isolaram palavras-chave


O serviço de categorização é construído usando nossa tecnologia de NaturalExtractor. Classifica texto em diferentes categorias de acordo com uma taxonomia predefinida.


Seria um exemplo típico de categorização neste domínio:

  • A tela"conceitos", "caso", "cobrir", "câmera", "bateria", que todos pertencem à categoria de produto como substantivos apenas. Frases como "Eu amo a tela no meu novo Kindle Fire" ou "Eu comprei uma ótima capa nova para meu iPad" seria classifiedas pertencentes à categoria de produto, mas frases como "Eu odeio quando eles tela meu iPad em segurança" ou "Espero que eles vão cobrir o novo Galaxy Tab em revisão na próxima semana" não.


Para um processo de categorização confiável, nosso serviço usa primeiro profunda análise linguística para detectar entidades, conceitos e verbos (por exemplo, "Barack Obama", "aquecimento global", "aumento de preços", "decolou"). A representação linguística do texto é verificada contra um dicionário que armazena a taxonomia. Quando uma palavra ou frase no texto corresponde a uma entrada de dicionário, a categoria para essa entrada é atribuída ao texto.


Podemos também ajudar seu processo de criação de dicionário para qualquer domínio de inicialização


Este processo baseia-se sobre o significado das palavras usadas e não depende de correspondência de palavra-chave simples. Variações linguísticas que alterar a forma das palavras, mas não alteram o seu significado de núcleo são tratadas corretamente. Isso inclui fenômenos lingüísticos tais como variação morfológica (diferentes formas de um verbo de acordo com o humor, tenso, gênero, número e pessoa) e regras sintáticas tais como verbos frasais ("leva de Apple leva sobre Google", "Start-up software italiano assume de maçã").


O serviço de categorização funciona com uma taxonomia fornecidos pelo usuário, mas muitas vezes não existe nenhum dicionário pré-existente ou Tesauro de categorias que podem ser facilmente integrados. Nesse caso temos uma solução simples para reduzir drasticamente o tempo e o custo da criação de um. Nossos serviços de extração de conceito e a entidade podem ser usados para analisar documentos pertencentes ao domínio de destino em ordem para cinta boot-o processo de construção da taxonomia. Extraindo os conceitos mais relevantes, entidades e verbos de um corpus de documentos o processo de atribuição de palavras de categorias pode ser significativamente reduzido.

Nossos parceiros

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Entre em contato conosco!

Boletim informativo

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us