Indeling van de tekst

Indeling van de tekst die taalkundig werkt door het classificeren van werkwoorden, zelfstandige naamwoorden, bijvoeglijke naamwoorden... in context, niet alleen geïsoleerde trefwoorden


De indeling service is gebouwd met behulp van onze NaturalExtractor-technologie. Het tekst ingedeeld in verschillende categorieën volgens een vooraf gedefinieerde taxonomie.


Een typisch voorbeeld van categorisering in dit domein zou zijn:

  • "De begrippen"screen","zaak", cover", "camera", "batterij" all belong to de productcategorie als zelfstandige naamwoorden alleen. Zinnen als "I love het scherm op mijn nieuwe Kindle Fire" of "Ik een grote nieuwe dekking voor mijn iPad gekocht heb" zou classifiedas die behoren tot de categorie producten maar zinnen als "Ik haat het wanneer ze mijn iPad bij security screening" of "Ik hoop dat ze gaan ter dekking van het nieuwe tabblad Galaxy in volgende week herziening" niet.


Voor een betrouwbare indeling proces, gebruikt onze service eerst diepe Taalanalyse-Taalwetenschap i om te ontdekken entiteiten, concepten en werkwoorden (bijvoorbeeld "Barack Obama ', 'globale opwarming',"stijging van prijzen","begon te lopen"). De taalkundige vertegenwoordiging van de tekst wordt vervolgens vergeleken met een woordenlijst die de taxonomie slaat. Wanneer een woord of woordgroep in de tekst komt met de vermelding van een woordenboek overeen, wordt de categorie voor dat item toegewezen aan de tekst.


We kunnen ook helpen u uw woordenboek creatieproces voor elk domein bootstrap


Dit proces is gebaseerd op de betekenis van de woorden gebruikt en niet vertrouwen op eenvoudige zoekwoord matching. Taalkundige variaties die de formulieren van woorden wijzigen maar veranderen niets aan de betekenis van hun core worden correct behandeld. Dit omvat taalkundige verschijnselen zoals morfologische variatie (verschillende vormen van een werkwoord volgens stemming, gespannen, geslacht, aantal en persoon) en syntactische regels zoals phrasal werkwoorden ("Apple neemt leiden over Google", "Apple neemt Italiaanse software start-up").


De indeling service werkt met een gebruiker opgegeven taxonomie, maar vaak is er geen bestaande woordenboek of synoniemenlijst van categorieën die gemakkelijk kunnen worden geïntegreerd. In dat geval hebben we een eenvoudige oplossing voor drastisch verminderen van de tijd en de kosten van het creëren van een. Onze concept en entiteit extractie-services kunnen worden gebruikt om te analyseren van documenten die behoren tot het doeldomein in volgorde aan boot-band het bouwproces taxonomie. Door de winning van de meest relevante concepten, entiteiten en werkwoorden uit een corpus van documenten kan het proces van woorden aan categorieën toewijzen aanzienlijk worden verkleind.

Onze partners

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Neem contact op met ons!

Nieuwsbrief

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us