Teksti liigitamine

Teksti kategooriatesse, mis toimib keeleliselt klassifitseerimisel tegusõnad, nimisõnad, omadussõnad... kontekstis, mitte ainult üksikud märksõnad


Kategooriatesse jaotamise teenuse on ehitatud meie NaturalExtractor kaudu. Ta liigitab teksti eri kategooriatesse vastavalt eelmääratletud taksonoomia.


Tüüpiline näide kategooriatesse jaotamine kõnealuses valdkonnas oleks:

  • "Mõisted"ekraan","asja","kata", kaamera", "aku" kõik kuuluvad toodete kategooriasse nagu liitsõnu ainult. Lauseid nagu "Ma armastan ekraani minu uus Kindle Fire" või "Olen ostnud suure uue katte minu iPad" oleks classifiedas toote-kategooriasse kuuluvatesse kuid lauseid nagu "Ma vihkan seda, kui nad ekraani minu iPad turvalisuse" või "Ma loodan, et nad ei kavatse katta uue Galaxy Tab järgmine nädal review" ei ole.


Usaldusväärne liigitamise protsessi meie teenuse esimene kasutab sügav keeleline analüüs tuvastada üksused, mõistete ja tegusõnu (nt "Barack Obama", "Globaalne soojenemine", "suurenemine hindade", "võttis maha"). Teksti keelelise esindus kontrollitakse seejärel taksonoomia salvestava sõnastikku. Kui sõna või fraasi vastab sõnastik kanne, määratakse kategooria kirje tekst.


Saame aidata teil bootstrap oma sõnastiku loomise protsessi iga domeeni


See protsess põhineb kasutatavate sõnade tähendus ja tugineda lihtne märksõna sobivus. Keeleline variatsioonid, muuta sõnastust, kuid ei muuda nende põhilisi tähendust käideldakse õigesti. See hõlmab keelelist nähtusi nagu morfoloogiline muutus (eri liiki Verbi meeleolu, pinges, soo, arvu ja isiku järgi) süntaktilise reeglid nagu ühendverbid ("Apple võtab edumaa Google", "Apple võtab üle Itaalia tarkvara käivitamine").


Kategooriatesse jaotamise teenus töötab kasutaja edastatud taksonoomia, kuid sageli ei ole olemasoleva sõnastiku või tesaurus, kuhu saab hõlpsasti integreerida. Sel juhul on lihtne lahendus oluliselt vähendada aega ja kulusid kodurühma loomist. Mõistet ning üksuste kaevandamise teenuseid saab analüüsida sihtdomeeni, et vöö taksonoomia väljaarendamise protsessi dokumente. Poolt kaevandamisele kõige olulisemad mõisted, üksused ja tegusõnad corpus dokumente paigutada sõnad kategooriad protsessi saab oluliselt vähendada.

Meie partnerid

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Võtke meiega ühendust!

Uudiskiri

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us