Categoreiddio testun

Categoreiddio testun gweithio'n ieithyddol gan ddosbarthu berfau, enwau, ansoddeiriau... mewn cyd-destun, nid yn unig yn ynysig allweddeiriau


Adeiladwyd y gwasanaeth categoreiddio gan ddefnyddio technoleg ein NaturalExtractor. N yn dosbarthu testun i wahanol gategorïau yn ôl tacsonomeg rhagddiffiniedig.


Byddai yn enghraifft nodweddiadol o gategoreiddio yn y parth hwn:

  • Y cysyniadau "sgrin", "achos", "cyflenwi", "camera", "batri" pob un yn perthyn i gategori'r cynnyrch fel enwau yn unig. Brawddegau fel "Rwyf wrth fy modd y sgrin ar fy Kindle tân newydd" neu "Rydw i wedi prynu gorchudd newydd gwych ar gyfer fy iPad" byddai classifiedas yn perthyn i gategori'r cynnyrch ond brawddegau yn hoffi "Yr wyf yn casáu ei pan maent yn sgrinio fy iPad ar ddiogelwch y" neu "Gobeithio y maent yn mynd i dalu am y Galaxy Tab newydd yn adolygiad yr wythnos nesaf" na hynny.


Ar gyfer proses categoreiddio dibynadwy, defnyddio ein gwasanaeth gyntaf dadansoddiad ieithyddol dwfn i ganfod endidau, cysyniadau a berfau (e.e. "Barack Obama", "cynhesu byd-eang", "gynyddu prisiau yn", "yn cymryd oddi ar"). Yna mae y gynrychiolaeth ieithyddol o'r testun yn gwirio erbyn geiriadur sy'n storio'r tacsonomeg. Pan air neu ymadrodd yn y testun yn cyfateb i'r mynediad geiriadur, pennir y categori ar gyfer cofnod hwnnw i'r testun.


Gallwn hefyd helpu eich bootstrap eich proses creu geiriadur ar gyfer unrhyw parth


Broses hon yn seiliedig ar ystyr y geiriau a ddefnyddir ac nad yw'n dibynnu ar baru allweddair syml. Ymdrinnir ag amrywiadau ieithyddol sy'n newid y mathau o eiriau ond nad ydynt yn newid eu hystyr craidd gywir. Mae hyn yn cynnwys rheolau cystrawennol fel berfau phrasal ("arwain afal yn cymryd dros Google", "Afal yn cymryd dros meddalwedd Eidalaidd cychwyn busnes") a ffenomena ieithyddol fel amrywiad morffolegol (gwahanol fathau o ferf yn ôl hwyliau, amser y ferf, rhywedd, nifer a person).


Mae'r gwasanaeth categoreiddio yn gweithio gyda tacsonomeg a ddarperir gan y defnyddiwr, ond yn aml nid oes unrhyw geiriadur eisoes na'r thesawrws o'r categorïau hynny'n hawdd y gellir eu hintegreiddio. Yn yr achos hwnnw gennym yn ateb syml i leihau'n sylweddol yr amser a'r gost o greu un. Gellir defnyddio ein gwasanaethau echdynnu cysyniad a endid i ddadansoddi dogfennau sy'n perthyn i'r parth targed er mwyn cist-strap y broses adeiladu tacsonomeg. Gan echdynnu'r cysyniadau, endidau a berfau mwyaf perthnasol o'r corpws o'r dogfennau yn llawer llai y broses o bennu geiriau i gategorïau.

Ein partneriaid

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Cysylltwch â ni!

Cylchlythyr

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us