Pengkategorian teks

Pengkategorian teks yang berfungsi secara Linguistik dengan mengelaskan kata kerja, kata benda, kata sifat Bahasa... dalam konteks, bukan sahaja diasingkan kata kunci


Perkhidmatan pengkategorian dibina menggunakan teknologi NaturalExtractor kami. Mengkelaskan teks ke dalam kategori yang berbeza mengikut taksonomi yang telah ditetapkan.


Contoh pengkategorian dalam domain ini ialah:

  • Dalam konsep "skrin" "kes", "merangkumi", "kamera", "bateri" Semua kepunyaan kategori produk sebagai perkataan sahaja. Ayat seperti "Saya suka skrin terakhir saya baru Kindle Fire" atau "Saya sudah membeli perlindungan baru yang hebat untuk iPad saya" akan classifiedas kepunyaan kategori produk tetapi ayat seperti "Aku benci bila mereka di skrin iPad saya Keselamatan" atau "Saya harap mereka akan menutup Tab Galaxy baru dalam kajian minggu depan" tidak.


Proses pengkategorian yang boleh dipercayai, Perkhidmatan kami mula-mula menggunakan analisis linguistik yang mendalam untuk mengesan entiti, konsep dan perkataan (cth: "Barack Obama", "pemanasan global", "meningkatkan harga", "mengambil"). Perwakilan Linguistik teks kemudian disemak terhadap kamus yang menyimpan taksonomi. Apabila perkataan atau frasa dalam teks sepadan dengan entri kamus, kategori untuk entri yang diperuntukkan kepada teks.


Kami juga boleh membantu anda bootstrap proses penciptaan kamus anda untuk domain mana-mana


Proses ini adalah berdasarkan makna perkataan-perkataan yang digunakan dan tidak bergantung kepada kata kunci yang mudah yang sepadan. Variasi bahasa yang mengubah bentuk-bentuk kata-kata tetapi tidak mengubah makna teras mereka diuruskan dengan betul. Ini termasuklah fenomena Linguistik seperti abdi sendiri variasi (berbeza bentuk-bentuk kata kerja mengikut mood, tegang, jantina, nombor dan orang) dan peraturan-peraturan Perbendaharaan katanya seperti kata frasa kerja ("Apple mengambil membawa ke atas Google", "Apple mengambil ke atas permulaan perisian Itali").


Perkhidmatan pengkategorian berfungsi dengan taksonomi pengguna yang dibekalkan, tetapi sering ada tiada kamus yang sedia ada atau juga kategori yang boleh diintegrasikan dengan mudah. Dalam kes ini, kami mempunyai satu penyelesaian yang mudah bagi secara dramatik mengurangkan masa dan kos untuk mewujudkan satu. Perkhidmatan pengeluaran kami konsep dan entiti yang boleh digunakan untuk menganalisis dokumen kepunyaan domain sasaran supaya proses pembinaan taksonomi tali but. Dengan mengeluarkan konsep-konsep, entiti dan kata kerja yang paling relevan dari corpus dokumen proses memberi kata-kata untuk kategori boleh ketara dikurangkan.

Rakan kongsi kami

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Hubungi kami!

Newsletter

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us