सांःकृितक, verbs nouns, वर्गीकृत करके काम करता है कि पाठ वर्गीकरण विशेषण के संदर्भ में, नहीं बस में.. पृथक खोजशब्दों
वर्गीकरण सेवा हमारे NaturalExtractor प्रौद्योगिकी का उपयोग कर बनाया गया है। यह पाठ एक पूर्वनिर्धारित वर्गीकरण के अनुसार अलग अलग श्रेणियों में वर्गीकृत किया।
इस डोमेन में वर्गीकरण का एक विशिष्ट उदाहरण होगा:
- अवधारणाओं "स्क्रीन", "मामला", "आवरण", "कैमरा", "बैटरी" सब केवल nouns के रूप में उत्पाद श्रेणी के हैं। "मैं मेरी नई जलाने आग पर स्क्रीन प्यार" या "मैं अपने iPad के लिए एक महान नए कवर खरीद लिया" जैसे वाक्यों उत्पाद वर्ग से संबंधित classifiedas हो जाएगा लेकिन वाक्य पसंद है "मैं इसे नफरत है जब वे सुरक्षा पर मेरी iPad स्क्रीन" या "मुझे आशा है कि वे अगले सप्ताह की समीक्षा में नई आकाशगंगा टैब को कवर करने के लिए जा रहे हैं" नहीं करते हैं।
एक विश्वसनीय वर्गीकरण प्रक्रिया के लिए, हमारी सेवा पहले गहरी भाषाई विश्लेषण संस्थाओं, अवधारणाओं और verbs का पता लगाने के लिए उपयोग करता है (उदाहरण के लिए "बराक ओबामा", "ग्लोबल वार्मिंग", "कीमतों में वृद्धि", "दूर ले")। पाठ के भाषाई प्रतिनिधित्व तब टेक्सॉनॉमी भंडार एक शब्दकोश के खिलाफ जाँच की है। जब एक शब्दकोश प्रविष्टि करने के लिए मेल खाती है एक शब्द या वाक्यांश पाठ में, उस प्रविष्टि के लिए श्रेणी पाठ करने के लिए असाइन किया गया है।
हम भी मदद कर सकता है आप किसी भी डोमेन के लिए अपने शब्दकोश के निर्माण प्रक्रिया bootstrap
यह प्रक्रिया प्रयुक्त शब्दों के अर्थ पर आधारित है और साधारण खोजशब्द मिलान पर निर्भर नहीं करता है। भाषाई रूपों कि शब्दों के रूपों को बदलने, लेकिन अपने कोर के अर्थ को बदल नहीं सही ढंग से नियंत्रित किया जाता है। इस भाषाई घटनाएं morphological रूपांतर (मूड, तनाव, लिंग, संख्या और व्यक्ति के अनुसार एक क्रिया के विभिन्न रूपों) जैसे और phrasal verbs ("से अधिक गूगल एप्पल लेता है लीड", "एप्पल इतालवी सॉफ्टवेयर स्टार्ट-अप से अधिक लेता है") जैसे वाक्यात्मक नियम शामिल हैं।
वर्गीकरण सेवा एक उपयोगकर्ता-दिए गए वर्गीकरण के साथ काम करता है, लेकिन अक्सर वहाँ कोई नहीं है पूर्व मौजूदा शब्दकोश या श्रेणियों है कि आसानी से एकीकृत किया जा सकता के कोश। उस मामले में हम नाटकीय रूप से समय और एक बनाने की लागत को कम करने के लिए एक सरल उपाय है। हमारी अवधारणा और एंटिटी निकासी सेवाएं बूट-पट्टा टेक्सॉनॉमी बिल्डिंग प्रक्रिया के लिए क्रम में लक्ष्य डोमेन से संबंधित दस्तावेजों का विश्लेषण करने के लिए इस्तेमाल किया जा सकता। दस्तावेजों का एक कोष से सबसे अधिक प्रासंगिक अवधारणाओं, संस्थाओं और verbs एक्स्ट्रेक्टिंग द्वारा शब्दों के लिए श्रेणियाँ असाइन करना की प्रक्रिया काफी कम हो सकते हैं।