Phân loại văn bản

Phân loại văn bản hoạt động ngôn ngữ bằng cách phân loại động từ, danh từ, tính từ... trong bối cảnh, không chỉ cô lập từ khóa


Dịch vụ phân loại được xây dựng bằng cách sử dụng công nghệ NaturalExtractor của chúng tôi. Nó phân loại văn bản vào các thể loại khác nhau theo một phân loại được xác định trước.


Một ví dụ điển hình của phân loại trong lĩnh vực này sẽ là:

  • Các khái niệm "màn hình", "trường hợp", "bao gồm", "máy ảnh", "pin" tất cả thuộc về các loại sản phẩm như là từ tiếng Anh chỉ. Câu như "Tôi thích màn hình của tôi mới Kindle cháy" hoặc "Tôi đã mua một tuyệt vời mới bao gồm cho iPad của tôi" sẽ là classifiedas thuộc danh mục sản phẩm nhưng câu như "Tôi ghét nó khi họ màn hình iPad của tôi tại an ninh" hoặc "Tôi hy vọng họ sẽ bao gồm Galaxy Tab mới trong tuần tới xét" thì không.


Cho một quá trình phân loại đáng tin cậy, chúng tôi dịch vụ đầu tiên sử dụng phân tích sâu ngôn ngữ để phát hiện các thực thể, khái niệm và động từ (ví dụ: "Barack Obama", "sự nóng lên toàn cầu", "tăng giá", "cất cánh"). Các đại diện ngôn ngữ của các văn bản sau đó là kiểm tra đối với một từ điển mà các cửa hàng phân loại. Khi một từ hoặc cụm từ trong văn bản tương ứng với một mục từ điển, thể loại cho mục đó được gán cho các văn bản.


Chúng tôi cũng có thể giúp anh bootstrap quá trình sáng tạo từ điển của bạn cho bất kỳ tên miền


Quá trình này dựa trên ý nghĩa của các từ được sử dụng và không dựa vào từ khóa đơn giản phù hợp với. Biến thể ngôn ngữ mà thay đổi hình thức từ nhưng không làm thay đổi ý nghĩa cốt lõi của họ được xử lý một cách chính xác. Điều này bao gồm ngôn ngữ hiện tượng như hình thái học biến thể (hình thức khác nhau của một danh từ theo tâm trạng, căng thẳng, giới tính, số và người) và các qui tắc cú pháp như cụm động từ ("Apple mất dẫn trên Google", "Apple mất hơn ý phần mềm khởi động").


Dịch vụ phân loại hoạt động với một phân loại cung cấp người sử dụng, nhưng thường có là không có sẵn từ điển hoặc từ điển của thể loại mà có thể dễ dàng tích hợp. Trong trường hợp đó, chúng tôi có một giải pháp đơn giản để giảm thiểu đáng kể thời gian và chi phí của việc tạo ra một. Các khái niệm và thực thể khai thác dịch vụ có thể được sử dụng để phân tích các tài liệu thuộc vùng mục tiêu để dây đeo khởi động quá trình xây dựng phân loại. Bằng cách chiết các khái niệm có liên quan nhất, các thực thể và động từ từ corpus tài liệu quá trình gán từ danh mục có thể được giảm đáng kể.

Đối tác của chúng tôi

itresearches Discover our Technology Demonstrations : http://t.co/Bm1s6kIFub http://t.co/9JcATBDbUc

Nhận được liên lạc với chúng tôi!

Bản tin

Address

Address:
34 New House, 67-68 Hatton Garden, London, England, EC1N 8JY, City of London
Toll(UK):
+448000786364
Fax(UK) :
+448458520997

About Us

IT Researches ltd is an information technology company & International computer research centre offering a wide variety of 'AI Powered™' IT services for companies and researchers worldwide .

Connet With Us