言語的動詞、名詞、分類することによって動作するテキスト分類... コンテキストでは、だけではなく形容詞分離されたキーワード
分類サービスは、私たちの NaturalExtractor 技術を使用しています。それは、定義済みの分類に従ってさまざまなカテゴリにテキストを分類します。
このドメイン内の分類の典型的な例になる:
- 概念「画面」、「ケース」、「カバー」、「カメラ」、「バッテリ」すべてのみの名詞として、製品のカテゴリに属しています。文「大好き、スクリーン私の新しい Kindle の火災に」または「私は私 iPad 素晴らしい新しいカバー買ってきた"のような商品カテゴリーに属する分類されるだろうが、文章のように"私は嫌いだ」ときセキュリティで私の iPad を画面または"私は彼らの次の週のレビューの新しい銀河のタブをカバーするつもり願っています"しません。
信頼性の高い分類プロセスでは、当社のサービス最初に使用して深い言語解析エンティティ、概念および動詞を検出するために (例えば"バラク・オバマ"、「地球温暖化」「価格の上昇」,「離陸」)。テキストの言語表現し、分類を格納するディクショナリに対してチェックされます。単語または語句のテキストの辞書エントリに対応する、そのエントリのカテゴリはテキストに割り当てられます。
また助けをあなたの辞書の作成プロセスの任意のドメインをブートス トラップすることができます。
このプロセスは使用される単語の意味に基づいており、単純なキーワード マッチに依存しません。単語のフォームの変更がその中核的な意味を変更しない言語のバリエーションは正しく処理されます。これは形態学的変化 (さまざまな気分、緊張、性別、数人によると動詞) などの言語現象と統語規則動詞句 (「アップルは鉛以上の Google の」,「イタリア語ソフトウェア起動アップル引き継ぐ」) などが含まれます。
分類サービスはユーザーが指定した分類で動作しますが、しばしばはありません既存の辞書や辞典のカテゴリを簡単に統合することができます。その場合は時間と 1 つの作成のコストを大幅に削減のための簡単な解決策があります。私たちのコンセプトとエンティティ抽出サービス ブート ストラップ分類プロセス構築のためにターゲット ドメインに属するドキュメントを分析するために使用できます。ドキュメントのコーパスから最も関連性の概念、エンティティおよび動詞を抽出してカテゴリに言葉を割り当てるプロセスを大幅に削減することができます。