cellular spaceのホームページにご来訪くださり、ありがとうございます。
前田建設工業 情報システム の コズミkozumi.pngです。

 

 

 

【集計】のユーザ辞書(推論)と 【関数処理】clusteringText の違いの確認の続きです。

 

 

前回の記事はこちら ⇒ 【集計の事例 第36回】ユーザ辞書(推論)とclusteringText(1)

 

 

  

では、【関数処理】clusteringText を見てみます。

 

 

プロセスをご覧ください。

【ファイル設定】→【縦結合】エレメントを追加します。ここまでは、前回と同じです。

(点線の箇所が前回と異なります。)

  

集計の事例87.png

 

 

続いて、【集計】エレメントを追加します。

 

ここで、【関数処理】clusteringText を追加し、「商品名」でクラスターを作成します。

割合は「70%」です。 

集計の事例88.png

 

 

さらに【横結合】エレメントを追加します。

ここでは、先の【集計】の【関数処理】clusteringText の結果で名寄せします。

これは、前回の結果と比較するための処理となります。

 

集計の事例89.png

 

 

 

結果はこちら ↓

集計の事例90.png

 

 

「商品名」に対し、

【関数処理】clusteringText を指定した属性で名寄せ していますね。

 

 

エレメントの組み合わせは異なりますが、

前回(【集計】のユーザ辞書(推論))と「同じ名寄せ結果」が得られました。

 

 

 

次回は、【集計】のユーザ辞書(推論)と【関数処理】clusteringText のまとめです。

 

 

 

 

 

使用しているデータは、疑似データです。実在の人物や団体などとは関係ありません。