cellular spaceのホームページにご来訪くださり、ありがとうございます。
前田建設工業 情報システム の コズミkozumi.pngです。

 

 

 

【集計】のユーザ辞書(推論)と 【関数処理】clusteringText の違いを確認します。

 

 

この2つの機能は、どちらも推論の割合を入力します。

動作や結果は「ほぼ同じ」となります。 

 

 

では違いは・・・

【集計】のユーザ辞書(推論)は、ユーザ辞書(間柄・同義語辞書)を参照します。

それに対し、【関数処理】clusteringText は参照しません。

 

 

 

では、実際のプロセスで結果を見てみましょう。

・どちらも推論割合は「70%」とします。

 

・「商品名」を名寄せします。

 

・入力ファイルはこちら↓

集計の事例83.png

 

 

 

まずは、【集計】のユーザ辞書(推論)を見てみます。

 

 

プロセスをご覧ください。

【ファイル設定】→【縦結合】エレメントを追加します。

【縦結合】は、そのまま設定します。

集計の事例84.png

 

 

続いて、【集計】エレメントを追加します。

 

ここで、[キー属性] に名寄せしたい「商品名」を指定し、

ユーザ辞書(推論)の70%を設定します。

 

集計の事例85.png

 

 

結果はこちら ↓

集計の事例86.png

 

 

似たような「商品名」で名寄せしましたね。

 

 

 

次回は、【関数処理】clusteringText での動作を見てみます。

 

 

 

 

 

使用しているデータは、疑似データです。実在の人物や団体などとは関係ありません。