cellular spaceのホームページにご来訪くださり、ありがとうございます。
前田建設工業 情報システム の コズミkozumi.pngです。

 

 

 

【集計】のユーザ辞書(推論)と 【関数処理】clusteringText のまとめです。

 

 

前回の記事はこちら ⇒ 【集計の事例 第37回】ユーザ辞書(推論)とclusteringText(2)

 

 

 

【集計】のユーザ辞書(推論)と 【関数処理】clusteringText ですが、

推論割合を同じ割合にすれば、結果も同じになることがわかりました。

 

 

 

では、どのようなケースでこれらを使い分けるのか?です。

 

 

目安として・・・

間柄・同義語辞書(ユーザ辞書)を参照しながら名寄せしたい場合は、【集計】のユーザ辞書(推論)

すでに、名寄せする属性の値が整っているのであれば 【関数処理】clusteringText

  を選択します。

 

 

 

例えば、【集計】のユーザ辞書(推論)で 間柄・同義語辞書(ユーザ辞書)を参照しましょう。

 

設定した 間柄・同義語辞書の内容はコチラ↓

集計の事例91.png

 

 

【集計】エレメントの設定結果 を見てみましょう ↓

集計の事例92.png

 

 

「商品名」の "ピカピカバルーン 3000mm" は、

間柄・同義語辞書 の登録内容で、名寄せしています。

 ⇒【関数処理】clusteringText では名寄せできません!

 

 

 

このように、用途にあわせてつかいわけてください。

 

 

 

 

 

使用しているデータは、疑似データです。実在の人物や団体などとは関係ありません。