関数-日付【normalizedateUS】

normalizedateUS

日付をMM/DD/YYYYの形式で返します。

 (Y:年 M:月 D:日)

 

- パラメータ -

 0:対象とする属性

 

- 例 -

平成26年01月31日 ⇒ 01/31/2014

14年1月1日 ⇒ 01/01/2014

 

関数-日付【subtraction】

subtraction

二つの属性に記述された日付の差を指定した単位で返します

 

- パラメータ -

 0:対象とする属性

 1:比較する属性。

 2:Y:年 M:月 D:日

 

- 例 -

引数2を"D"(日)

2014/4/1 , 2013/5/31 ⇒ 215

 

引数2を"M"(月)

2014/4/1 , 2013/5/31 ⇒ 8

関数-日付【subtractionToday】

subtractionToday

属性に記述された日付と今日の差を指定した単位で返します。

 

- パラメータ -

 0:対象とする属性

 1:Y:年 M:月 D:日

 

- 例 -

引数2を"Y"(年) ※2015/10/16

2014/4/1 ⇒ -1

関数-日付【weekOfMonth】

weekOfMonth

日付をその月の何週目であるかを示します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2013/6/1 ⇒ 6月1週目

2013/5/30 ⇒ 5月5週目

関数-日付【weekOfYear】

weekOfYear

日付をその年の何週目であるかを示します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2013/6/1 ⇒ 2013年22週目

2013/5/30 ⇒ 2013年22週目

関数-日付【year】

year

日付を年で示します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2013/6/1 ⇒ 2013年

平成26年1月01日 ⇒ 2014年

jnounphrase

属性に含まれる文字列から名詞のみ抽出します。抽出された名詞はスペースで区切ります。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

志津川トンネル東工区着工式 ⇒ 志津川 トンネル 東 工区 着工式

3年半ぶりの飯田橋に想う ⇒ 3年 半ぶり 飯田橋

normalizeaddress

属性に含まれる住所をクレンジングします。記述抜けや誤記により推論を行った場合は、#を付与します

 

- パラメータ -

 0:対象とする属性

 

- 例 -

東京都千代田区飯田橋一ノ十二ノ七 ⇒ 東京都 千代田区 飯田橋 1-12-7

千代田区富士見2丁目10番2号 ⇒ #東京都 千代田区 富士見 2-10-2

東京都練間区高松5?8?2 ⇒ #東京都 練馬区 高松 5-8-20

normalizeaddresslite

属性に含まれる住所を簡易的なクレンジングをします。住所辞書を使用せずに記述ルールのチェックのみのため、normalizeaddressよりも高速に処理することができますが、誤記や記述抜けに対処できません。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

東京都千代田区飯田橋一ノ十二ノ七 ⇒ 東京都 千代田区 飯田橋 1 12 7

※記述抜け

千代田区富士見2丁目10番2号 ⇒ 千代田区 富士見 2 10 2

※誤記

東京都練間区高松5?8?2 ⇒ 東京都 練間区 高松 5 8 20

normalizecompany

商業登記規則に基づきクレンジングを行います。実在する企業名等のチェックは行いません。また、事業所および部署の記述が存在する場合は、自動的にスラッシュ区切りで分離します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

前田建設工業(株) ⇒ 前田建設工業株式会社

前田建設工業カ) 情報SSC ⇒ 前田建設工業株式会社/情報SSC

normalizecompanyExtCorp

商業登記規則に基づきクレンジングを行い、事業所および部署の記述が存在する場合は法人名のみ抽出します。実在する企業名等のチェックは行いません。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

前田建設工業(株) 関西支店⇒ 前田建設工業株式会社

前田建設工業カ) 情報SSC ⇒ 前田建設工業株式会社

normalizecompanyExtPoB

事業所および部署の記述のみ抽出します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

前田建設工業(株) 関西支店⇒ 関西支店

前田建設工業カ) 情報SSC ⇒ 情報SSC

normalizename

「斉藤」「斎藤」「齋藤」と幾つかの異なる字体(異体字)を異体字辞書に基づきクレンジングをします。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

斎藤 ⇒ 斉藤

廣田 ⇒ 広田

normalizephonenumber

電話番号をクレンジングをします。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

03(1234)5678 ⇒ 0312345678

03-1234-5678 ⇒ 0312345678

normalizenumber

漢数字を含む数字をクレンジングをします。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

弐拾参万四千 ⇒ 234000

二百五十四は254 ⇒ 254は254

normalizepostcode

郵便番号をクレンジングをします。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

〒123-4567 ⇒ 1234567

関数-分析・調査【K-Means++】

K-Means++

対象属性(X)と対象属性(Y)からK-Means++法によるクラスターを生成します。

 434px-KMeans-Gaussian-data.svg.png

K-means separates data into Voronoi-cells, which assumes equal-sized clusters (not adequate here)

345px-KMeans-density-data.svg.png

K-means cannot represent density-based clusters

画像引用元

- パラメータ -

 0:対象とする属性(X)

 1:対象とする属性(Y)。

 2:クラスタ数

 

- 例 -

K-means1.JPG

 引数2に"3"を設定してK-Means++を実行

K-means2.JPG

上記結果をExcelでグラフを作成しました

K-means4.JPG

clusteringText

対象属性内の文字列を近似アルゴリズムによりクラスターを生成します。クラスターの生成には、近似値の閾値(0-100)を設定することで自由に集合させることができます。

 

※近似アルゴリズムは、Damerau-Levenshtein距離を拡張し、挿入・削除・置換・転置のほかに連続性と距離を加えた新しい手法を採用しています。

 

 1)前田建設工業 関西支店 ⇔ 前田建設工業 関東支店 90%

 2)前田建設工業 関西支店 ⇔ 前田建設 関東支店    52%

 3)前田建設工業 関西支店 ⇔ 建設工業 関西支店    34%

※近似値は表示されません

上記の例では、閾値を80に設定すれば、1)のみ同じ集合になります。閾値を40に設定すれば、1)と2)が同じ集合になります。

 

- パラメータ -

 0:対象とする属性

 1:閾値(0-100)

 

- 例 -

引数1に"40"

前田建設工業 関西支店 , Cluster-0

前田建設工業 関東支店 , Cluster-0

前田建設 関東支店 , Cluster-0

建設工業 関西支店 , Cluster-1

関数-分析・調査【count】

count

対象属性内の文字列に指定した文字列が、いくつ含まれているか数えます。

  

- パラメータ -

 0:対象とする属性

 1:数える文字列

 

- 例 -

引数1に"にわ"

うわにわにはにわにわとりがいる ⇒ 3

関数-分析・調査【dataPattern】

dataPattern

対象属性内の文字列を元にパターン化します。

  

- パラメータ -

 0:対象とする属性

 

- 例 -

K01-3567 ⇒ WDD-DDDD

K1-3567 ⇒ WD-DDDD

ipContinentName

対象属性内のグローバルIPから地域を取得します

  

- パラメータ -

 0:対象とする属性

 

- 例 -

211.129.5.10 ⇒ アジア

207.46.13.51 ⇒ 北アメリカ

ipCountryName

グローバルIPアドレスから国名を取得します。

  

- パラメータ -

 0:対象とする属性

 

- 例 -

211.129.5.10 ⇒ 日本

207.46.13.51 ⇒ アメリカ合衆国

関数-分析・調査【length】

length

文字数の長さを取得します。

  

- パラメータ -

 0:対象とする属性

 

- 例 -

ABC ⇒ 3

wordFrequency

日本語文書の解析から語句の出現頻度を取得します。パターンは、{語句1}_{出現数1} , {語句2}_{出現数2} , ・・・

  

- パラメータ -

 0:対象とする属性

 

- 例 -

契約を進めることになった。12月に本契約。⇒ 契約_2、12月_1

textDistance

対象属性内の文字列を近似アルゴリズムにより、近似値を求めます。

 

※近似アルゴリズムは、Damerau-Levenshtein距離を拡張し、挿入・削除・置換・転置のほかに連続性と距離を加えた新しい手法を採用しています。

- パラメータ -

 0:対象とする属性

 

- 例 -

前田建設工業 関西支店 ⇔ 前田建設工業 関東支店 90%

前田建設工業 関西支店 ⇔ 前田建設 関東支店    52%

前田建設工業 関西支店 ⇔ 建設工業 関西支店    34%

関数-分析・調査【unitAvg】

unitAvg

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性のそれぞれに平均値を求めます。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitAvg.JPG

関数-分析・調査【unitCount】

unitCount

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性のそれぞれの件数を求めます。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 ※20161028(追記) 

Ver1.37から引数0の入力は不要になりました。また、引数1の未設定が可能になり、全レコード数が表示されます。

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitCount.JPG

unitFrequency

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性の文字列の頻度からランキングを作成します。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base2.JPG

 - 引数0に"駅名"、引数1に"会社"を設定 -

UnitFrq.JPG

関数-分析・調査【unitJoin】

unitJoin

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性の文字列のをコンマで接続した文字列を作成します。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base2.JPG

 - 引数0に"駅名"、引数1に"会社"を設定 -

UnitJoin.JPG

関数-分析・調査【unitMax】

unitMax

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性に含まれる数値の最大値を取得します。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitMax.JPG

関数-分析・調査【unitMin】

unitMin

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性に含まれる数値の最少値を取得します。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitMin.JPG

関数-分析・調査【unitMode】

unitMode

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性に含まれる数値の最頻値を取得します。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitMode.JPG

関数-分析・調査【unitPersent】

unitPersent

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性のそれぞれに百分率を求めます。

クラスタ―内の最大値が100となります。小数点1桁まで出力されます。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitPersent.JPG

関数-分析・調査【unitSum】

unitSum

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性の値の合計値を求めます。

 

- パラメータ -

 0:対象とする属性

 1:グループ属性

 

- 例 -

元データ

 Unit_base.JPG

 - 引数0に"交通費"、引数1に"会社"を設定 -

UnitSum.JPG

関数-日付【getDate】

getDate

日付のみを取得します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/15 ⇒ 2015/12/15

10:01:15 ⇒ {空}

2015/12/15 10:01:15 ⇒ 2015/12/15

関数-時刻【normalizetime】

normalizetime

時刻を24時間制の HH:mm:ssにします。、日付が有った場合は、スラッシュ区切りになります。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/16 午前08時08分08秒 ⇒ 2015/12/16 08:08:08

2015年12月16日 08:08午前 ⇒ 2015/12/16 08:08:00

平成27年12月16日 08:08AM ⇒ 2015/12/16 08:08:00

関数-時刻【hour】

hour

時間を取得します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/16 午前08時08分08秒 ⇒ 8

平成27年12月16日 08:08PM ⇒ 20

関数-時刻【minute】

minute

分を取得します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/16 午前08時08分08秒 ⇒ 8

関数-時刻【second】

second

秒を取得します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/16 午前08時08分08秒 ⇒ 8

関数-時刻【isTime】

isTime

時間であるかどうかをチェックします。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

99:99:99 ⇒ FALSE

03:06:33 ⇒ TRUE

関数-時刻【addTime】

addTime

時間:分:秒を加算します。

 

- パラメータ -

 0:対象とする属性

 1:加算する時

 2:加算する分

 3:加算する秒

 

 

- 例 -

引数1:1 引数2:0 引数3:0

2015/12/16 午前08時08分08秒 ⇒ 2015/12/16 09:08:08

関数-時刻【addNow】

addNow

現在の時刻に加算します。

 

- パラメータ -

 0:加算する時

 1:加算する分

 2:加算する秒

 

- 例 -

引数1:1 引数2:0 引数3:0

{現在時刻(2015/12/16 08:08:08)} ⇒ 2015/12/16 09:08:08

関数-時刻【morningOrAfternoon】

morningOrAfternoon

午前か午後か判定します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/16 午前08時08分08秒 ⇒ AM

平成27年12月16日 20:24:36 ⇒ PM

関数-時刻【subtractionTime】

subtractionTime

時間の差を取得します。

 

- パラメータ -

 0:対象とする属性

 1:差を求める属性。

 2:単位。4種類から選択(H=時、M=分、S=秒、A=自動) 

 

- 例 -

引数2:H

2015/12/15 11:30:35 ⇔ 2015/12/15 12:30:35 ⇒ -1

引数2:S

2018/1/6 11:19:29 ⇔ 2015/12/15 12:30:35 ⇒ 1897200

引数2:A

2015/12/16 2:16:15 ⇔ 2015/12/15 12:30:35 ⇒ 13:45:40

関数-時刻【subtractionNow】

subtractionNow

現在の時間との差を取得します。

 

- パラメータ -

 0:対象とする属性

 1:単位。4種類から選択(H=時、M=分、S=秒、A=自動) 

 

- 例 -

引数1:A

2015/12/15 12:30:35 ⇒ -527:15:26

関数-時刻【getTime】

getTime

時刻のみを取得します。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2015/12/15 ⇒ {空}

10:01:15 ⇒ 10:01:15

2015/12/15 10:01:15 ⇒ 10:01:15

statisticFrequency

 

指定された頻度データを整理します。

 

指定された属性内の全データの頻度出現回数を降順のコンマ区切りで出力します。

 

- パラメータ -

 [対象属性]

  (関数「wordFrequency」を指定した属性、

  もしくは【集計属性設定】画面で「頻度」を指定した属性を指定してください。)

 [引数1](無し)

 

- 例 -

 元データ ・・・ 【集計属性設定】画面で「頻度」を指定した属性

 01.PNG

 - 結果 -

 02.PNG

関数-分析・調査【unitMedian】

unitMedian

 

指定したグループ属性(No.1属性)の値からクラスターを作り、対象属性に含まれる数値の中央値を取得します。

 

 

- パラメータ -

 [対象属性] 対象とする属性

 [引数1] グループ属性

 

- 例 -

 元データ

 03.PNG


 - 結果 [対象属性]に"交通費"、[引数1]に"会社"を設定 -

 

  右側の属性が結果です。

04.PNG

関数-クレンジング【yomigana】

yomigana

 

漢字と平仮名をカタカナに変換します。変換できない文字 はそのまま出力します。

 

- パラメータ -

 0:対象とする属性。

 

- 例 -

前田たろう ⇒ 前田タロウ

関数-日付【dayOfWeek】

weekOfYear

日付の曜日(日本語)を出力します。

時刻のみの場合は、1970/01/01(固定)の曜日となります。

 

- パラメータ -

 0:対象とする属性

 

- 例 -

2016/10/1 ⇒ 土曜日