img1.jpg

日々の業務でExcel(エクセル)を使用する方は多いでしょう。さまざまな関数や機能を持つExcelは、単純な計算から複雑なデータのグラフ化までこなす便利なソフトウェアです。
高度なデータ分析でなければ、Excelを用いてデータ分析することも可能です。ここでは、Excelでデータ分析を行う際に知っておくべきスキルについてご紹介します。

データ入力の効率を上げる

img2.jpg例えば、どこかの店のデータ分析を行う場合、商品名や単価などをいちいち手入力して膨大な時間と手間をかけていませんか。また、データの量が膨大で、その中から欲しいデータを見つけ出すのに苦労された経験はありませんか。
そのような場合にVLOOKUP関数を利用しましょう。データ入力の手間が省け、簡単に欲しいデータの検索を行うことができます。
VLOOKUP関数を使用する前には、表とは別にデータの一覧表を用意しておく必要があります。一覧表に商品名や単価、商品IDなどを入力しておくことによって、表に商品IDを入力するだけで商品名や単価が自動で入力されるようになります。
また横方向に検索したい場合は、HLOOKUP関数を使用しましょう。HLOOKUP関数はVLOOKUP関数と使用方法はほとんど変わりませんが、縦方向に検索するVLOOKUP関数に対して、HLOOKUP関数は横方向に検索することが可能です。

累計を求める作業を簡単にする

電卓を使用しての細かい計算や累計を求める作業は難しく、計算ミスを起こす恐れがあります。例えば、A1?A10のセルの値の合計を求めたい場合、「=A1+A2+......A10」のように合計を求めていくのは手間と時間がかかり大変です。しかし、「=SUM(A1:A10)」のようにSUM関数を利用することによって、効率的に合計を求めることができます。
また、SUMIF関数DSUM関数を利用することによって、条件を付けて累計を求めることが可能です。SUMIF関数とは「SUMIF(範囲・検索条件・合計範囲)」の書式で使用し、範囲と検索条件によって指定したセルの合計値を返します。しかし、2つ以上の検索条件がある場合は集計を出すことができないため、そのような場合はDSUM関数を使用します。

視覚的にデータを分析する

img3.jpgこれまでデータ分析を行うためには、ある程度の手順を踏む必要がありました。まず表を作成し、その次にそれをどのように分析するかを考えます。効果的な分析方法を選ぶのは、高いスキルを必要とする作業です。
しかし、Excel2013にクイック分析機能が追加されたことによって、折れ線グラフなどのグラフを素早く作成したり、スーパークラインを作成してデータの推移を見ることができます。
Excel 2007やExcel 2010で分析ツールを利用する場合は、分析ツールアドインを組み込むことでデータ分析を行うことができます。

大量のデータ分析には分析ツールがおすすめ

関数やクイック分析機能などが使用できるExcelは、データ分析を行う際に非常に便利なツールです。しかしExcelは、データ量が一定のサイズを超えると読み込むことができません。そのため、Excelは大量のデータを扱う分析には向いていないと言えます。(Excelで取り扱えるデータの限度は1,048,576 行 x 16,384 列まで)POSデータやログデータのような膨大な数のデータを分析することは難しいでしょう。
AccessやMySQL、RDBMSなどのデータベース管理システムを利用することも1つの手ですが、SQR(DB言語)などの専門知識や学習が必要となるため、素人にはハードルが高くなります。
そこでおすすめなのが「分析ツール」です。分析ツールを使用することによって、大量にあるデータを高速に分析することが可能となります。

おわりに

ここまで、Excelでデータ分析を行う際に知っておくべきスキルをご紹介しました。Excelにある関数やクイック分析機能などの機能を活用することにより、作業効率を向上させることが可能です。Excelのスキルを習得して、ぜひデータ分析に役立ててください。また、データ分析ツールを使用するのも効果的な手段です。分析ツールは、大量のデータ分析も高速に行うことができ、高度な知識も必要としないため誰でも簡単に使用することができます。Excelと併用して分析ツールも活用してはいかがでしょうか。

img1.jpg

多くの企業は、顧客情報や商品の売れ行きなどのデータをもとにデータ分析を行い、今後の方針を定めています。しかし、使用するデータに誤りがあった場合、正しい分析結果を導き出すことができません。正しい分析結果を導き出すためには、分析前にデータ加工を行う必要があります。ここでは、初心者データサイエンティストが陥りやすいミスと、分析前のデータ加工の重要性についてご紹介します。

なぜデータ加工が必要になるのか

データ分析に使用するデータの中には極端な値のデータや、間違った内容のものが含まれている場合があります。分析の目的によってはこれらのデータを無視または軽視できる可能性もありますが、場合によってはこれらのデータが分析結果に大きな影響を与える恐れがあります。
分析前のデータに手を加えることに抵抗がある方もいると思いますが、正しい分析結果を導き出すためには、データ分析の前にデータ加工を行うことが重要です。初心者データサイエンティストが陥りやすいミスに注目しながら、データ加工の重要性について、今一度考えてみましょう。

異常値の取り扱いを誤る

img2.jpg初心者データサイエンティストが陥りやすいミスの中に、「異常値」の取り扱いを誤ったミスがあります。異常値とは、他のデータと比較して値がかけ離れているデータです。皆さんはデータ分析を行う際、収集したデータをそのまま使用していませんか。
分析の前には、まずデータの中に異常値がないか確認しましょう。
また、このほかにも異常値に関するミスとして、異常値の拡大解釈が挙げられます。異常値の拡大解釈は「きっとこうなるはずだ」「こうあって欲しい」などの、憶測や仮説に影響された考えから引き起こされます。正しい分析結果を導き出すため、客観的にデータと向き合いましょう。
異常値などの特徴的なデータを発見した際は、分析の目的によって加工または排除すべきか否かを判断する必要があります。また、異常値が多く見られる場合は、データの品質自体を疑うことも大切です。

比較対象の誤り

img3.jpgデータ分析の方法の1つに、複数のデータを比較して分析結果を導き出す方法があります。例えば、数多くの商品の販売数を比較することによって、生産量の指針を見出すことが可能です。
しかし、比較することができないデータを取り扱ってしまっては、正しい分析結果を導き出すことができません。例えば、「商品A」の価格と「商品B」の価格との間に大きな差がある場合、単に販売数を比較するだけでは正しい結果を得ることができません。そのため、複数のデータを比較する場合、分析の目的に応じて比較対象を慎重に見極める必要があります。初心者データサイエンティストはこの比較対象を誤りがちです。また、「商品の価格」と「販売数」など、本来比較できないデータを使用しているケースもあるため、注意しましょう。
複数のデータを比較してデータ分析を行う際は、「特徴選択」というデータ加工法を用いることをおすすめします。特徴選択とは、データベースの中から有益なデータのみを事前に選択することです。データ分析を行うにあたり、データの特徴は数が多いほど精度の高い分析結果が得られると思われがちです。しかし、特徴の数が多くなるにつれて冗長な特徴などの不要なデータが混入しやすくなるため、期待通りの結果は得られません。分析結果の精度を上げるためにも、特徴選択を行うことが必要になります。

表記の違い

同じ内容のデータであっても、表記が異なっていると無効値になる恐れがあります。例えば、「○○(株)」と「株式会社○○」は同じ内容ですが表記は異なります。このように表記の違いがあると、どちらか一方のデータが抜け落ちてしまいます。そのため、データ分析の前には、無秩序なデータを統一化・標準化(名寄せ)を行うことが大切です。名寄せを行うことによりデータの漏れを防ぎ、さらに重複したデータを排除することもできます。

おわりに

データ分析において、事前のデータ加工は必須です。しかし、扱うデータの量が膨大な場合、全て手作業で加工するのは相当な手間と時間がかかるため困難でしょう。そこで、データ分析ツールを使用することをおすすめします。
データ分析ツールはデータ加工を効率化するだけでなく、ヒューマンエラーの防止にも役立ちます。効率的なデータ分析を行うためにも、データ分析ツールの使用を検討してはいかがでしょうか。

img1

Excel(エクセル)やAccess(アクセス)は、データ分析やデータ管理を行う際に大変便利なソフトウェアです。しかし、膨大な情報量を扱う顧客管理においては、これらのソフトの使用により余計な手間が増えてしまったり、欲しい結果を得られなかったりする場合があります。
ここでは、Excel及びAccessで行う顧客管理の問題点についてご紹介します。

データの名寄せができない可能性がある

img2.jpg複数のデータベースにまたがるデータを同一の人物・企業・世帯ごとに統合することを「名寄せ」と言います。例えば、ワークショップを複数回開催し、参加者が各ワークショップ終了時にExcelのアンケート・フォーマットに氏名・住所・電話番号・意見や要望などを入力する場合を考えましょう。
この場合の名寄せとは、各ワークショップのアンケートデータを参加者ごとに整理することです。住所や電話番号などのデータが完全に一致している場合、名寄せは容易です。しかし、住所や電話番号の書き方がアンケートによって異なる場合、このままの状態では名寄せできないケースがあります。

具体的には、複数回のワークショップに参加した参加者が、ある回のワークショップのアンケートでは住所を「東京都豊島区〇〇」と記述し、別の回のアンケートでは「豊島区〇〇」と記述した場合、「東京都」という部分が抜けているためにデータを名寄せできないことがあります。

氏名の「斉藤、齊藤、斎藤」のような異体字の取り扱いも厄介です。

電話番号についても同様です。参加者の電話番号が、あるExcelシートには「0803XXXXXXX」と記述があり、別のシートには「080-3XXX-XXXX」と記述がある場合、正しくデータを名寄せできない可能性があります。特に旧住所や本籍、生年月日などの多数の個人情報を含む顧客情報では、名寄せに失敗する可能性が高まります。

名寄せをする前のデータ・クレンジング

アンケート実施前に回答者に表記統一の周知を行うことにより、名寄せに失敗する可能性は減らせるものの、ゼロにすることはできません。アンケート回答者が指示を見落としたり、従わなかったりして、必ずしもすべてのデータの表記が統一されるわけではないためです。
そのため、適切に名寄せするためにはデータ・クレンジング(Data Cleansing)が必要です。データ・クレンジングとは、データの誤りや重複を排除して整理することを指します。先のアンケートのケースでは住所や電話番号などの表記を統一させ、同一人物のデータを完全に一致させることです。

例えば、ハイフンを含まない電話番号とハイフンを含む電話番号の2つが混在するケースでは、ExcelのSUBSTITUTE関数を利用してハイフンを削除することにより、ハイフンを含まない電話番号に統一する必要があります。

データ加工ツールの導入でクレンジングを効率化

img3.jpg少数のデータをクレンジングすることは比較的容易です。しかし、多数のデータをクレンジングする場合、膨大な時間がかかります。さらに人為的なミスにも注意が必要です。手作業でデータのクレンジングを行う場合、データの量が多いほどミスの可能性が高まります。ミスによって名寄せされないデータが生じた場合、クレンジングに費やした時間が無駄になるだけでなく、誤った結果が出てしまいます。

では、名寄せを正しく迅速に実施するためには、どのようにクレンジングすれば良いのでしょうか。
この問題を解決するにはデータ加工ツールを導入すると良いでしょう。データ加工ツールとは、煩雑なクレンジングの作業の手間を減らし、データの品質向上を図るツールです。このツールではGUIによる直観的な操作でデータの変換・加工・抽出を行うことができます。

おわりに

ここまで、ExcelやAccessで行う顧客管理の問題点についてご紹介しました。近年では膨大な情報「ビッグデータ」の活用が企業の競争力を左右すると言われています。保有する情報をビジネスの現場に生かすためには膨大なデータを蓄積するだけでなく、データを常に「使える状態」に保つ必要があります。
その際、データ加工ツールは心強い助けとなるでしょう。貴重なデータを眠らせていないか、再確認してみましょう。