連続と不連続(Continuous and Discrete)

2015/12/04 16:35 Shingo 2 Comments

こんにちは、Kaoriです。
TC Las Vegas, Tokyoとでドタバタしていたらブログすっかりご無沙汰になっておりました。。。

さて、気を取り直して今回は連続と不連続についての記事です!!



連続と不連続といえば、なんとなく概念的にわかっている人もいるでしょうし、全然知らないという方もいらっしゃるかと思います。ですが具体的にどう動きが変わるのか、というところはあまり知られていないのかな、と思ったので解説してみます。

連続と不連続は日付に限った話ではないのですが、今回はわかりやすい例なので日付を使っていきたいと思います。
まずは日付についておさらいしていきましょう。


Tableauで何も考えずに日付をドラッグ&ドロップして月だけを表示するとこんな感じになると思います。


月を右クリックして中を覗いてみるとこうなっています。
なぜか年、四半期、月、日という同じ項目が二つずつ並んでいます。
これはどう使い分けたらいいでしょう? 使い始めの時期は戸惑うポイントじゃないかと思います。


今選んでいる月は上にある月です。
右に書いてある凡例に注目していただきたいのですが5月と記載されていて、つまりここには年の情報が入っていないということがわかります。
したがって今出ている折れ線グラフは月ごとの集計値の推移、つまり複数年分のデータがあったとしたらそれらすべての年の1月の売上、すべての年の2月の売上・・・といった形で集計されています。
ここに列や行や色などといった箇所に年を入れてあげればそれぞれの年の売上を出すことができますが、それはまた別のお話・・・


さて、ここでみなさんに注目していただきたいのは下の方にある「不連続」に●がついているということです。
この値は不連続なんですね。


では、もう一つの月と見比べてみましょう。

下側の月を選んでいます。

こちらは「連続」に●がついています。

連続と不連続の違い、というのは年月でもてるか月単体で持つか、といったことではないんです。
それはあくまでTableauでよく使うからこういう選択肢を用意しているだけで、実は年月の情報を持っていたとしても不連続に変換することは可能です。
不連続に変えるとこんな感じで年月の推移を不連続で見ることができます。


じゃあ連続と不連続の違いってなんなの????
ということになると思いますが、まずは見た目の違いから押さえていきましょう。

【連続の場合】


【不連続の場合】


違いその1: ピルの色が違う(連続=緑、不連続=青)
違いその2: グリッド(連続=あり、不連続=なし)
違いその3: 年月の表示方法(連続=軸(目盛り)、不連続=ラベル)

見た目はこんな違いがありますね。
では概念的にどう違うのかおさえていきましょう。


日付って時間で、時間は過去から未来へと流れていきますよね。この時系列の流れを変えることはできない、連続値というのはその特性を受け継いでいます。
数値の場合も同じです。1、2、3、4、5、6、7、8・・・と進んでいく数字の順番を数字の意味として変えることは不可能ですよね。
それからもうひとつ、その値は見栄え上分かれているように見えるかもしれませんが、時間だろうと数字だろうと、ずーっとつながっているものですよね(1から2の間には1.5があったり1.99999999・・・があったり・・・)。連続値というのは分断されていなくて、つながった一本の線なんです。

だから連続を列や行に持ってきたときには、そのつながった流れの上にのせてプロットしていることになります。

では連続を不連続に変換するとどうなるでしょうか?

日付や数値だった場合は、これを所定の単位で分断してバケツに入れ、名前(ラベル)をつけているというイメージです。
これはもはや繋がっていません。名前は同じ2011年1月ですが、全く違う性質を持っています。
2011年1月と2011年2月は明確な区分で持って分断され、つながったものではなくなっているんです。
そしてこの情報は名前として理解されているので、2011年1月が2011年2月より前に存在する、という情報はなくなっています。

ではこれらの性質を理解したうえで、Tableau上での動きの違いを見ていきましょう。
たとえばリファレンスラインを引いてみます。


連続値は繋がった線なので、リファレンスラインを入れることができます。

不連続にしてしまうと線を入れられません。
ラベルで分けられたものに線を入れることに意味がないからですね。


では不連続ではどういうことができるでしょう?

バケツを作ってラベルとして切り分けた状態でなので、もう時系列の順に並べなくても表示できます。
したがって売上順に並べ替えたりすることが可能です。

2014年9月がもっとも売り上げが高い月だったことが並べ替えでわかります。

連続値の年月は時間という概念をもった順番の決まっているものなので、売上順に並べ替えたりすることはできません。


いかがでしたでしょうか?
連続と不連続、ちょっと難しいと思われがちな内容ですが、できるだけわかりやすく説明できたらと思って書いてみました。
参考になる情報があれば嬉しいです!

Kaori

2 件のコメント:

  1. このコメントは投稿者によって削除されました。

    返信削除
  2. 勉強になりました。ありがとうございます。

    返信削除