自分を活かして 相手を活かして 今を活かす

【シンキングタイム】グラフや数値から何を読み取る?

こんにちは、おかちゃんせんせいです!

2023年8月13日現在、台風7号が日本縦断するとかしないとかで騒いでいます。

そんな台風の予測はどのようにして実施され、どのくらいの精度なのか気になって調べてみました。

◆お知らせ◆

【まとめ記事】

現在、これまで書いてきた記事をテーマ別にまとめています。

詳しくはこちらから

台風の予測方法

これは本題ではないので、気象庁に書かれている内容をそのまま引用します。

気象庁では、国内だけでなく、世界各国で行われる地上や上空の観測データを活用した数値予報を用いて将来の大気の状態を予想しています。スーパーコンピュータを用いて、地球全体の大気の状態のこれからの変化をシミュレーション技術で計算し、明日、明後日、・・・一週間後の大気の状態を求めることができるということです。

気象庁より引用

現在の各国の予測モデルによる台風の進路経路については、こちらのサイトで確認できます。

予測の精度

ここからが本題。
実際の予測精度についても気象庁の情報を参考にしてみたいと思います。

まず、台風進路予報(中心位置の予報)の年平均誤差についての表は下図になります。

参照先:気象庁

これだけをみた時に、グラフから伝わってくることは、
・年々誤差は減っていること
・予報時間が短いほど精度は良いこと
かと思います。

おそらく誰が見てもそう感じるかもしれません——が、
グラフを読み取る時には見た目だけで判断するのはNGです。

グラフを見るときにしっかり確認しなければならないのは、
今回の場合は3つのポイントです。

  1. 数値は平均値であること
  2. 100kmの誤差が意味するところ
  3. 標本数(母数)がどのくらいあるのか

1つ目が「数値は平均値であること」です。
まず大前提として平均値はあくまで数値の合計値を総数で割っただけのものであって、その数値は何も特徴や意味はありません

これがものすごく大事なポイント。

たし合わせた数値自体にはそれぞれ特徴や意味するところはあります。
例えば、ある3人の体重がAくん(45kg)、Bくん(54kg)、Cくん(51kg)だったとすると——平均値を計算すると50kgになります。
では、この50kgは何を意味しているでしょうか?

誰かの体重ではなく、ただの50kgという数値です。

なぜそのように言えるのかというと、、、
Dくん(29kg)、Eくん(51kg)、Fくん(70kg)の平均値を求めても50kgになります。

つまり、何が言いたいのかと言いますと、
平均値は各数値の傾向やバラつきを一切考慮していない
ということ。

だから、平均値だけ見ていては、何も実際のところの傾向はよくわからないままなのです。

『基準値』について考えるときの3つの要チェックポイント〜塩分摂取量をベースに考えてみよう〜

2つ目は、「100kmが意味していること」です。

これは判断がとても難しいところです。
なぜなら、距離の感覚は各々の主観によるところが大きいから、100kmの誤差が許容範囲なのかそうではないのかが判断ができないから。

なので、具体的に100kmというと、名古屋の県庁所在地から直線距離で100kmに位置するところを調べてみたところ、
・静岡県側では、天竜川の河口付近
・三重県側では、伊勢を超えた大王崎辺り
・滋賀県側では、ちょうど滋賀県と京都の県境あたり
・福井側では、敦賀あたり
・岐阜県、長野県側では、御嶽山あたり
になります。

日本という枠ではなく、各市郡村単位で見てみると、結構大きな誤差だと感じるのは私くらいでしょうか。

最後の3つ目は、「標本数がどのくらいあるのか」です。
これは1つ目にも関連する話ですが、平均値は標本数(個数)に大きく左右される可能性が高いです。

先ほどの例ですと、標本数は3つだけなのでバラつきがあることはわかりますが、イレギュラーな数値なのかどうかまでは判断できません。
例えば、3つではなく300くらい標本数があって、どの数値を確認しても大体50kgくらいだと分かれば平均値は参考にできますが、極端な話50kg(±10kg)にはほとんどデータがなく、それ以外の数値だったとして平均値が50kgだとしたら、平均値だけでは何も語ることができません。

なので、もしデータ検証をしたい場合には、データ数やのデータの傾向や精度をパッと確認できるとしたら、棒グラフや折れ線グラフではなく、散布図の方がお勧めです。

https://www.stat.go.jp/naruhodo/9_graph/jyokyu/sanpu.html

おわりに

ただ、公に公表されているグラフで散布図を見たことはほとんどありません。

なぜなら散布図を見せてしまうと、データを意図的に見せることが難しくなるから
標本数が少ないのに、棒グラフにすることで科学的根拠として報告して見せているケースをよく見かけますが、散布図を見せてしまうと「たったこれだけのデータで科学的根拠だと言い切れるの?」と疑問に思う人が出てきやくなります。

表やグラフを見る時には、必ず相手の意図があることはしっかり理解した上で見ることをお勧めします!


最後まで読んでいただき、ありがとうございました!

科学的根拠って何? データに思考操作されず意図を読み解くコツとは? 【読み解く】グラフとコメントは何を意図しているのか? vol.1

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA