データの海に宿る知恵 -本質の羅針盤シリーズ目次

本質の羅針盤シリーズ表紙 シリーズ目次
この記事は約3分で読めます。

インターネットの普及につれ世界中の人々に、様々なデータをネット上で共有する習慣が根付いた。典型的には、動画・写真をSNSに投稿して公開する習慣。個人以外にも、政府、大学、企業などの組織が同様にデータをネット上で共有する。この結果、インターネットは「データの巨大な海」に化けた。
かつてデータといえば、「先月の売上データ」「5年2組の英語の成績データ」のように身近で小さなデータがイメージに浮かんだ。しかし、データの海にあるのは多種多様なデータ(文書、静止画、動画、音声など)で、身近で小さなデータに対し「ビッグデータ」と呼ばれる。
本シリーズを通じ、データの海にある多種多様なビッグデータを組み合わせて分析し、データの海に潜む真実や法則性のあぶり出しに取り組む。人間には扱い切れないビッグデータの検索や分析の際の強力な道具として生成AIを活用する。
本記事に掲載した表は、データ分析に取り組んだ記事群の目次で、ここから興味ある記事をクリックしてご覧いただきたい。

記事のタイトル 記事のポイント 対象読者
統計分析技法「相関」

二つの項目間で影響の「強さ」「弱さ」「無さ」を数値で表す統計学の技法が「相関そうかん」。この技法は使い方次第で、たとえば成績と影響が大きい生活習慣が見つかる場合もある。
本記事では、相関の詳細な計算方法には触れず、相関の使い方と、相関が示す数値の意味を説明する。
※データ分析の背後にある統計技法の入門記事

二つの別のモノゴトの間にある関係の強さ(弱さ)を「量」(数値)で示す技法に興味がある方
統計分析技法「相関」表紙 「相関関係の量」が持つ意味や使い方に興味がある方
「相関関係の量」が計算できた時、その値の信頼性を判断する基準に興味がある方
Covid-19第1波の感染傾向調査に基づくリスク分析

2020年5月のCovid-19の第1波における県別の感染状況(県民の行動様式や消費傾向と、感染率の高さの関係)から、感染リスクを高める行動などを、感染状況のデータ(項目数:1,272項目、生データ数:60,067件)を統計的に分析する。
なお分析実施時点は生成AIの普及前で、分析はすべて手作業で行った。

感染対策として効果的な(逆にリスクが高い)行動様式や消費傾向に興味がある方
新型コロナウイルスの顕微鏡写真 「食品」「生活スタイル」と「感染率」の関係に興味がある方
県別の感染実勢分析に基づく「人口集中度」と「感染率」の関係に興味がある方
地球の「エラー」をデバッグ  地球をひとつのソフトウエアシステムと見立て、ソフトウエアの品質管理(デバッグ)技術を適用して、地球という巨大な物理システムが持つ「仕様バグ」(=大地震)の原因をAIを使って分析した。
分析の結果、南海トラフ地震の発生時期と場所について、過去の大地震との相関係数0.9という、統計学的に極めて有意な確度で予測できると判った。
南海トラフ地震に興味がある方
地球の「エラー」をデバッグ表紙 AIを使ったデータ分析に興味がある方
大地震の予知方法に興味がある方
この記事を書いた人
公政

ヒトの行動原理を、書籍や番組で得た「知恵」「知見」を基に言語化します。
ヒトの行動原理に、ソフトウエア開発畑での設計の仕事で蓄積した知見を組み合わせ、独自視点で編成し言語化した『知恵』を発信しています。
ご興味あれば他の記事もご覧ください。

公政をフォローする
シリーズ目次継の和知の和技の和

コメント