X

相関係数と回帰直線とは?為替と原油データで学ぶ数学の活かし方

目次[閉じる]

「最近、円安と原油高が同時に進んで生活が苦しい…」と感じたことはありませんか?日々ニュースで流れるドル円為替と原油価格ですが、これらがいつ、どのように連動しているのか、その正確なルールをパッと答えられる人は多くありません。

ビジネスや投資、さらには日々の生活において、「なんとなく関係がありそう」という直感だけで動くのはリスクが伴います。複雑に絡み合う社会の仕組みを読み解くために必要なもの、それこそが高校や大学で習う「統計学(数学)」の視点です。

この記事では、過去15年間のリアルな経済データをもとに作成した3つの相関図を使い、統計学の基本である「相関係数」と「回帰直線」の本質を驚くほど分かりやすく解説します。

「数学なんて大人になっていつ使うの?」と思っていた方こそ、ぜひ最後まで読んでみてください。読み終わる頃には、複雑なデータから未来を先回りして予測し、賢い行動に繋げるための『最強の武器』が手に入っているはずです。

2026年ゴールデンウィーク(GW)期間を境とした、「GW前60日間」と「GW後60日間」のドル円為替相場とWTI原油価格の相関図(散布図・回帰直線)

グラフの解説と経済的背景 2026GW前後60日間のドル円為替相場とWTI原油価格の相関図(散布図・回帰直線)

同じ2026年内のわずか数ヶ月間であるにもかかわらず、GWを境に回帰直線の傾きが真逆(プラスからマイナスへ)にひっくり返っているのが視覚的にわかります。

1. 2026ゴールデンウィーク前(オレンジ):\(r = 0.58\) (中程度の正の相関)
緊迫化する国際情勢を背景に「エネルギー危機への懸念から原油が買われ(原油高)」、同時に米国のインフレ長期化懸念から「日米金利差によるドル買い(円安)」が進んだため、2つの指標が同じ方向に動く「正の相関」を記録しました。
2. 2026ゴールデンウィーク後(ブルー):\(r = -0.71\) (強い負の相関)
連休が明けると情勢への過度な警戒感が和らぎ、原油市場は一転して供給過剰懸念から売り優勢(原油安)となりました。しかし、為替市場では依然としてドル高・円安トレンドが継続したため、今度は「円安が進むほど原油が下落する」という強烈な「負の相関」に構造が180度シフトしました。

このように、全く同じデータの組み合わせであっても、「切り取る期間」によって数学的な関係性が劇的に変化するという点は、データ分析において非常に重要な教訓となります。

導入

私たちの身の回りには、一見すると関係がなさそうで、実は深く結びついているデータが無数に存在します。例えば、ガソリン価格の元となる「原油価格」と、日々ニュースで耳にする「ドル円為替相場」です。これらがどのように連動しているかを理解することは、世界経済を読み解くだけでなく、ビジネスや投資の意思決定において非常に重要です。

しかし、「なんとなく関係がありそう」という直感だけでは、不確実な時代を生き抜く予測は立てられません。そこで役立つのが数学です。

この記事では、過去15年間のリアルな経済データを用いながら、統計学の基本である「相関係数」「回帰直線」の数学的な定義とその強力なメリットについて分かりやすく解説します。数学という「最強の眼鏡」をかけることで、複雑な社会がどのように見違えるか、そのおもしろさを体感してください。

1. 15年間の経済データで見る「ドル円」と「原油価格」の構造変化

まずは、過去15年間のドル円為替相場(月末値)とWTI原油価格(月末値)の月次データをもとに、時代を3つの局面に区切って作成した相関図(散布図)と回帰直線を見てみましょう。データは数学の力によって、時代ごとの驚くべき構造変化を教えてくれます。

① 2011年〜2014年:弱い負の相関(超円高・原油高期)

最初に見るのが、東日本大震災直後の超円高期からアベノミクス初期にかけての期間です。

  • 相関係数(\(r\)):-0.32(弱い負の相関)

この時代は、民主党政権下の70円台という歴史的な超円高から、120円手前までの急激な円安への大転換期でした。一方で原油は1バレル100ドル前後の高値圏で推移していました。2014年後半に「シェール革命」によって原油が暴落したことで、右下がりの傾向(円安になるほど原油が安くなる)が生まれ、弱い負の相関を示しています。

② 2015年〜2019年:ほとんど相関なし(シェール革命・安定期)

次に見るのが、為替が比較的落ち着いていたアベノミクス安定期です。

  • 相関係数(\(r\)):-0.18(ほとんど相関なし)

為替は105円〜120円台のレンジ内に収まっていましたが、原油価格は米国の供給過剰やOPECによる協調減産合意など、ドル円の動きとは関係なく「産油国側の都合(純粋な需給)」で単独で激しく上下しました。数学的な数値も見事に「連動性がほぼゼロである」ことを証明しています。

③ 2022年〜現在:中程度の負の相関(ウクライナ侵攻・金利差円安期)

最後は、私たちが今まさに直面している直近の激動の期間です。

  • 相関係数(\(r\)):-0.47(中程度の負の相関)

過去15年間の中で、最も綺麗な右下がりの反比例関係が描かれています。これは、米国のFRB(連邦準備制度理事会)がインフレ抑制のために行った強力な利上げが原因です。金利上昇は「強烈なドル高(=激しい円安)」を招くと同時に、世界的な景気減速懸念を生んで「原油価格の抑制」を同時に引き起こしました。共通の要因(米金利)が2つの指標を逆方向に強く引っ張ったため、明らかな負の相関が観測されています。


2. 数学的な定義を理解する:相関係数と回帰直線とは何か?

データが示すおもしろさを確認したところで、これらを導き出す統計学の2大ツール「相関係数」「回帰直線」の数学的な正体を、専門用語をできるだけ噛み砕いて解説します。

相関係数(ピアソンの積率相関係数)の定義

相関係数(一般に \(r\) で表される)は、「2つのデータの連動性の強さと方向性」を -1 から +1 までの間の数値で表した指標です。

数学的には、2つの変数 \(X\) と \(Y\) の「共分散」を、それぞれの「標準偏差(データのばらつき度合い)」の積で割ることで求められます。数式で表すと以下のようになります。$$r = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sqrt{\sum (X_i – \bar{X})^2} \sqrt{\sum (Y_i – \bar{Y})^2}}$$

この計算を行うことで、元のデータの単位(「円」や「ドル/バレル」など)がすべてキャンセルされ、純粋な「関係性の強さ」だけが抽出されます。

  • \(r\) が +1 に近い(正の相関):\(X\) が増えると \(Y\) も増える(例:気温とエアコンの電気代)
  • \(r\) が 0 に近い(無相関):\(X\) と \(Y\) には連動性がない(例:身長とテストの点数)
  • \(r\) が -1 に近い(負の相関):\(X\) が増えると \(Y\) は減る(今回のドル円と原油の関係)

回帰直線の定義

回帰直線とは、散布図に打たれたデータ全体の傾向を最も代表する「引き締まった1本の直線」のことです。中学校で習う一次関数の式 \(y = ax + b\) (\(a\) は傾き、\(b\) は切片)と同じ形をしています。

この線をどうやって引いているかというと、数学的な「最小二乗法(さいしょうにじょうほう)」予測のズレを2乗した合計が「最も小さくなる」ような傾きと切片というルールに基づいています。

各データ点から直線までの縦方向の距離(残差、つまり予測のズレ)を2乗し、それらをすべて足し合わせた合計が「最も小さくなる」ような傾き \(a\) と切片 \(b\) を微分などの計算によって一意に割り出します。これにより、主観を一切挟まない「最もデータにフィットした直線」が完成します。


3. 数学の定義がもたらす「圧倒的なよさ(メリット)」

なぜ、わざわざこのような複雑な計算をして数値や線を導き出すのでしょうか。そこには、人間の直感や目視による限界を超える3つの圧倒的なメリットがあるからです。

メリット1:複雑な事象の「単純化・可視化」

生データ(数値の羅列)のままでは、2022年以降のドル円と原油の関係をパッと見で見抜くことは不可能です。しかし、相関図に落とし込んで回帰直線を1本引くだけで、「円安(右に移動)が進むほど、原油価格(下)は下がりやすい構造にある」という世界経済のパワーバランスが、子供でも一目で理解できる形に単純化されます。

メリット2:主観を排除した「客観的な比較」

「最近、円安と原油ってなんとなく逆の動きをしていない?」という個人の感想は、ビジネスでは使えません。しかし、数学を使えば、2015〜2019年は -0.18 だったのに対し、2022年以降は -0.47 であると、「過去に比べて逆相関の強さが約2.6倍に強まっている」という事実を、誰も反論できない客観的エビデンスとして提示できるようになります。

メリット3:構造を数式化することによる「予測可能性」

これが最大のメリットです。回帰直線が $y = -0.57x + 165.7$ のような数式として求まっていれば、「もし今後、さらに日米金利差が開いて為替が 1ドル=165円 になったら、原油はいくらになるか?」という未知の領域に対して、$x=165$ を代入することで 1バレル=約71.6ドル という具体的な予測値を計算できるようになります。


4. 日常やビジネスで相関図が活かされる3つの典型例

為替や原油のようなマクロ経済だけでなく、私たちの身近な生活やビジネスの現場でも、様々な相関図が分析や予測、そして具体的な行動へと繋げられています。代表的な3つの例を紹介します。

例1:小売業の「最高気温」と「商品の売上高」

  • 分析と予測:コンビニやスーパーでは、縦軸に「アイスクリームや麦茶の売上高」、横軸に「その日の最高気温」をとった相関図が毎日分析されています。ここには非常に強い「正の相関($r$ が +1 に近い)」が存在し、回帰直線から「気温が30度を超えると、25度の日に比べて売上が何倍になるか」が明確に予測できます。
  • 行動への結びつき:店長は翌日の天気予報(予想最高気温)を見るだけで、勘に頼ることなく、仕入れるアイスの数量を過不足なく自動的に発注できます。これにより、機会損失(売り切れ)の防止と、廃棄ロスの削減を同時に実現しています。

【例1のグラフ】最高気温とアイスクリーム売上高の相関図

気温が上がるほど売上が直線的に伸びる、典型的な「強い正の相関(\(r = 0.88\))」を表しています。 

例2:マーケティングの「広告費」と「新規顧客獲得数」

  • 分析と予測:企業のマーケティング担当者は、縦軸に「月間の新規契約者数」、横軸に「Web広告への投資額」をプロットします。回帰直線の「傾き」を見ることで、広告費を1万円増やしたときに顧客が何人増えるかという「投資対効果(ROI)」を数式化して予測します。
  • 行動への結びつき:もし投資を増やしても売上曲線が頭打ち(相関が弱まる領域)になることが分かれば、広告を止めて「製品の機能改善」に資金を振り向けるといった、経営資源の最適な配分決定に直接繋がります

【例2のグラフ】広告費と新規顧客獲得数の相関図

投資を増やすほど顧客が増える「中程度の正の相関(\(r = 0.65\))」です。ビジネスの投資対効果(ROI)を測る指標になります。

例3:健康管理の「毎日の歩数」と「睡眠の質(深い睡眠の時間)」

  • 分析と予測:スマートウォッチのアプリの裏側でも数学が動いています。横軸に「日中の歩数(活動量)」、縦軸に「夜間の深い睡眠の時間」をプロットし、個人の相関を分析します。「日中に7,000歩以上歩いた日は、睡眠の質が向上する」という正の相関が個人データから割り出されます。
  • 行動への結びつき:アプリが「今日はまだ4,000歩です。あと15分歩くと、今夜の睡眠の質が上がります」と通知を出すことで、ユーザーは健康維持のための自発的なウォーキングという行動を起こすことができます。

【例3のグラフ】歩数と深い睡眠時間の相関図

日常の健康データに見られる「緩やかな正の相関(\(r = 0.52\))」です。データがややばらついているものの、右上がりの傾向が確認できます。

例1から例3までのデータプロット(データ点)は、シミュレーション(数式と乱数)によって生成した再現(模擬)データであり、特定の店舗や個人の実測値そのものではありません。

しかし、それぞれの相関係数(rの値)やデータのばらつき具合は、実際の統計データや学術的な調査報告とほぼ一致するよう緻密に設計されています。

実在する公的データや一般的な統計基準と、今回のグラフがどのように結びついているのか、その根拠を解説します。


各データの統計的根拠

※ 例1~例3のグラフについてのデータは、公的な統計傾向に基づき作成された再現データです」

例1:最高気温とアイスクリーム売上高

  • 実データとの整合性: 総務省統計局の「家計調査」や気象庁の「ビジネス気象データ」によると、最高気温と冷菓(アイスクリームなど)の支出額には、r = 0.8〜0.9 という非常に強い正の相関があることが実証されています [1, 2]。
  • グラフの設計: 気温22度を超えると売上が伸び始め、30度を超えると急激に需要が高まるという、小売業界の「気温感応度」の実態に沿ってプロットを配置しています [1]。

例2:広告費と新規顧客獲得数

  • 実データとの整合性: マーケティング実務において、Web広告費(リスティング広告やSNS広告など)とコンバージョン数(顧客獲得数)の相関は、一般的に r = 0.6〜0.7 程度の中程度の正の相関になります。
  • グラフの設計: なぜ「1(完全な直線)」にならないかというと、広告を増やしても競合他社の動きや、季節ごとの需要の波(ノイズ)の影響を受けるためです。グラフでは、ビジネスの現場で最もよく見られる「現実的なばらつき」を再現しています。

例3:歩数と深い睡眠時間

  • 実データとの整合性: 睡眠医学や健康科学の論文(スマートウォッチ等のウェアラブル端末を用いた大規模調査)において、日中の適度な運動量(歩数)と、夜間のノンレム睡眠(深い睡眠)の時間には、r = 0.4〜0.5前後の緩やかな正の相関が報告されています。
  • グラフの設計: 体調やストレス、カフェイン摂取など「歩数以外の要因」でも睡眠の質は大きく変わるため、3つの例の中で最もデータを大きく散らばらせ、実態に近い「緩やかな傾向」を表現しています。

なぜブログ記事で「本物の模擬データ」を使うのが良いのか?

実際の特定の1店舗の生データには、例えば「大雨で臨時休業した日(極端な外れ値)」などのノイズが混ざりすぎており、読者が「相関関係の本質」を学ぶ際のノイズになってしまいます。

今回のように「統計的な真実(実在する相関係数)」をベースに作られたクリーンな模擬データを使用することで、読者に対して以下のようなメリットを提供できます。

  1. グラフの見た目が綺麗で、回帰直線の意味が直感的に伝わりやすい。
  2. 特定の企業秘密や個人情報に抵触しないため、WordPressの記事として安心して世界に公開できる。

結論:数学を暮らしに活かす、ということの本当のよさ

多くの人が学生時代に「因数分解や統計なんて、大人になっていつ使うの?」疑問に思ったはずです。しかし、今回見てきたように、社会のあらゆる意思決定の裏側には相関係数や回帰直線といった数学のフレームワークが息づいています。

数学を学ぶ本当のよさは、計算ドリルを早く解くことではありません。「複雑な現実世界からノイズを取り除き、物事の本質的なルール(関係性)を見つけ出し、未来を先回りして予測する知恵」を手に入れることにあります。

データの関係性を正しく見抜く数学の視点を持てば、ニュースの報道に右往左往させられることなく、自分の頭で考え、賢い選択をし、日々の暮らしや仕事をより豊かな方向へとコントロールしていけるようになるのです。


読者への問いかけ

あなたのビジネスや日常生活の中で、「これを横軸、あれを縦軸にしてみたら、実は繋がっているかもしれない」と思う2つのデータはありませんか?ぜひ、手元のExcelなどで小さな散布図を描くことから、数学の楽しさをリスタートしてみてください!


参考・出典一覧

本記事の執筆にあたり、分析・計算の基盤として以下の公的機関および信頼性の高いデータソースの指標を参照・活用しています。

maru320i: