- AIは、計算を間違えることがあるのでしょうか。
-
計算を間違えることがあります。
複雑な計算についての信頼度の目安は、40〜60%です。
間違える理由は、AI(大規模言語模型)は、電卓のように「数式をプログラムとして処理する」のではなく、「次に来るもっともらしい言葉(数字)を予測する」という仕組みで動いているからです。
「Pythonを使って解いて」と指示すれば、AIは自分自身で計算せず正確な電卓(プログラム)を動かすので、信頼度が100%に近づきます。
1 趣旨
2026年現在、AIサービスは、多くの場面で活用されています。著名なものは、主に「生成AI(文章・画像・動画など)」と「特化型AI」の2つに分類されます。代表的な生成AIは、日常やビジネスで最も普及している文章作成・情報収集AIであり、ChatGPT (OpenAI) , Gemini (Google) , Claude (Anthropic) , Perplexity AI , Microsoft 365 Copilot があります。
筆者は、AIの特性を探るため、代表的な生成AIの一つである Google が開発した Gemini 1.5 Pro に、3×3行列計算等を指示しました。
すると,同問の行列計算について、3回続けての誤答でした。AIが行った複雑な計算は、100%は信用できない例です。
やり取りの顛末は、以下の通りです。その中からAIの特性「くせ」を垣間見ることができます。
また、最終的に、AIにどのような指示の出し方をすると精度の高い解答(AIは回答かも)が得られるのかについてもまとめています。
以下、AI(Gemini 1.5 Pro , 2026年5月10日) の回答とそれを通して分かったことの説明です。
「2 計算間違いの発生」から「4 得意、不得意と活用のコツ」までは、AIの回答です。
途中のマーカーや太字の装飾は筆者の加筆です。また、内容の一部削除や式の整形等も行っています。方程式の解については、AIの回答が変化したことが分かるように、解を赤文字にしています。筆者のコメントがあるときは、「※ 筆者コメント」と明示しています。
なお、本稿は、行列の計算等に時間を要します。
時間の無い方やAIへの指示の出し方など結論が先に読みたい方は、次の「リンク まとめへ」のボタンをクリックしてください。結論に飛ぶことができます。
2 計算間違いの発生
Q1 例題の解を求める式
例えば、3つの変数を持つ以下の連立方程式を解く場合を考えます。
\[
\begin{cases}
\begin{array}{r@{\;}r@{\;}r@{\;}r@{\;}r@{\;}c@{\;}l}
2x &+ &y &+ &z &=& 8 \\
3x &+ &2y &- &z &=& 3 \\
x &- &y &+ &2z &=& 4
\end{array}
\end{cases}
\]
1. 方程式を行列形式で表す
2. 逆行列 \(A^{-1}\) を求める
3. 解のベクトル \(\boldsymbol{x}\) を計算する
- \(x = \frac{1}{10} (3 \times 8 + (-3) \times 3 + (-3) \times 4) = \frac{1}{10} (24 – 9 – 12) = \frac{3}{10} = 0.3\)
- \(y = \frac{1}{10} ((-7) \times 8 + 3 \times 3 + 5 \times 4) = \frac{1}{10} (-56 + 9 + 20) = \frac{-27}{10} = -2.7\)
- \(z = \frac{1}{10} ((-5) \times 8 + 3 \times 3 + 1 \times 4) = \frac{1}{10} (-40 + 9 + 4) = \frac{-27}{10} = -2.7\)
✅ 回答
3 誤答認識と再計算
Q2 AIが、解を間違える理由
1. 正しい逆行列 \(A^{-1}\) の導出
これをもとに計算した正しい逆行列は以下の通りです。
2. 正しい計算(掃き出し法の結果)
- 式1: \(2(1) + (3) + (3) = 8\)
- 式2: \(3(1) + 2(3) – (3) = 6\)
- 式3: \((1) – (3) + 2(3) = 4\)
$$\boldsymbol{x} = \begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} 1 \\ 3 \\ 3 \end{bmatrix}$$
なぜ先ほど間違えたのか
※ 筆者コメント
| (※ここまでは先ほどと同じですが、この行列自体の数値が私の計算ミスで誤っていました。正しくは以下の値になります。) $$A^{-1} = \frac{1}{10} \begin{bmatrix} 3 & -3 & -3 \\ -7 & 3 & 5 \\ -5 & 3 & 1 \end{bmatrix} \quad \text{ではなく} \quad \frac{1}{10} \begin{bmatrix} 3 & -3 & -3 \\ -7 & 3 & 5 \\ -5 & 3 & 1 \end{bmatrix}$$ (失礼しました、正しく計算し直した逆行列を適用します) |
上記の \(A^{-1}\) について、「[左側(修正前)] ではなく [右側(修正後)]」。筆者には等しい行列式に見えます。計算ミスの修正解説でAIが何を説明しようとしているのか困惑します。
転記ミスでないことを明示するため、筆者コメントを入れます。
Q3 AIの手計算で間違える理由
1. なぜAIは計算を間違えるのか
- 「計算」ではなく「作文」をしている:
AIにとって「2+2=4」は、計算結果ではなく、「2+2」という文字列の次には「4」が続く確率が高い、という学習データに基づいた「文章」として認識されています。 - 複雑な手順に弱い:
行列の計算のように「Aを求めて、次にBを処理して……」という多段階の推論が必要な場合、途中で「もっともらしいけれど間違った数字」を一度選んでしまうと、その後の計算がすべて狂ってしまいます。
2. 「手計算」と呼んだ理由
ステップバイステップ:ミスのない「掃き出し法」による解決
① 1行目と3行目を入れ替える(計算を楽にするため)
② 1列目を掃除する(1行目を使って下の2つを 0 にする)
- 2行目:(2行目) - (1行目×3)
- 3行目:(3行目) - (1行目×2)
③ 3行目をシンプルにする
④ 2行目と3行目を入れ替え、2列目を掃除する
- 1行目:(1行目) + (2行目)
- 3行目:(3行目) - (2行目×5)
Q4 プログラム(Python)を実行した「厳密な計算結果」
厳密な計算結果
確かな解き方の手順
- 行列の「逆数」にあたるものを作る
行列 $A$ の逆行列 $A^{-1}$ を計算します。
$$A^{-1} = \begin{bmatrix} -0.5 & 0.5 & 0.5 \\ 1.166… & -0.5 & -0.833… \\ 0.833… & -0.5 & -0.166… \end{bmatrix}$$ - 定数ベクトルと掛け算する
この逆行列に、右側の数字の塊 \[\begin{bmatrix} 8 \\ 3 \\ 4 \end{bmatrix}\] を掛けます。 - 答えが出る
各行を計算すると、\[-0.5 \times 8 + 0.5 \times 3 + 0.5 \times 4 = -4 + 1.5 + 2 = -0.5\] となり、\(x\) が求まります。同様に \(y\) と \(z\) も導かれます。
この結果から言える「行列の良さ」
4 得意、不得意と活用のコツ
Q5 AIが得意なこと、苦手なこと
AIの得意・苦手と信頼度の目安
| 項目 | 特徴 | 信頼度の目安 |
|---|---|---|
| 文章の要約・添削 | 文脈を読み取り、自然な言葉に直す作業。 | 95% |
| プログラミング | コードの生成やエラーの特定。論理性があるため得意。 | 85% |
| 翻訳 | 言語間のニュアンスの変換。 | 90% |
| アイデア出し | 企画案やキャッチコピーなど、正解のない創造。 | 95% |
| 論理的な推論 | 「AならばB」という筋道を立てて説明すること。 | 70〜80% |
| 複雑な数値計算 | 桁数が多い、または多段階の計算(今回の行列など)。 | 40〜60% |
| 最新情報の提供 | ニュースや、学習データ締切後の出来事。 | 30〜50% |
| 事実確認 (Fact Check) | 人名、地名、年号などの細かい固有名詞。 | 60〜70% |
なぜ信頼度に差が出るのか?
- 得意(高信頼度):パターン認識
AIは「過去の膨大なデータから似たパターンを探す」のが得意です。文章の作成や要約は、言葉の並びのパターンが豊富なため、非常に高い精度を発揮します。 - 苦手(低信頼度):厳密なステップの積み上げ
数学の計算や事実の確認は、「100回のステップのうち、1回でも間違えたらアウト」という世界です。AIは確率で動いているため、その1回のミスを拾いやすく、結果として信頼度が下がります。
AIを賢く使うコツ
- 計算や事実は「ツール」を併用させる:
「Pythonを使って解いて」と指示すれば、AIは自分自身で計算せず、正確な電卓(プログラム)を動かすので信頼度が100%に近づきます。 - たたき台として使う:
文章作成やアイデア出しなど、人間が後で確認・修正しやすい作業に任せるのが最も効果的です。
Q6 AIに「計算ミスをさせないための命令のコツ」
1. 「Pythonを使って」と明示する
- ダメな例: 「この行列の逆行列を計算して」
- 良い例: 「この行列の逆行列を、Pythonを使って正確に計算して」
- こうすることで、AIは「作文」を止め、内部の正確な計算機(Python実行環境)に処理を投げます。
2. 「ステップバイステップで考えて」と付け加える
- 命令のコツ:
文末に「ステップバイステップで、一段階ずつ確認しながら解いて」と書く。
- いきなり答えを出そうとするとAIは「予測」で答えてしまいますが、一歩ずつ手順を言葉にさせることで、論理の破綻に自分(AI)で気づきやすくなります。
3. 役割(ロール)を与える
- 命令のコツ:
「あなたは数学の教授です。学生に教えるように、検算を行いながら正確に解いてください」- 役割を与えることで、関連する高精度な学習データが優先的に参照されやすくなります。
まとめ:AIとの付き合い方
- 計算・事実: AIに計算機(Python)や検索ツールを使わせる。
- 文章・構成: AIの得意な「予測能力」をそのまま活かす。
Q7 Pythonを使って複雑な行列や統計計算を正確に解く実演
1. 解く問題(4元連立一次方程式)
\begin{cases}
\begin{array}{r@{\;}r@{\;}r@{\;}r@{\;}r@{\;}r@{\;}r@{\;}c@{\;}r}
x &+ &y &+ &z &+ &w &=&10 \\
2x &+ &y &- &z &+ &3w &=&15 \\
x &- &2y &+ &3z &- &w &= &5\\
3x &+ &3y &+ &2z &- &2w &= &22
\end{array}
\end{cases}
\]
2. コンピュータによる実行
3. 計算結果
- \(x = 1.5\)
- \(y = 0.5\)
- \(z = 3.125\)
- \(w = 4.875\)
ここが「行列+AI(プログラム)」の凄さ
- 人間の場合: 4変数の連立方程式を手で解こうとすると、代入や消去を何度も繰り返し、どこか一箇所で「プラスとマイナス」を書き間違えただけで、すべての努力が水の泡になります。
- AI(Python利用)の場合:
- 行列の形(データの塊)を定義する。
np.linalg.inv(A)(逆行列を求めよ)という命令を出す。
これだけで、内部的に何十ステップもの計算を0.001秒以内にミスなく完了させます。
結論
5 まとめ 問題点と回答精度が上がる指示の出し方
今回 (2026-0510)、AIに複雑な行列計算の回答を求めました。AIは、「Gemini 1.5 Pro」。
やり取りを通して、AIの特性および回答精度が上がる指示の出し方のいくつかが分かりました。その内容をまとめると、以下のようです。
1 特性
- AI(大規模言語模型)は、電卓のように「数式をプログラムとして処理する」のではなく、「次に来るもっともらしい言葉(数字)を予測する」という仕組みで動いている。
- したがって、AIは、複雑な数値計算、桁数が多い、または多段階の計算は不得意。信頼度の目安は、40〜60%である。
- AIの信頼度は、「答えが一つに定まるかどうか」と「情報の新しさ」によって大きく変わる。
2 得意・不得意な分野
- 得意なこと:
文章の要約・添削 文脈を読み取り、自然な言葉に直す作業。信頼度の目安 95%
アイデア出し 企画案やキャッチコピーなど、正解のない創造。信頼度の目安 95%
翻訳 言語間のニュアンスの変換。信頼度の目安 90% - 比較的得意なこと:
プログラミング コードの生成やエラーの特定。論理性があるため得意。信頼度の目安 85%
論理的な推論 「AならばB」という筋道を立てて説明すること。信頼度の目安 70〜80%
事実確認 (Fact Check) 人名、地名、年号などの細かい固有名詞。信頼度の目安 60〜70% - 苦手なこと:
複雑な数値計算 桁数が多い、または多段階の計算(今回の行列など)。信頼度の目安 40〜60%
最新情報の提供 ニュースや、学習データ締切後の出来事。信頼度の目安 30〜50%
3 回答精度を上げる指示
- AIを賢く使うコツ:
「Pythonを使って解いて」と指示するなど計算や事実は「ツール」を併用させる
文章作成やアイデア出しなどのたたき台として使う。人間が後で確認・修正しやすい作業に任せるのが最も効果的。 - 計算ミスをさせないための命令のコツ:
「この行列の逆行列を、Pythonを使って正確に計算して」など、「Pythonを使って」と明示する
「ステップバイステップで考えて」と付け加える
「あなたは数学の教授です。学生に教えるように、検算を行いながら正確に解いてください」など、 役割(ロール)を与える
4 まとめ
- 計算・事実確認には、AIに計算機(Python)や検索ツールを使わせる。また、文章・構成には、AIの得意な「予測能力」をそのまま活かす。このような使い方をすれば、有力な思考、判断、表現ツールとなる