ベンフォードの法則と京大数学2024

ベンフォードの法則

多くの状況で自然数の最初の桁(最高位)に現れる数は一様に分布しない。

具体的に n (=1,2,,9)n \ (= 1,2, \dots , 9) の出てくる確率 PnP_nPn=log10n+1n P_n = \log_{10} \dfrac{n+1}{n} に近いことが多い。

P1>P2>P3>>P9P_1>P_2>P_3>\cdots>P_9 です。「最初の桁は小さくなりがち」という法則です。

実験

多くの状況の例として,2のべき乗たちの最初の桁の分布を見てみましょう。

集合 AnA_nAn={2k1kn} A_n = \{ 2^k \mid 1 \leqq k \leqq n \} と定義します。様々な nn で最初の桁の数の分布を見ていきましょう。

1 2 3 4 5 6 7 8 9
A10A_{10} 0.3 0.2 0.1 0.1 0 0.1 0 0.1 0
A100A_{100} 0.3 0.17 0.13 0.1 0.07 0.07 0.06 0.05 0.05
A1000A_{1000} 0.302 0.174 0.125 0.097 0.079 0.069 0.056 0.052 0.045

例えば,表の左上のマスは 0.30.3 ですが,これは 21,22,...,2102^1,2^2,...,2^{10} の中に最高位が 11 であるものが 33 個あることを表します。

参考までに対数の値をいつか紹介すると, log102=0.3010log1032=0.1760log1043=0.1249 \log_{10} 2 = 0.3010 \dots \\ \log_{10} \dfrac{3}{2} = 0.1760 \dots \\ \log_{10} \dfrac{4}{3} = 0.1249 \dots となり,ベンフォードの法則が成り立ちそうですね。

問題(京都大学2024)

次は,ベンフォードの法則に関連する入試問題です。

問題

自然数 kk に対して,ak=2ka_k = 2^{\sqrt{k}} とする.nn を自然数とし,aka_k の整数部分が nn 桁であるような kk の個数を NkN_k とする。また,aka_k の整数部分が nn 桁であり,その最高位の数が 11 であるような kk の個数を LnL_n とする。次を求めよ。 limnLnNn \lim_{n \to \infty} \dfrac{L_n}{N_n} ただし,例えば実数 2345.6782345.678 の整数部分は 2345234544 桁で,最高位の数は 22 である。

解答

aka_k の整数部分が nn 桁であることを不等式で表すと 10n12k10n 10^{n-1} \leqq 2^{\sqrt{k}} \leqq 10^n となる。対数を取って二乗することで kk について解くと (n1log102)2k(nlog102)2 \left( \dfrac{n-1}{\log_{10} 2} \right)^2 \leqq k \leqq \left( \dfrac{n}{\log_{10} 2} \right)^2 であるため Nn=[(nlog102)2][(n1log102)2] N_n = \left[ \left( \dfrac{n}{\log_{10} 2} \right)^2 \right] - \left[ \left( \dfrac{n-1}{\log_{10} 2} \right)^2 \right] となる。

aka_k の整数部分が nn 桁で,最高位の数が 11 であることを不等式で表すと 10n12k2×10n1 10^{n-1} \leqq 2^{\sqrt{k}} \leqq 2 \times 10^{n-1} となる。同様に kk について解くと (n1log102)2k(n1log102+1)2 \left( \dfrac{n-1}{\log_{10} 2} \right)^2 \leqq k \leqq \left( \dfrac{n-1}{\log_{10} 2} +1 \right)^2 であるため Ln=[(n1log102+1)2][(n1log102)2] L_n = \left[ \left( \dfrac{n-1}{\log_{10} 2} +1 \right)^2 \right] - \left[ \left( \dfrac{n-1}{\log_{10} 2} \right)^2 \right] となる。

x1[x]<xx-1 \leqq [x] < x であるため (nlog102)2(n1log102)21<Nn<(nlog102)2(n1log102)2+1(n1log102+1)2(n1log102)21<Ln<(n1log102+1)2(n1log102)2+1 \left( \dfrac{n}{\log_{10} 2} \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2 - 1 < N_n < \left( \dfrac{n}{\log_{10} 2} \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2 + 1\\ \left( \dfrac{n-1}{\log_{10} 2} +1 \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2 - 1 < L_n < \left( \dfrac{n-1}{\log_{10} 2} +1 \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2 + 1 である。

(nlog102)2(n1log102)2=2n1(log102)2(n1log102+1)2(n1log102)2=2(n1)log102+1\begin{aligned} &\left( \dfrac{n}{\log_{10} 2} \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2\\ &= \dfrac{2n-1}{(\log_{10} 2)^2}\\ &\left( \dfrac{n-1}{\log_{10} 2} +1 \right)^2 - \left( \dfrac{n-1}{\log_{10} 2} \right)^2\\ &= \dfrac{2(n-1)}{\log_{10}2} + 1 \end{aligned} に注意すると 2(n1)(log102)2n1+(log102)2<LnNn<2(n1)(log102)+2(log102)22n1(log102)2 \dfrac{2(n-1)(\log_{10} 2)}{2n-1+(\log_{10} 2)^2} < \dfrac{L_n}{N_n} < \dfrac{2(n-1)(\log_{10} 2)+2(\log_{10}2)^2}{2n-1-(\log_{10} 2)^2} を得る。

limn2(n1)(log102)2n1+(log102)2=log102limn2(n1)(log102)+2(log102)22n1(log102)2=log102 \lim_{n \to \infty} \dfrac{2(n-1)(\log_{10} 2)}{2n-1+(\log_{10} 2)^2} = \log_{10} 2\\ \lim_{n \to \infty} \dfrac{2(n-1)(\log_{10} 2)+2(\log_{10}2)^2}{2n-1-(\log_{10} 2)^2} = \log_{10} 2 である。はさみうちの法則より LnNn=log102\displaystyle \dfrac{L_n}{N_n} = \log_{10} 2 である。

丁寧に計算するだけでした!答えが P1=log102P_1=\log_{10}2 になり,ベンフォードの法則の通りです。

復習として最高位が 2233 の場合も確認してみましょう。

ベンフォードの法則を元に実験データを適当にごまかしているかどうか調べることもできます。