AHC032

 

 

 

AHC032 の考察記事です。

 

11,762 M 点で 18 位でした。

 

ざっくり方針

  • 1 マスで 1 手ずつ使う
  • 上から順に、各行を 4 マス+ 5 マスに分けて全探索により最善手を選ぶ
  • 下 3 列は 6 マスずつ全探索
  • 最後の 9 マスは 9 手を全探索

 

お気持ち

  • 試行回数に制限があるので、試行ごとの効率を最適化したい
  • マス数と試行回数が一致しているので、基本的にはマスごとに試行 1 回を対応させたい
  • きれいな法則がないので基本的には探索ゲーになる
  • 本問では、選択肢があまり多くないことによる情報量的限界と、探索の計算時間的な限界の二つの側面がある
  • 例えば焼きなまし法のように、探索時間を潤沢に使う方法は遅い言語では不利になりがち(Python だと辛い)
  • 前者の限界以上の精度を出せる程度の探索を効率行えれば計算時間がネックになることはない
  • 実際、本問では「行ごと」「4 列+5列」の全探索でこれを達成できる

 

 

前提

  • 1 マスあたり 1 スタンプ使うことにする
    • 2 マスで 2 スタンプなどは可とする
    • 1 マス(だけ)のために 2 スタンプ押したり、 2 マスで 1 スタンプのように節約することは取り入れなかった
      • 後者は実装できれば取り入れた方が良かった

 

詳細方針

 

左 4 マス全探索

 

各行について、左から 4 マスに影響する置き方を考えます。具体的には、画像の灰色の部分を固定したときに、ピンクの部分の置き方を最適化したいです。

白の部分はあとで考えるので浸食して OK 。

 

「1 マスあたり 1 スタンプ」ルールを考えると、許容される配置は、左上の位置のタプルで表すと (0, 0, 0, 1), (0, 0, 0, 2), (0, 0, 0, 3), (0, 0, 1, 1), (0, 0, 1, 2), (0, 0, 1, 3), (0, 0, 2, 2), (0, 0, 2, 3), (0, 1, 1, 1), (0, 1, 1, 2), (0, 1, 1, 3), (0, 1, 2, 2), (0, 1, 2, 3) の 13 パターン、どのスタンプを使うかを含めても 875,400 通りしかないので全探索できます。

なお、 (0, 0, 0, 0)(0, 2, 2, 3) などは「1 マス 1 スタンプ」を満たさないので省きました(前者は右端のマスが覆われず、後者は最初の 2 マスを 1 スタンプしかカバーしていない)。

 

 

 

右 5 マス全探索

 

 

こちらは置く位置のパターンは 8 通り、どのスタンプを使うかを含めても 5,140,800 通りありますが、最初の 3 マスが確定した時点で弱い場合は打ち切るなどの枝刈りでもう少し減らすことができます。

先ほどの 4 マスより 1 マス増えますが、右側にはみ出せないため置き方はあまり多くなりません。

 

 

下 3 行(6 マス全探索)

こちらは置く位置のパターンは 3 通り、どのスタンプを使うかを含めても 5,081,230 通りあります。最初の 3 マスが確定した時点で打ち切ると、若干減らすことができます。

 

下 3 行(最後の 9 マスを全探索)

こちらは置く位置は 1 とおり、どのスタンプを使うかは 6,906,900 通りあります。

これは枝刈りできないので全部頑張ります。

 

 

 

スコアの概算

問題がシンプルなので、実はある程度仮定を置くと「いくつかのマスについて全探索」を繰り返すような解法を前提にスコアの理論値が概算できます。

以下 P=998244353 とします。

1 マスに 1 回までスタンプを押す場合

1 マスの場合、そこを左上とするスタンプを置く方法は「無」のスタンプを押す方法も含めて 21 通りあります。これらが一様ランダムな場合の最小コストは、 \displaystyle\frac{1}{22}P です *1

仮に 81 マスすべてこの誤差で置いたとすると、ケースあたりのスコアは約 77.18B になります。

 

一般の場合

より一般に d マスで c 通りを試すとき、最善パターンのペナルティを計算しましょう。

簡単のため P で割って、マスごとのコストの分布が [0, 1)

確率変数 X0 以上 1 以下の一様分布に従うとします。それらの合計 S の密度関数は d 次関数が複数つながった複雑な形になりますが、 0\lt s \lt 1 (★)の範囲では f_{S}(s)=P(S\lt s)=\displaystyle\frac{1}{d!}s^{d} と表せます。

スタンプの押し方が c 通りあるとして、簡単のためこれらの置き方によるペナルティが一様ランダムに存在すると近似します。 c 通り試したときの最小値は複雑な形になりますが、簡単のため該当付近が線形だと仮定すると 1 マス 1 スタンプの場合と同様、この逆関数c+1 分位点、すなわち \displaystyle f_{S}^{-1}(\frac{1}{c+1}) になります。

 

スタンプの押し方

1 個のマスに(そこを左上として)合計 z 個のスタンプを押す方法は _{M}H_{z} = _{M+z-1}C_{z} 通りあります。

y 個のマスに合計 z 個のスタンプを押す方法は DP を用いて計算できます。

例えば本問全体では、 49 個のマスに 81 個のスタンプを押すことができますが、その方法は約 8.4 \times 10^{122} 通りあります。

 

期待得点率

上記をもとに、 x マスを最適化するためそのうち y マスに(そこを左上として) z 個のスタンプを押すときの得点率 g(x, y, z) を計算することができます。

 

x y z 得点率 g(x,y,z)
1 1 1 95.45\%
3 1 3 94.99\%
4 4 4 98.57\%
5 3 5 97.91\%
6 2 6 96.64\%
9 1 9 92.31\%
81 49 81 98.89\%

 

 

最終解法期待値

例えば上に書いた私の解法では、理想的には、全体の得点率は 

\displaystyle\frac{1}{81}(24g(4, 4, 4) + 30g(5, 3, 5) + 18g(6, 2, 6) + 9g(9, 1, 9)) \sim 97.20\% 、すなわちケースあたり約 78.59B 、合計 11.79T のスコアが得られることが期待できると分かります。

実際の私のスコアは 11.76T とやや低くなっています。これは枝刈りによりすべて探索できていないことや、実際はすべての置き方が一様に分布していないことなどによるものと考えられます。

 

1マス - 3マス - 9マス 解法期待値

よりシンプルな解法として

  • 左上の 6×6 部分は 1 マスだけ見て貪欲に決める
  • 右 3 列は 3 マスずつ最適化する
  • 下 3 列は 3 マスずつ最適化する
  • 最後の 9 マスは 9 個のスタンプの置き方を最適化する

という方法があります。この場合の期待値は

\displaystyle\frac{1}{81}(36g(1, 1, 1) + 36 g(3, 1, 3) + 9 g(9, 1, 9)) \sim 94.90\% 、すなわちケースあたり約 76.74B 、合計約 11.51T のスコアが得られることが期待できます。実は私の 第3提出 がこれだったのですが、ほぼ理論値通りの得点が得られていることが分かります *2

 

全体理論値

計算量を無視したこの問題の理論上の最適解スコアは、約 81P \times g(81, 49, 81) = 79.96B150 ケースだと約 11.994T になることが分かります *3

 

 

 

 

 

End

 

 

 

*1:正確には P が有限なので少しずれます

*2:こちらでは枝刈りなどする必要がなかったので、理論値に近いスコアが得られています

*3:実際には上で書いた私の解法が理論値に比べて悪化していたのと同様に、スタンプを押した結果が一様に分布していないことにより若干悪化すると思われます