K th number

K-th number

@hyksm

概要個の整数の要素を持つ集合が存在する番目に小さい要素の値を求めたい

まず中央値（番目に小さい要素の値）を求めるアルゴリズムを考え、選択アルゴリズムに拡張する

目的決定性アルゴリズム乱択アルゴリズム

計算の途中にランダムな選択をする乱数を使って実行手順候補の内の１つを選ぶ

多くの場合、決定的な解法よりも効率的単純であり、実装が容易

中央値を求めるアルゴリズムまずは決定性アルゴリズム

ソート

クイックソートと同じような感じピボットを決めて数列を分割中央値が含まれているほうの数列で再帰的に

分割を行うピボットをうまく決めると平均的に

問題点ではあるが・・・

比較的実装が重たい定数項が重い

乱数を使うことで改善できる！モンテカルロアルゴリズム

目標中央値をとしたときに、となるような集

合の要素を見つける集合の中で以上以下の要素の個数を以下

に抑える

見つからなかったら「失敗」を出力片側誤りのモンテカルロアルゴリズム

で中央値を求める未満の要素の個数（）を求める以上以下の要素をソート個目の要素（＝中央値）を出力する

以上以下の要素の個数が以下なので、計算量は（計算省略）

とを求めるために中央値がどのあたりにあるかを知りたい

標本抽出元の標本から一様ランダムに選択して小さい

標本をつくる

とを求めるために元の集合から一様ランダムに要素を選び、

要素を持つ新しい集合を作る先程と同様に、ソートはで行える新しい集合の中央値が求められる

とを求めるために新しい集合の中央値は元の集合の中央値

に近いことが期待される中央値から離れた要素をおよびとする　は新しい標本の番目に小さい要素　は新しい標本の番目に小さい要素

𝑑 𝑢

目標の確認中央値をとしたときに、となるような集

合の要素を見つける集合の中で以上以下の要素の個数を以下

に抑える

前に求めたは上の条件をどのくらいの確率で満たしている？

（満たしていなかったら「失敗」）

失敗確率の解析失敗となる事象は以下の 3 種類

未満の要素の個数がより大きいより大きい要素の個数がより大きい以上以下の要素がより多い

失敗確率の解析詳しい計算は長くなるので省略 Chebyshev の不等式を適用それぞれの事象が起こる確率は

「失敗」を出力する確率は

実際に実行してみるのとき

計算上の失敗確率　　ぐらい実際の失敗確率　　　ぐらい

のとき計算上の失敗確率　　実際の失敗確率　　　（失敗なし）

が大きければ失敗なしと見なせる

実際に実行してみる実行時間も決定性アルゴリズムより早いのケースを 10000 回実行して

乱択（）　約秒決定（）　約秒ソート（）　約 37 秒

実用的！

選択アルゴリズムに拡張集合の番目を求めるアルゴリズム決定性アルゴリズムは中央値を求めるア

ルゴリズムとほぼ同じ

選択アルゴリズムに拡張乱択アルゴリズムもほぼ同じ

との基準点が番目の要素に移動標本抽出によって作られた集合に、元の集

合の最小値と最大値を加える必要があるどんな値でもとで挟めるようにするため

失敗確率の解析最小値と最大値を追加しているので、解析

がちょっと難しい中央値アルゴリズムとほぼ同じだが、大

分大雑把な解析を行った失敗確率はで抑えられる

実際に実行してみるのとき

計算上の失敗確率　　ぐらい実際の失敗確率　　　ぐらい

のとき計算上の失敗確率　　実際の失敗確率　　　（失敗なし）

で 10000 回実行乱択⇒約秒　　決定性⇒約秒

まとめ乱択は実装が比較的楽

決定性アルゴリズムのは実装が重い定数係数も小さい

実行時間が決定性アルゴリズムより短いが大きければ失敗もほとんどしない

成功するまでプログラムを動かしても良い

乱択アルゴリズムって便利！

Documents

K th number