パラメトロン計算機: ループ検出

2016年10月5日水曜日

ループ検出

前回のこのタイトルのブログで, Gosper流のループ検出法の説明をしたが, これでループが発見できる理由があれだけではいまいちである.

私がどう納得しているかも書いておく必要があろう. x_iが次々と置かれていく様子を添字だけで再掲する.

i	T₀	T₁	T₂	T₃
1	1
2	1	2
3	3	2
4	3	2	4
5	5	2	4
6	5	6	4
7	7	6	4
8	7	6	4	8
9	9	6	4	8
10	9	10	4	8

これらの表中のx_iに, 次のxがあるかどうかを調べるのだが, そこで添字の差だけの表にすると

i	T₀	T₁	T₂	T₃
1	-1
2	-2	-1
3	-1	-2
4	-2	-3	-1
5	-1	-4	-2
6	-2	-1	-3
7	-1	-2	-4
8	-2	-3	-5	-1
9	-1	-4	-6	-2
10	-2	-1	-7	-3

つまり1つ前2つ前に同じものがあると, それらはT₀で見付かり, 3つ前4つ前にあると, それらはT₁で見付かり,...というわけだ. Tの添字が大きいほど, 繰り返し開始時のμの値の曖昧さが大きいことがこの表から判明する.

TAOCPでは演習問題3.1-7にこの話があり, その解答には

x_nが表T_ρnに格納されると, それはその後x_n+1, x_n+2, ..., x_n+2^ρn+1と比較される.

と記載してあるが, 上の説明の方が分り易いと私は思っている.

Gosperの元の記事はHAKMEM 132 (http://home.pipeline.com/~hbaker1/hakmem/flows.html#item132)にある.

2016年9月22日木曜日

ループ検出

数列x_iが例えば32ビットの語の範囲の値しかとれなくて, x_i+1=f(x_i)を繰り返していくと, いつかは昔のある値が現れ, 以後同じ数列を辿ることになって, ループを回り始める.

このループの開始位置とループ長を求めるのがループ検出である.

そのひとつの方法にBill Gosperの考案したものがあり, あちこちに説明があるが, あまり真面目に読んだことはなかった. しかし気にはなっていたので, この数日プログラムを書いてみたりしながら, その仕掛けを調べてみた.

いまx₁, x₂, x₃, ... が1,2,3,4,5,6,7,8,9.10,6,7,8,9,10,6,7,8,...であったとしよう.(x₀から始める流儀もあり, また私はそれが好きだが, 今回の添字は1から始めることにした.) The Art of Computer Programming(TAOCP)の演習問題3.1,6の記述を借用すれば, 「x₁,x₂,...,x_μ,..., x_μ+λ-1は互いに相異なるが, n ≥μの時はx_n=x_n+λであるμとλがある.」

このμが開始位置, λがループ長で, 上の例ではμ=6, λ=5だ.

記憶場所も時間もふんだんにある時は, xの値をすべて順に記憶しておき, 新しいxについて, それを過去のすべてのxの値のそれぞれと比較する. そこに同じものがあれば, 前の値のあったところがループの開始場所であり, そこから今の値までの長さがループ長である.

しかし, こんなことはとてもやっていられないから, あの手この手を考えることになる. その一つにGosperの提案したものがある. 以下は添字などを私流に多少修正したものである.

これは簡単にいえば, 繰り返しが「現れるや否や」発見するのは諦める, 最新のxの1つ前, 2つ前, 4つ前, 8つ前, ... などを覚えておき, ループに入り同じ値が現れ始めたらなるべく早目にそれを発見しようという方針である.

「1つ, 2つ, 4つ, 8つ,...」から推察されるように, n個のxを調べた時は, log₂ n個程度の配列Tを使う.

ところで, n>0を二進法で表した時, もっとも右の1の位置, もっとも左の1の位置をTAOCPに倣い, それぞれρ(n), &lambda(n)とする. ビットの位置は右端を0とする. (上のループ長の定義にもλがあって申し訳ない.)

ρ(1)=0, λ(1)=0; 
ρ(2)=1, λ(2)=1; 
ρ(3)=0, λ(3)=1; 
ρ(4)=2, λ(4)=2; 
ρ(5)=0, λ(5)=2; 
ρ(6)=1, λ(6)=2; 
ρ(7)=0, λ(7)=2; 
ρ(8)=3, λ(8)=3;

ρの方は別名ルーラー関数(物差関数)という.

十進法の物差しとは様子が違い, ひと目盛りが半分ずつに分割されていて, インチの物差しが大体こういう感じである.

ρとλを計算する関数 rhoとlamは次のようだ.

ρは

(define (rho x)
 (define (r x rh)
   (if (= (modulo x 2) 0) (r (quotient x 2) (+ rh 1)) rh))
 (if (= x 0) 'error (r x 0)))

(map rho (a2b 1 16)) => (0 1 0 2 0 1 0 3 0 1 0 2 0 1 0)

またλは関数logがあれば

(define (lam n)
 (inexact->exact (floor (/ (log n) (log 2))))

(map lam (a2b 1 16))=>
(0 1 1 2 2 2 2 3 3 3 3 3 3 3 3)

ρのように自力で計算するには

(define (lam x)
 (cond ((= x 0) 'error)
       ((= x 1) 0)
       (else (+ (lam (quotient x 2)) 1))))

さて配列をT₀, T₁, T₂, ... とする. (こちらは0から始める) そしてx_iをT_ρ(i)に順に置くのである.

x_iが次々と置かれていく様子は次のようだ.

i	T₀	T₁	T₂	T₃
1	x₁
2	x₁	x₂
3	x₃	x₂
4	x₃	x₂	x₄
5	x₅	x₂	x₄
6	x₅	x₆	x₄
7	x₇	x₆	x₄
8	x₇	x₆	x₄	x₈
9	x₉	x₆	x₄	x₈
10	x₇	x₁₀	x₄	x₈

注意すべきは, この表のうち見えているのは最後の行だけということである. つまりi=8の時には, x₁, x₂, x₃, x₅はすでに消えている.

さて, 上の例のようなループがあった時の同様な配列のx₁₀=10までの変化の様子は,

i	T₀	T₁	T₂	T₃
1	1
2	1	2
3	3	2
4	3	2	4
5	5	2	4
6	5	6	4
7	7	6	4
8	7	6	4	8
9	9	6	4	8
10	9	10	4	8

のようだ. ここでx₁₁=6になった時, この配列は9, 10, 4, 8であり, この中に6はないから, 6を(ρ(11)=0だから)T₀のところに置く. したがって配列は6, 10, 4, 8になる. 次, x₁₂=7も配列にないから, 7をT₂に置き, 配列は6, 10, 7, 8になる.

次はx₁₃=8だが, i=8の時に作ったT₃に8があるので, 循環が始まっていたのがわかる.

そこで問題はiの行のT_kを置いたのは誰かということだ. 最初の表からxを削除した表は次のようだが

i\k	0	1	2	3
1	1
2	1	2
3	3	2
4	3	2	4
5	5	2	4
6	5	6	4
7	7	6	4
8	7	6	4	8
9	9	6	4	8
10	7	10	4	8

これで例えばi=7, k=2ならこの4を置いたのはi=4であったということが知りたい.

いろいろやってみると, iからiの下からk+1ビットをとったものの, 先頭の0,1を逆にしたものを引くといいらしいことが分かる.

iの下からk+1ビットをとるには, 2^k+2-1で1のビット列を作ってマスクする.

i &(2^k+2-1)

これを 2^kでxorすると先頭のビットが反転する.

それをiから引くのである. Schemeで書くと

(define (m i k)
   (- i (fix:xor (fix:and i (- (fix:lsh 1 (+ k 1)) 1)) 
    (fix:lsh 1 k))))

であって, 実際に計算すると

(do ((i 1 (+ i 1))) ((= i 11))
(display (cons i 
 (map (lambda (k) (m i k)) (a2b 0 (+ (lam i) 1)))))
(newline))

(1 1)
(2 1 2)
(3 3 2)
(4 3 2 4)
(5 5 2 4)
(6 5 6 4)
(7 7 6 4)
(8 7 6 4 8)
(9 9 6 4 8)
(10 9 10 4 8)

となって上の表と一致する.

従ってi=13の時のx_13>=8がi=12, k=3にあり, (m 12 3)=8が分ったから, λ=13-8=5であった.

プログラムを書いてやってみよう. 最初の数列x_iは, μとλから

(define (f i mu lm)
 (if (< i mu) i (+ (modulo (- i mu) lm) mu)))

(map (lambda (i) (f i 6 5)) (a2b 1 19)) => 
(1 2 3 4 5 6 7 8 9 10 6 7 8 9 10 6 7 8)

と作る. プログラム全体と実行結果を下に示す.

(define (iloop i x)
 (define (kloop k)
  (if (> k (lam (- i 1))) (iloop i x)
  (begin 
   (if (= x (vector-ref tab k)) (list i k (m (- i 1) k))
     (kloop (+ k 1))))))
(vector-set! tab (rho i) x)
(display i) (display (take (+ (lam i) 1) (vector->list tab))) 
(newline)
(set! i (+ i 1))
(set! x (f i mu lm))
(kloop 0))

(define mu 6) (define lm 5)
(iloop 1 (f 1 mu lm))

1(1)
2(1 2)
3(3 2)
4(3 2 4)
5(5 2 4)
6(5 6 4)
7(7 6 4)
8(7 6 4 8)
9(9 6 4 8)
10(9 10 4 8)
11(6 10 4 8)
12(6 10 7 8)

=> (13 3 8)

つまりi=13のとき, k=3の所に同じものがあり, その時のiは8であった. 従ってλは13-8=5であった.

パラメトロン計算機

2016年10月5日水曜日

ループ検出

2016年9月22日木曜日

ループ検出

ラベル

ブログアーカイブ

自己紹介

パラメトロン計算機

2016年10月5日水曜日

ループ検出

2016年9月22日木曜日

ループ検出

ラベル

ブログ アーカイブ

自己紹介

ブログアーカイブ