Mandelbrot集合描画支援ハードウェア [ Pyxis ]

３．システム設計

表紙
目次

１．　製作の目的
１．１　対象
１．２　問題点
１．３　解決法
１．４　略記号について

２．　システム概要
２．１　設計方針
２．２　システム的機能
２．３　動作の概要

３．　システム設計
３．１　演算フローの検討
３．２　数値のデータ表現
３．３　式(1-5)の判定法

４．　機能ブロックの解説
４．１　システムブロック
４．２　加算・減算回路
４．３　乗算回路
４．４　Ox：C_x生成回路
４．５　Oy：C_y生成回路
４．６　Xx：Z_x²－Z_y²＋C_x演算回路
４．７　Yy：２Z_xZ_y＋C_ｙ演算回路
４．８　Rr：Z_x²＋Z_y²演算回路
４．９　Cn：制御回路
４．10　回路図の構成

５．　タイミング設計
５．１　タイムチャートの表記法
５．２　タイムチャート

６．　使用部品

 ７．　実装設計
７．１　基板
７．２　レイアウト

８．　製作

 ９．　ハンドリングソフトウェア

 10．　結果
10．１　実行時間
10．２　設計目標との対比

11．　終わりに

付録１　制御信号と出力条件
付録２　タイムチャート
付録３　部品表
付録４　部品レイアウト図 (約240KB)
付録５　回路階層と機能説明
付録６　全回路図 (約1.7MB)

fig3-1

［図３-１］演算フロー

［図３-２］パイプラインとピクセルペア

３.１　演算フローの検討

　式(1-6)及びリスト１-１をデータフローを中心に考えると，図３-１のように表すことができます．

(1)パイプライン化
　この図から，反復１回分の演算は前半の乗算部と後半の加減算部に分割でき，かつそのそれぞれが，互いの演算結果を利用し合う形のループになっていることがわかります．よって，乗算部と加減算部をパイプライン化することで，それぞれを休むことなく動作させることができます．そのため，このパイプラインループに２ピクセル分のデータをいれ，乗算部と加減算部を交互に回るように全体を構成しました．
　まずＰ_Ｅが乗算部へ入り，その結果が加減算部へ送られると同時に乗算部ではＰ_Ｄの処理が開始されます（図３-２）．以後これを反復し，Ｐ_Ｅが乗算部に戻ってくる毎にｎが１増えることになります．
　このように，Ｐ_Ｅ,Ｐ_Ｄのそれぞれについて式(1-1)の反復演算が同時に行われます．これにより通常動作中の演算回路の利用効率を100％とすることができます．

(2)並列処理
　図３-１のフローには乗算Ｚ_nｘ^２，Ｚ_nｘＺ_nｙ，Ｚ_nｙ^２を中心とした，次の３つの大きな流れがあることがわかります．

exp3-1

これらはそれぞれ，式(1-6a)の実部と虚部，式(1-6b)に対応しています．
　主な演算部を，この乗算を中心とした３つに分解し，その各部が並列に動作するようにしました．乗算器を３つ用意し，そのそれぞれから同時に出力される結果を，３分割された各加減算部が並列に利用しています．　なお式(3-1b)の２倍演算は，Ｚ_nｘＺ_nｙの乗算結果をステージ間レジスタにロードする部分で１ビットずらしておくことで処理しています．
　以上のように，演算フローの中の並列性を，コスト他の制限が許す範囲で最大限に利用しています．それによって，全体の処理速度，演算回路の利用効率をそれぞれ向上させています．

３.２　数値のデータ表現

　演算数値データのフォーマットは，２の補数固定小数点64ビットにしました．ビット割り当ては，符号１ビット，整数部３ビット，小数部60ビットです．

(1)ビット配分
　式(1-5)の条件により，Ｍ集合の演算は実数部虚数部ともに±２の範囲で考えれば十分です．これを有効利用すれば，無用に大きな数を表現する必要がなくなり，整数部のビット数を最小限に押さえられます．実際には，式(1-5)の判定をＺ_ｘ^２＋Ｚ_ｙ^２だけでなく，それぞれ２乗する前のＺ_ｘ，Ｚ_ｙにおいても判定するようにして，整数部を３ビットに押さえています．これについては次項で説明します．

(2)２の補数表現
　Pyxisの乗算回路には，２の補数をそのまま乗算できる２次Boothアルゴリズムを用いています．これにより，演算回路のすべてでデータ表現を２の補数に統一することができます．符号反転や絶対値などの余分な回路を省略し，かつ加減算と相性の良い最適な表現法といえます．

(3)ビット数と固定小数点表現
　データ長に64ビット用意したのは，非常に大きな拡大率の図形に対して十分な反復回数の演算ができるようにするためです．この固定小数点表現なら有効桁は十進数で１８桁以上ありますので，対象の複素平面に対して一様（これが重要）に十分な精度が得られます．浮動小数点方式では，表現できる数値が対数的であることに加え，1.0付近の数値を表現すると指数部が無意味になることから，ハードウエアが複雑になる以上にそのメリットはありません．

３.３　式(1-5)の判定法

(1)Ｚ_nｘ^２＋Ｚ_nｙ^２の判定
　|Ｚ_n|を得るためには(Ｚ_nｘ^２＋Ｚ_nｙ^２)^１／２を計算する必要がありますが，式(1-5)の判定が目的ならもちろんこれは不要で，次式の成立を調べれば十分です．

(2)判定法の改良
　しかし，３.２で説明したように，64ビットの数値データを有効に使うためには，できるだけ小数部のビット数が多い方が有利です．
　仮に，あるｎ-1回目における式(3-2)の判定が

にて不成立となったとすると，次回(n)の判定の時には，例えば，

exp3-2b

の時に，

となってしまいます．この数を表せるようにするには，整数部に６ビットが必要です．
　このビット数を削減するため,２乗の前のＺ_nｘ,Ｚ_nｙをそれぞれチェックする回路を追加しました．もちろんこのためのハードウエア量が大きければ本末転倒ですが，論理的にはわずかゲート３個で実現可能です．
　式(3-1)において，

exp3-34

のいずれかが成り立つならば，式(3-2)も成立します．
　この式(3-3),式(3-4)の判定を，Ｚ_nｘ,Ｚ_nｙが乗算部に入る直前に行います．このことは，式(3-2)の評価の一部を１反復サイクル前に先取りして行うことと同じです．従って，式(3-3),式(3-4)の判定結果は制御回路にて１サイクル分遅延した後，式(3-2)と併せて評価するようにします．
　これによるワーストケースは，式(3-3)，式(3-4)のどちらもを満たさない最大値，

exp3-34a