Heisenberg Machine (gpgpu) -...

30
GPU(Graphic Processing Unit)による分子動力学、積分 方程式および量子計算 理研 中央研 飯高敏晃 http://www.iitaka.org/

Transcript of Heisenberg Machine (gpgpu) -...

Page 1: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

GPU(Graphic Processing Unit)による分子動力学、積分方程式および量子計算

理研 中央研 飯高敏晃

http://www.iitaka.org/

Page 2: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

何について話すか

専用計算機

計算対象

ハイゼンベルク・マシーン(量子スピン系用計算機)

Page 3: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

初代GRAPEは20万円

なぜ安かったか

秋葉原で市販品(量産品)の部品を買ってきて組み立てた。

http://www.iitaka.org/bookshelf_j.html#special_computer

Page 4: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

いまやるなら、GPUだ!

GPUボード 2~7万円

高性能GPU付きパソコン20万円位(大抵のパソコンに最初から付いている)

GPUとは。グラフィック アクセラレーターのこと。パソコンの画面への描画を制御する素子。」

Page 5: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

GPUとは

パソコンの描画素子

年数千億円のゲーム市場⇒量産効果、開発競争による高性能低価格化

プログラム可能

浮動小数点計算可能

http://www.nvidia.com/

Page 6: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

CPUとGPU

GPUCPU

計算 表示

GPUCPUO(N)

演算O(N2)

通常の利用

補助計算機として

Page 7: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

分子動力学計算

粒子集団の運動方程式を数値的に解く

O(N2)

Page 8: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

MD-GRAPEとの比較

[3] R. Susukita et al., Phys. Commun. 155, 115 (2003).[4] M.Taiji et al., in Proceedings of SC'03, November 15-21, 2003, Phoenix Arizona, USA.

202501655(165)(5)

http://mdgrape.gsc.riken.jp/?easiestml_lang=xlang:ja

Page 9: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

GPUの計算速度(分子動力学)

6

7

8

9

3 4 5 6 7

Number of Particlelog10(N)

Spee

dlo

g10(

pair/

sec

CPUGPU

-5

0

5

3 4 5 6 7

Number of Particlelog10(N)

Tim

elo

g10(

T(se

c))

CPU

GPU

Page 10: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

計算精度

Page 11: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

GPUでの計算精度

-8

-7

-6

-5

-4

-33 4 5 6 7

Number of Particlelog10(N)

log1

0(er

ror)

Single PrecisionHigh Precision

Single Precision:GPU内蔵の単精度浮動小数点計算High Precision :計算の一部を多倍長ライブラリを用いて高精度化

Page 12: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

GPUでの数値表現

各色が単精度浮動小数点(32bit)に対応画素の構成

例:128x128粒子の座標

Page 13: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

Cg言語(GPU用C言語)

クーロン力の和の計算

Page 14: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

アセンブラ

TEMP R0;TEMP R1;TEMP R2;TEMP RC;TEMP HC;OUTPUT oCol = result.color;TEX R0.xyz, fragment.texcoord[0], texture[0], RECT;MOVR R2.xyz, c[0].x;MOVR R0.w, c[0].x;LOOP c[0].yxzw;MOVR R1.w, R0;MOVR R1.x, c[1];ADDR R1.xy, R1.wxzw, c[0].w;TEX R1.xyz, R1, texture[0], RECT;ADDR R1.xyz, R1, -R0;MULR R0.w, R1.y, R1.y;MADR R0.w, R1.x, R1.x, R0;MADR R0.w, R1.z, R1.z, R0;ADDR R0.w, R0, c[2].x;RSQR R2.w, R0.w;RCPR R2.w, R2.w;MULR R0.w, R2, R0;RCPR R0.w, R0.w;MADR R2.xyz, R1, R0.w, R2;ADDR R0.w, R1, c[0].z;ENDLOOP;TEX R0.xyz, fragment.texcoord[0], texture[1] RECT;ADDR oCol xyz R2 R0;END

Page 15: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

Lippman-Shwinger方程式

第2種 Fredhom積分方程式

リップマンシュウィンガー方程式

ナノ構造体の電気伝導などに応用

Page 16: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

スピン系用計算機

古典スピン系用計算機「イジング・マシーン」(伊藤伸泰、泰地真弘人、鈴木増雄、1988)

本研究では、量子スピン系用計算機「ハイゼンベルク・マシーン」に挑戦。

Page 17: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

ハイゼンベルク・マシーン

量子スピン系のハイゼンベルク模型の有限温度における動的性質を計算

http://www.iitaka.org/gpgpu.html

Page 18: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

Cu2+

量子スピン鎖

http://www.iitaka.org/frog2j.html

Page 19: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

ナノ分子磁石

K6[V15As6O42(H2O)] or V15

•実験: Sakon et al. (2003), Ajiro et al. (2003).•Line width, Line shpae, Intensity and DM/DD interaction.•理論:Machida et al. (cond-mat/0501439, J. Phys. Soc. Jpn. Suppl. 74, 107(2005). )

http://www.iitaka.org/down.html

Page 20: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

相互作用のない多電子系の線形応答関数

時間応答

フーリエ変換

T.Iitaka et al., Phys. Rev. E56, 1222 (1997) T.Iitaka et al., Phys. Rev. E61, R3314 (2000)

http://www.iitaka.org/frog2j.html

Page 21: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

行列関数のチェビシェフ展開

行列関数:

)()(2

)()(21)(

11

12

01

=−

−=

=

+≡

kN

llkl

kk

k

k

kk

xTxfN

c

HTN

cHTcHf

)1()()(2)(.............

2)()()(

11

22

1

0

≥−=

−=

==

−+ nHTHHTHT

IHHT

HHTIHT

nnn

行列版チェビシェフ多項式: H, 規格化ハミルトニアン⇒固有値の範囲 [-1,+1]

Page 22: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

Exp(-βH)

ボルツマン因子

分配関数

熱力学平均値

)()(2)(1

0 HTIIe nn

nH βββ ∑

=

− +=

[ ]HeZ β−= Tr

[ ] ZeA H /ATr β−=R.Kosloff and H.Tal-ezer, Chem.Phys.Lett. 127,223 (1986).R.N.Silver and H.Roeder, Internatnl. J. Mod. Phys.C 5,735(1994)

Page 23: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

Exp(-iHt)

時間発展演算子

01

0000

10

,)()()(2,)(,,

)()()(2)(

tHTtJittJtett

HTtJitJe

nn

nniHt

nn

nniHt

φφφφ ∑

∑∞

=

=

−+==+

−+=

H.Tal-ezer and R.Kosloff, J.Chem.Phys. 81,3967 (1984).Fortran Programs by T.Iitaka

Page 24: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

波動関数から画素への写像例

一色が32Bit実数1個に対応 

=⎥⎥⎦

⎢⎢⎣

++

=⎥⎦

⎤⎢⎣

⎡=

↓↓

↑↑

↑IR

IR

φφφφ

φφ

φ   

   

Page 25: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

多スピン系の波動関数

       

       

       

       

スピン3個の波動関数複素数8成分=実数16個

|±±±>=

Page 26: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

スピン演算子の作用

       

       

       

       

• 昇降演算子⇔平行移動

S+(2)|±±±>=

Page 27: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

ハイゼンベルク・マシーン

Dell Dimension 9100 + NVIDIA Gforce7800GTX

スパコンより速いパソコン!?

http://www.iitaka.org/gpgpu.html

Page 28: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

理研ベンチマーク賞受賞

2006年3月23日

実測 約6GFLOPS過去の1CPUの記録(2006年1月23日)

http://www.iitaka.org/gpgpu.html

Page 29: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

価格性能比

価格 本体+GPU=19万円    GPUボードのみ 7万円性能 ピーク150GFLOPS

実効  50GFLPOS (目標)スパコン(SX-7)では?価格     ?千万円

    ピーク性能 12GFLOPS

Page 30: Heisenberg Machine (gpgpu) - chubu-univdphysique.isc.chubu.ac.jp/Kenk06Jan/Iitaka20060119.pdfいまやるなら、GPUだ!GPUボード 2~7万円 高性能GPU付きパソコン20万円位

まとめ

ハイゼンベルク・マシーンの構想と開発状況を報告した。

分子動力学、流体力学に関する予備計算では、スパコンに劣らぬ性能を示した。

量子スピン系ではさらなる性能向上が期待される。