ベストアンサー

より高速な画像の表示法

2007/05/18 15:00

医療画像（DICOM）のバイナリデータを読み込んで表示させるプログラムを作っているのですが、非常に遅い（約4秒）ので改善したいのです。おそらく、ループ中での、エンディアンの変換とPixelへの張付けが原因と思うのですが、改善方法が判りません。宜しくお願いします。 BolandC++Builder6,Pentiam4,1Gメモリ,XPの環境です。 DICOMO画像のファイルサイズは約2053kB 画像データは1024*1024の16ビットです。 __________________________________ Byte bb[2097152]; int iImage[512][512]; word c,wData; fp=fopen("filename","rb"); setvbuf(fp,NULL,_IOFBF,4096*1024*1024); while(gData!=0xE07F) //グループタグの検索// fread(& gData,2,1,fp); while(eData!=0x1000) //エレメントタグの検索// freadd(& eData,2,1,fp); fread(&wData,2,4,fp); //空読み// fread(bb,1,2097152,fp); //画像データ// fclose(fp); for(y=0;y<=512;y++){ for(x=0;x<=512;x++){ wData=256*bb[4*x+4096*y]+bb[4*x+4096*y+1]; c=wData*256/4096; iImage[x][y]=c; Image->Canvas->Pixels[x][y]=(TColor)((c<<16)|(c<<8)|c); c=0; } }

t0103
お礼率65% (17/26)

C・C++・C#
回答数18
ありがとう数17

みんなの回答 （18）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

sakusaker7
ベストアンサー率62% (800/1280)

2007/05/18 17:20 回答No.8

原因は幾つか推測できるだろうと思います。が、ここでやるべきは闇雲にここが怪しいからいじってみようという場当たり的な対処ではなく、きちんとプロファイリングをして、どこがホットスポットなのかを見極めることだと思います。もっともC++ Builderだとまともに使えるプロファイラがあるのかどうかわかりません(無責任ですみません)。少なくとも無料で使えるものはないかも知れません。

質問者

お礼 2007/05/22 13:20

その後、ダブルバッファの様な処理をさせたところ、0.4sと約7倍速くなりました。貴重なご意見ありがとうございました。

質問者

補足 2007/05/22 10:57

遅くなりましたがご意見を参考にしてclockで処理時間を計測しました default 3.00s 配列を[y][x]　2.47s ＃16＃17　2.49s Canvas->Pixel[x][y]を外し、新たな配列に入れた場合　0.062s となりました。 Canvas->Pixel[x][y]の処理が遅い原因のようですが、ループ内ではBitmapの画素値の計算だけにして、ループ外でBItmapの配列を直接imageに貼付ける処理を試してようと思いますが、方法が判りません。　

ログインすると、全ての回答が全文表示されます。

その他の回答 (17)

chie65536
ベストアンサー率41% (2512/6032)

2007/05/18 16:25 回答No.7

＞★fread の部分が遅くなっている気がします。＞・fopen() 後のループである fread() をしない方が良いでしょう。＞freadをせずにメモリの確保しメモリ上で検索するにはメモリ上で検索しても余り意味がない。Ｃのライブラリルーチンは内部的にバッファを持っていて、バッファリングされてメモリ上にあるデータは、ＩＯ操作せずにメモリ操作しかしない。 freadの関数のオーバーヘッドが多少減るのみで、高速化は期待出来ない。「スキップするヘッダのサイズが数キロバイトで、freadが数千のオーダーで呼ばれる」とかなら、最適化も充分に意味があるが、「患者氏名」とかが入ってるなら、せいぜい繰り返しても数十回であろう。

質問者

お礼 2007/05/18 18:02

回答ありがとうございます。 freadの回数は2000回オーバーですので、期待はできるかもしれません。ただ、やり方がよく判らないのです。

ログインすると、全ての回答が全文表示されます。

noname#39970

2007/05/18 16:16 回答No.6

ええともう片方はこうかな wData=256*bb[4*x+4096*y]+bb[4*x+4096*y+1]; ↓ //演算回数の削減 a= (x<<2) + (y<<12); wData= (bb[a]<<8)|bb[++a];

ログインすると、全ての回答が全文表示されます。

chie65536
ベストアンサー率41% (2512/6032)

2007/05/18 16:15 回答No.5

＞wData=256*bb[4*x+4096*y]+bb[4*x+4096*y+1]; ＞c=wData*256/4096; ここ、何か変ですね。上位、下位で２バイト持って来ておきながら Wordのデータを256倍して上位バイトを捨て、１２ビット分の除算で、下位側の４ビットだけ残してる。＞Image->Canvas->Pixels[x][y]=(TColor)((c<<16)|(c<<8)|c); 最終的には、cが８ビットで、それをRGBの24ビットのR,G,B同じモノクロにしているつもりになっている。もし「１画素16ビットの1024×1024を、間引きして、８ビット256階調の512×512にする」んで正しければ、以下のようになる。－－－－－－－－－－－－－－ Byte bb[2097152]; Byte *p; int iImage[512][512]; word c,wData; fp=fopen("filename","rb"); setvbuf(fp,NULL,_IOFBF,4096*1024*1024); while(gData!=0xE07F) //グループタグの検索// fread(& gData,2,1,fp); while(eData!=0x1000) //エレメントタグの検索// freadd(& eData,2,1,fp); fread(&wData,2,4,fp); //空読み// fread(bb,1,2097152,fp); //画像データ// fclose(fp); p=bb; for(y=0;y<=512;y++){ for(x=0;x<=512;x++){ c=*p++;//cは16ビットの上位バイト iImage[x][y]=c*256+*p;//iImageには16ビット分を格納 Image->Canvas->Pixels[x][y]=(TColor)(c*0x010101); p+=3; } p+=2048; } －－－－－－－－－－－－－－＞c=wData*256/4096; の意味が良く判らないが、元ソースのまま、同じ動作にするなら－－－－－－－－－－－－－－ Byte bb[2097152]; Byte *p; int iImage[512][512]; word c,wData; fp=fopen("filename","rb"); setvbuf(fp,NULL,_IOFBF,4096*1024*1024); while(gData!=0xE07F) //グループタグの検索// fread(& gData,2,1,fp); while(eData!=0x1000) //エレメントタグの検索// freadd(& eData,2,1,fp); fread(&wData,2,4,fp); //空読み// fread(bb,1,2097152,fp); //画像データ// fclose(fp); p=bb; for(y=0;y<=512;y++){ for(x=0;x<=512;x++){ wData=*p*256+p[1]; c=wData*256/4096; iImage[x][y]=c; Image->Canvas->Pixels[x][y]=(TColor)(c*0x010101); p+=4; } p+=2048; } －－－－－－－－－－－－－－になる。「c=wData*256/4096;」の意味が理解不可能なので、ここは最適化せずにそのまま残している。

質問者

お礼 2007/05/18 17:59

回答ありがとうございます。もし「１画素16ビットの1024×1024を、間引きして、８ビット256階調の512×512にする」んで正しければ、以下のようになる。この解釈でよいのですがうまく動きませんでした。

ログインすると、全ての回答が全文表示されます。

noname#39970

2007/05/18 15:52 回答No.4

ごめん　違った　c=wData*256/4096;　は単純に上の桁を8bit排除する物なのかな c=wData>>4; //排除しないならこうだと思う。(通分)

ログインすると、全ての回答が全文表示されます。

noocyte
ベストアンサー率58% (171/291)

2007/05/18 15:47 回答No.3

> setvbuf(fp,NULL,_IOFBF,4096*1024*1024); 4GB のバッファですか!? しかも，メモリが 1GB しかないのに．これは確保に失敗しているでしょう．いや，それ以前に，size_t が32ビット以下ならば， 4096 * 1024 * 1024 はオーバーフローして０になっているはずです． (コンパイル時に警告とかエラーになりませんでしたか？) いずれにしても setvbuf() はエラーを返しており，バッファは確保されていないはずです．それが遅さの原因と思われます．ちゃんとエラーチェックをする習慣をつけてください． (fread() についても．)

質問者

お礼 2007/05/18 17:00

回答ありがとうございます。 setvbufについて。PCはネットに繋いでいないので、Macから質問しているのですがタイプするときに*1024を１回間違いました。私のタイプミスで余計なお時間を取らせてしまいました。 (fread() についても．)はどういう意味でしょうか？

ログインすると、全ての回答が全文表示されます。

noname#39970

2007/05/18 15:36 回答No.2

うーん見てぱっと考えつくのは　2の乗数による乗除算を論理演算・ビット演算に置き換えていく事かな例えば c=wData*256/4096; //↓(これは下8bitをちょん切って更に3bitずらす作業だと思う) c=(wData&0xfff8)<<3; //型の大きさで0xfff8は適当に。 //手を抜くなら (!((!wData)|0x7))<<3 とか。ステップ数多いから遅いかも

ログインすると、全ての回答が全文表示されます。

Oh-Orange
ベストアンサー率63% (854/1345)

2007/05/18 15:30 回答No.1

★fread の部分が遅くなっている気がします。・fopen() 後のループである fread() をしない方が良いでしょう。　つまり、画像全体が収まるメモリを確保して、その画像ファイルすべてを　メモリに読み込みます。そして、メモリ上で『グループタグの検索』や　『エレメントタグの検索』を検索してみます。メモリが多いなら出来るかな。・あと別の方法で一度、画像データから『グループタグの検索』や『エレメントタグの検索』を　検索して画像の読み込む位置を別のファイルに保存しておきます。　そして、その位置ファイルを先に読み込み、fseek() 関数で位置を移動してから　瞬時に画像データを 2097152 バイト分読み込む方式を取ればもっと高速になります。　また、メモリも画像データを読み込む 2097152 バイト分で済みます。・以上。参考に。

質問者