GLSLによる高速ガウスぼかしのトリックは、GPUがハードウェアで線形補間を提供するという事実を利用することです。したがって、1つのプリフェッチまたは8つの3Dボクセルで4つの2Dピクセルを効果的にサンプリングできます。サンプリングする場所を決定することにより、出力に重みを付けることができます。決定的なリファレンスは、オンラインで入手できるSigg and Hadwigerの「高速3次テクスチャフィルタリング」です。
読みやすい説明については、「線形サンプリングによる効率的なガウスぼかし」のWebページを参照してください。前述のように、ガウスぼかしは幅の広いカーネルで分離可能であるため、次元ごとに1つのパスを実行するのが最も効率的です。
ただし、このトリックを使用して、シングルパスでガウスカーネルをタイトカーネルで近似することもできます。以下の例では、3Dカーネルを上のスライス= [1 2 1; 2 4 2; 1 2 1]; 中央のスライス= [2 4 2; 4 8 4; 2 4 2]; 下部スライス= [1 2 1; 2 4 2; 1 2 1]。各次元で+/- 0.5ボクセルをサンプリングすることにより、27ではなく8つのテクスチャフェッチでこれを実行します。これをGLSLでMRIcroGLシェーダーファイルとして示しています。スクリプトを「a.txt」としてドロップして保存MRIcroGLの「シェーダー」フォルダー。プログラムを再起動すると、レイキャスト画像がぼやけて表示されます。「doBlur」チェックボックスをクリックすると、ぼかしのオンとオフが切り替わります。ラップトップで統合されたIntel GPUと「chris_t1」を使用する MRIcroGLに付属の画像では、ぼかしなしで70fps(1テクスチャフェッチ)とぼかしありで21fps(8フェッチ)が得られます。コードのほとんどは単なる古典的なレイキャスターであり、「doBlur」条件は質問をカプセル化します。
//-------a.txtファイルが続く
//pref
doBlur|bool|true
//vert
void main() {
gl_TexCoord[1] = gl_MultiTexCoord1;
gl_Position = ftransform();
}
//frag
uniform int loops;
uniform float stepSize, sliceSize, viewWidth, viewHeight;
uniform sampler3D intensityVol;
uniform sampler2D backFace;
uniform vec3 clearColor;
uniform bool doBlur;
void main() {
// get normalized pixel coordinate in view port (e.g. [0,1]x[0,1])
vec2 pixelCoord = gl_FragCoord.st;
pixelCoord.x /= viewWidth;
pixelCoord.y /= viewHeight;
// starting position of the ray is stored in the texture coordinate
vec3 start = gl_TexCoord[1].xyz;
vec3 backPosition = texture2D(backFace,pixelCoord).xyz;
vec3 dir = backPosition - start;
float len = length(dir);
dir = normalize(dir);
vec3 deltaDir = dir * stepSize;
vec4 colorSample,colAcc = vec4(0.0,0.0,0.0,0.0);
float lengthAcc = 0.0;
float opacityCorrection = stepSize/sliceSize;
//ray dithering http://marcusbannerman.co.uk/index.php/home/42-articles/97-vol-render-optimizations.html
vec3 samplePos = start.xyz + deltaDir* (fract(sin(gl_FragCoord.x * 12.9898 + gl_FragCoord.y * 78.233) * 43758.5453));
//offset to eight locations surround target: permute top/bottom, anterior/posterior, left/right
float dx = 0.5; //distance from target voxel
vec3 vTAR = vec3( dx, dx, dx)*sliceSize;
vec3 vTAL = vec3( dx, dx,-dx)*sliceSize;
vec3 vTPR = vec3( dx,-dx, dx)*sliceSize;
vec3 vTPL = vec3( dx,-dx,-dx)*sliceSize;
vec3 vBAR = vec3(-dx, dx, dx)*sliceSize;
vec3 vBAL = vec3(-dx, dx,-dx)*sliceSize;
vec3 vBPR = vec3(-dx,-dx, dx)*sliceSize;
vec3 vBPL = vec3(-dx,-dx,-dx)*sliceSize;
for(int i = 0; i < loops; i++) {
if (doBlur) {
colorSample = texture3D(intensityVol,samplePos+vTAR);
colorSample += texture3D(intensityVol,samplePos+vTAL);
colorSample += texture3D(intensityVol,samplePos+vTPR);
colorSample += texture3D(intensityVol,samplePos+vTPL);
colorSample += texture3D(intensityVol,samplePos+vBAR);
colorSample += texture3D(intensityVol,samplePos+vBAL);
colorSample += texture3D(intensityVol,samplePos+vBPR);
colorSample += texture3D(intensityVol,samplePos+vBPL);
colorSample *= 0.125; //average of 8 sample locations
} else
colorSample = texture3D(intensityVol,samplePos);
colorSample.a = 1.0-pow((1.0 - colorSample.a), opacityCorrection);
colorSample.rgb *= colorSample.a;
//accumulate color
colAcc = (1.0 - colAcc.a) * colorSample + colAcc;
samplePos += deltaDir;
lengthAcc += stepSize;
// terminate if opacity > 95% or the ray is outside the volume
if ( lengthAcc >= len || colAcc.a > 0.95 ) break;
}
colAcc.rgb = mix(clearColor,colAcc.rgb,colAcc.a);
gl_FragColor = colAcc;
}