for
ループを回避するのではなく、パフォーマンスに関心があることを明確にしたため、この回答の下部にはいくつかのベンチマークコードがあります。
実際、for
ループはおそらくここで最もパフォーマンスの高いオプションだと思います。"新しい"(2015b)JITエンジンが導入された(ソース)以来、for
ループは本質的に低速ではありません。実際、ループは内部で最適化されています。
ベンチマークから、mat2cell
ThomasIsCodingが提供するオプションが非常に遅いことがわかります ...
スケールを明確にするためにその行を削除すると、私のsplitapply
方法はかなり遅くなります。obchardonのaccumarrayオプションは少し優れていますが、最も速い(そして比較可能な)オプションはarrayfun
(Thomasによって示唆されているように)またはfor
ループを使用しています。これarrayfun
は基本的for
にほとんどのユースケースの変装ループであることに注意してください。したがって、これは驚くべきタイではありません。
for
コードを読みやすくして最高のパフォーマンスを得るには、ループを使用することをお勧めします。
編集:
ループが最速のアプローチであると想定した場合、find
コマンドを中心にいくつかの最適化を行うことができます。
具体的には
確認しM
た論理。以下のプロットが示すように、これは比較的小さなの場合は速くなる可能性M
がありますが、大きなの場合は型変換のトレードオフで遅くなりますM
。
を使用する代わりに、論理M
を使用して配列1:size(M,2)
にインデックスを付けfind
ます。これにより、ループの最も遅い部分(find
コマンド)が回避され、型変換のオーバーヘッドを上回り、最も速いオプションになります。
最高のパフォーマンスを得るための私の推奨は次のとおりです。
function A = f_forlooplogicalindexing( M )
M = logical(M);
k = 1:size(M,2);
N = size(M,1);
A = cell(N,1);
for r = 1:N
A{r} = k(M(r,:));
end
end
これを以下のベンチマークに追加しました。ループスタイルのアプローチの比較を以下に示します。
ベンチマークコード:
rng(904); % Gives OP example for randi([0,1],3)
p = 2:12;
T = NaN( numel(p), 7 );
for ii = p
N = 2^ii;
M = randi([0,1],N);
fprintf( 'N = 2^%.0f = %.0f\n', log2(N), N );
f1 = @()f_arrayfun( M );
f2 = @()f_mat2cell( M );
f3 = @()f_accumarray( M );
f4 = @()f_splitapply( M );
f5 = @()f_forloop( M );
f6 = @()f_forlooplogical( M );
f7 = @()f_forlooplogicalindexing( M );
T(ii, 1) = timeit( f1 );
T(ii, 2) = timeit( f2 );
T(ii, 3) = timeit( f3 );
T(ii, 4) = timeit( f4 );
T(ii, 5) = timeit( f5 );
T(ii, 6) = timeit( f6 );
T(ii, 7) = timeit( f7 );
end
plot( (2.^p).', T(2:end,:) );
legend( {'arrayfun','mat2cell','accumarray','splitapply','for loop',...
'for loop logical', 'for loop logical + indexing'} );
grid on;
xlabel( 'N, where M = random N*N matrix of 1 or 0' );
ylabel( 'Execution time (s)' );
disp( 'Done' );
function A = f_arrayfun( M )
A = arrayfun(@(r) find(M(r,:)),1:size(M,1),'UniformOutput',false);
end
function A = f_mat2cell( M )
[i,j] = find(M.');
A = mat2cell(i,arrayfun(@(r) sum(j==r),min(j):max(j)));
end
function A = f_accumarray( M )
[val,ind] = ind2sub(size(M),find(M.'));
A = accumarray(ind,val,[],@(x) {x});
end
function A = f_splitapply( M )
[r,c] = find(M);
A = splitapply( @(x) {x}, c, r );
end
function A = f_forloop( M )
N = size(M,1);
A = cell(N,1);
for r = 1:N
A{r} = find(M(r,:));
end
end
function A = f_forlooplogical( M )
M = logical(M);
N = size(M,1);
A = cell(N,1);
for r = 1:N
A{r} = find(M(r,:));
end
end
function A = f_forlooplogicalindexing( M )
M = logical(M);
k = 1:size(M,2);
N = size(M,1);
A = cell(N,1);
for r = 1:N
A{r} = k(M(r,:));
end
end
for
ですか、それともループを回避したいですか?この問題について、MATLABの最新バージョンでは、for
ループが最速の解決策であると強く思います。パフォーマンスの問題がある場合、古いアドバイスに基づいてソリューションの間違った場所を探していると思います。