提高matlab运行速度的心得(转自振动论坛) 疯狂代码！

提高matlab运行速度的心得（转自振动论坛）2009-03-02 19:03:12| 分类： matlab | 标签： |字号大中小订阅
首先说说Matlab与其他语言的差异：例如对于C或者C++来说，只要算法的思想不变、采用的数据结构相同，不同人写出来的语句在效率上一般不会产生太大的差别。所以，对于C 来说，程序的好坏一般由算法来决定。但是，在matlab中，同样的算法、同样的结构、同样的流程，如果采用的语句不一样，在效率上就会大大不同。所以，我认为，使用matlab比使用其他语言更加困难，也显得matlab更难以掌握。另外，由于matlab在存储管理上的不便，使得在同时提高时空两域的效率变得更加困难，特别是在空间上（因为在时间上matlab提供了profiler这个非常有用的工具，但是在空间上就没有）。当需要处理大量的数据时，精简时空两域的程序语句就尤为重要了。
空间上：
1. 建议使用A = logical(sparse(m,n))，不建议使用 A = sparse(false(m,n))，两者结果一样，但是后者生成m×n的临时矩阵，浪费空间，且当m、n很大时，后者不一定能申请成功；
2. 使用sparse几点注意：
a) 只能用在二维以下的矩阵上；
b) 由于matlab按照“先行后列”的方式读取数据（即先把第一列所有行读取完以后再读取第二列的各行），因此定义稀疏矩阵时，最好“行数>列数”，这样有利于寻址和空间的节省（自己试试a=sparse(10,5); whos a和b= sparse(5,10);whos b就知道了）；
c) 对大型矩阵用sparse非常有效（不但节省空间，而且加快速度，强烈推荐！这在动态申请数组空间的时候尤其方便，当然了，数组不是太大的时候也可以使用 eval即字符串的方法），但对小型矩阵使用反而增加存储量（自己试试a=false(5,1); whos a和b=logical(sparse(5,1));whos b就知道了），相信这是由稀疏矩阵需要存储额外的信息引起的。
3. 尽量按照精度来选择数据的类型，例如，如果只需用到0－255之间的整数，则定义矩阵为uint8型就ok了，定义方式：A = zeros(10,10,’uint8’)；可以用intmin(‘uint8’)和intmax(‘uint8’)返回该种类型的最值。
时间上：
1. 在for循环中，清零操作用赋值语句 A = B，其中B是在for循环外的一个同A大小一样的全0阵，不要使用A(:) = 0；但这样会大大影响后面的逐点运算速度。这个问题要请教高手，那就是“个别语句的改动会引起其他语句的执行速度”。例如分别运行3万多次下面代码，但执行时间有较大差别：
iLen = length(find(alRegion)); % 0.58 s
if iLen >= iThreshold_2 % 0.05 s
…
end
和
iLen = sum(alRegion); % 0.37 s
if iLen >= iThreshold_2 % 0.40 s
…
end
2. Find函数较慢，可用logical函数代替，但是，当需要取得满足条件的下标时，就无法使用logical函数，这已经在我之前的帖子中提及过。不过，大家有没有想过，连find函数都可以进行优化的，方法是用“基本矩阵进行显式逻辑引用”来代替find。例如，假设矩阵A是一个61*73*20的三维逻辑矩阵，如果用下面的语句循环3万多次，需要的时间是13 s ：
B = find(A == true);
如果采用下面的方法，则只需要不到0.7 s：
首先定义一个索引矩阵：
a3iCubicIdx = uint32(1:iTotalVoxel); % uint32可以根据需要调整，这里省略了条件判断
a3iCubicIdx = reshape(a3iCubicIdx, [iVolLen, iVolWdh, iVolHgh]);
然后在循环中写以下代码：
a3iTemp = a3iCubicIdx(iXmin:iXMax,iYMin:iYMax,iZMin:iZMax);
B = aiTemp(A(iXmin:iXMax,iYMin:iYMax,iZMin:iZMax));
当然了，改进的前提是知道矩阵A的非零元（即值为true的元素）大致的分布，也就是能够求出iXmin:iXMax,iYMin:iYMax,iZMin:iZMax这个范围。现在终于明白并体会到cwit所说的“连num2str都优化过”的含义了。
3. 不断优化代码，例如corrcoef函数，matlab自带的corrcoef函数求整个矩阵所有列的相关系数，因为我只需要求出某一列跟其他各列的相关系数，所以参照corrcoef函数自己写了一个，不但把速度提了上去，而且还发现了：repmat(5，100，1)的速度并不比 _disibledevent=>
b) A = permute(A,[2,1]);
c) A = shiftdim(A,1);
6. “使用eval方式动态存储多个一维数组”比“使用二维数组动态存储多个一维数组”要快，即：eval(['A_', num2str(k),' = B;']);比 A(k,:) = B; 快，其中B是一个一维数组，k表示循环次数。注：并非所有B都进行存储，只存储满足某个条件的B，另外，对预申请空间A不成功，这是对结论的补充说明。值得注意的是，如果对B是一个稀疏的一维数组，则eval方式的优势荡然无存，当k增大时反而增加系统开销。
7. 当矩阵很大时，利用A(:,k+1:end)=[];去掉多余元素操作时会减慢程序的运行，因此，如果后续处理中没有用到这些多余元素，则没有必要使用这个语句，即不管就是了。
8. 当需要对很大的一个矩阵进行操作时，可以考虑使用循环来完成。例如corrcoef函数，如果处理的对象矩阵A是100*180时（即对100个列向量求它们两两之间的相关程度，假设需要的只是前面99个与第100个向量的相关系数，其他不需要用到），直接用corrcoef(A)会比较慢，这时候可以考虑把矩阵A分为5个部分，每个子块与第100个向量进行相关，这样速度会更快。
9. 局部比较、赋值比全局比较、赋值要快（呵呵，这是废话），假设A、B都是三维逻辑矩阵，如果只想对某个局部（例如 X_1:X_2,Y_1:Y_2,Z_1:Z_2这个立方体）进行比较和赋值，则推荐使用B(X_1:X_2,Y_1:Y_2,Z_1:Z_2) = B(X_1:X_2,Y_1:Y_2,Z_1:Z_2) & ~A(X_1:X_2,Y_1:Y_2,Z_1:Z_2)，这比B(A) = false或B = B&~A速度上都要快不少。
后记：
1. 此心得原来打算在cwit给了我回复，指正文中错误之后再整理并发布的，不过cwit很忙，所以不知道要等到什么时候，因此先献丑了，有错误大家也帮忙指正一下。特别是happy、bainhome、jimin，还有Tla等高手。（注：之前写的版本与这个版本略有不同，主要是删除了“循环总次数固定无论使用多少个for循环速度不变”这句，因为考虑到矩阵维数会影响速度）
2. 上述技巧都是出自我在处理大型矩阵时候自己总结出来的个人心得，转载时请注明。
3. 实验室中由于只有我一个人比较关心matlab的运行速度和存储空间问题（尤其是速度问题），所以不像cwit那样，有一个团队可以互相讨论互相提高，因此，我的心得难免有错误或理解不当的地方，请大家见谅。
4. 错误的地方待cwit给我完整的回复后我会跟贴更正或补充。

Tags:

提高matlab运行速度的心得(转自振动论坛)

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注