论文部分内容阅读
OpenMP 3.0规范中的collapse从句能指导编译器进行紧嵌套循环的并行化.最新OpenMP4.0规范中新增了用于指导循环向量化的simd结构,它也支持collapse从句,指导编译器进行紧嵌套循环的向量化.当前,GCC 4.9已基本实现了OpenMP 4.0规范,但实验表明它对collapse从句的支持并不理想,甚至阻碍嵌套循环的成功向量化.