资源列表
[并行运算] mpi-bitonic-sort-master
说明:Bitonic order implementation code with mpi usage<pippo90 > 在 2025-01-10 上传 | 大小:38kb | 下载:0
[并行运算] startParaller
说明:并行运算,matlab函数,开始并行运算程序,很好用(Parallel operation, matlab function, start parallel computing program, very easy to use)<zyf123 > 在 2025-01-10 上传 | 大小:4kb | 下载:0
[并行运算] Hands-on CUDA codes
说明:用于CUDA方案的程序码说明,提供的练习有: cudaMallocAndMemcpy myFirstKernel reverseArray_singleblock reverseArray_multiblock reverseArray_multiblock_fast(Skeletons and solutions for hands-on CUDA codes, they are listed as the followin<p-yang > 在 2025-01-10 上传 | 大小:2.32mb | 下载:0
[并行运算] cudaMallocAndMemcpy
说明:在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy bet<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] myFirstKernel
说明:启动内核--从“myFirstKernel”模板开始。 Part1:使用指针d_a为内核的结果分配设备内存。 Part2:使用1-D的1-D网格来配置和启动内核 线程块。 Part3:让每个线程设置一个d_a的元素,如下所示: idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4:将d_a<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] reverseArray_singleblock
说明:反向阵列(单块)-- 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_singleblock”模板开始 B: 只有一个线程块启动,以反转一个大小的数组 N = numThreads = 256个元素 C: 第1部分(共1个):所有你需要做的是实现内核的“reverseArrayBlock()” D:<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] reverseArray_multiblock
说明:反向阵列(multiblock): 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_multiblock”模板开始 B:多个256线程块启动,要颠倒大小为N,N / 256块的数组 第1部分:计算要启动的块数 第2部分:实现内核reverseArrayBlock 请注意,现在您必须同时进行计算 块内<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0