资源列表
[并行运算] Hands-on CUDA codes
说明:用于CUDA方案的程序码说明,提供的练习有: cudaMallocAndMemcpy myFirstKernel reverseArray_singleblock reverseArray_multiblock reverseArray_multiblock_fast(Skeletons and solutions for hands-on CUDA codes, they are listed as the followin<p-yang > 在 2025-01-10 上传 | 大小:2.32mb | 下载:0
[并行运算] cudaMallocAndMemcpy
说明:在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy bet<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] myFirstKernel
说明:启动内核--从“myFirstKernel”模板开始。 Part1:使用指针d_a为内核的结果分配设备内存。 Part2:使用1-D的1-D网格来配置和启动内核 线程块。 Part3:让每个线程设置一个d_a的元素,如下所示: idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4:将d_a<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] reverseArray_singleblock
说明:反向阵列(单块)-- 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_singleblock”模板开始 B: 只有一个线程块启动,以反转一个大小的数组 N = numThreads = 256个元素 C: 第1部分(共1个):所有你需要做的是实现内核的“reverseArrayBlock()” D:<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] reverseArray_multiblock
说明:反向阵列(multiblock): 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_multiblock”模板开始 B:多个256线程块启动,要颠倒大小为N,N / 256块的数组 第1部分:计算要启动的块数 第2部分:实现内核reverseArrayBlock 请注意,现在您必须同时进行计算 块内<p-yang > 在 2025-01-10 上传 | 大小:6kb | 下载:0
[并行运算] mpi_mat_vect_time
说明:使用mpi编写的进行矩阵乘法运算的并行程序。(An parallel program using MPI to realize the multiplication of matrices.)<Teresa123 > 在 2025-01-10 上传 | 大小:2kb | 下载:0
[并行运算] Parallel Programming With Microsoft Visual C++
说明:Parallel Programming With Microsoft Visual C++<disciplinant > 在 2025-01-10 上传 | 大小:2.41mb | 下载:0
[并行运算] MatlabCuda
说明:自己写的GPU并行程序和MATLAB 平台混合调用,适合初学者学习MATLAB 和GPU的并行编程(Write their own GPU parallel program and MATLAB platform mixed call, suitable for beginners to learn MATLAB and GPU parallel programming)<Bigstrong > 在 2025-01-10 上传 | 大小:2.44mb | 下载:0
[并行运算] polar_BP_decoder.cu
说明:本代码是基于GPU的polar码BP并行译码,主要完成基于GPU的并行译码功能,开发语言为CUDA C。(BP parallel decoding of polar codes based on GPU)<npu > 在 2025-01-10 上传 | 大小:2kb | 下载:0