HW8 finish ! #6

jiayaozhang · 2022-02-11T15:41:59Z

这是基于“边角料法”的，请把他改成基于“网格跨步循环”的：10 分

template<class Func>
__global__ void parallel_for(int n, Func func){
    for(int i = blockDim.x * blockIdx.x + threadIdx.x;i < n ; i += blockDim.x * gridDim.x){
        func(i);
    }
}

fill_sin 改成“网格跨步循环”以后，这里三重尖括号里的参数如何调整？10 分

   parallel_for<<<32,1024>>>(n,[arr_data = arr.data()] __device__ (int i){
        arr_data[i] = __sinf(i);
    });

这里的“边角料法”对于不是 1024 整数倍的 n 会出错，为什么？请修复：10 分

 filter_positive<<< (n+1024-1) / 1024, 1024>>>(counter.data(), res.data(), arr.data(), n);

这里 CPU 访问数据前漏了一步什么操作？请补上：10 分

    checkCudaErrors(cudaDeviceSynchronize());

jiayaozhang added 4 commits February 11, 2022 21:57

add hw8

584906d

update hw8

b4d3854

add new features

57c3c92

finish hw8 yeah !

8fcf33a

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HW8 finish ! #6

HW8 finish ! #6

jiayaozhang commented Feb 11, 2022

HW8 finish ! #6

Are you sure you want to change the base?

HW8 finish ! #6

Conversation

jiayaozhang commented Feb 11, 2022

这是基于“边角料法”的，请把他改成基于“网格跨步循环”的：10 分

fill_sin 改成“网格跨步循环”以后，这里三重尖括号里的参数如何调整？10 分

这里的“边角料法”对于不是 1024 整数倍的 n 会出错，为什么？请修复：10 分

这里 CPU 访问数据前漏了一步什么操作？请补上：10 分