AMDGPU: Implement get_global_offset builtin
Also fix get_global_id to consider offset No idea how to add this for ptx, so they are stuck with the old get_global_id implementation. v2: split to a separate patch v3: Switch R600 to use implictarg.ptr Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 276443
This commit is contained in:
parent
74f02db922
commit
a82e080b57
|
@ -1,5 +1,6 @@
|
|||
math/ldexp.cl
|
||||
synchronization/barrier_impl.ll
|
||||
workitem/get_global_offset.cl
|
||||
workitem/get_group_id.cl
|
||||
workitem/get_local_id.cl
|
||||
workitem/get_work_dim.cl
|
||||
|
|
|
@ -0,0 +1,11 @@
|
|||
#include <clc/clc.h>
|
||||
|
||||
_CLC_DEF uint get_global_offset(uint dim)
|
||||
{
|
||||
__attribute__((address_space(2))) uint * ptr =
|
||||
(__attribute__((address_space(2))) uint *)
|
||||
__builtin_amdgcn_implicitarg_ptr();
|
||||
if (dim < 3)
|
||||
return ptr[dim + 1];
|
||||
return 0;
|
||||
}
|
|
@ -30,6 +30,7 @@
|
|||
#include <clc/workitem/get_local_id.h>
|
||||
#include <clc/workitem/get_num_groups.h>
|
||||
#include <clc/workitem/get_group_id.h>
|
||||
#include <clc/workitem/get_global_offset.h>
|
||||
|
||||
/* 6.11.2 Math Functions */
|
||||
#include <clc/math/acos.h>
|
||||
|
|
|
@ -0,0 +1 @@
|
|||
_CLC_DECL size_t get_global_offset(uint dim);
|
|
@ -1,5 +1,5 @@
|
|||
#include <clc/clc.h>
|
||||
|
||||
_CLC_DEF size_t get_global_id(uint dim) {
|
||||
return get_group_id(dim)*get_local_size(dim) + get_local_id(dim);
|
||||
return get_group_id(dim) * get_local_size(dim) + get_local_id(dim) + get_global_offset(dim);
|
||||
}
|
||||
|
|
|
@ -1,4 +1,5 @@
|
|||
synchronization/barrier.cl
|
||||
workitem/get_global_id.cl
|
||||
workitem/get_group_id.cl
|
||||
workitem/get_local_id.cl
|
||||
workitem/get_local_size.cl
|
||||
|
|
|
@ -0,0 +1,5 @@
|
|||
#include <clc/clc.h>
|
||||
|
||||
_CLC_DEF size_t get_global_id(uint dim) {
|
||||
return get_group_id(dim) * get_local_size(dim) + get_local_id(dim);
|
||||
}
|
|
@ -1,4 +1,5 @@
|
|||
synchronization/barrier_impl.ll
|
||||
workitem/get_global_offset.cl
|
||||
workitem/get_group_id.cl
|
||||
workitem/get_local_id.cl
|
||||
workitem/get_work_dim.cl
|
||||
|
|
|
@ -0,0 +1,11 @@
|
|||
#include <clc/clc.h>
|
||||
|
||||
_CLC_DEF uint get_global_offset(uint dim)
|
||||
{
|
||||
__attribute__((address_space(7))) uint * ptr =
|
||||
(__attribute__((address_space(7))) uint *)
|
||||
__builtin_r600_implicitarg_ptr();
|
||||
if (dim < 3)
|
||||
return ptr[dim + 1];
|
||||
return 0;
|
||||
}
|
Loading…
Reference in New Issue