1*f83ae31cSJonathan Peyton // RUN: %libomp-compile-and-run
2*f83ae31cSJonathan Peyton #include <stdio.h>
3*f83ae31cSJonathan Peyton #include <stdint.h>
4*f83ae31cSJonathan Peyton #include <omp.h>
5*f83ae31cSJonathan Peyton #include "omp_testsuite.h"
6*f83ae31cSJonathan Peyton
7*f83ae31cSJonathan Peyton int alignments[] = {64, 128, 256, 512, 1024, 2048, 4096};
8*f83ae31cSJonathan Peyton
aligned_by(uint64_t addr)9*f83ae31cSJonathan Peyton unsigned aligned_by(uint64_t addr) {
10*f83ae31cSJonathan Peyton uint64_t alignment = 1;
11*f83ae31cSJonathan Peyton while((addr & (alignment-1)) == 0) {
12*f83ae31cSJonathan Peyton alignment <<= 1;
13*f83ae31cSJonathan Peyton }
14*f83ae31cSJonathan Peyton return (alignment >> 1);
15*f83ae31cSJonathan Peyton }
16*f83ae31cSJonathan Peyton
test_kmp_aligned_malloc()17*f83ae31cSJonathan Peyton int test_kmp_aligned_malloc()
18*f83ae31cSJonathan Peyton {
19*f83ae31cSJonathan Peyton int err = 0;
20*f83ae31cSJonathan Peyton #pragma omp parallel shared(err)
21*f83ae31cSJonathan Peyton {
22*f83ae31cSJonathan Peyton int i;
23*f83ae31cSJonathan Peyton int* ptr;
24*f83ae31cSJonathan Peyton uint64_t addr;
25*f83ae31cSJonathan Peyton int tid = omp_get_thread_num();
26*f83ae31cSJonathan Peyton
27*f83ae31cSJonathan Peyton for(i = 0; i < sizeof(alignments)/sizeof(int); i++) {
28*f83ae31cSJonathan Peyton int alignment = alignments[i];
29*f83ae31cSJonathan Peyton // allocate 64 bytes with 64-byte alignment
30*f83ae31cSJonathan Peyton // allocate 128 bytes with 128-byte alignment, etc.
31*f83ae31cSJonathan Peyton ptr = (int*)kmp_aligned_malloc(alignment, alignment);
32*f83ae31cSJonathan Peyton addr = (uint64_t)ptr;
33*f83ae31cSJonathan Peyton if(addr & (alignment-1)) {
34*f83ae31cSJonathan Peyton printf("thread %d: addr = %p (aligned to %u bytes) but expected "
35*f83ae31cSJonathan Peyton " alignment = %d\n", tid, ptr, aligned_by(addr), alignment);
36*f83ae31cSJonathan Peyton err = 1;
37*f83ae31cSJonathan Peyton }
38*f83ae31cSJonathan Peyton kmp_free(ptr);
39*f83ae31cSJonathan Peyton }
40*f83ae31cSJonathan Peyton
41*f83ae31cSJonathan Peyton ptr = kmp_aligned_malloc(128, 127);
42*f83ae31cSJonathan Peyton if (ptr != NULL) {
43*f83ae31cSJonathan Peyton printf("thread %d: kmp_aligned_malloc() didn't return NULL when "
44*f83ae31cSJonathan Peyton "alignment was not power of 2\n", tid);
45*f83ae31cSJonathan Peyton err = 1;
46*f83ae31cSJonathan Peyton }
47*f83ae31cSJonathan Peyton } /* end of parallel */
48*f83ae31cSJonathan Peyton return !err;
49*f83ae31cSJonathan Peyton }
50*f83ae31cSJonathan Peyton
main()51*f83ae31cSJonathan Peyton int main()
52*f83ae31cSJonathan Peyton {
53*f83ae31cSJonathan Peyton int i;
54*f83ae31cSJonathan Peyton int num_failed=0;
55*f83ae31cSJonathan Peyton
56*f83ae31cSJonathan Peyton for(i = 0; i < REPETITIONS; i++) {
57*f83ae31cSJonathan Peyton if(!test_kmp_aligned_malloc()) {
58*f83ae31cSJonathan Peyton num_failed++;
59*f83ae31cSJonathan Peyton }
60*f83ae31cSJonathan Peyton }
61*f83ae31cSJonathan Peyton return num_failed;
62*f83ae31cSJonathan Peyton }
63