1*f83ae31cSJonathan Peyton // RUN: %libomp-compile-and-run
2*f83ae31cSJonathan Peyton #include <stdio.h>
3*f83ae31cSJonathan Peyton #include <stdint.h>
4*f83ae31cSJonathan Peyton #include <omp.h>
5*f83ae31cSJonathan Peyton #include "omp_testsuite.h"
6*f83ae31cSJonathan Peyton 
7*f83ae31cSJonathan Peyton int alignments[] = {64, 128, 256, 512, 1024, 2048, 4096};
8*f83ae31cSJonathan Peyton 
aligned_by(uint64_t addr)9*f83ae31cSJonathan Peyton unsigned aligned_by(uint64_t addr) {
10*f83ae31cSJonathan Peyton     uint64_t alignment = 1;
11*f83ae31cSJonathan Peyton     while((addr & (alignment-1)) == 0) {
12*f83ae31cSJonathan Peyton         alignment <<= 1;
13*f83ae31cSJonathan Peyton     }
14*f83ae31cSJonathan Peyton     return (alignment >> 1);
15*f83ae31cSJonathan Peyton }
16*f83ae31cSJonathan Peyton 
test_kmp_aligned_malloc()17*f83ae31cSJonathan Peyton int test_kmp_aligned_malloc()
18*f83ae31cSJonathan Peyton {
19*f83ae31cSJonathan Peyton   int err = 0;
20*f83ae31cSJonathan Peyton   #pragma omp parallel shared(err)
21*f83ae31cSJonathan Peyton   {
22*f83ae31cSJonathan Peyton     int i;
23*f83ae31cSJonathan Peyton     int* ptr;
24*f83ae31cSJonathan Peyton     uint64_t addr;
25*f83ae31cSJonathan Peyton     int tid = omp_get_thread_num();
26*f83ae31cSJonathan Peyton 
27*f83ae31cSJonathan Peyton     for(i = 0; i < sizeof(alignments)/sizeof(int); i++) {
28*f83ae31cSJonathan Peyton       int alignment = alignments[i];
29*f83ae31cSJonathan Peyton       // allocate 64 bytes with 64-byte alignment
30*f83ae31cSJonathan Peyton       // allocate 128 bytes with 128-byte alignment, etc.
31*f83ae31cSJonathan Peyton       ptr = (int*)kmp_aligned_malloc(alignment, alignment);
32*f83ae31cSJonathan Peyton       addr = (uint64_t)ptr;
33*f83ae31cSJonathan Peyton       if(addr & (alignment-1)) {
34*f83ae31cSJonathan Peyton         printf("thread %d: addr = %p (aligned to %u bytes) but expected "
35*f83ae31cSJonathan Peyton                " alignment = %d\n", tid, ptr, aligned_by(addr), alignment);
36*f83ae31cSJonathan Peyton         err = 1;
37*f83ae31cSJonathan Peyton       }
38*f83ae31cSJonathan Peyton       kmp_free(ptr);
39*f83ae31cSJonathan Peyton     }
40*f83ae31cSJonathan Peyton 
41*f83ae31cSJonathan Peyton     ptr = kmp_aligned_malloc(128, 127);
42*f83ae31cSJonathan Peyton     if (ptr != NULL) {
43*f83ae31cSJonathan Peyton       printf("thread %d: kmp_aligned_malloc() didn't return NULL when "
44*f83ae31cSJonathan Peyton              "alignment was not power of 2\n", tid);
45*f83ae31cSJonathan Peyton       err = 1;
46*f83ae31cSJonathan Peyton     }
47*f83ae31cSJonathan Peyton   } /* end of parallel */
48*f83ae31cSJonathan Peyton   return !err;
49*f83ae31cSJonathan Peyton }
50*f83ae31cSJonathan Peyton 
main()51*f83ae31cSJonathan Peyton int main()
52*f83ae31cSJonathan Peyton {
53*f83ae31cSJonathan Peyton   int i;
54*f83ae31cSJonathan Peyton   int num_failed=0;
55*f83ae31cSJonathan Peyton 
56*f83ae31cSJonathan Peyton   for(i = 0; i < REPETITIONS; i++) {
57*f83ae31cSJonathan Peyton     if(!test_kmp_aligned_malloc()) {
58*f83ae31cSJonathan Peyton       num_failed++;
59*f83ae31cSJonathan Peyton     }
60*f83ae31cSJonathan Peyton   }
61*f83ae31cSJonathan Peyton   return num_failed;
62*f83ae31cSJonathan Peyton }
63