mirror of
https://github.com/RPCS3/llvm-mirror.git
synced 2024-11-23 19:23:23 +01:00
490efbdf4e
It's a bug fix. For rerolled loops SE trip count remains unchanged. It leads to incorrect work of the next passes. My patch just resets SE info for rerolled loop forcing SE to re-evaluate it next time it requested. I also added a verifier call in the exisitng test to be sure no invalid SE data remain. Without my fix this test would fail with -verify-scev. Differential Revision: http://reviews.llvm.org/D18316 llvm-svn: 264051
329 lines
14 KiB
LLVM
329 lines
14 KiB
LLVM
; RUN: opt < %s -loop-reroll -verify-scev -S | FileCheck %s
|
|
target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
|
|
target triple = "x86_64-unknown-linux-gnu"
|
|
|
|
; void goo32(float alpha, float *a, float *b) {
|
|
; for (int i = 0; i < 3200; i += 32) {
|
|
; a[i] += alpha * b[i];
|
|
; a[i + 1] += alpha * b[i + 1];
|
|
; a[i + 2] += alpha * b[i + 2];
|
|
; a[i + 3] += alpha * b[i + 3];
|
|
; a[i + 4] += alpha * b[i + 4];
|
|
; a[i + 5] += alpha * b[i + 5];
|
|
; a[i + 6] += alpha * b[i + 6];
|
|
; a[i + 7] += alpha * b[i + 7];
|
|
; a[i + 8] += alpha * b[i + 8];
|
|
; a[i + 9] += alpha * b[i + 9];
|
|
; a[i + 10] += alpha * b[i + 10];
|
|
; a[i + 11] += alpha * b[i + 11];
|
|
; a[i + 12] += alpha * b[i + 12];
|
|
; a[i + 13] += alpha * b[i + 13];
|
|
; a[i + 14] += alpha * b[i + 14];
|
|
; a[i + 15] += alpha * b[i + 15];
|
|
; a[i + 16] += alpha * b[i + 16];
|
|
; a[i + 17] += alpha * b[i + 17];
|
|
; a[i + 18] += alpha * b[i + 18];
|
|
; a[i + 19] += alpha * b[i + 19];
|
|
; a[i + 20] += alpha * b[i + 20];
|
|
; a[i + 21] += alpha * b[i + 21];
|
|
; a[i + 22] += alpha * b[i + 22];
|
|
; a[i + 23] += alpha * b[i + 23];
|
|
; a[i + 24] += alpha * b[i + 24];
|
|
; a[i + 25] += alpha * b[i + 25];
|
|
; a[i + 26] += alpha * b[i + 26];
|
|
; a[i + 27] += alpha * b[i + 27];
|
|
; a[i + 28] += alpha * b[i + 28];
|
|
; a[i + 29] += alpha * b[i + 29];
|
|
; a[i + 30] += alpha * b[i + 30];
|
|
; a[i + 31] += alpha * b[i + 31];
|
|
; }
|
|
; }
|
|
|
|
; Function Attrs: norecurse nounwind uwtable
|
|
define void @goo32(float %alpha, float* %a, float* readonly %b) #0 {
|
|
entry:
|
|
br label %for.body
|
|
|
|
for.body: ; preds = %entry, %for.body
|
|
%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
|
|
%arrayidx = getelementptr inbounds float, float* %b, i64 %indvars.iv
|
|
%0 = load float, float* %arrayidx, align 4
|
|
%mul = fmul float %0, %alpha
|
|
%arrayidx2 = getelementptr inbounds float, float* %a, i64 %indvars.iv
|
|
%1 = load float, float* %arrayidx2, align 4
|
|
%add = fadd float %1, %mul
|
|
store float %add, float* %arrayidx2, align 4
|
|
%2 = or i64 %indvars.iv, 1
|
|
%arrayidx5 = getelementptr inbounds float, float* %b, i64 %2
|
|
%3 = load float, float* %arrayidx5, align 4
|
|
%mul6 = fmul float %3, %alpha
|
|
%arrayidx9 = getelementptr inbounds float, float* %a, i64 %2
|
|
%4 = load float, float* %arrayidx9, align 4
|
|
%add10 = fadd float %4, %mul6
|
|
store float %add10, float* %arrayidx9, align 4
|
|
%5 = or i64 %indvars.iv, 2
|
|
%arrayidx13 = getelementptr inbounds float, float* %b, i64 %5
|
|
%6 = load float, float* %arrayidx13, align 4
|
|
%mul14 = fmul float %6, %alpha
|
|
%arrayidx17 = getelementptr inbounds float, float* %a, i64 %5
|
|
%7 = load float, float* %arrayidx17, align 4
|
|
%add18 = fadd float %7, %mul14
|
|
store float %add18, float* %arrayidx17, align 4
|
|
%8 = or i64 %indvars.iv, 3
|
|
%arrayidx21 = getelementptr inbounds float, float* %b, i64 %8
|
|
%9 = load float, float* %arrayidx21, align 4
|
|
%mul22 = fmul float %9, %alpha
|
|
%arrayidx25 = getelementptr inbounds float, float* %a, i64 %8
|
|
%10 = load float, float* %arrayidx25, align 4
|
|
%add26 = fadd float %10, %mul22
|
|
store float %add26, float* %arrayidx25, align 4
|
|
%11 = or i64 %indvars.iv, 4
|
|
%arrayidx29 = getelementptr inbounds float, float* %b, i64 %11
|
|
%12 = load float, float* %arrayidx29, align 4
|
|
%mul30 = fmul float %12, %alpha
|
|
%arrayidx33 = getelementptr inbounds float, float* %a, i64 %11
|
|
%13 = load float, float* %arrayidx33, align 4
|
|
%add34 = fadd float %13, %mul30
|
|
store float %add34, float* %arrayidx33, align 4
|
|
%14 = or i64 %indvars.iv, 5
|
|
%arrayidx37 = getelementptr inbounds float, float* %b, i64 %14
|
|
%15 = load float, float* %arrayidx37, align 4
|
|
%mul38 = fmul float %15, %alpha
|
|
%arrayidx41 = getelementptr inbounds float, float* %a, i64 %14
|
|
%16 = load float, float* %arrayidx41, align 4
|
|
%add42 = fadd float %16, %mul38
|
|
store float %add42, float* %arrayidx41, align 4
|
|
%17 = or i64 %indvars.iv, 6
|
|
%arrayidx45 = getelementptr inbounds float, float* %b, i64 %17
|
|
%18 = load float, float* %arrayidx45, align 4
|
|
%mul46 = fmul float %18, %alpha
|
|
%arrayidx49 = getelementptr inbounds float, float* %a, i64 %17
|
|
%19 = load float, float* %arrayidx49, align 4
|
|
%add50 = fadd float %19, %mul46
|
|
store float %add50, float* %arrayidx49, align 4
|
|
%20 = or i64 %indvars.iv, 7
|
|
%arrayidx53 = getelementptr inbounds float, float* %b, i64 %20
|
|
%21 = load float, float* %arrayidx53, align 4
|
|
%mul54 = fmul float %21, %alpha
|
|
%arrayidx57 = getelementptr inbounds float, float* %a, i64 %20
|
|
%22 = load float, float* %arrayidx57, align 4
|
|
%add58 = fadd float %22, %mul54
|
|
store float %add58, float* %arrayidx57, align 4
|
|
%23 = or i64 %indvars.iv, 8
|
|
%arrayidx61 = getelementptr inbounds float, float* %b, i64 %23
|
|
%24 = load float, float* %arrayidx61, align 4
|
|
%mul62 = fmul float %24, %alpha
|
|
%arrayidx65 = getelementptr inbounds float, float* %a, i64 %23
|
|
%25 = load float, float* %arrayidx65, align 4
|
|
%add66 = fadd float %25, %mul62
|
|
store float %add66, float* %arrayidx65, align 4
|
|
%26 = or i64 %indvars.iv, 9
|
|
%arrayidx69 = getelementptr inbounds float, float* %b, i64 %26
|
|
%27 = load float, float* %arrayidx69, align 4
|
|
%mul70 = fmul float %27, %alpha
|
|
%arrayidx73 = getelementptr inbounds float, float* %a, i64 %26
|
|
%28 = load float, float* %arrayidx73, align 4
|
|
%add74 = fadd float %28, %mul70
|
|
store float %add74, float* %arrayidx73, align 4
|
|
%29 = or i64 %indvars.iv, 10
|
|
%arrayidx77 = getelementptr inbounds float, float* %b, i64 %29
|
|
%30 = load float, float* %arrayidx77, align 4
|
|
%mul78 = fmul float %30, %alpha
|
|
%arrayidx81 = getelementptr inbounds float, float* %a, i64 %29
|
|
%31 = load float, float* %arrayidx81, align 4
|
|
%add82 = fadd float %31, %mul78
|
|
store float %add82, float* %arrayidx81, align 4
|
|
%32 = or i64 %indvars.iv, 11
|
|
%arrayidx85 = getelementptr inbounds float, float* %b, i64 %32
|
|
%33 = load float, float* %arrayidx85, align 4
|
|
%mul86 = fmul float %33, %alpha
|
|
%arrayidx89 = getelementptr inbounds float, float* %a, i64 %32
|
|
%34 = load float, float* %arrayidx89, align 4
|
|
%add90 = fadd float %34, %mul86
|
|
store float %add90, float* %arrayidx89, align 4
|
|
%35 = or i64 %indvars.iv, 12
|
|
%arrayidx93 = getelementptr inbounds float, float* %b, i64 %35
|
|
%36 = load float, float* %arrayidx93, align 4
|
|
%mul94 = fmul float %36, %alpha
|
|
%arrayidx97 = getelementptr inbounds float, float* %a, i64 %35
|
|
%37 = load float, float* %arrayidx97, align 4
|
|
%add98 = fadd float %37, %mul94
|
|
store float %add98, float* %arrayidx97, align 4
|
|
%38 = or i64 %indvars.iv, 13
|
|
%arrayidx101 = getelementptr inbounds float, float* %b, i64 %38
|
|
%39 = load float, float* %arrayidx101, align 4
|
|
%mul102 = fmul float %39, %alpha
|
|
%arrayidx105 = getelementptr inbounds float, float* %a, i64 %38
|
|
%40 = load float, float* %arrayidx105, align 4
|
|
%add106 = fadd float %40, %mul102
|
|
store float %add106, float* %arrayidx105, align 4
|
|
%41 = or i64 %indvars.iv, 14
|
|
%arrayidx109 = getelementptr inbounds float, float* %b, i64 %41
|
|
%42 = load float, float* %arrayidx109, align 4
|
|
%mul110 = fmul float %42, %alpha
|
|
%arrayidx113 = getelementptr inbounds float, float* %a, i64 %41
|
|
%43 = load float, float* %arrayidx113, align 4
|
|
%add114 = fadd float %43, %mul110
|
|
store float %add114, float* %arrayidx113, align 4
|
|
%44 = or i64 %indvars.iv, 15
|
|
%arrayidx117 = getelementptr inbounds float, float* %b, i64 %44
|
|
%45 = load float, float* %arrayidx117, align 4
|
|
%mul118 = fmul float %45, %alpha
|
|
%arrayidx121 = getelementptr inbounds float, float* %a, i64 %44
|
|
%46 = load float, float* %arrayidx121, align 4
|
|
%add122 = fadd float %46, %mul118
|
|
store float %add122, float* %arrayidx121, align 4
|
|
%47 = or i64 %indvars.iv, 16
|
|
%arrayidx125 = getelementptr inbounds float, float* %b, i64 %47
|
|
%48 = load float, float* %arrayidx125, align 4
|
|
%mul126 = fmul float %48, %alpha
|
|
%arrayidx129 = getelementptr inbounds float, float* %a, i64 %47
|
|
%49 = load float, float* %arrayidx129, align 4
|
|
%add130 = fadd float %49, %mul126
|
|
store float %add130, float* %arrayidx129, align 4
|
|
%50 = or i64 %indvars.iv, 17
|
|
%arrayidx133 = getelementptr inbounds float, float* %b, i64 %50
|
|
%51 = load float, float* %arrayidx133, align 4
|
|
%mul134 = fmul float %51, %alpha
|
|
%arrayidx137 = getelementptr inbounds float, float* %a, i64 %50
|
|
%52 = load float, float* %arrayidx137, align 4
|
|
%add138 = fadd float %52, %mul134
|
|
store float %add138, float* %arrayidx137, align 4
|
|
%53 = or i64 %indvars.iv, 18
|
|
%arrayidx141 = getelementptr inbounds float, float* %b, i64 %53
|
|
%54 = load float, float* %arrayidx141, align 4
|
|
%mul142 = fmul float %54, %alpha
|
|
%arrayidx145 = getelementptr inbounds float, float* %a, i64 %53
|
|
%55 = load float, float* %arrayidx145, align 4
|
|
%add146 = fadd float %55, %mul142
|
|
store float %add146, float* %arrayidx145, align 4
|
|
%56 = or i64 %indvars.iv, 19
|
|
%arrayidx149 = getelementptr inbounds float, float* %b, i64 %56
|
|
%57 = load float, float* %arrayidx149, align 4
|
|
%mul150 = fmul float %57, %alpha
|
|
%arrayidx153 = getelementptr inbounds float, float* %a, i64 %56
|
|
%58 = load float, float* %arrayidx153, align 4
|
|
%add154 = fadd float %58, %mul150
|
|
store float %add154, float* %arrayidx153, align 4
|
|
%59 = or i64 %indvars.iv, 20
|
|
%arrayidx157 = getelementptr inbounds float, float* %b, i64 %59
|
|
%60 = load float, float* %arrayidx157, align 4
|
|
%mul158 = fmul float %60, %alpha
|
|
%arrayidx161 = getelementptr inbounds float, float* %a, i64 %59
|
|
%61 = load float, float* %arrayidx161, align 4
|
|
%add162 = fadd float %61, %mul158
|
|
store float %add162, float* %arrayidx161, align 4
|
|
%62 = or i64 %indvars.iv, 21
|
|
%arrayidx165 = getelementptr inbounds float, float* %b, i64 %62
|
|
%63 = load float, float* %arrayidx165, align 4
|
|
%mul166 = fmul float %63, %alpha
|
|
%arrayidx169 = getelementptr inbounds float, float* %a, i64 %62
|
|
%64 = load float, float* %arrayidx169, align 4
|
|
%add170 = fadd float %64, %mul166
|
|
store float %add170, float* %arrayidx169, align 4
|
|
%65 = or i64 %indvars.iv, 22
|
|
%arrayidx173 = getelementptr inbounds float, float* %b, i64 %65
|
|
%66 = load float, float* %arrayidx173, align 4
|
|
%mul174 = fmul float %66, %alpha
|
|
%arrayidx177 = getelementptr inbounds float, float* %a, i64 %65
|
|
%67 = load float, float* %arrayidx177, align 4
|
|
%add178 = fadd float %67, %mul174
|
|
store float %add178, float* %arrayidx177, align 4
|
|
%68 = or i64 %indvars.iv, 23
|
|
%arrayidx181 = getelementptr inbounds float, float* %b, i64 %68
|
|
%69 = load float, float* %arrayidx181, align 4
|
|
%mul182 = fmul float %69, %alpha
|
|
%arrayidx185 = getelementptr inbounds float, float* %a, i64 %68
|
|
%70 = load float, float* %arrayidx185, align 4
|
|
%add186 = fadd float %70, %mul182
|
|
store float %add186, float* %arrayidx185, align 4
|
|
%71 = or i64 %indvars.iv, 24
|
|
%arrayidx189 = getelementptr inbounds float, float* %b, i64 %71
|
|
%72 = load float, float* %arrayidx189, align 4
|
|
%mul190 = fmul float %72, %alpha
|
|
%arrayidx193 = getelementptr inbounds float, float* %a, i64 %71
|
|
%73 = load float, float* %arrayidx193, align 4
|
|
%add194 = fadd float %73, %mul190
|
|
store float %add194, float* %arrayidx193, align 4
|
|
%74 = or i64 %indvars.iv, 25
|
|
%arrayidx197 = getelementptr inbounds float, float* %b, i64 %74
|
|
%75 = load float, float* %arrayidx197, align 4
|
|
%mul198 = fmul float %75, %alpha
|
|
%arrayidx201 = getelementptr inbounds float, float* %a, i64 %74
|
|
%76 = load float, float* %arrayidx201, align 4
|
|
%add202 = fadd float %76, %mul198
|
|
store float %add202, float* %arrayidx201, align 4
|
|
%77 = or i64 %indvars.iv, 26
|
|
%arrayidx205 = getelementptr inbounds float, float* %b, i64 %77
|
|
%78 = load float, float* %arrayidx205, align 4
|
|
%mul206 = fmul float %78, %alpha
|
|
%arrayidx209 = getelementptr inbounds float, float* %a, i64 %77
|
|
%79 = load float, float* %arrayidx209, align 4
|
|
%add210 = fadd float %79, %mul206
|
|
store float %add210, float* %arrayidx209, align 4
|
|
%80 = or i64 %indvars.iv, 27
|
|
%arrayidx213 = getelementptr inbounds float, float* %b, i64 %80
|
|
%81 = load float, float* %arrayidx213, align 4
|
|
%mul214 = fmul float %81, %alpha
|
|
%arrayidx217 = getelementptr inbounds float, float* %a, i64 %80
|
|
%82 = load float, float* %arrayidx217, align 4
|
|
%add218 = fadd float %82, %mul214
|
|
store float %add218, float* %arrayidx217, align 4
|
|
%83 = or i64 %indvars.iv, 28
|
|
%arrayidx221 = getelementptr inbounds float, float* %b, i64 %83
|
|
%84 = load float, float* %arrayidx221, align 4
|
|
%mul222 = fmul float %84, %alpha
|
|
%arrayidx225 = getelementptr inbounds float, float* %a, i64 %83
|
|
%85 = load float, float* %arrayidx225, align 4
|
|
%add226 = fadd float %85, %mul222
|
|
store float %add226, float* %arrayidx225, align 4
|
|
%86 = or i64 %indvars.iv, 29
|
|
%arrayidx229 = getelementptr inbounds float, float* %b, i64 %86
|
|
%87 = load float, float* %arrayidx229, align 4
|
|
%mul230 = fmul float %87, %alpha
|
|
%arrayidx233 = getelementptr inbounds float, float* %a, i64 %86
|
|
%88 = load float, float* %arrayidx233, align 4
|
|
%add234 = fadd float %88, %mul230
|
|
store float %add234, float* %arrayidx233, align 4
|
|
%89 = or i64 %indvars.iv, 30
|
|
%arrayidx237 = getelementptr inbounds float, float* %b, i64 %89
|
|
%90 = load float, float* %arrayidx237, align 4
|
|
%mul238 = fmul float %90, %alpha
|
|
%arrayidx241 = getelementptr inbounds float, float* %a, i64 %89
|
|
%91 = load float, float* %arrayidx241, align 4
|
|
%add242 = fadd float %91, %mul238
|
|
store float %add242, float* %arrayidx241, align 4
|
|
%92 = or i64 %indvars.iv, 31
|
|
%arrayidx245 = getelementptr inbounds float, float* %b, i64 %92
|
|
%93 = load float, float* %arrayidx245, align 4
|
|
%mul246 = fmul float %93, %alpha
|
|
%arrayidx249 = getelementptr inbounds float, float* %a, i64 %92
|
|
%94 = load float, float* %arrayidx249, align 4
|
|
%add250 = fadd float %94, %mul246
|
|
store float %add250, float* %arrayidx249, align 4
|
|
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 32
|
|
%cmp = icmp slt i64 %indvars.iv.next, 3200
|
|
br i1 %cmp, label %for.body, label %for.end
|
|
|
|
; CHECK-LABEL: @goo32
|
|
|
|
; CHECK: for.body:
|
|
; CHECK: %indvar = phi i64 [ %indvar.next, %for.body ], [ 0, %entry ]
|
|
; CHECK: %arrayidx = getelementptr inbounds float, float* %b, i64 %indvar
|
|
; CHECK: %0 = load float, float* %arrayidx, align 4
|
|
; CHECK: %mul = fmul float %0, %alpha
|
|
; CHECK: %arrayidx2 = getelementptr inbounds float, float* %a, i64 %indvar
|
|
; CHECK: %1 = load float, float* %arrayidx2, align 4
|
|
; CHECK: %add = fadd float %1, %mul
|
|
; CHECK: store float %add, float* %arrayidx2, align 4
|
|
; CHECK: %indvar.next = add i64 %indvar, 1
|
|
; CHECK: %exitcond = icmp eq i64 %indvar, 3199
|
|
; CHECK: br i1 %exitcond, label %for.end, label %for.body
|
|
; CHECK: ret
|
|
|
|
for.end: ; preds = %for.body
|
|
ret void
|
|
}
|
|
|
|
attributes #0 = { nounwind uwtable }
|