[SelectionDAG] Add fcmp UNDEF handling to SelectionDAG::FoldSetCC

Second half of PR40800, this patch adds DAG undef handling to fcmp instructions to match the behavior in llvm::ConstantFoldCompareInstruction, this permits constant folding of vector comparisons where some elements had been reduced to UNDEF (by SimplifyDemandedVectorElts etc.). This involves a lot of tweaking to reduced tests as bugpoint loves to reduce fcmp arguments to undef........ Differential Revision: https://reviews.llvm.org/D60006 llvm-svn: 357765
2025-01-31 12:41:49 +01:00 · 2019-04-05 14:56:21 +00:00 · 2019-04-05 14:56:21 +00:00 · 6f6fdb453a
commit 6f6fdb453a
parent 761a639cfc
8 changed files with 214 additions and 212 deletions
--- a/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
+++ b/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
@ -2085,14 +2085,19 @@ SDValue SelectionDAG::FoldSetCC(EVT VT, SDValue N1, SDValue N2,
    case ISD::SETUGE: return getBoolConstant(R!=APFloat::cmpLessThan, dl, VT,
                                             OpVT);
    }
-  } else if (N1CFP && OpVT.isSimple()) {
+  } else if (N1CFP && OpVT.isSimple() && !N2.isUndef()) {
    // Ensure that the constant occurs on the RHS.
    ISD::CondCode SwappedCond = ISD::getSetCCSwappedOperands(Cond);
    if (!TLI->isCondCodeLegal(SwappedCond, OpVT.getSimpleVT()))
      return SDValue();
    return getSetCC(dl, VT, N2, N1, SwappedCond);
-  } else if (N2CFP && N2CFP->getValueAPF().isNaN()) {
-    // If an operand is known to be a nan, we can fold it.
+  } else if ((N2CFP && N2CFP->getValueAPF().isNaN()) ||
+             (OpVT.isFloatingPoint() && (N1.isUndef() || N2.isUndef()))) {
+    // If an operand is known to be a nan (or undef that could be a nan), we can
+    // fold it.
+    // Choosing NaN for the undef will always make unordered comparison succeed
+    // and ordered comparison fails.
+    // Matches behavior in llvm::ConstantFoldCompareInstruction.
    switch (ISD::getUnorderedFlavor(Cond)) {
    default:
      llvm_unreachable("Unknown flavor!");
--- a/test/CodeGen/AArch64/half.ll
+++ b/test/CodeGen/AArch64/half.ll
@ -96,24 +96,27 @@ define void @test_trunc64(double %in, half* %addr) {
  ret void
 }

-define i16 @test_fccmp(i1 %a) {
+define i16 @test_fccmp(i1 %a, i16 %in) {
 ; CHECK-LABEL: test_fccmp:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    mov w8, #24576
+; CHECK-NEXT:    fmov s0, w1
 ; CHECK-NEXT:    movk w8, #15974, lsl #16
 ; CHECK-NEXT:    mov w9, #16384
+; CHECK-NEXT:    fcvt s0, h0
 ; CHECK-NEXT:    movk w9, #15428, lsl #16
-; CHECK-NEXT:    fmov s0, w8
-; CHECK-NEXT:    fcmp s0, s0
-; CHECK-NEXT:    fmov s0, w9
+; CHECK-NEXT:    fmov s1, w8
+; CHECK-NEXT:    fcmp s0, s1
+; CHECK-NEXT:    fmov s1, w9
 ; CHECK-NEXT:    cset w8, pl
-; CHECK-NEXT:    fccmp s0, s0, #8, pl
+; CHECK-NEXT:    fccmp s0, s1, #8, pl
 ; CHECK-NEXT:    mov w9, #4
 ; CHECK-NEXT:    csinc w9, w9, wzr, mi
 ; CHECK-NEXT:    add w0, w8, w9
 ; CHECK-NEXT:    ret
-  %cmp0 = fcmp ogt half 0xH3333, undef
-  %cmp1 = fcmp ogt half 0xH2222, undef
+  %f16 = bitcast i16 %in to half
+  %cmp0 = fcmp ogt half 0xH3333, %f16
+  %cmp1 = fcmp ogt half 0xH2222, %f16
  %x = select i1 %cmp0, i16 0, i16 1
  %or = or i1 %cmp1, %cmp0
  %y = select i1 %or, i16 4, i16 1
--- a/test/CodeGen/ARM/fcmp-xo.ll
+++ b/test/CodeGen/ARM/fcmp-xo.ll
@ -2,34 +2,35 @@
 ; RUN: llc < %s -mtriple=thumbv7m-arm-none-eabi -mattr=+execute-only,+fp-armv8 | FileCheck %s --check-prefixes=CHECK,VMOVSR
 ; RUN: llc < %s -mtriple=thumbv7m-arm-none-eabi -mattr=+execute-only,+fp-armv8,+neon,+neonfp | FileCheck %s --check-prefixes=CHECK,NEON

-define arm_aapcs_vfpcc float @foo0() local_unnamed_addr {
+define arm_aapcs_vfpcc float @foo0(float %a0) local_unnamed_addr {
 ; CHECK-LABEL: foo0:
 ; CHECK:       @ %bb.0:
-; CHECK-NEXT:    vmov.f32 s0, #5.000000e-01
-; CHECK-NEXT:    vmov.f32 s2, #-5.000000e-01
 ; CHECK-NEXT:    vcmpe.f32 s0, #0
+; CHECK-NEXT:    vmov.f32 s2, #5.000000e-01
 ; CHECK-NEXT:    vmrs APSR_nzcv, fpscr
+; CHECK-NEXT:    vmov.f32 s4, #-5.000000e-01
 ; CHECK-NEXT:    it mi
-; CHECK-NEXT:    vmovmi.f32 s0, s2
+; CHECK-NEXT:    vmovmi.f32 s2, s4
+; CHECK-NEXT:    vmov.f32 s0, s2
 ; CHECK-NEXT:    bx lr
-  %1 = fcmp nsz olt float undef, 0.000000e+00
+  %1 = fcmp nsz olt float %a0, 0.000000e+00
  %2 = select i1 %1, float -5.000000e-01, float 5.000000e-01
  ret float %2
 }

-define arm_aapcs_vfpcc float @float1() local_unnamed_addr {
+define arm_aapcs_vfpcc float @float1(float %a0) local_unnamed_addr {
 ; CHECK-LABEL: float1:
 ; CHECK:       @ %bb.0: @ %.end
-; CHECK-NEXT:    vmov.f32 s0, #1.000000e+00
-; CHECK-NEXT:    vmov.f32 s2, #5.000000e-01
-; CHECK-NEXT:    vmov.f32 s4, #-5.000000e-01
-; CHECK-NEXT:    vcmpe.f32 s0, s0
+; CHECK-NEXT:    vmov.f32 s2, #1.000000e+00
+; CHECK-NEXT:    vmov.f32 s4, #5.000000e-01
+; CHECK-NEXT:    vmov.f32 s6, #-5.000000e-01
+; CHECK-NEXT:    vcmpe.f32 s2, s0
 ; CHECK-NEXT:    vmrs APSR_nzcv, fpscr
-; CHECK-NEXT:    vselgt.f32 s0, s4, s2
+; CHECK-NEXT:    vselgt.f32 s0, s6, s4
 ; CHECK-NEXT:    bx lr
  br i1 undef, label %.end, label %1

-  %2 = fcmp nsz olt float undef, 1.000000e+00
+  %2 = fcmp nsz olt float %a0, 1.000000e+00
  %3 = select i1 %2, float -5.000000e-01, float 5.000000e-01
  br label %.end

@ -38,62 +39,62 @@ define arm_aapcs_vfpcc float @float1() local_unnamed_addr {
  ret float %4
 }

-define arm_aapcs_vfpcc float @float128() local_unnamed_addr {
+define arm_aapcs_vfpcc float @float128(float %a0) local_unnamed_addr {
 ; VMOVSR-LABEL: float128:
 ; VMOVSR:       @ %bb.0:
 ; VMOVSR-NEXT:    mov.w r0, #1124073472
-; VMOVSR-NEXT:    vmov.f32 s2, #5.000000e-01
-; VMOVSR-NEXT:    vmov s0, r0
-; VMOVSR-NEXT:    vmov.f32 s4, #-5.000000e-01
-; VMOVSR-NEXT:    vcmpe.f32 s0, s0
+; VMOVSR-NEXT:    vmov.f32 s4, #5.000000e-01
+; VMOVSR-NEXT:    vmov s2, r0
+; VMOVSR-NEXT:    vmov.f32 s6, #-5.000000e-01
+; VMOVSR-NEXT:    vcmpe.f32 s2, s0
 ; VMOVSR-NEXT:    vmrs APSR_nzcv, fpscr
-; VMOVSR-NEXT:    vselgt.f32 s0, s4, s2
+; VMOVSR-NEXT:    vselgt.f32 s0, s6, s4
 ; VMOVSR-NEXT:    bx lr
 ;
 ; NEON-LABEL: float128:
 ; NEON:       @ %bb.0:
-; NEON-NEXT:    vmov.f32 s0, #5.000000e-01
 ; NEON-NEXT:    mov.w r0, #1124073472
-; NEON-NEXT:    vmov d2, r0, r0
-; NEON-NEXT:    vmov.f32 s2, #-5.000000e-01
-; NEON-NEXT:    vcmpe.f32 s4, s0
+; NEON-NEXT:    vmov.f32 s2, #5.000000e-01
+; NEON-NEXT:    vmov d3, r0, r0
+; NEON-NEXT:    vmov.f32 s4, #-5.000000e-01
+; NEON-NEXT:    vcmpe.f32 s6, s0
 ; NEON-NEXT:    vmrs APSR_nzcv, fpscr
-; NEON-NEXT:    vselgt.f32 s0, s2, s0
+; NEON-NEXT:    vselgt.f32 s0, s4, s2
 ; NEON-NEXT:    bx lr
-  %1 = fcmp nsz olt float undef, 128.000000e+00
+  %1 = fcmp nsz olt float %a0, 128.000000e+00
  %2 = select i1 %1, float -5.000000e-01, float 5.000000e-01
  ret float %2
 }

-define arm_aapcs_vfpcc double @double1() local_unnamed_addr {
+define arm_aapcs_vfpcc double @double1(double %a0) local_unnamed_addr {
 ; CHECK-LABEL: double1:
 ; CHECK:       @ %bb.0:
-; CHECK-NEXT:    vmov.f64 d16, #5.000000e-01
 ; CHECK-NEXT:    vmov.f64 d18, #1.000000e+00
-; CHECK-NEXT:    vcmpe.f64 d18, d16
+; CHECK-NEXT:    vcmpe.f64 d18, d0
 ; CHECK-NEXT:    vmrs APSR_nzcv, fpscr
+; CHECK-NEXT:    vmov.f64 d16, #5.000000e-01
 ; CHECK-NEXT:    vmov.f64 d17, #-5.000000e-01
 ; CHECK-NEXT:    vselgt.f64 d0, d17, d16
 ; CHECK-NEXT:    bx lr
-  %1 = fcmp nsz olt double undef, 1.000000e+00
+  %1 = fcmp nsz olt double %a0, 1.000000e+00
  %2 = select i1 %1, double -5.000000e-01, double 5.000000e-01
  ret double %2
 }

-define arm_aapcs_vfpcc double @double128() local_unnamed_addr {
+define arm_aapcs_vfpcc double @double128(double %a0) local_unnamed_addr {
 ; CHECK-LABEL: double128:
 ; CHECK:       @ %bb.0:
-; CHECK-NEXT:    vmov.f64 d16, #5.000000e-01
 ; CHECK-NEXT:    movs r0, #0
-; CHECK-NEXT:    movt r0, #16480
 ; CHECK-NEXT:    movs r1, #0
+; CHECK-NEXT:    movt r0, #16480
+; CHECK-NEXT:    vmov.f64 d16, #5.000000e-01
 ; CHECK-NEXT:    vmov d18, r1, r0
-; CHECK-NEXT:    vcmpe.f64 d18, d16
+; CHECK-NEXT:    vcmpe.f64 d18, d0
 ; CHECK-NEXT:    vmrs APSR_nzcv, fpscr
 ; CHECK-NEXT:    vmov.f64 d17, #-5.000000e-01
 ; CHECK-NEXT:    vselgt.f64 d0, d17, d16
 ; CHECK-NEXT:    bx lr
-  %1 = fcmp nsz olt double undef, 128.000000e+00
+  %1 = fcmp nsz olt double %a0, 128.000000e+00
  %2 = select i1 %1, double -5.000000e-01, double 5.000000e-01
  ret double %2
 }
--- a/test/CodeGen/ARM/fp16-instructions.ll
+++ b/test/CodeGen/ARM/fp16-instructions.ll
@ -701,22 +701,23 @@ entry:
 ; 34. VRINTZ

 ; 35. VSELEQ
-define half @select_cc1()  {
-  %1 = fcmp nsz oeq half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc1(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz oeq half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc1:

-; CHECK-HARDFP-FULLFP16:	     vcmp.f16 s0, s0
-; CHECK-HARDFP-FULLFP16-NEXT:	 vmrs APSR_nzcv, fpscr
+; CHECK-HARDFP-FULLFP16:       vcmp.f16 s6, s0
+; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16:       vseleq.f16  s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmp.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmp.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmoveq.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmp.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmp.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32:       vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32:       it eq
 ; CHECK-SOFTFP-FP16-T32:       vmoveq.f32 s{{.}}, s{{.}}
@ -727,170 +728,178 @@ define half @select_cc1()  {
 ; be encoded as an FP16 immediate need to be added here.
 ;
 ; 36. VSELGE
-define half @select_cc_ge1()  {
-  %1 = fcmp nsz oge half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_ge1(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz oge half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_ge1:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
-; CHECK-HARDFP-FULLFP16-NEXT:	 vmrs APSR_nzcv, fpscr
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s6, s0
+; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselge.f16 s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovge.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it ge
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovge.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_ge2()  {
-  %1 = fcmp nsz ole half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_ge2(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz ole half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_ge2:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s6
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselge.f16 s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovls.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it ls
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovls.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_ge3()  {
-  %1 = fcmp nsz ugt half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_ge3(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz ugt half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_ge3:

-; CHECK-HARDFP-FULLFP16: 	     vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s6
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselge.f16 s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovhi.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it hi
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovhi.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_ge4()  {
-  %1 = fcmp nsz ult half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_ge4(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz ult half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_ge4:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s6, s0
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselge.f16 s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovlt.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it lt
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovlt.f32 s{{.}}, s{{.}}
 }

 ; 37. VSELGT
-define half @select_cc_gt1()  {
-  %1 = fcmp nsz ogt half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_gt1(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz ogt half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_gt1:

-; CHECK-HARDFP-FULLFP16:	     vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s6, s0
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselgt.f16  s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovgt.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it gt
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovgt.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_gt2()  {
-  %1 = fcmp nsz uge half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_gt2(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz uge half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_gt2:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s6
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs  APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselgt.f16  s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovpl.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it pl
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovpl.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_gt3()  {
-  %1 = fcmp nsz ule half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_gt3(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz ule half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_gt3:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s6, s0
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs  APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselgt.f16  s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovle.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it le
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovle.f32 s{{.}}, s{{.}}
 }

-define half @select_cc_gt4()  {
-  %1 = fcmp nsz olt half undef, 0xH0001
-  %2 = select i1 %1, half 0xHC000, half 0xH0002
-  ret half %2
+define half @select_cc_gt4(half* %a0)  {
+  %1 = load half, half* %a0
+  %2 = fcmp nsz olt half %1, 0xH0001
+  %3 = select i1 %2, half 0xHC000, half 0xH0002
+  ret half %3

 ; CHECK-LABEL:                 select_cc_gt4:

-; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s0
+; CHECK-HARDFP-FULLFP16:       vcmpe.f16 s0, s6
 ; CHECK-HARDFP-FULLFP16-NEXT:  vmrs  APSR_nzcv, fpscr
 ; CHECK-HARDFP-FULLFP16-NEXT:  vselgt.f16  s0, s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-A32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-A32-NEXT:  vmovmi.f32 s{{.}}, s{{.}}

-; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s0, s0
+; CHECK-SOFTFP-FP16-T32:       vcmpe.f32 s6, s0
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmrs APSR_nzcv, fpscr
 ; CHECK-SOFTFP-FP16-T32-NEXT:  it mi
 ; CHECK-SOFTFP-FP16-T32-NEXT:  vmovmi.f32 s{{.}}, s{{.}}
--- a/test/CodeGen/ARM/vcge.ll
+++ b/test/CodeGen/ARM/vcge.ll
@ -279,9 +279,10 @@ define <8 x i8> @vclei8Z(<8 x i8>* %A) nounwind {
 ; Radar 8782191
 ; Floating-point comparisons against zero produce results with integer
 ; elements, not floating-point elements.
-define void @test_vclez_fp() nounwind optsize {
+define void @test_vclez_fp(<4 x float>* %A) nounwind optsize {
 ; CHECK-LABEL: test_vclez_fp:
 ; CHECK:       @ %bb.0: @ %entry
+; CHECK-NEXT:    vld1.64 {d16, d17}, [r0]
 ; CHECK-NEXT:    vcle.f32 q8, q8, #0
 ; CHECK-NEXT:    vmovn.i32 d16, q8
 ; CHECK-NEXT:    vmov.i8 d17, #0x1
@ -289,7 +290,8 @@ define void @test_vclez_fp() nounwind optsize {
 ; CHECK-NEXT:    vadd.i8 d16, d16, d17
 ; CHECK-NEXT:    vst1.8 {d16}, [r0]
 entry:
-  %0 = fcmp ole <4 x float> undef, zeroinitializer
+  %ld = load <4 x float>, <4 x float>* %A
+  %0 = fcmp ole <4 x float> %ld, zeroinitializer
  %1 = sext <4 x i1> %0 to <4 x i16>
  %2 = add <4 x i16> %1, zeroinitializer
  %3 = shufflevector <4 x i16> %2, <4 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
--- a/test/CodeGen/SPARC/fp128.ll
+++ b/test/CodeGen/SPARC/fp128.ll
@ -73,10 +73,11 @@ entry:
 ; SOFT:       _Q_cmp
 ; SOFT:       cmp

-define i32 @f128_compare2() {
+define i32 @f128_compare2(fp128* byval %f0) {
 entry:
-  %0 = fcmp ogt fp128 undef, 0xL00000000000000000000000000000000
-  br i1 %0, label %"5", label %"7"
+  %0 = load fp128, fp128* %f0, align 8
+  %1 = fcmp ogt fp128 %0, 0xL00000000000000000000000000000000
+  br i1 %1, label %"5", label %"7"

 "5":                                              ; preds = %entry
  ret i32 0
--- a/test/CodeGen/X86/block-placement.ll
+++ b/test/CodeGen/X86/block-placement.ll
@ -469,7 +469,7 @@ exit:
  ret i32 %merge
 }

-define void @fpcmp_unanalyzable_branch(i1 %cond) {
+define void @fpcmp_unanalyzable_branch(i1 %cond, double %a0) {
 ; This function's CFG contains an once-unanalyzable branch (une on floating
 ; points). As now it becomes analyzable, we should get best layout in which each
 ; edge in 'entry' -> 'entry.if.then_crit_edge' -> 'if.then' -> 'if.end' is
@ -498,7 +498,7 @@ lor.lhs.false:
  br i1 undef, label %if.end, label %exit

 exit:
-  %cmp.i = fcmp une double 0.000000e+00, undef
+  %cmp.i = fcmp une double 0.000000e+00, %a0
  br i1 %cmp.i, label %if.then, label %if.end, !prof !3

 if.then:
@ -641,7 +641,7 @@ loop3:
  br label %loop1
 }

-define void @unanalyzable_branch_to_loop_header() {
+define void @unanalyzable_branch_to_loop_header(double %a0) {
 ; Ensure that we can handle unanalyzable branches into loop headers. We
 ; pre-form chains for unanalyzable branches, and will find the tail end of that
 ; at the start of the loop. This function uses floating point comparison
@ -654,7 +654,7 @@ define void @unanalyzable_branch_to_loop_header() {
 ; CHECK: %exit

 entry:
-  %cmp = fcmp une double 0.000000e+00, undef
+  %cmp = fcmp une double 0.000000e+00, %a0
  br i1 %cmp, label %loop, label %exit

 loop:
@ -665,7 +665,7 @@ exit:
  ret void
 }

-define void @unanalyzable_branch_to_best_succ(i1 %cond) {
+define void @unanalyzable_branch_to_best_succ(i1 %cond, double %a0) {
 ; Ensure that we can handle unanalyzable branches where the destination block
 ; gets selected as the optimal successor to merge.
 ;
@ -683,7 +683,7 @@ entry:
  br i1 %cond, label %bar, label %foo, !prof !1

 foo:
-  %cmp = fcmp une double 0.000000e+00, undef
+  %cmp = fcmp une double 0.000000e+00, %a0
  br i1 %cmp, label %bar, label %exit

 bar:
@ -713,7 +713,7 @@ a:
  br label %c

 b:
-  %cmp = fcmp une float %x, undef
+  %cmp = fcmp une float %x, 0.0
  br i1 %cmp, label %c, label %exit

 c:
@ -736,199 +736,199 @@ entry:
  br label %0

  %val0 = load volatile float, float* undef
-  %cmp0 = fcmp une float %val0, undef
+  %cmp0 = fcmp une float %val0, 0.0
  br i1 %cmp0, label %1, label %0
  %val1 = load volatile float, float* undef
-  %cmp1 = fcmp une float %val1, undef
+  %cmp1 = fcmp une float %val1, 0.0
  br i1 %cmp1, label %2, label %1
  %val2 = load volatile float, float* undef
-  %cmp2 = fcmp une float %val2, undef
+  %cmp2 = fcmp une float %val2, 0.0
  br i1 %cmp2, label %3, label %2
  %val3 = load volatile float, float* undef
-  %cmp3 = fcmp une float %val3, undef
+  %cmp3 = fcmp une float %val3, 0.0
  br i1 %cmp3, label %4, label %3
  %val4 = load volatile float, float* undef
-  %cmp4 = fcmp une float %val4, undef
+  %cmp4 = fcmp une float %val4, 0.0
  br i1 %cmp4, label %5, label %4
  %val5 = load volatile float, float* undef
-  %cmp5 = fcmp une float %val5, undef
+  %cmp5 = fcmp une float %val5, 0.0
  br i1 %cmp5, label %6, label %5
  %val6 = load volatile float, float* undef
-  %cmp6 = fcmp une float %val6, undef
+  %cmp6 = fcmp une float %val6, 0.0
  br i1 %cmp6, label %7, label %6
  %val7 = load volatile float, float* undef
-  %cmp7 = fcmp une float %val7, undef
+  %cmp7 = fcmp une float %val7, 0.0
  br i1 %cmp7, label %8, label %7
  %val8 = load volatile float, float* undef
-  %cmp8 = fcmp une float %val8, undef
+  %cmp8 = fcmp une float %val8, 0.0
  br i1 %cmp8, label %9, label %8
  %val9 = load volatile float, float* undef
-  %cmp9 = fcmp une float %val9, undef
+  %cmp9 = fcmp une float %val9, 0.0
  br i1 %cmp9, label %10, label %9
  %val10 = load volatile float, float* undef
-  %cmp10 = fcmp une float %val10, undef
+  %cmp10 = fcmp une float %val10, 0.0
  br i1 %cmp10, label %11, label %10
  %val11 = load volatile float, float* undef
-  %cmp11 = fcmp une float %val11, undef
+  %cmp11 = fcmp une float %val11, 0.0
  br i1 %cmp11, label %12, label %11
  %val12 = load volatile float, float* undef
-  %cmp12 = fcmp une float %val12, undef
+  %cmp12 = fcmp une float %val12, 0.0
  br i1 %cmp12, label %13, label %12
  %val13 = load volatile float, float* undef
-  %cmp13 = fcmp une float %val13, undef
+  %cmp13 = fcmp une float %val13, 0.0
  br i1 %cmp13, label %14, label %13
  %val14 = load volatile float, float* undef
-  %cmp14 = fcmp une float %val14, undef
+  %cmp14 = fcmp une float %val14, 0.0
  br i1 %cmp14, label %15, label %14
  %val15 = load volatile float, float* undef
-  %cmp15 = fcmp une float %val15, undef
+  %cmp15 = fcmp une float %val15, 0.0
  br i1 %cmp15, label %16, label %15
  %val16 = load volatile float, float* undef
-  %cmp16 = fcmp une float %val16, undef
+  %cmp16 = fcmp une float %val16, 0.0
  br i1 %cmp16, label %17, label %16
  %val17 = load volatile float, float* undef
-  %cmp17 = fcmp une float %val17, undef
+  %cmp17 = fcmp une float %val17, 0.0
  br i1 %cmp17, label %18, label %17
  %val18 = load volatile float, float* undef
-  %cmp18 = fcmp une float %val18, undef
+  %cmp18 = fcmp une float %val18, 0.0
  br i1 %cmp18, label %19, label %18
  %val19 = load volatile float, float* undef
-  %cmp19 = fcmp une float %val19, undef
+  %cmp19 = fcmp une float %val19, 0.0
  br i1 %cmp19, label %20, label %19
  %val20 = load volatile float, float* undef
-  %cmp20 = fcmp une float %val20, undef
+  %cmp20 = fcmp une float %val20, 0.0
  br i1 %cmp20, label %21, label %20
  %val21 = load volatile float, float* undef
-  %cmp21 = fcmp une float %val21, undef
+  %cmp21 = fcmp une float %val21, 0.0
  br i1 %cmp21, label %22, label %21
  %val22 = load volatile float, float* undef
-  %cmp22 = fcmp une float %val22, undef
+  %cmp22 = fcmp une float %val22, 0.0
  br i1 %cmp22, label %23, label %22
  %val23 = load volatile float, float* undef
-  %cmp23 = fcmp une float %val23, undef
+  %cmp23 = fcmp une float %val23, 0.0
  br i1 %cmp23, label %24, label %23
  %val24 = load volatile float, float* undef
-  %cmp24 = fcmp une float %val24, undef
+  %cmp24 = fcmp une float %val24, 0.0
  br i1 %cmp24, label %25, label %24
  %val25 = load volatile float, float* undef
-  %cmp25 = fcmp une float %val25, undef
+  %cmp25 = fcmp une float %val25, 0.0
  br i1 %cmp25, label %26, label %25
  %val26 = load volatile float, float* undef
-  %cmp26 = fcmp une float %val26, undef
+  %cmp26 = fcmp une float %val26, 0.0
  br i1 %cmp26, label %27, label %26
  %val27 = load volatile float, float* undef
-  %cmp27 = fcmp une float %val27, undef
+  %cmp27 = fcmp une float %val27, 0.0
  br i1 %cmp27, label %28, label %27
  %val28 = load volatile float, float* undef
-  %cmp28 = fcmp une float %val28, undef
+  %cmp28 = fcmp une float %val28, 0.0
  br i1 %cmp28, label %29, label %28
  %val29 = load volatile float, float* undef
-  %cmp29 = fcmp une float %val29, undef
+  %cmp29 = fcmp une float %val29, 0.0
  br i1 %cmp29, label %30, label %29
  %val30 = load volatile float, float* undef
-  %cmp30 = fcmp une float %val30, undef
+  %cmp30 = fcmp une float %val30, 0.0
  br i1 %cmp30, label %31, label %30
  %val31 = load volatile float, float* undef
-  %cmp31 = fcmp une float %val31, undef
+  %cmp31 = fcmp une float %val31, 0.0
  br i1 %cmp31, label %32, label %31
  %val32 = load volatile float, float* undef
-  %cmp32 = fcmp une float %val32, undef
+  %cmp32 = fcmp une float %val32, 0.0
  br i1 %cmp32, label %33, label %32
  %val33 = load volatile float, float* undef
-  %cmp33 = fcmp une float %val33, undef
+  %cmp33 = fcmp une float %val33, 0.0
  br i1 %cmp33, label %34, label %33
  %val34 = load volatile float, float* undef
-  %cmp34 = fcmp une float %val34, undef
+  %cmp34 = fcmp une float %val34, 0.0
  br i1 %cmp34, label %35, label %34
  %val35 = load volatile float, float* undef
-  %cmp35 = fcmp une float %val35, undef
+  %cmp35 = fcmp une float %val35, 0.0
  br i1 %cmp35, label %36, label %35
  %val36 = load volatile float, float* undef
-  %cmp36 = fcmp une float %val36, undef
+  %cmp36 = fcmp une float %val36, 0.0
  br i1 %cmp36, label %37, label %36
  %val37 = load volatile float, float* undef
-  %cmp37 = fcmp une float %val37, undef
+  %cmp37 = fcmp une float %val37, 0.0
  br i1 %cmp37, label %38, label %37
  %val38 = load volatile float, float* undef
-  %cmp38 = fcmp une float %val38, undef
+  %cmp38 = fcmp une float %val38, 0.0
  br i1 %cmp38, label %39, label %38
  %val39 = load volatile float, float* undef
-  %cmp39 = fcmp une float %val39, undef
+  %cmp39 = fcmp une float %val39, 0.0
  br i1 %cmp39, label %40, label %39
  %val40 = load volatile float, float* undef
-  %cmp40 = fcmp une float %val40, undef
+  %cmp40 = fcmp une float %val40, 0.0
  br i1 %cmp40, label %41, label %40
  %val41 = load volatile float, float* undef
  %cmp41 = fcmp une float %val41, undef
  br i1 %cmp41, label %42, label %41
  %val42 = load volatile float, float* undef
-  %cmp42 = fcmp une float %val42, undef
+  %cmp42 = fcmp une float %val42, 0.0
  br i1 %cmp42, label %43, label %42
  %val43 = load volatile float, float* undef
-  %cmp43 = fcmp une float %val43, undef
+  %cmp43 = fcmp une float %val43, 0.0
  br i1 %cmp43, label %44, label %43
  %val44 = load volatile float, float* undef
-  %cmp44 = fcmp une float %val44, undef
+  %cmp44 = fcmp une float %val44, 0.0
  br i1 %cmp44, label %45, label %44
  %val45 = load volatile float, float* undef
-  %cmp45 = fcmp une float %val45, undef
+  %cmp45 = fcmp une float %val45, 0.0
  br i1 %cmp45, label %46, label %45
  %val46 = load volatile float, float* undef
-  %cmp46 = fcmp une float %val46, undef
+  %cmp46 = fcmp une float %val46, 0.0
  br i1 %cmp46, label %47, label %46
  %val47 = load volatile float, float* undef
-  %cmp47 = fcmp une float %val47, undef
+  %cmp47 = fcmp une float %val47, 0.0
  br i1 %cmp47, label %48, label %47
  %val48 = load volatile float, float* undef
-  %cmp48 = fcmp une float %val48, undef
+  %cmp48 = fcmp une float %val48, 0.0
  br i1 %cmp48, label %49, label %48
  %val49 = load volatile float, float* undef
-  %cmp49 = fcmp une float %val49, undef
+  %cmp49 = fcmp une float %val49, 0.0
  br i1 %cmp49, label %50, label %49
  %val50 = load volatile float, float* undef
-  %cmp50 = fcmp une float %val50, undef
+  %cmp50 = fcmp une float %val50, 0.0
  br i1 %cmp50, label %51, label %50
  %val51 = load volatile float, float* undef
-  %cmp51 = fcmp une float %val51, undef
+  %cmp51 = fcmp une float %val51, 0.0
  br i1 %cmp51, label %52, label %51
  %val52 = load volatile float, float* undef
-  %cmp52 = fcmp une float %val52, undef
+  %cmp52 = fcmp une float %val52, 0.0
  br i1 %cmp52, label %53, label %52
  %val53 = load volatile float, float* undef
-  %cmp53 = fcmp une float %val53, undef
+  %cmp53 = fcmp une float %val53, 0.0
  br i1 %cmp53, label %54, label %53
  %val54 = load volatile float, float* undef
-  %cmp54 = fcmp une float %val54, undef
+  %cmp54 = fcmp une float %val54, 0.0
  br i1 %cmp54, label %55, label %54
  %val55 = load volatile float, float* undef
-  %cmp55 = fcmp une float %val55, undef
+  %cmp55 = fcmp une float %val55, 0.0
  br i1 %cmp55, label %56, label %55
  %val56 = load volatile float, float* undef
-  %cmp56 = fcmp une float %val56, undef
+  %cmp56 = fcmp une float %val56, 0.0
  br i1 %cmp56, label %57, label %56
  %val57 = load volatile float, float* undef
-  %cmp57 = fcmp une float %val57, undef
+  %cmp57 = fcmp une float %val57, 0.0
  br i1 %cmp57, label %58, label %57
  %val58 = load volatile float, float* undef
-  %cmp58 = fcmp une float %val58, undef
+  %cmp58 = fcmp une float %val58, 0.0
  br i1 %cmp58, label %59, label %58
  %val59 = load volatile float, float* undef
-  %cmp59 = fcmp une float %val59, undef
+  %cmp59 = fcmp une float %val59, 0.0
  br i1 %cmp59, label %60, label %59
  %val60 = load volatile float, float* undef
-  %cmp60 = fcmp une float %val60, undef
+  %cmp60 = fcmp une float %val60, 0.0
  br i1 %cmp60, label %61, label %60
  %val61 = load volatile float, float* undef
-  %cmp61 = fcmp une float %val61, undef
+  %cmp61 = fcmp une float %val61, 0.0
  br i1 %cmp61, label %62, label %61
  %val62 = load volatile float, float* undef
-  %cmp62 = fcmp une float %val62, undef
+  %cmp62 = fcmp une float %val62, 0.0
  br i1 %cmp62, label %63, label %62
  %val63 = load volatile float, float* undef
-  %cmp63 = fcmp une float %val63, undef
+  %cmp63 = fcmp une float %val63, 0.0
  br i1 %cmp63, label %64, label %63
  %val64 = load volatile float, float* undef
-  %cmp64 = fcmp une float %val64, undef
+  %cmp64 = fcmp une float %val64, 0.0
  br i1 %cmp64, label %65, label %64

  br label %exit
--- a/test/CodeGen/X86/fcmp-constant.ll
+++ b/test/CodeGen/X86/fcmp-constant.ll
@ -18,7 +18,7 @@ define <2 x i64> @fcmp_oeq_v2f64() {
 define <2 x i64> @fcmp_oeq_v2f64_undef() {
 ; CHECK-LABEL: fcmp_oeq_v2f64_undef:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    cmpeqpd {{.*}}(%rip), %xmm0
+; CHECK-NEXT:    xorps %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp oeq <2 x double> <double 0x3FF0000000000000, double 0xFFEFFFFFFFFFFFFF>, undef
  %2 = sext <2 x i1> %1 to <2 x i64>
@ -28,8 +28,7 @@ define <2 x i64> @fcmp_oeq_v2f64_undef() {
 define <2 x i64> @fcmp_oeq_v2f64_undef_elt() {
 ; CHECK-LABEL: fcmp_oeq_v2f64_undef_elt:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movapd {{.*#+}} xmm0 = <u,1.0E+0>
-; CHECK-NEXT:    cmpeqpd {{.*}}(%rip), %xmm0
+; CHECK-NEXT:    xorps %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp oeq <2 x double> <double 0x3FF0000000000000, double 0xFFEFFFFFFFFFFFFF>, <double undef, double 0x3FF0000000000000>
  %2 = sext <2 x i1> %1 to <2 x i64>
@ -49,7 +48,7 @@ define <4 x i32> @fcmp_oeq_v4f32() {
 define <4 x i32> @fcmp_oeq_v4f32_undef() {
 ; CHECK-LABEL: fcmp_oeq_v4f32_undef:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    cmpeqps {{.*}}(%rip), %xmm0
+; CHECK-NEXT:    xorps %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp oeq <4 x float> <float 1.0, float -1.0, float +2.0, float -0.0>, undef
  %2 = sext <4 x i1> %1 to <4 x i32>
@ -59,8 +58,7 @@ define <4 x i32> @fcmp_oeq_v4f32_undef() {
 define <4 x i32> @fcmp_oeq_v4f32_undef_elt() {
 ; CHECK-LABEL: fcmp_oeq_v4f32_undef_elt:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movaps {{.*#+}} xmm0 = <u,1.0E+0,-1.0E+0,2.0E+0>
-; CHECK-NEXT:    cmpeqps {{.*}}(%rip), %xmm0
+; CHECK-NEXT:    movaps {{.*#+}} xmm0 = [0,4294967295,4294967295,0]
 ; CHECK-NEXT:    retq
  %1 = fcmp oeq <4 x float> <float -0.0, float 1.0, float -1.0, float undef>, <float undef, float 1.0, float -1.0, float +2.0>
  %2 = sext <4 x i1> %1 to <4 x i32>
@ -84,11 +82,7 @@ define <2 x i64> @fcmp_ueq_v2f64() {
 define <2 x i64> @fcmp_ueq_v2f64_undef() {
 ; CHECK-LABEL: fcmp_ueq_v2f64_undef:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movapd {{.*#+}} xmm0 = [1.0E+0,-1.7976931348623157E+308]
-; CHECK-NEXT:    movapd %xmm0, %xmm1
-; CHECK-NEXT:    cmpeqpd %xmm0, %xmm1
-; CHECK-NEXT:    cmpunordpd %xmm0, %xmm0
-; CHECK-NEXT:    orpd %xmm1, %xmm0
+; CHECK-NEXT:    pcmpeqd %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp ueq <2 x double> <double 0x3FF0000000000000, double 0xFFEFFFFFFFFFFFFF>, undef
  %2 = sext <2 x i1> %1 to <2 x i64>
@ -98,12 +92,8 @@ define <2 x i64> @fcmp_ueq_v2f64_undef() {
 define <2 x i64> @fcmp_ueq_v2f64_undef_elt() {
 ; CHECK-LABEL: fcmp_ueq_v2f64_undef_elt:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movapd {{.*#+}} xmm1 = <u,1.0E+0>
-; CHECK-NEXT:    movapd {{.*#+}} xmm0 = [1.0E+0,-1.7976931348623157E+308]
-; CHECK-NEXT:    movapd %xmm0, %xmm2
-; CHECK-NEXT:    cmpeqpd %xmm1, %xmm2
-; CHECK-NEXT:    cmpunordpd %xmm1, %xmm0
-; CHECK-NEXT:    orpd %xmm2, %xmm0
+; CHECK-NEXT:    movq $-1, %rax
+; CHECK-NEXT:    movq %rax, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp ueq <2 x double> <double 0x3FF0000000000000, double 0xFFEFFFFFFFFFFFFF>, <double undef, double 0x3FF0000000000000>
  %2 = sext <2 x i1> %1 to <2 x i64>
@ -123,11 +113,7 @@ define <4 x i32> @fcmp_ueq_v4f32() {
 define <4 x i32> @fcmp_ueq_v4f32_undef() {
 ; CHECK-LABEL: fcmp_ueq_v4f32_undef:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movaps {{.*#+}} xmm0 = [1.0E+0,-1.0E+0,2.0E+0,-0.0E+0]
-; CHECK-NEXT:    movaps %xmm0, %xmm1
-; CHECK-NEXT:    cmpeqps %xmm0, %xmm1
-; CHECK-NEXT:    cmpunordps %xmm0, %xmm0
-; CHECK-NEXT:    orps %xmm1, %xmm0
+; CHECK-NEXT:    pcmpeqd %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp ueq <4 x float> <float 1.0, float -1.0, float +2.0, float -0.0>, undef
  %2 = sext <4 x i1> %1 to <4 x i32>
@ -137,12 +123,7 @@ define <4 x i32> @fcmp_ueq_v4f32_undef() {
 define <4 x i32> @fcmp_ueq_v4f32_undef_elt() {
 ; CHECK-LABEL: fcmp_ueq_v4f32_undef_elt:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    movaps {{.*#+}} xmm1 = <u,1.0E+0,-1.0E+0,2.0E+0>
-; CHECK-NEXT:    movaps {{.*#+}} xmm0 = <-0.0E+0,1.0E+0,-1.0E+0,u>
-; CHECK-NEXT:    movaps %xmm0, %xmm2
-; CHECK-NEXT:    cmpeqps %xmm1, %xmm2
-; CHECK-NEXT:    cmpunordps %xmm1, %xmm0
-; CHECK-NEXT:    orps %xmm2, %xmm0
+; CHECK-NEXT:    pcmpeqd %xmm0, %xmm0
 ; CHECK-NEXT:    retq
  %1 = fcmp ueq <4 x float> <float -0.0, float 1.0, float -1.0, float undef>, <float undef, float 1.0, float -1.0, float +2.0>
  %2 = sext <4 x i1> %1 to <4 x i32>