llvm-mirror/test/CodeGen/X86/fast-isel-cmp-branch3.ll

; RUN: llc < %s -fast-isel -fast-isel-abort=1 -mtriple=x86_64-apple-darwin10 | FileCheck %s

define i32 @fcmp_oeq1(float %x) {
; CHECK-LABEL: fcmp_oeq1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp oeq float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_oeq2(float %x) {
; CHECK-LABEL: fcmp_oeq2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  jne {{LBB.+_1}}
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp oeq float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ogt1(float %x) {
; CHECK-LABEL: fcmp_ogt1
; CHECK-NOT:   ucomiss
; CHECK:       movl $1, %eax
  %1 = fcmp ogt float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ogt2(float %x) {
; CHECK-LABEL: fcmp_ogt2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  jbe {{LBB.+_1}}
  %1 = fcmp ogt float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_oge1(float %x) {
; CHECK-LABEL: fcmp_oge1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp oge float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_oge2(float %x) {
; CHECK-LABEL: fcmp_oge2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  jb {{LBB.+_1}}
  %1 = fcmp oge float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_olt1(float %x) {
; CHECK-LABEL: fcmp_olt1
; CHECK-NOT:   ucomiss
; CHECK:       movl $1, %eax
  %1 = fcmp olt float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_olt2(float %x) {
; CHECK-LABEL: fcmp_olt2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm0, %xmm1
; CHECK-NEXT:  jbe {{LBB.+_1}}
  %1 = fcmp olt float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ole1(float %x) {
; CHECK-LABEL: fcmp_ole1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp ole float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ole2(float %x) {
; CHECK-LABEL: fcmp_ole2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm0, %xmm1
; CHECK-NEXT:  jb {{LBB.+_1}}
  %1 = fcmp ole float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_one1(float %x) {
; CHECK-LABEL: fcmp_one1
; CHECK-NOT:   ucomiss
; CHECK:       movl $1, %eax
  %1 = fcmp one float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_one2(float %x) {
; CHECK-LABEL: fcmp_one2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  je {{LBB.+_1}}
  %1 = fcmp one float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ord1(float %x) {
; CHECK-LABEL: fcmp_ord1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp ord float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ord2(float %x) {
; CHECK-LABEL: fcmp_ord2
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_1}}
  %1 = fcmp ord float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_uno1(float %x) {
; CHECK-LABEL: fcmp_uno1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_2}}
  %1 = fcmp uno float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_uno2(float %x) {
; CHECK-LABEL: fcmp_uno2
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jp {{LBB.+_2}}
  %1 = fcmp uno float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ueq1(float %x) {
; CHECK-LABEL: fcmp_ueq1
; CHECK-NOT:   ucomiss
  %1 = fcmp ueq float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ueq2(float %x) {
; CHECK-LABEL: fcmp_ueq2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  je {{LBB.+_2}}
  %1 = fcmp ueq float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ugt1(float %x) {
; CHECK-LABEL: fcmp_ugt1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jnp {{LBB.+_1}}
  %1 = fcmp ugt float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ugt2(float %x) {
; CHECK-LABEL: fcmp_ugt2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm0, %xmm1
; CHECK-NEXT:  jae {{LBB.+_1}}
  %1 = fcmp ugt float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_uge1(float %x) {
; CHECK-LABEL: fcmp_uge1
; CHECK-NOT:   ucomiss
  %1 = fcmp uge float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_uge2(float %x) {
; CHECK-LABEL: fcmp_uge2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm0, %xmm1
; CHECK-NEXT:  ja {{LBB.+_1}}
  %1 = fcmp uge float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ult1(float %x) {
; CHECK-LABEL: fcmp_ult1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jnp {{LBB.+_1}}
  %1 = fcmp ult float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ult2(float %x) {
; CHECK-LABEL: fcmp_ult2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  jae {{LBB.+_1}}
  %1 = fcmp ult float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ule1(float %x) {
; CHECK-LABEL: fcmp_ule1
; CHECK-NOT:   ucomiss
  %1 = fcmp ule float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_ule2(float %x) {
; CHECK-LABEL: fcmp_ule2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  ja {{LBB.+_1}}
  %1 = fcmp ule float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_une1(float %x) {
; CHECK-LABEL: fcmp_une1
; CHECK:       ucomiss  %xmm0, %xmm0
; CHECK-NEXT:  jnp {{LBB.+_1}}
  %1 = fcmp une float %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @fcmp_une2(float %x) {
; CHECK-LABEL: fcmp_une2
; CHECK:       xorps    %xmm1, %xmm1
; CHECK-NEXT:  ucomiss  %xmm1, %xmm0
; CHECK-NEXT:  jne {{LBB.+_2}}
; CHECK-NEXT:  jnp {{LBB.+_1}}
  %1 = fcmp une float %x, 0.000000e+00
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_eq(i32 %x) {
; CHECK-LABEL: icmp_eq
; CHECK-NOT:   cmpl
; CHECK:       xorl %eax, %eax
  %1 = icmp eq i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_ne(i32 %x) {
; CHECK-LABEL: icmp_ne
; CHECK-NOT:   cmpl
; CHECK:       movl $1, %eax
  %1 = icmp ne i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_ugt(i32 %x) {
; CHECK-LABEL: icmp_ugt
; CHECK-NOT:   cmpl
; CHECK:       movl $1, %eax
  %1 = icmp ugt i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_uge(i32 %x) {
; CHECK-LABEL: icmp_uge
; CHECK-NOT:   cmpl
; CHECK:       xorl %eax, %eax
  %1 = icmp uge i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_ult(i32 %x) {
; CHECK-LABEL: icmp_ult
; CHECK-NOT:   cmpl
; CHECK:       movl $1, %eax
  %1 = icmp ult i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_ule(i32 %x) {
; CHECK-LABEL: icmp_ule
; CHECK-NOT:   cmpl
; CHECK:       xorl %eax, %eax
  %1 = icmp ule i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_sgt(i32 %x) {
; CHECK-LABEL: icmp_sgt
; CHECK-NOT:   cmpl
; CHECK:       movl $1, %eax
  %1 = icmp sgt i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_sge(i32 %x) {
; CHECK-LABEL: icmp_sge
; CHECK-NOT:   cmpl
; CHECK:       xorl %eax, %eax
  %1 = icmp sge i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_slt(i32 %x) {
; CHECK-LABEL: icmp_slt
; CHECK-NOT:   cmpl
; CHECK:       movl $1, %eax
  %1 = icmp slt i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}

define i32 @icmp_sle(i32 %x) {
; CHECK-LABEL: icmp_sle
; CHECK-NOT:   cmpl
; CHECK:       xorl %eax, %eax
  %1 = icmp sle i32 %x, %x
  br i1 %1, label %bb1, label %bb2
bb2:
  ret i32 1
bb1:
  ret i32 0
}
Change the fast-isel-abort option from bool to int to enable "levels" Summary: Currently fast-isel-abort will only abort for regular instructions, and just warn for function calls, terminators, function arguments. There is already fast-isel-abort-args but nothing for calls and terminators. This change turns the fast-isel-abort options into an integer option, so that multiple levels of strictness can be defined. This will help no being surprised when the "abort" option indeed does not abort, and enables the possibility to write test that verifies that no intrinsics are forgotten by fast-isel. Reviewers: resistor, echristo Subscribers: jfb, llvm-commits Differential Revision: http://reviews.llvm.org/D7941 From: Mehdi Amini <mehdi.amini@apple.com> llvm-svn: 230775 2015-02-27 19:32:11 +01:00			`; RUN: llc < %s -fast-isel -fast-isel-abort=1 -mtriple=x86_64-apple-darwin10 \| FileCheck %s`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00
			`define i32 @fcmp_oeq1(float %x) {`
			`; CHECK-LABEL: fcmp_oeq1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_1}}`
			`%1 = fcmp oeq float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_oeq2(float %x) {`
			`; CHECK-LABEL: fcmp_oeq2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: jne {{LBB.+_1}}`
Allow X86::COND_NE_OR_P and X86::COND_NP_OR_E to be reversed. Currently, AnalyzeBranch() fails non-equality comparison between floating points on X86 (see https://llvm.org/bugs/show_bug.cgi?id=23875). This is because this function can modify the branch by reversing the conditional jump and removing unconditional jump if there is a proper fall-through. However, in the case of non-equality comparison between floating points, this can turn the branch "unanalyzable". Consider the following case: jne.BB1 jp.BB1 jmp.BB2 .BB1: ... .BB2: ... AnalyzeBranch() will reverse "jp .BB1" to "jnp .BB2" and then "jmp .BB2" will be removed: jne.BB1 jnp.BB2 .BB1: ... .BB2: ... However, AnalyzeBranch() cannot analyze this branch anymore as there are two conditional jumps with different targets. This may disable some optimizations like block-placement: in this case the fall-through behavior is enforced even if the fall-through block is very cold, which is suboptimal. Actually this optimization is also done in block-placement pass, which means we can remove this optimization from AnalyzeBranch(). However, currently X86::COND_NE_OR_P and X86::COND_NP_OR_E are not reversible: there is no defined negation conditions for them. In order to reverse them, this patch defines two new CondCode X86::COND_E_AND_NP and X86::COND_P_AND_NE. It also defines how to synthesize instructions for them. Here only the second conditional jump is reversed. This is valid as we only need them to do this "unconditional jump removal" optimization. Differential Revision: http://reviews.llvm.org/D11393 llvm-svn: 264199 2016-03-23 22:45:37 +01:00			`; CHECK-NEXT: jp {{LBB.+_1}}`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = fcmp oeq float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ogt1(float %x) {`
			`; CHECK-LABEL: fcmp_ogt1`
			`; CHECK-NOT: ucomiss`
			`; CHECK: movl $1, %eax`
			`%1 = fcmp ogt float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ogt2(float %x) {`
			`; CHECK-LABEL: fcmp_ogt2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: jbe {{LBB.+_1}}`
			`%1 = fcmp ogt float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_oge1(float %x) {`
			`; CHECK-LABEL: fcmp_oge1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_1}}`
			`%1 = fcmp oge float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_oge2(float %x) {`
			`; CHECK-LABEL: fcmp_oge2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: jb {{LBB.+_1}}`
			`%1 = fcmp oge float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_olt1(float %x) {`
			`; CHECK-LABEL: fcmp_olt1`
			`; CHECK-NOT: ucomiss`
			`; CHECK: movl $1, %eax`
			`%1 = fcmp olt float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_olt2(float %x) {`
			`; CHECK-LABEL: fcmp_olt2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm0, %xmm1`
			`; CHECK-NEXT: jbe {{LBB.+_1}}`
			`%1 = fcmp olt float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ole1(float %x) {`
			`; CHECK-LABEL: fcmp_ole1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_1}}`
			`%1 = fcmp ole float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ole2(float %x) {`
			`; CHECK-LABEL: fcmp_ole2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm0, %xmm1`
			`; CHECK-NEXT: jb {{LBB.+_1}}`
			`%1 = fcmp ole float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_one1(float %x) {`
			`; CHECK-LABEL: fcmp_one1`
			`; CHECK-NOT: ucomiss`
			`; CHECK: movl $1, %eax`
			`%1 = fcmp one float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_one2(float %x) {`
			`; CHECK-LABEL: fcmp_one2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: je {{LBB.+_1}}`
			`%1 = fcmp one float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ord1(float %x) {`
			`; CHECK-LABEL: fcmp_ord1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_1}}`
			`%1 = fcmp ord float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ord2(float %x) {`
			`; CHECK-LABEL: fcmp_ord2`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_1}}`
			`%1 = fcmp ord float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_uno1(float %x) {`
			`; CHECK-LABEL: fcmp_uno1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_2}}`
			`%1 = fcmp uno float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_uno2(float %x) {`
			`; CHECK-LABEL: fcmp_uno2`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jp {{LBB.+_2}}`
			`%1 = fcmp uno float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ueq1(float %x) {`
			`; CHECK-LABEL: fcmp_ueq1`
			`; CHECK-NOT: ucomiss`
			`%1 = fcmp ueq float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ueq2(float %x) {`
			`; CHECK-LABEL: fcmp_ueq2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: je {{LBB.+_2}}`
			`%1 = fcmp ueq float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ugt1(float %x) {`
			`; CHECK-LABEL: fcmp_ugt1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jnp {{LBB.+_1}}`
			`%1 = fcmp ugt float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ugt2(float %x) {`
			`; CHECK-LABEL: fcmp_ugt2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm0, %xmm1`
			`; CHECK-NEXT: jae {{LBB.+_1}}`
			`%1 = fcmp ugt float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_uge1(float %x) {`
			`; CHECK-LABEL: fcmp_uge1`
			`; CHECK-NOT: ucomiss`
			`%1 = fcmp uge float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_uge2(float %x) {`
			`; CHECK-LABEL: fcmp_uge2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm0, %xmm1`
			`; CHECK-NEXT: ja {{LBB.+_1}}`
			`%1 = fcmp uge float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ult1(float %x) {`
			`; CHECK-LABEL: fcmp_ult1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jnp {{LBB.+_1}}`
			`%1 = fcmp ult float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ult2(float %x) {`
			`; CHECK-LABEL: fcmp_ult2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: jae {{LBB.+_1}}`
			`%1 = fcmp ult float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ule1(float %x) {`
			`; CHECK-LABEL: fcmp_ule1`
			`; CHECK-NOT: ucomiss`
			`%1 = fcmp ule float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_ule2(float %x) {`
			`; CHECK-LABEL: fcmp_ule2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: ja {{LBB.+_1}}`
			`%1 = fcmp ule float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_une1(float %x) {`
			`; CHECK-LABEL: fcmp_une1`
			`; CHECK: ucomiss %xmm0, %xmm0`
			`; CHECK-NEXT: jnp {{LBB.+_1}}`
			`%1 = fcmp une float %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @fcmp_une2(float %x) {`
			`; CHECK-LABEL: fcmp_une2`
			`; CHECK: xorps %xmm1, %xmm1`
			`; CHECK-NEXT: ucomiss %xmm1, %xmm0`
			`; CHECK-NEXT: jne {{LBB.+_2}}`
Allow X86::COND_NE_OR_P and X86::COND_NP_OR_E to be reversed. Currently, AnalyzeBranch() fails non-equality comparison between floating points on X86 (see https://llvm.org/bugs/show_bug.cgi?id=23875). This is because this function can modify the branch by reversing the conditional jump and removing unconditional jump if there is a proper fall-through. However, in the case of non-equality comparison between floating points, this can turn the branch "unanalyzable". Consider the following case: jne.BB1 jp.BB1 jmp.BB2 .BB1: ... .BB2: ... AnalyzeBranch() will reverse "jp .BB1" to "jnp .BB2" and then "jmp .BB2" will be removed: jne.BB1 jnp.BB2 .BB1: ... .BB2: ... However, AnalyzeBranch() cannot analyze this branch anymore as there are two conditional jumps with different targets. This may disable some optimizations like block-placement: in this case the fall-through behavior is enforced even if the fall-through block is very cold, which is suboptimal. Actually this optimization is also done in block-placement pass, which means we can remove this optimization from AnalyzeBranch(). However, currently X86::COND_NE_OR_P and X86::COND_NP_OR_E are not reversible: there is no defined negation conditions for them. In order to reverse them, this patch defines two new CondCode X86::COND_E_AND_NP and X86::COND_P_AND_NE. It also defines how to synthesize instructions for them. Here only the second conditional jump is reversed. This is valid as we only need them to do this "unconditional jump removal" optimization. Differential Revision: http://reviews.llvm.org/D11393 llvm-svn: 264199 2016-03-23 22:45:37 +01:00			`; CHECK-NEXT: jnp {{LBB.+_1}}`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = fcmp une float %x, 0.000000e+00`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_eq(i32 %x) {`
			`; CHECK-LABEL: icmp_eq`
			`; CHECK-NOT: cmpl`
Reapply [FastISel][X86] Use XOR to materialize the "0" value (r215594). Note: This was originally reverted to track down a buildbot error. Reapply without any modifications. llvm-svn: 216011 2014-08-19 21:44:10 +02:00			`; CHECK: xorl %eax, %eax`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = icmp eq i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_ne(i32 %x) {`
			`; CHECK-LABEL: icmp_ne`
			`; CHECK-NOT: cmpl`
			`; CHECK: movl $1, %eax`
			`%1 = icmp ne i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_ugt(i32 %x) {`
			`; CHECK-LABEL: icmp_ugt`
			`; CHECK-NOT: cmpl`
			`; CHECK: movl $1, %eax`
			`%1 = icmp ugt i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_uge(i32 %x) {`
			`; CHECK-LABEL: icmp_uge`
			`; CHECK-NOT: cmpl`
Reapply [FastISel][X86] Use XOR to materialize the "0" value (r215594). Note: This was originally reverted to track down a buildbot error. Reapply without any modifications. llvm-svn: 216011 2014-08-19 21:44:10 +02:00			`; CHECK: xorl %eax, %eax`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = icmp uge i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_ult(i32 %x) {`
			`; CHECK-LABEL: icmp_ult`
			`; CHECK-NOT: cmpl`
			`; CHECK: movl $1, %eax`
			`%1 = icmp ult i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_ule(i32 %x) {`
			`; CHECK-LABEL: icmp_ule`
			`; CHECK-NOT: cmpl`
Reapply [FastISel][X86] Use XOR to materialize the "0" value (r215594). Note: This was originally reverted to track down a buildbot error. Reapply without any modifications. llvm-svn: 216011 2014-08-19 21:44:10 +02:00			`; CHECK: xorl %eax, %eax`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = icmp ule i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_sgt(i32 %x) {`
			`; CHECK-LABEL: icmp_sgt`
			`; CHECK-NOT: cmpl`
			`; CHECK: movl $1, %eax`
			`%1 = icmp sgt i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_sge(i32 %x) {`
			`; CHECK-LABEL: icmp_sge`
			`; CHECK-NOT: cmpl`
Reapply [FastISel][X86] Use XOR to materialize the "0" value (r215594). Note: This was originally reverted to track down a buildbot error. Reapply without any modifications. llvm-svn: 216011 2014-08-19 21:44:10 +02:00			`; CHECK: xorl %eax, %eax`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = icmp sge i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_slt(i32 %x) {`
			`; CHECK-LABEL: icmp_slt`
			`; CHECK-NOT: cmpl`
			`; CHECK: movl $1, %eax`
			`%1 = icmp slt i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`

			`define i32 @icmp_sle(i32 %x) {`
			`; CHECK-LABEL: icmp_sle`
			`; CHECK-NOT: cmpl`
Reapply [FastISel][X86] Use XOR to materialize the "0" value (r215594). Note: This was originally reverted to track down a buildbot error. Reapply without any modifications. llvm-svn: 216011 2014-08-19 21:44:10 +02:00			`; CHECK: xorl %eax, %eax`
[FastISel][X86] Optimize predicates and fold CMP instructions. This optimizes predicates for certain compares, such as fcmp oeq %x, %x to fcmp ord %x, %x. The latter one is more efficient to generate. The same optimization is applied to conditional branches. llvm-svn: 211126 2014-06-17 23:55:43 +02:00			`%1 = icmp sle i32 %x, %x`
			`br i1 %1, label %bb1, label %bb2`
			`bb2:`
			`ret i32 1`
			`bb1:`
			`ret i32 0`
			`}`