llvm-mirror/test/CodeGen/X86/gather-addresses.ll

; RUN: llc -mtriple=x86_64-linux -mcpu=nehalem < %s | FileCheck %s
; RUN: llc -mtriple=x86_64-win32 -mcpu=nehalem < %s | FileCheck %s
; rdar://7398554

; When doing vector gather-scatter index calculation with 32-bit indices,
; bounce the vector off of cache rather than shuffling each individual
; element out of the index vector.

; CHECK: andps    ([[H:%rdx|%r8]]), %xmm0
; CHECK: movaps   %xmm0, {{(-24)?}}(%rsp)
; CHECK: movslq   {{(-24)?}}(%rsp), %rax
; CHECK: movsd    ([[P:%rdi|%rcx]],%rax,8), %xmm0
; CHECK: movslq   {{-20|4}}(%rsp), %rax
; CHECK: movhpd   ([[P]],%rax,8), %xmm0
; CHECK: movslq   {{-16|8}}(%rsp), %rax
; CHECK: movsd    ([[P]],%rax,8), %xmm1
; CHECK: movslq   {{-12|12}}(%rsp), %rax
; CHECK: movhpd   ([[P]],%rax,8), %xmm1

define <4 x double> @foo(double* %p, <4 x i32>* %i, <4 x i32>* %h) nounwind {
  %a = load <4 x i32>* %i
  %b = load <4 x i32>* %h
  %j = and <4 x i32> %a, %b
  %d0 = extractelement <4 x i32> %j, i32 0
  %d1 = extractelement <4 x i32> %j, i32 1
  %d2 = extractelement <4 x i32> %j, i32 2
  %d3 = extractelement <4 x i32> %j, i32 3
  %q0 = getelementptr double* %p, i32 %d0
  %q1 = getelementptr double* %p, i32 %d1
  %q2 = getelementptr double* %p, i32 %d2
  %q3 = getelementptr double* %p, i32 %d3
  %r0 = load double* %q0
  %r1 = load double* %q1
  %r2 = load double* %q2
  %r3 = load double* %q3
  %v0 = insertelement <4 x double> undef, double %r0, i32 0
  %v1 = insertelement <4 x double> %v0, double %r1, i32 1
  %v2 = insertelement <4 x double> %v1, double %r2, i32 2
  %v3 = insertelement <4 x double> %v2, double %r3, i32 3
  ret <4 x double> %v3
}
Revert "Temporarily enable MI-Sched on X86." This reverts commit 98a9b72e8c56dc13a2617de84503a3d78352789c. llvm-svn: 184823 2013-06-25 04:48:58 +02:00			`; RUN: llc -mtriple=x86_64-linux -mcpu=nehalem < %s \| FileCheck %s`
			`; RUN: llc -mtriple=x86_64-win32 -mcpu=nehalem < %s \| FileCheck %s`
Add an rdar number to this test. llvm-svn: 98654 2010-03-16 20:08:20 +01:00			`; rdar://7398554`
Recognize code for doing vector gather/scatter index calculations with 32-bit indices. Instead of shuffling each element out of the index vector, when all indices are needed, just store the input vector to the stack and load the elements out. llvm-svn: 98588 2010-03-16 00:23:03 +01:00
			`; When doing vector gather-scatter index calculation with 32-bit indices,`
			`; bounce the vector off of cache rather than shuffling each individual`
			`; element out of the index vector.`

Revert "Temporarily enable MI-Sched on X86." This reverts commit 98a9b72e8c56dc13a2617de84503a3d78352789c. llvm-svn: 184823 2013-06-25 04:48:58 +02:00			`; CHECK: andps ([[H:%rdx\|%r8]]), %xmm0`
			`; CHECK: movaps %xmm0, {{(-24)?}}(%rsp)`
			`; CHECK: movslq {{(-24)?}}(%rsp), %rax`
			`; CHECK: movsd ([[P:%rdi\|%rcx]],%rax,8), %xmm0`
			`; CHECK: movslq {{-20\|4}}(%rsp), %rax`
			`; CHECK: movhpd ([[P]],%rax,8), %xmm0`
			`; CHECK: movslq {{-16\|8}}(%rsp), %rax`
			`; CHECK: movsd ([[P]],%rax,8), %xmm1`
			`; CHECK: movslq {{-12\|12}}(%rsp), %rax`
			`; CHECK: movhpd ([[P]],%rax,8), %xmm1`
Recognize code for doing vector gather/scatter index calculations with 32-bit indices. Instead of shuffling each element out of the index vector, when all indices are needed, just store the input vector to the stack and load the elements out. llvm-svn: 98588 2010-03-16 00:23:03 +01:00
			`define <4 x double> @foo(double* %p, <4 x i32>* %i, <4 x i32>* %h) nounwind {`
			`%a = load <4 x i32>* %i`
			`%b = load <4 x i32>* %h`
			`%j = and <4 x i32> %a, %b`
			`%d0 = extractelement <4 x i32> %j, i32 0`
			`%d1 = extractelement <4 x i32> %j, i32 1`
			`%d2 = extractelement <4 x i32> %j, i32 2`
			`%d3 = extractelement <4 x i32> %j, i32 3`
			`%q0 = getelementptr double* %p, i32 %d0`
			`%q1 = getelementptr double* %p, i32 %d1`
			`%q2 = getelementptr double* %p, i32 %d2`
			`%q3 = getelementptr double* %p, i32 %d3`
			`%r0 = load double* %q0`
			`%r1 = load double* %q1`
			`%r2 = load double* %q2`
			`%r3 = load double* %q3`
			`%v0 = insertelement <4 x double> undef, double %r0, i32 0`
			`%v1 = insertelement <4 x double> %v0, double %r1, i32 1`
			`%v2 = insertelement <4 x double> %v1, double %r2, i32 2`
			`%v3 = insertelement <4 x double> %v2, double %r3, i32 3`
			`ret <4 x double> %v3`
			`}`