1
0
mirror of https://github.com/RPCS3/llvm-mirror.git synced 2024-11-22 02:33:06 +01:00

[ARM] Single source vmovnt tests. NFC

This commit is contained in:
David Green 2021-02-11 17:50:11 +00:00
parent 2f91cc65b2
commit 0f9807e238

View File

@ -41,6 +41,48 @@ entry:
ret <8 x i16> %out
}
define arm_aapcs_vfpcc <8 x i16> @vmovn32_trunc3(<4 x i32> %src1) {
; CHECK-LABEL: vmovn32_trunc3:
; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vmov q1, q0
; CHECK-NEXT: vmov r0, s4
; CHECK-NEXT: vmov.16 q0[0], r0
; CHECK-NEXT: vmov.16 q0[1], r0
; CHECK-NEXT: vmov r0, s5
; CHECK-NEXT: vmov.16 q0[2], r0
; CHECK-NEXT: vmov.16 q0[3], r0
; CHECK-NEXT: vmov r0, s6
; CHECK-NEXT: vmov.16 q0[4], r0
; CHECK-NEXT: vmov.16 q0[5], r0
; CHECK-NEXT: vmov r0, s7
; CHECK-NEXT: vmov.16 q0[6], r0
; CHECK-NEXT: vmov.16 q0[7], r0
; CHECK-NEXT: bx lr
;
; CHECKBE-LABEL: vmovn32_trunc3:
; CHECKBE: @ %bb.0: @ %entry
; CHECKBE-NEXT: vrev64.32 q2, q0
; CHECKBE-NEXT: vmov r0, s8
; CHECKBE-NEXT: vmov.16 q1[0], r0
; CHECKBE-NEXT: vmov.16 q1[1], r0
; CHECKBE-NEXT: vmov r0, s9
; CHECKBE-NEXT: vmov.16 q1[2], r0
; CHECKBE-NEXT: vmov.16 q1[3], r0
; CHECKBE-NEXT: vmov r0, s10
; CHECKBE-NEXT: vmov.16 q1[4], r0
; CHECKBE-NEXT: vmov.16 q1[5], r0
; CHECKBE-NEXT: vmov r0, s11
; CHECKBE-NEXT: vmov.16 q1[6], r0
; CHECKBE-NEXT: vmov.16 q1[7], r0
; CHECKBE-NEXT: vrev64.16 q0, q1
; CHECKBE-NEXT: bx lr
entry:
%strided.vec = shufflevector <4 x i32> %src1, <4 x i32> undef, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
%out = trunc <8 x i32> %strided.vec to <8 x i16>
ret <8 x i16> %out
}
define arm_aapcs_vfpcc <16 x i8> @vmovn16_trunc1(<8 x i16> %src1, <8 x i16> %src2) {
; CHECK-LABEL: vmovn16_trunc1:
; CHECK: @ %bb.0: @ %entry
@ -80,6 +122,72 @@ entry:
ret <16 x i8> %out
}
define arm_aapcs_vfpcc <16 x i8> @vmovn16_trunc3(<8 x i16> %src1) {
; CHECK-LABEL: vmovn16_trunc3:
; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vmov.u16 r0, q0[0]
; CHECK-NEXT: vmov q1, q0
; CHECK-NEXT: vmov.8 q0[0], r0
; CHECK-NEXT: vmov.8 q0[1], r0
; CHECK-NEXT: vmov.u16 r0, q1[1]
; CHECK-NEXT: vmov.8 q0[2], r0
; CHECK-NEXT: vmov.8 q0[3], r0
; CHECK-NEXT: vmov.u16 r0, q1[2]
; CHECK-NEXT: vmov.8 q0[4], r0
; CHECK-NEXT: vmov.8 q0[5], r0
; CHECK-NEXT: vmov.u16 r0, q1[3]
; CHECK-NEXT: vmov.8 q0[6], r0
; CHECK-NEXT: vmov.8 q0[7], r0
; CHECK-NEXT: vmov.u16 r0, q1[4]
; CHECK-NEXT: vmov.8 q0[8], r0
; CHECK-NEXT: vmov.8 q0[9], r0
; CHECK-NEXT: vmov.u16 r0, q1[5]
; CHECK-NEXT: vmov.8 q0[10], r0
; CHECK-NEXT: vmov.8 q0[11], r0
; CHECK-NEXT: vmov.u16 r0, q1[6]
; CHECK-NEXT: vmov.8 q0[12], r0
; CHECK-NEXT: vmov.8 q0[13], r0
; CHECK-NEXT: vmov.u16 r0, q1[7]
; CHECK-NEXT: vmov.8 q0[14], r0
; CHECK-NEXT: vmov.8 q0[15], r0
; CHECK-NEXT: bx lr
;
; CHECKBE-LABEL: vmovn16_trunc3:
; CHECKBE: @ %bb.0: @ %entry
; CHECKBE-NEXT: vrev64.16 q2, q0
; CHECKBE-NEXT: vmov.u16 r0, q2[0]
; CHECKBE-NEXT: vmov.8 q1[0], r0
; CHECKBE-NEXT: vmov.8 q1[1], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[1]
; CHECKBE-NEXT: vmov.8 q1[2], r0
; CHECKBE-NEXT: vmov.8 q1[3], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[2]
; CHECKBE-NEXT: vmov.8 q1[4], r0
; CHECKBE-NEXT: vmov.8 q1[5], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[3]
; CHECKBE-NEXT: vmov.8 q1[6], r0
; CHECKBE-NEXT: vmov.8 q1[7], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[4]
; CHECKBE-NEXT: vmov.8 q1[8], r0
; CHECKBE-NEXT: vmov.8 q1[9], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[5]
; CHECKBE-NEXT: vmov.8 q1[10], r0
; CHECKBE-NEXT: vmov.8 q1[11], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[6]
; CHECKBE-NEXT: vmov.8 q1[12], r0
; CHECKBE-NEXT: vmov.8 q1[13], r0
; CHECKBE-NEXT: vmov.u16 r0, q2[7]
; CHECKBE-NEXT: vmov.8 q1[14], r0
; CHECKBE-NEXT: vmov.8 q1[15], r0
; CHECKBE-NEXT: vrev64.8 q0, q1
; CHECKBE-NEXT: bx lr
entry:
%strided.vec = shufflevector <8 x i16> %src1, <8 x i16> undef, <16 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3, i32 4, i32 4, i32 5, i32 5, i32 6, i32 6, i32 7, i32 7>
%out = trunc <16 x i16> %strided.vec to <16 x i8>
ret <16 x i8> %out
}
define arm_aapcs_vfpcc <2 x i64> @vmovn64_t1(<2 x i64> %src1, <2 x i64> %src2) {
; CHECK-LABEL: vmovn64_t1:
@ -331,6 +439,25 @@ entry:
ret <4 x i32> %out
}
define arm_aapcs_vfpcc <4 x i32> @vmovn32_single_t(<4 x i32> %src1) {
; CHECK-LABEL: vmovn32_single_t:
; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vmov.f32 s1, s0
; CHECK-NEXT: vmov.f32 s3, s2
; CHECK-NEXT: bx lr
;
; CHECKBE-LABEL: vmovn32_single_t:
; CHECKBE: @ %bb.0: @ %entry
; CHECKBE-NEXT: vrev64.32 q1, q0
; CHECKBE-NEXT: vmov.f32 s5, s4
; CHECKBE-NEXT: vmov.f32 s7, s6
; CHECKBE-NEXT: vrev64.32 q0, q1
; CHECKBE-NEXT: bx lr
entry:
%out = shufflevector <4 x i32> %src1, <4 x i32> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 2>
ret <4 x i32> %out
}
@ -474,6 +601,29 @@ entry:
ret <8 x i16> %out
}
define arm_aapcs_vfpcc <8 x i16> @vmovn16_single_t(<8 x i16> %src1) {
; CHECK-LABEL: vmovn16_single_t:
; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vins.f16 s0, s0
; CHECK-NEXT: vins.f16 s1, s1
; CHECK-NEXT: vins.f16 s2, s2
; CHECK-NEXT: vins.f16 s3, s3
; CHECK-NEXT: bx lr
;
; CHECKBE-LABEL: vmovn16_single_t:
; CHECKBE: @ %bb.0: @ %entry
; CHECKBE-NEXT: vrev64.16 q1, q0
; CHECKBE-NEXT: vins.f16 s5, s5
; CHECKBE-NEXT: vins.f16 s4, s4
; CHECKBE-NEXT: vins.f16 s6, s6
; CHECKBE-NEXT: vins.f16 s7, s7
; CHECKBE-NEXT: vrev64.16 q0, q1
; CHECKBE-NEXT: bx lr
entry:
%out = shufflevector <8 x i16> %src1, <8 x i16> undef, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
ret <8 x i16> %out
}
define arm_aapcs_vfpcc <16 x i8> @vmovn8_b1(<16 x i8> %src1, <16 x i8> %src2) {
; CHECK-LABEL: vmovn8_b1:
@ -710,3 +860,67 @@ entry:
%out = shufflevector <16 x i8> %src1, <16 x i8> %src2, <16 x i32> <i32 16, i32 1, i32 18, i32 3, i32 20, i32 5, i32 22, i32 7, i32 24, i32 9, i32 26, i32 11, i32 28, i32 13, i32 30, i32 15>
ret <16 x i8> %out
}
define arm_aapcs_vfpcc <16 x i8> @vmovn8_single_t(<16 x i8> %src1) {
; CHECK-LABEL: vmovn8_single_t:
; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vmov.u8 r0, q0[0]
; CHECK-NEXT: vmov q1, q0
; CHECK-NEXT: vmov.8 q0[0], r0
; CHECK-NEXT: vmov.8 q0[1], r0
; CHECK-NEXT: vmov.u8 r0, q1[2]
; CHECK-NEXT: vmov.8 q0[2], r0
; CHECK-NEXT: vmov.8 q0[3], r0
; CHECK-NEXT: vmov.u8 r0, q1[4]
; CHECK-NEXT: vmov.8 q0[4], r0
; CHECK-NEXT: vmov.8 q0[5], r0
; CHECK-NEXT: vmov.u8 r0, q1[6]
; CHECK-NEXT: vmov.8 q0[6], r0
; CHECK-NEXT: vmov.8 q0[7], r0
; CHECK-NEXT: vmov.u8 r0, q1[8]
; CHECK-NEXT: vmov.8 q0[8], r0
; CHECK-NEXT: vmov.8 q0[9], r0
; CHECK-NEXT: vmov.u8 r0, q1[10]
; CHECK-NEXT: vmov.8 q0[10], r0
; CHECK-NEXT: vmov.8 q0[11], r0
; CHECK-NEXT: vmov.u8 r0, q1[12]
; CHECK-NEXT: vmov.8 q0[12], r0
; CHECK-NEXT: vmov.8 q0[13], r0
; CHECK-NEXT: vmov.u8 r0, q1[14]
; CHECK-NEXT: vmov.8 q0[14], r0
; CHECK-NEXT: vmov.8 q0[15], r0
; CHECK-NEXT: bx lr
;
; CHECKBE-LABEL: vmovn8_single_t:
; CHECKBE: @ %bb.0: @ %entry
; CHECKBE-NEXT: vrev64.8 q2, q0
; CHECKBE-NEXT: vmov.u8 r0, q2[0]
; CHECKBE-NEXT: vmov.8 q1[0], r0
; CHECKBE-NEXT: vmov.8 q1[1], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[2]
; CHECKBE-NEXT: vmov.8 q1[2], r0
; CHECKBE-NEXT: vmov.8 q1[3], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[4]
; CHECKBE-NEXT: vmov.8 q1[4], r0
; CHECKBE-NEXT: vmov.8 q1[5], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[6]
; CHECKBE-NEXT: vmov.8 q1[6], r0
; CHECKBE-NEXT: vmov.8 q1[7], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[8]
; CHECKBE-NEXT: vmov.8 q1[8], r0
; CHECKBE-NEXT: vmov.8 q1[9], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[10]
; CHECKBE-NEXT: vmov.8 q1[10], r0
; CHECKBE-NEXT: vmov.8 q1[11], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[12]
; CHECKBE-NEXT: vmov.8 q1[12], r0
; CHECKBE-NEXT: vmov.8 q1[13], r0
; CHECKBE-NEXT: vmov.u8 r0, q2[14]
; CHECKBE-NEXT: vmov.8 q1[14], r0
; CHECKBE-NEXT: vmov.8 q1[15], r0
; CHECKBE-NEXT: vrev64.8 q0, q1
; CHECKBE-NEXT: bx lr
entry:
%out = shufflevector <16 x i8> %src1, <16 x i8> undef, <16 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6, i32 8, i32 8, i32 10, i32 10, i32 12, i32 12, i32 14, i32 14>
ret <16 x i8> %out
}