1
0
mirror of https://github.com/RPCS3/llvm-mirror.git synced 2024-10-22 04:22:57 +02:00

[Hexagon] Add patterns for vector shift-and-accumulate

llvm-svn: 331918
This commit is contained in:
Krzysztof Parzyszek 2018-05-09 21:10:41 +00:00
parent c923946f57
commit fa4a514b8e
3 changed files with 70 additions and 432 deletions

View File

@ -348,6 +348,11 @@ let Predicates = [UseHVX] in {
def: Pat<(HexagonVLSR HVI16:$Vs, I32:$Rt), (V6_vlsrh HvxVR:$Vs, I32:$Rt)>;
def: Pat<(HexagonVLSR HVI32:$Vs, I32:$Rt), (V6_vlsrw HvxVR:$Vs, I32:$Rt)>;
def: Pat<(add HVI32:$Vx, (HexagonVASL HVI32:$Vu, I32:$Rt)),
(V6_vaslw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>;
def: Pat<(add HVI32:$Vx, (HexagonVASR HVI32:$Vu, I32:$Rt)),
(V6_vasrw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>;
def: Pat<(shl HVI16:$Vs, HVI16:$Vt), (V6_vaslhv HvxVR:$Vs, HvxVR:$Vt)>;
def: Pat<(shl HVI32:$Vs, HVI32:$Vt), (V6_vaslwv HvxVR:$Vs, HvxVR:$Vt)>;
def: Pat<(sra HVI16:$Vs, HVI16:$Vt), (V6_vasrhv HvxVR:$Vs, HvxVR:$Vt)>;

View File

@ -4,70 +4,8 @@
; CHECK: v0.h = vasl(v0.h,r0)
define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
%b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
%b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
%b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
%b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
%b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
%b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
%b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
%b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
%b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
%b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
%b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
%b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
%b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
%b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
%b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
%b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
%b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
%b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
%b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
%b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
%b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
%b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
%b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
%b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
%b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
%b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
%b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
%b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
%b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
%b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
%b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
%b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
%v0 = shl <64 x i16> %a0, %b63
%b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
%v0 = shl <64 x i16> %a0, %b1
ret <64 x i16> %v0
}
@ -75,70 +13,8 @@ define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.h = vasr(v0.h,r0)
define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
%b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
%b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
%b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
%b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
%b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
%b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
%b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
%b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
%b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
%b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
%b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
%b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
%b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
%b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
%b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
%b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
%b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
%b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
%b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
%b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
%b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
%b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
%b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
%b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
%b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
%b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
%b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
%b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
%b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
%b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
%b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
%b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
%v0 = ashr <64 x i16> %a0, %b63
%b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
%v0 = ashr <64 x i16> %a0, %b1
ret <64 x i16> %v0
}
@ -146,70 +22,8 @@ define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.uh = vlsr(v0.uh,r0)
define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
%b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
%b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
%b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
%b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
%b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
%b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
%b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
%b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
%b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
%b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
%b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
%b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
%b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
%b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
%b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
%b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
%b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
%b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
%b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
%b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
%b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
%b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
%b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
%b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
%b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
%b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
%b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
%b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
%b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
%b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
%b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
%b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
%v0 = lshr <64 x i16> %a0, %b63
%b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
%v0 = lshr <64 x i16> %a0, %b1
ret <64 x i16> %v0
}
@ -217,38 +31,8 @@ define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.w = vasl(v0.w,r0)
define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
%b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
%b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
%b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
%b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
%b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
%b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
%b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
%b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
%b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
%b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
%b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
%b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
%b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
%b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
%b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
%b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
%v0 = shl <32 x i32> %a0, %b31
%b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
%v0 = shl <32 x i32> %a0, %b1
ret <32 x i32> %v0
}
@ -256,38 +40,8 @@ define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 {
; CHECK: v0.w = vasr(v0.w,r0)
define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
%b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
%b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
%b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
%b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
%b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
%b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
%b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
%b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
%b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
%b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
%b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
%b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
%b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
%b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
%b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
%b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
%v0 = ashr <32 x i32> %a0, %b31
%b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
%v0 = ashr <32 x i32> %a0, %b1
ret <32 x i32> %v0
}
@ -295,41 +49,31 @@ define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 {
; CHECK: v0.uw = vlsr(v0.uw,r0)
define <32 x i32> @test0012(<32 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
%b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
%b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
%b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
%b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
%b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
%b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
%b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
%b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
%b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
%b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
%b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
%b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
%b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
%b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
%b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
%b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
%v0 = lshr <32 x i32> %a0, %b31
%b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
%v0 = lshr <32 x i32> %a0, %b1
ret <32 x i32> %v0
}
; CHECK-LABEL: test0013:
; CHECK: v0.w += vasl(v1.w,r0)
define <32 x i32> @test0013(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 {
%b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0
%b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
%v0 = shl <32 x i32> %a1, %b1
%v1 = add <32 x i32> %a0, %v0
ret <32 x i32> %v1
}
; CHECK-LABEL: test0014:
; CHECK: v0.w += vasr(v1.w,r0)
define <32 x i32> @test0014(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 {
%b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0
%b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
%v0 = ashr <32 x i32> %a1, %b1
%v1 = add <32 x i32> %a0, %v0
ret <32 x i32> %v1
}
; CHECK-LABEL: test0020:
; CHECK: v0.h = vasl(v0.h,v1.h)
define <64 x i16> @test0020(<64 x i16> %a0, <64 x i16> %a1) #0 {

View File

@ -4,38 +4,9 @@
; CHECK: v0.h = vasl(v0.h,r0)
define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
%v0 = shl <32 x i16> %a0, %b31
%b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
%v0 = shl <32 x i16> %a0, %b1
ret <32 x i16> %v0
}
@ -43,38 +14,8 @@ define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.h = vasr(v0.h,r0)
define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
%v0 = ashr <32 x i16> %a0, %b31
%b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
%v0 = ashr <32 x i16> %a0, %b1
ret <32 x i16> %v0
}
@ -82,38 +23,8 @@ define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.uh = vlsr(v0.uh,r0)
define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 {
%b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
%b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
%b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
%b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
%b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
%b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
%b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
%b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
%b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
%b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
%b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
%b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
%b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
%b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
%b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
%b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
%b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
%b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
%b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
%b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
%b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
%b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
%b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
%b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
%b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
%b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
%b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
%b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
%b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
%b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
%b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
%b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
%v0 = lshr <32 x i16> %a0, %b31
%b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
%v0 = lshr <32 x i16> %a0, %b1
ret <32 x i16> %v0
}
@ -121,22 +32,8 @@ define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 {
; CHECK: v0.w = vasl(v0.w,r0)
define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
%v0 = shl <16 x i32> %a0, %b15
%b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
%v0 = shl <16 x i32> %a0, %b1
ret <16 x i32> %v0
}
@ -144,22 +41,8 @@ define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 {
; CHECK: v0.w = vasr(v0.w,r0)
define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
%v0 = ashr <16 x i32> %a0, %b15
%b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
%v0 = ashr <16 x i32> %a0, %b1
ret <16 x i32> %v0
}
@ -167,25 +50,31 @@ define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 {
; CHECK: v0.uw = vlsr(v0.uw,r0)
define <16 x i32> @test0012(<16 x i32> %a0, i32 %a1) #0 {
%b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
%b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
%b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
%b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
%b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
%b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
%b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
%b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
%b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
%b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
%b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
%b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
%b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
%b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
%b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
%b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
%v0 = lshr <16 x i32> %a0, %b15
%b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
%v0 = lshr <16 x i32> %a0, %b1
ret <16 x i32> %v0
}
; CHECK-LABEL: test0013:
; CHECK: v0.w += vasl(v1.w,r0)
define <16 x i32> @test0013(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 {
%b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0
%b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
%v0 = shl <16 x i32> %a1, %b1
%v1 = add <16 x i32> %a0, %v0
ret <16 x i32> %v1
}
; CHECK-LABEL: test0014:
; CHECK: v0.w += vasr(v1.w,r0)
define <16 x i32> @test0014(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 {
%b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0
%b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
%v0 = ashr <16 x i32> %a1, %b1
%v1 = add <16 x i32> %a0, %v0
ret <16 x i32> %v1
}
; CHECK-LABEL: test0020:
; CHECK: v0.h = vasl(v0.h,v1.h)
define <32 x i16> @test0020(<32 x i16> %a0, <32 x i16> %a1) #0 {