x86_64-xop-encoding.s 22.7 KB
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648
// RUN: llvm-mc -triple x86_64-unknown-unknown --show-encoding %s | FileCheck %s

//////////////////////////
// 2 operand instructions
/////////////////////////
        
// vphsubwd
// CHECK: vphsubwd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe2,0x0c,0x01]
          vphsubwd (%rcx,%rax), %xmm1
// CHECK: vphsubwd %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe2,0xc8]
          vphsubwd %xmm0, %xmm1

// vphsubdq
// CHECK: vphsubdq (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe3,0x0c,0x01] 
          vphsubdq (%rcx,%rax), %xmm1
// CHECK: vphsubdq %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe3,0xc8]
          vphsubdq %xmm0, %xmm1

// vphsubbw
// CHECK: vphsubbw (%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe1,0x08]
          vphsubbw (%rax), %xmm1
// CHECK: vphsubbw %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe1,0xca]
          vphsubbw %xmm2, %xmm1

// vphaddwq
// CHECK: vphaddwq (%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xc7,0x21]
          vphaddwq (%rcx), %xmm4
// CHECK: vphaddwq %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xc7,0xd6]
          vphaddwq %xmm6, %xmm2

// vphaddwd
// CHECK: vphaddwd (%rdx,%rax), %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0xc6,0x3c,0x02]
          vphaddwd (%rdx,%rax), %xmm7
// CHECK: vphaddwd %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xc6,0xe3]
          vphaddwd %xmm3, %xmm4

// vphadduwq
// CHECK: vphadduwq (%rcx,%rax), %xmm6
// CHECK: encoding: [0x8f,0xe9,0x78,0xd7,0x34,0x01]
          vphadduwq (%rcx,%rax), %xmm6
// CHECK: vphadduwq %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xd7,0xc7]
          vphadduwq %xmm7, %xmm0

// vphadduwd
// CHECK: vphadduwd (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xd6,0x28]
          vphadduwd (%rax), %xmm5
// CHECK: vphadduwd %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xd6,0xca]
          vphadduwd %xmm2, %xmm1

// vphaddudq
// CHECK: vphaddudq 8(%rcx,%rax), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xdb,0x64,0x01,0x08]
          vphaddudq 8(%rcx,%rax), %xmm4
// CHECK: vphaddudq %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xdb,0xd6]
          vphaddudq %xmm6, %xmm2

// vphaddubw
// CHECK: vphaddubw (%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0xd1,0x19]
          vphaddubw (%rcx), %xmm3
// CHECK: vphaddubw %xmm5, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xd1,0xc5]
          vphaddubw %xmm5, %xmm0

// vphaddubq
// CHECK: vphaddubq (%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xd3,0x21]
          vphaddubq (%rcx), %xmm4
// CHECK: vphaddubq %xmm2, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xd3,0xd2]
          vphaddubq %xmm2, %xmm2

// vphaddubd
// CHECK: vphaddubd (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xd2,0x28]
          vphaddubd (%rax), %xmm5
// CHECK: vphaddubd %xmm5, %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0xd2,0xfd]
          vphaddubd %xmm5, %xmm7

// vphadddq
// CHECK: vphadddq (%rdx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xcb,0x22]
          vphadddq (%rdx), %xmm4
// CHECK: vphadddq %xmm4, %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xcb,0xec]
          vphadddq %xmm4, %xmm5

// vphaddbw
// CHECK: vphaddbw (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc1,0x0c,0x01]
          vphaddbw (%rcx,%rax), %xmm1
// CHECK: vphaddbw %xmm5, %xmm6
// CHECK: encoding: [0x8f,0xe9,0x78,0xc1,0xf5]
          vphaddbw %xmm5, %xmm6

// vphaddbq
// CHECK: vphaddbq (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc3,0x0c,0x01]
          vphaddbq (%rcx,%rax), %xmm1
// CHECK: vphaddbq %xmm2, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xc3,0xc2]
          vphaddbq %xmm2, %xmm0

// vphaddbd
// CHECK: vphaddbd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc2,0x0c,0x01]
          vphaddbd (%rcx,%rax), %xmm1
// CHECK: vphaddbd %xmm1, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0xc2,0xd9]
          vphaddbd %xmm1, %xmm3

// vfrczss
// CHECK: vfrczss (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x82,0x0c,0x01]
          vfrczss (%rcx,%rax), %xmm1
// CHECK: vfrczss %xmm5, %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0x82,0xfd]
          vfrczss %xmm5, %xmm7

// vfrczsd
// CHECK: vfrczsd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x83,0x0c,0x01]
          vfrczsd (%rcx,%rax), %xmm1
// CHECK: vfrczsd %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0x83,0xc7]
          vfrczsd %xmm7, %xmm0

// vfrczps
// CHECK: vfrczps 4(%rax), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0x58,0x04]
          vfrczps 4(%rax), %xmm3
// CHECK: vfrczps %xmm6, %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0xee]
          vfrczps %xmm6, %xmm5
// CHECK: vfrczps (%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0x09]
          vfrczps (%rcx), %xmm1
// CHECK: vfrczps %ymm2, %ymm4
// CHECK: encoding: [0x8f,0xe9,0x7c,0x80,0xe2]
          vfrczps %ymm2, %ymm4

// vfrczpd
// CHECK: vfrczpd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x81,0x0c,0x01]
          vfrczpd (%rcx,%rax), %xmm1
// CHECK: vfrczpd %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0x81,0xc7]
          vfrczpd %xmm7, %xmm0
// CHECK: vfrczpd (%rcx,%rax), %ymm2
// CHECK: encoding: [0x8f,0xe9,0x7c,0x81,0x14,0x01]
          vfrczpd (%rcx,%rax), %ymm2
// CHECK: vfrczpd %ymm5, %ymm3
// CHECK: encoding: [0x8f,0xe9,0x7c,0x81,0xdd]
          vfrczpd %ymm5, %ymm3


        
//////////////////////////
// 3 operand instructions
/////////////////////////
        
// vpshlw
// CHECK: vpshlw %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x95,0xd1]
          vpshlw %xmm0, %xmm1, %xmm2
// CHECK: vpshlw (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x95,0x10]
          vpshlw (%rax), %xmm1, %xmm2
// CHECK: vpshlw %xmm0, (%rax,%rcx), %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x95,0x14,0x08]
          vpshlw %xmm0, (%rax,%rcx), %xmm2

// vpshlq
// CHECK: vpshlq %xmm2, %xmm4, %xmm6
// CHECK: encoding: [0x8f,0xe9,0x68,0x97,0xf4]
          vpshlq %xmm2, %xmm4, %xmm6
// CHECK: vpshlq (%rcx), %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0xe8,0x97,0x09]
          vpshlq (%rcx), %xmm2, %xmm1
// CHECK: vpshlq %xmm5, (%rdx,%rcx), %xmm6
// CHECK: encoding: [0x8f,0xe9,0x50,0x97,0x34,0x0a]
          vpshlq %xmm5, (%rdx,%rcx), %xmm6

// vpshld
// CHECK: vpshld %xmm7, %xmm5, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x40,0x96,0xdd]
          vpshld %xmm7, %xmm5, %xmm3
// CHECK: vpshld 4(%rax), %xmm3, %xmm3
// CHECK: encoding: [0x8f,0xe9,0xe0,0x96,0x58,0x04]
          vpshld 4(%rax), %xmm3, %xmm3
// CHECK: vpshld %xmm1, (%rax,%rcx), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x70,0x96,0x2c,0x08]
          vpshld %xmm1, (%rax,%rcx), %xmm5

// vpshlb
// CHECK: vpshlb %xmm1, %xmm2, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x70,0x94,0xda]
          vpshlb %xmm1, %xmm2, %xmm3
// CHECK: vpshlb (%rcx), %xmm0, %xmm7
// CHECK: encoding: [0x8f,0xe9,0xf8,0x94,0x39]
          vpshlb (%rcx), %xmm0, %xmm7
// CHECK: vpshlb %xmm2, (%rax,%rdx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x68,0x94,0x1c,0x10]
          vpshlb %xmm2, (%rax,%rdx), %xmm3

// vpshaw
// CHECK: vpshaw %xmm7, %xmm5, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x40,0x99,0xdd]
          vpshaw %xmm7, %xmm5, %xmm3
// CHECK: vpshaw (%rax), %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0xe8,0x99,0x08]
          vpshaw (%rax), %xmm2, %xmm1
// CHECK: vpshaw %xmm0, 8(%rax,%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0x99,0x5c,0x08,0x08]
          vpshaw %xmm0, 8(%rax,%rcx), %xmm3

// vpshaq
// CHECK: vpshaq %xmm4, %xmm4, %xmm4
// CHECK: encoding: [0x8f,0xe9,0x58,0x9b,0xe4]
          vpshaq %xmm4, %xmm4, %xmm4
// CHECK: vpshaq (%rcx), %xmm2, %xmm0
// CHECK: encoding: [0x8f,0xe9,0xe8,0x9b,0x01]
          vpshaq (%rcx), %xmm2, %xmm0
// CHECK: vpshaq %xmm6, (%rax,%rcx), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x48,0x9b,0x2c,0x08]
          vpshaq %xmm6, (%rax,%rcx), %xmm5

// vpshad
// CHECK: vpshad %xmm5, %xmm4, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x50,0x9a,0xc4]
          vpshad %xmm5, %xmm4, %xmm0
// CHECK: vpshad (%rax), %xmm2, %xmm5
// CHECK: encoding: [0x8f,0xe9,0xe8,0x9a,0x28]
          vpshad (%rax), %xmm2, %xmm5
// CHECK: vpshad %xmm2, (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x68,0x9a,0x28]
          vpshad %xmm2, (%rax), %xmm5

// vpshab
// CHECK: vpshab %xmm1, %xmm1, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x70,0x98,0xc1]
          vpshab %xmm1, %xmm1, %xmm0
// CHECK: vpshab (%rcx), %xmm4, %xmm0
// CHECK: encoding: [0x8f,0xe9,0xd8,0x98,0x01]
          vpshab (%rcx), %xmm4, %xmm0
// CHECK: vpshab %xmm5, (%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x50,0x98,0x19]
          vpshab %xmm5, (%rcx), %xmm3

// vprotw
// CHECK: vprotw (%rax), %xmm3, %xmm6
// CHECK: encoding: [0x8f,0xe9,0xe0,0x91,0x30]
          vprotw (%rax), %xmm3, %xmm6
// CHECK: vprotw %xmm5, (%rax,%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x50,0x91,0x0c,0x08]
          vprotw %xmm5, (%rax,%rcx), %xmm1
// CHECK: vprotw %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x91,0xd1]
          vprotw %xmm0, %xmm1, %xmm2
// CHECK: vprotw $42, (%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0x09,0x2a]
          vprotw $42, (%rcx), %xmm1
// CHECK: vprotw $41, (%rax), %xmm4
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0x20,0x29]
          vprotw $41, (%rax), %xmm4
// CHECK: vprotw $40, %xmm1, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0xd9,0x28]
          vprotw $40, %xmm1, %xmm3

// vprotq
// CHECK: vprotq (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x93,0x10]
          vprotq (%rax), %xmm1, %xmm2
// CHECK: vprotq (%rax,%rcx), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x93,0x14,0x08]
          vprotq (%rax,%rcx), %xmm1, %xmm2
// CHECK: vprotq %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x93,0xd1]
          vprotq %xmm0, %xmm1, %xmm2
// CHECK: vprotq $42, (%rax), %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0x10,0x2a]
          vprotq $42, (%rax), %xmm2
// CHECK: vprotq $42, (%rax,%rcx), %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0x14,0x08,0x2a]
          vprotq $42, (%rax,%rcx), %xmm2
// CHECK: vprotq $42, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0xd1,0x2a]
          vprotq $42, %xmm1, %xmm2

// vprotd
// CHECK: vprotd (%rax), %xmm0, %xmm3
// CHECK: encoding: [0x8f,0xe9,0xf8,0x92,0x18]
          vprotd (%rax), %xmm0, %xmm3
// CHECK: vprotd %xmm2, (%rax,%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x68,0x92,0x24,0x08]
          vprotd %xmm2, (%rax,%rcx), %xmm4
// CHECK: vprotd %xmm5, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x50,0x92,0xd3]
          vprotd %xmm5, %xmm3, %xmm2
// CHECK: vprotd $43, (%rcx), %xmm6
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0x31,0x2b]
          vprotd $43, (%rcx), %xmm6
// CHECK: vprotd $44, (%rax,%rcx), %xmm7
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0x3c,0x08,0x2c]
          vprotd $44, (%rax,%rcx), %xmm7
// CHECK: vprotd $45, %xmm4, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0xe4,0x2d]
          vprotd $45, %xmm4, %xmm4

// vprotb
// CHECK: vprotb (%rcx), %xmm2, %xmm5
// CHECK: encoding: [0x8f,0xe9,0xe8,0x90,0x29]
          vprotb (%rcx), %xmm2, %xmm5
// CHECK: vprotb %xmm5, (%rax,%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x50,0x90,0x24,0x08]
          vprotb %xmm5, (%rax,%rcx), %xmm4
// CHECK: vprotb %xmm4, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x58,0x90,0xd3]
          vprotb %xmm4, %xmm3, %xmm2
// CHECK: vprotb $46, (%rax), %xmm3
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0x18,0x2e]
          vprotb $46, (%rax), %xmm3
// CHECK: vprotb $47, (%rax,%rcx), %xmm7
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0x3c,0x08,0x2f]
          vprotb $47, (%rax,%rcx), %xmm7
// CHECK: vprotb $48, %xmm5, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0xed,0x30]
          vprotb $48, %xmm5, %xmm5

//////////////////////////
// 4 operand instructions
/////////////////////////

// vpmadcswd
// CHECK: vpmadcswd %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xb6,0xe2,0x10]
        vpmadcswd %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpmadcswd %xmm1, (%rax), %xmm3, %xmm4		
// CHECK: encoding: [0x8f,0xe8,0x60,0xb6,0x20,0x10]
        vpmadcswd %xmm1, (%rax), %xmm3, %xmm4		

// vpmadcsswd
// CHECK: vpmadcsswd %xmm1, %xmm4, %xmm6, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x48,0xa6,0xe4,0x10]
          vpmadcsswd %xmm1, %xmm4, %xmm6, %xmm4
// CHECK: vpmadcsswd %xmm1, (%rax,%rcx), %xmm3, %xmm4		
// CHECK: encoding: [0x8f,0xe8,0x60,0xa6,0x24,0x08,0x10]
          vpmadcsswd %xmm1, (%rax,%rcx), %xmm3, %xmm4		

// vpmacsww
// CHECK: vpmacsww %xmm0, %xmm2, %xmm5, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x50,0x95,0xe2,0x00]
          vpmacsww %xmm0, %xmm2, %xmm5, %xmm4
// CHECK: vpmacsww %xmm1, (%rax), %xmm6, %xmm4		
// CHECK: encoding: [0x8f,0xe8,0x48,0x95,0x20,0x10]
          vpmacsww %xmm1, (%rax), %xmm6, %xmm4		

// vpmacswd
// CHECK: vpmacswd %xmm4, %xmm5, %xmm6, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x48,0x96,0xfd,0x40]
          vpmacswd %xmm4, %xmm5, %xmm6, %xmm7
// CHECK: vpmacswd %xmm0, (%rax), %xmm1, %xmm2		
// CHECK: encoding: [0x8f,0xe8,0x70,0x96,0x10,0x00]
          vpmacswd %xmm0, (%rax), %xmm1, %xmm2		

// vpmacssww
// CHECK: vpmacssww %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x68,0x85,0xcb,0x40]
          vpmacssww %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: vpmacssww %xmm6, (%rcx), %xmm7, %xmm7		
// CHECK: encoding: [0x8f,0xe8,0x40,0x85,0x39,0x60]
          vpmacssww %xmm6, (%rcx), %xmm7, %xmm7		

// vpmacsswd
// CHECK: vpmacsswd %xmm4, %xmm2, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0x86,0xd2,0x40]
          vpmacsswd %xmm4, %xmm2, %xmm4, %xmm2
// CHECK: vpmacsswd %xmm0, 8(%rax,%rcx), %xmm1, %xmm0		
// CHECK: encoding: [0x8f,0xe8,0x70,0x86,0x44,0x08,0x08,0x00]
          vpmacsswd %xmm0, 8(%rax,%rcx), %xmm1, %xmm0		

// vpmacssdql
// CHECK: vpmacssdql %xmm1, %xmm1, %xmm2, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x68,0x87,0xe1,0x10]
          vpmacssdql %xmm1, %xmm1, %xmm2, %xmm4
// CHECK: vpmacssdql %xmm7, (%rcx), %xmm6, %xmm5		
// CHECK: encoding: [0x8f,0xe8,0x48,0x87,0x29,0x70]
          vpmacssdql %xmm7, (%rcx), %xmm6, %xmm5		

// vpmacssdqh
// CHECK: vpmacssdqh %xmm3, %xmm2, %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x78,0x8f,0xca,0x30]
          vpmacssdqh %xmm3, %xmm2, %xmm0, %xmm1
// CHECK: vpmacssdqh %xmm7, (%rax,%rcx), %xmm2, %xmm3		
// CHECK: encoding: [0x8f,0xe8,0x68,0x8f,0x1c,0x08,0x70]
          vpmacssdqh %xmm7, (%rax,%rcx), %xmm2, %xmm3		

// vpmacssdd
// CHECK: vpmacssdd %xmm2, %xmm2, %xmm3, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x60,0x8e,0xea,0x20]
          vpmacssdd %xmm2, %xmm2, %xmm3, %xmm5
// CHECK: vpmacssdd %xmm4, (%rax), %xmm1, %xmm2		
// CHECK: encoding: [0x8f,0xe8,0x70,0x8e,0x10,0x40]
          vpmacssdd %xmm4, (%rax), %xmm1, %xmm2		

// vpmacsdql
// CHECK: vpmacsdql %xmm3, %xmm0, %xmm6, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x48,0x97,0xf8,0x30]
          vpmacsdql %xmm3, %xmm0, %xmm6, %xmm7
// CHECK: vpmacsdql %xmm5, 8(%rcx), %xmm3, %xmm5		
// CHECK: encoding: [0x8f,0xe8,0x60,0x97,0x69,0x08,0x50]
          vpmacsdql %xmm5, 8(%rcx), %xmm3, %xmm5		

// vpmacsdqh
// CHECK: vpmacsdqh %xmm7, %xmm5, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x60,0x9f,0xd5,0x70]
          vpmacsdqh %xmm7, %xmm5, %xmm3, %xmm2
// CHECK: vpmacsdqh %xmm5, 4(%rax), %xmm2, %xmm0		
// CHECK: encoding: [0x8f,0xe8,0x68,0x9f,0x40,0x04,0x50]
          vpmacsdqh %xmm5, 4(%rax), %xmm2, %xmm0		

// vpmacsdd
// CHECK: vpmacsdd %xmm4, %xmm6, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0x9e,0xd6,0x40]
          vpmacsdd %xmm4, %xmm6, %xmm4, %xmm2
// CHECK: vpmacsdd %xmm4, (%rax,%rcx), %xmm4, %xmm3		
// CHECK: encoding: [0x8f,0xe8,0x58,0x9e,0x1c,0x08,0x40]
          vpmacsdd %xmm4, (%rax,%rcx), %xmm4, %xmm3		

// vpcomw
// CHECK: vpcomw $42, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x2a]
          vpcomw $42, %xmm2, %xmm3, %xmm4
// CHECK: vpcomw $42, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0x20,0x2a]
          vpcomw $42, (%rax), %xmm3, %xmm4

// vpcomuw
// CHECK: vpcomuw $43, %xmm1, %xmm3, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe9,0x2b]
          vpcomuw $43, %xmm1, %xmm3, %xmm5
// CHECK: vpcomuw $44, (%rax,%rcx), %xmm0, %xmm6
// CHECK: encoding: [0x8f,0xe8,0x78,0xed,0x34,0x08,0x2c]
          vpcomuw $44, (%rax,%rcx), %xmm0, %xmm6

// vpcomuq
// CHECK: vpcomuq $45, %xmm3, %xmm3, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x60,0xef,0xfb,0x2d]
          vpcomuq $45, %xmm3, %xmm3, %xmm7
// CHECK: vpcomuq $46, (%rax), %xmm3, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x60,0xef,0x08,0x2e]
          vpcomuq $46, (%rax), %xmm3, %xmm1

// vpcomud
// CHECK: vpcomud $47, %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x70,0xee,0xd0,0x2f]
          vpcomud $47, %xmm0, %xmm1, %xmm2
// CHECK: vpcomud $48, 4(%rax), %xmm6, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x48,0xee,0x58,0x04,0x30]
          vpcomud $48, 4(%rax), %xmm6, %xmm3

// vpcomub
// CHECK: vpcomub $49, %xmm3, %xmm4, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x58,0xec,0xeb,0x31]
          vpcomub $49, %xmm3, %xmm4, %xmm5
// CHECK: vpcomub $50, (%rcx), %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x48,0xec,0x11,0x32]
          vpcomub $50, (%rcx), %xmm6, %xmm2

// vpcomq
// CHECK: vpcomq $51, %xmm3, %xmm0, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x78,0xcf,0xeb,0x33]
          vpcomq $51, %xmm3, %xmm0, %xmm5
// CHECK: vpcomq $52, (%rax), %xmm1, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x70,0xcf,0x38,0x34]
          vpcomq $52, (%rax), %xmm1, %xmm7

// vpcomd
// CHECK: vpcomd $53, %xmm3, %xmm3, %xmm0
// CHECK: encoding: [0x8f,0xe8,0x60,0xce,0xc3,0x35]
          vpcomd $53, %xmm3, %xmm3, %xmm0
// CHECK: vpcomd $54, (%rcx), %xmm2, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x68,0xce,0x11,0x36]
          vpcomd $54, (%rcx), %xmm2, %xmm2

// vpcomb
// CHECK: vpcomb $55, %xmm6, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0xcc,0xd6,0x37]
          vpcomb $55, %xmm6, %xmm4, %xmm2
// CHECK: vpcomb $56, 8(%rax), %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x60,0xcc,0x50,0x08,0x38]
          vpcomb $56, 8(%rax), %xmm3, %xmm2

// CHECK: vpcomltw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x00]
          vpcomltw %xmm2, %xmm3, %xmm4

// CHECK: vpcomlew %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x01]
          vpcomlew %xmm2, %xmm3, %xmm4

// CHECK: vpcomgtw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x02]
          vpcomgtw %xmm2, %xmm3, %xmm4

// CHECK: vpcomgew %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x03]
          vpcomgew %xmm2, %xmm3, %xmm4

// CHECK: vpcomeqw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x04]
          vpcomeqw %xmm2, %xmm3, %xmm4

// CHECK: vpcomneqw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x05]
          vpcomneqw %xmm2, %xmm3, %xmm4

// CHECK: vpcomfalsew %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x06]
          vpcomfalsew %xmm2, %xmm3, %xmm4

// CHECK: vpcomtruew %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x07]
          vpcomtruew %xmm2, %xmm3, %xmm4


// CHECK: vpcomltuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x00]
          vpcomltuw %xmm2, %xmm3, %xmm4

// CHECK: vpcomleuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x01]
          vpcomleuw %xmm2, %xmm3, %xmm4

// CHECK: vpcomgtuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x02]
          vpcomgtuw %xmm2, %xmm3, %xmm4

// CHECK: vpcomgeuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x03]
          vpcomgeuw %xmm2, %xmm3, %xmm4

// CHECK: vpcomequw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x04]
          vpcomequw %xmm2, %xmm3, %xmm4

// CHECK: vpcomnequw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x05]
          vpcomnequw %xmm2, %xmm3, %xmm4

// CHECK: vpcomfalseuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x06]
          vpcomfalseuw %xmm2, %xmm3, %xmm4

// CHECK: vpcomtrueuw %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe2,0x07]
          vpcomtrueuw %xmm2, %xmm3, %xmm4

// vpperm
// CHECK: vpperm %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa3,0xe2,0x10]
        vpperm %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpperm (%rax), %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0xe0,0xa3,0x20,0x20]
        vpperm (%rax), %xmm2, %xmm3, %xmm4
// CHECK: vpperm %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa3,0x20,0x10]
        vpperm %xmm1, (%rax), %xmm3, %xmm4

// vpcmov
// CHECK: vpcmov %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa2,0xe2,0x10]
	vpcmov %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpcmov (%rax), %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0xe0,0xa2,0x20,0x20]
	vpcmov (%rax), %xmm2, %xmm3, %xmm4
// CHECK: vpcmov %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa2,0x20,0x10]
	vpcmov %xmm1, (%rax), %xmm3, %xmm4
// CHECK: vpcmov %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0x64,0xa2,0xe2,0x10]
	vpcmov %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: vpcmov (%rax), %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0xe4,0xa2,0x20,0x20]
	vpcmov (%rax), %ymm2, %ymm3, %ymm4
// CHECK: vpcmov %ymm1, (%rax), %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0x64,0xa2,0x20,0x10]
	vpcmov %ymm1, (%rax), %ymm3, %ymm4


//////////////////////////
// 5 operand instructions
/////////////////////////
// vpermil2pd
// CHECK: vpermil2pd $1, %xmm5, %xmm2, %xmm1, %xmm7
// CHECK: encoding: [0xc4,0xe3,0x71,0x49,0xfa,0x51]
          vpermil2pd $1, %xmm5, %xmm2, %xmm1, %xmm7
// CHECK: vpermil2pd $2, (%rax), %xmm3, %xmm3, %xmm4
// CHECK: encoding: [0xc4,0xe3,0xe1,0x49,0x20,0x32]
          vpermil2pd $2, (%rax), %xmm3, %xmm3, %xmm4
// CHECK: vpermil2pd $3, 8(%rax), %ymm0, %ymm4, %ymm6
// CHECK: encoding: [0xc4,0xe3,0xdd,0x49,0x70,0x08,0x03]
          vpermil2pd $3, 8(%rax), %ymm0, %ymm4, %ymm6
// CHECK: vpermil2pd $0, %xmm3, (%rax,%rcx), %xmm1, %xmm0
// CHECK: encoding: [0xc4,0xe3,0x71,0x49,0x04,0x08,0x30]
          vpermil2pd $0, %xmm3, (%rax,%rcx), %xmm1, %xmm0
// CHECK: vpermil2pd $1, %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0xc4,0xe3,0x65,0x49,0xe2,0x11]
          vpermil2pd $1, %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: vpermil2pd $2, %ymm1, (%rax), %ymm3, %ymm4
// CHECK: encoding: [0xc4,0xe3,0x65,0x49,0x20,0x12]
          vpermil2pd $2, %ymm1, (%rax), %ymm3, %ymm4

// vpermil2ps
// CHECK: vpermil2ps $0, %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: encoding: [0xc4,0xe3,0x69,0x48,0xcb,0x40]
          vpermil2ps $0, %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: vpermil2ps $1, 4(%rax), %xmm2, %xmm3, %xmm0
// CHECK: encoding: [0xc4,0xe3,0xe1,0x48,0x40,0x04,0x21]
          vpermil2ps $1, 4(%rax), %xmm2, %xmm3, %xmm0
// CHECK: vpermil2ps $2, (%rax), %ymm1, %ymm5, %ymm6
// CHECK: encoding: [0xc4,0xe3,0xd5,0x48,0x30,0x12]
          vpermil2ps $2, (%rax), %ymm1, %ymm5, %ymm6
// CHECK: vpermil2ps $3, %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0xc4,0xe3,0x61,0x48,0x20,0x13]
          vpermil2ps $3, %xmm1, (%rax), %xmm3, %xmm4
// CHECK: vpermil2ps $0, %ymm4, %ymm4, %ymm2, %ymm2
// CHECK: encoding: [0xc4,0xe3,0x6d,0x48,0xd4,0x40]
          vpermil2ps $0, %ymm4, %ymm4, %ymm2, %ymm2
// CHECK: vpermil2pd $1, %ymm1, 4(%rax), %ymm1, %ymm0
// CHECK: encoding: [0xc4,0xe3,0x75,0x49,0x40,0x04,0x11]
          vpermil2pd $1, %ymm1, 4(%rax), %ymm1, %ymm0