文档章节

MMX指令集系列之二----移位运算和乘法指令

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:45
字数 683
阅读 16
收藏 0

4. 数据移位指令

  4.1 16位并行左移指令

   psllw MM,MM/m64

   psllw MM,imm8

   把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
   低字移出的位不会移入高字.
   例:
   当MM0 = 0xffff  ffff ffff  ffff, 执行psllw MM0,1
   则MM0 = 0xfffe fffe fffe fffe

 

  4.2 16位并行逻辑右移指令


  psrlw MM,MM/m64

  psrlw MM,imm8


  把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高字移出的位不会移入低字.
  例:
  当MM0 = 0xffff  ffff  ffff  ffff, 执行psrlw MM0,1
  则MM0 = 0x7fff 7fff 7fff 7fff

 

4.3 32位并行左移指令


  pslld MM,MM/m64

  pslld MM,MM imm8

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
  低双字移出的位不会移入高双字.
  例:
  当MM0 = 0xffffffff  ffffffff, 执行 pslld MM0,1
  则MM0 = 0xfffffffe fffffffe

 

4.4 32位并行逻辑右移指令


 psrld MM,MM/m64

 psrld MM,imm8
 

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高双字移出的位不会移入低双字.
  例:
  当 MM0 = 0xffffffff  ffffffff, 执行psrld MM0,1
  则 MM0 = 0x7fffffff 7fffffff


4.5 64位数据逻辑左移和逻辑右移

  psllq MM,imm8

  psrlq MM,imm8



4.6 16位并行算术右移和32位并行算术右移

  psraw MM,imm8

  psrad MM,imm8

  


5. 乘法指令

   pmullw MM,MM/m64

   并行16位按字相乘, 取结果低16位, 放入目的寄存器的对应字.  

  例:
  当 MM0 ==  0x0000 0000 0002 acfe

     MM1 ==  0x0000 0000 0009 cef3, 执行 pmullw,

    则MM0 =  0x0000 0000 0012 991a
    2 * 9 = 18,18 = 0000 0012h,取低16位 0012 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取低16位 991a 为结果.

   pmulhw MM,MM/m64
   并行16位按字相乘, 取结果高16位, 放入目的寄存器的对应字.

  例:
  当MM0 ==  0x0000 0000 0002 acfe

    MM1 ==  0x0000 0000 0009 cef3, 执行 pmulhw,

    则MM0 = 0x0000 0000 0000 0fe7
    2 * 9 = 18,18 = 0000 0012h,取高16位 0000 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取高16位 0fe7 为结果.

 pmaddwd MM,MM/m64
 按字对齐有符号向量点乘.
                     高32位 | 低32位
 目的寄存器:     a0| a1 | a2 | a3
 源寄存器:       b0| b1 | b2 | b3
 目的寄存器结果:  a0*b0+a1*b1 | a2*b2+a3*b3

 

小结:

  1. 移位指令按照16位或32位进行并行移位.也可以直接操作整个64位数。

  2. 右移指令分为逻辑右移和算术右移。左移指令没有算术左移一说。

  3. 只有三种乘法指令,并行乘法的数据单位都是16位有符号数。

 

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/04/23/3588232.html

abcijkxyz
粉丝 64
博文 6421
码字总数 1876
作品 0
深圳
项目经理
私信 提问
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
6K
28
05-ARM体系结构与常用汇编指令

一、ARM体系结构  ARM(Advanced RISC Machines) ,既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。ARM 处理器是一种低功耗高性能的 32 位R...

梦想成大牛
2018/01/05
0
0
ARM指令集详解(超详细!带实例!)

转载:https://www.cnblogs.com/liujiahi/archive/2011/03/22/2196401.html 算术和逻辑指令 ADC : 带进位的加法 (Addition with Carry) ADC{条件}{S} , , 将把两个操作数加起来,并把结果放置...

zjy900507
2018/03/08
0
0
从奔腾I的VCD播放到AI区块链播放器——程序优化的魔法

从上个世纪本腾I电脑播放VCD,通过巧妙的算法优化,可以在损失部分效果的情况下在低性能的电脑上播放VCD。时至今日,硬件性能大幅飙升,许多算法近乎“失传”了。但对于充满好奇心的程序员,...

LiveVideoStack
2018/04/23
0
0
C/C++ 编译器--AsmJit

AsmJit 是一个完整的 JIT(Just-In-Time,运行时刻)的针对 C++ 语言的汇编器,可以生成兼容 x86 和 x64 架构的原生代码,不仅支持整个 x86/x64 的指令集(包括传统的 MMX 和最新的 AVX2 指令集...

匿名
2009/06/27
2.7K
1

没有更多内容

加载失败,请刷新页面

加载更多

Mybatis Plus删除

/** @author beth @data 2019-10-17 00:30 */ @RunWith(SpringRunner.class) @SpringBootTest public class DeleteTest { @Autowired private UserInfoMapper userInfoMapper; /** 根据id删除......

一个yuanbeth
今天
4
0
总结

一、设计模式 简单工厂:一个简单而且比较杂的工厂,可以创建任何对象给你 复杂工厂:先创建一种基础类型的工厂接口,然后各自集成实现这个接口,但是每个工厂都是这个基础类的扩展分类,spr...

BobwithB
今天
4
0
java内存模型

前言 Java作为一种面向对象的,跨平台语言,其对象、内存等一直是比较难的知识点。而且很多概念的名称看起来又那么相似,很多人会傻傻分不清楚。比如本文我们要讨论的JVM内存结构、Java内存模...

ls_cherish
今天
4
0
友元函数强制转换

友元函数强制转换 p522

天王盖地虎626
昨天
5
0
js中实现页面跳转(返回前一页、后一页)

本文转载于:专业的前端网站➸js中实现页面跳转(返回前一页、后一页) 一:JS 重载页面,本地刷新,返回上一页 复制代码代码如下: <a href="javascript:history.go(-1)">返回上一页</a> <a h...

前端老手
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部