文档章节

MMX指令集系列之二

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:45
字数 566
阅读 10
收藏 0

4. 数据移位指令

   psllw MM,MM/m64

   psllw MM,imm8

   把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
   低字移出的位不会移入高字.
   例:
   当MM0 = 0xffff  ffff ffff  ffff, 执行psllw MM0,1
   则MM0 = 0xfffe fffe fffe fffe

  psrlw MM,MM/m64

  psrlw MM,imm8


  把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高字移出的位不会移入低字.
  例:
  当MM0 = 0xffff  ffff  ffff  ffff, 执行psrlw MM0,1
  则MM0 = 0x7fff 7fff 7fff 7fff

  pslld MM,MM/m64

  pslld MM,MM imm8

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
  低双字移出的位不会移入高双字.
  例:
  当MM0 = 0xffffffff  ffffffff, 执行 pslld MM0,1
  则MM0 = 0xfffffffe fffffffe

 psrld MM,MM/m64

 psrld MM,imm8
 

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高双字移出的位不会移入低双字.
  例:
  当 MM0 = 0xffffffff  ffffffff, 执行psrld MM0,1
  则 MM0 = 0x7fffffff 7fffffff

5. 乘法指令

    pmullw MM,MM/m64

   并行16位按字相乘, 取结果低16位, 放入目的寄存器的对应字.  

  例:
  当MM0 == 0x0000 0002 0000 acfe

    MM1 ==  0x0000 0009 0000 cef3, 执行 pmullw,

    则MM0 = 0x0000 0000 0012 991a
    2 * 9 = 18,18 = 0000 0012h,取低16位 0012 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取低16位 991a 为结果.

   pmulhw MM,MM/m64
   并行16位按字相乘, 取结果高16位, 放入目的寄存器的对应字.

  例:
  当MM0 == 0x0000 0002 0000 acfe

    MM1 ==  0x0000 0009 0000 cef3, 执行 pmulhw,

    则MM0 = 0x0000 0000 0000 0fe7
    2 * 9 = 18,18 = 0000 0012h,取高16位 0000 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取高16位 0fe7 为结果.

 pmaddwd MM,MM/m64
 按字对齐有符号向量点乘.
 高32位 | 低32位
 目的寄存器:    a0| a1 | a2 | a3
 源寄存器:       b0| b1 | b2 | b3
 目的寄存器结果:  a0*b0+a1*b1 | a2*b2+a3*b3

 

小结:

  1. 移位指令按照16位或32位进行并行移位。

  2. 移位指令分为逻辑左移和逻辑右移。

  3. 只有三种乘法指令,并行乘法的数据单位都是16位有符号数。

 

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/03/26/2982576.html

共有 人打赏支持
abcijkxyz
粉丝 63
博文 6196
码字总数 1876
作品 0
深圳
项目经理
私信 提问
C/C++ 编译器--AsmJit

AsmJit 是一个完整的 JIT(Just-In-Time,运行时刻)的针对 C++ 语言的汇编器,可以生成兼容 x86 和 x64 架构的原生代码,不仅支持整个 x86/x64 的指令集(包括传统的 MMX 和最新的 AVX2 指令集...

匿名
2009/06/27
2.5K
1
cpu指令集包括哪些?

如题!我知道有mmx,sse等等.可是mmx指令集是在96年才有的, 而之前386,486,586等那些呢,包含哪些指令,相关资料在哪下载? 是不是sse1包含mmx,,,,,,,sse2包含sse1,,,,,,,sse3包含sse2 我知道去英...

音乐&编程
2012/09/14
2.1K
3
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
5.7K
28
Flat Assembler 1.70 发布,汇编工具

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

红薯
2012/04/19
1K
10
i386和x86-64区别通俗易懂版本(转)

x86架构首度出现在1978年推出的Intel 8086中央处理器,它是从Intel 8008处理器中发展而来的,而8008则是发展自Intel 4004的。Intel之后又推出了包括80186、80286、80386以及80486。 在设计上...

easonjim
2017/07/25
0
0

没有更多内容

加载失败,请刷新页面

加载更多

docker搞个wordpress

1.先把wordpress的镜像下载下来 docker pull wordpress 2.下载mysql docker pull mysql:lastest 3.启动mysql docker run --name blog -e root -d mysql:5.7 docker run --name some-mysql -e......

无极之岚
7分钟前
0
0
【宇润日常疯测-005】PHP 中的 clone 和 new 性能比较

clone和new本不应该放在一起比较,它们的作用是不同的。但可能有一些场景下,可以用clone也可以用new,那么这时候我们选哪个呢? 我编写了两个测试,第一个是声明一个空类,第二个是带构造方...

宇润
7分钟前
0
1
点击按钮弹出类似IOS 底部 dialog

implementation 'com.baoyz.actionsheet:library:1.1.7' 然后设置按钮点击监听,,调用下列代码即可 ActionSheet.createBuilder(this, getSupportFragmentManager()) ......

lanyu96
11分钟前
1
0
专访阿里云专有云马劲,一个理性的理想主义者

“我的故事都是和团队技术相关的,自己还真没有什么引人入胜的故事。”当马劲被问到能不能多分享些个人经历故事时他笑着说,我们就干脆怀着好奇聊了聊他和阿里云专有云一路走来的故事。 马劲...

阿里云官方博客
43分钟前
1
0
java环形缓冲区

import java.util.ArrayList;import java.util.List;/** * * 环形缓冲区<br/> * 一. 写数据:<br/> * 1. push: 当数据已写满时返回false,否则可以正常写入返回true<br/>......

whoisliang
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部