文档章节

SSE指令集系列之三

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:46
字数 653
阅读 10
收藏 0

6. SSE整数运算指令

  pavgb  MM,MM/m64

      pavgb XMM,XMM/m128

  把源存储器与目的寄存器按字节无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器。

  源存储器为m128时,内存变量地址必须16字节对齐.

 

  pavgw MM,MM/m64

  pavgw XMM,XMM/m128

  把源存储器与目的寄存器按字无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器,

  源存储器为m128时,内存变量必须对齐内存16字节.

 

  pextrw r32,MM,imm8

      pextrw r32,XMM,imm8

      从源寄存器中选第imm8(0~3 或 0~7)个字送入目的寄存器的低16位,高16位清零.

      imm8范围为 0~255,当源寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8

  目的寄存器是32位通用寄存器

 

  pinsrw MM,r32/m32,imm8

  pinsrw XMM,r32/m32,imm8

  把源存储器的低16位内容送入目的寄存器第imm8(0~3 或 0~7)个字,其余字不变.

      imm8范围为 0~255,当目的寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8

  源寄存器是32位通用寄存器

     例:

               7    6   5    4   3   2   1   0
    当 XMM0 = 0x ffff ffff ffff ffff ffff ffff ffff ffff
           eax = 0x 1234 5678,

           执行 pinsrw XMM0,eax,3
    则 XMM0 = 0x ffff ffff ffff ffff 5678 ffff ffff ffff


    执行pinsrw XMM0,eax,9
    则XMM0 = 0x ffff ffff ffff ffff ffff ffff 5678 ffff

 

     pmaxsw MM,MM/m64

           pmaxsw XMM,XMM/m128

    把源存储器与目的寄存器按字有符号整数比较,大数放入目的寄存器对应字

    源存储器为m128时,内存变量地址必须16字节对齐.

     pmaxub MM,MM/m64

           pmaxub XMM,XMM/m128

    把源存储器与目的寄存器按字节无符号整数比较,大数放入目的寄存器对应字节,

    源存储器为m128时,内存变量地址必须16字节对齐

     pminsw MM,MM/m64

           pminsw XMM,XMM/m128

    把源存储器与目的寄存器按字有符号整数比较,较小数放入目的寄存器对应字,

    源存储器为m128时,内存变量地址必须16字节对齐

     pminub MM,MM/m64

           pminub XMM,XMM/m128

    把源存储器与目的寄存器按字节无符号整数比较,较小数放入目的寄存器对应字节,

    源存储器为m128时,内存变量地址必须16字节对齐

          小结: SSE整数运算指令是对MMX指令集的扩充。

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/03/27/2984643.html

共有 人打赏支持
abcijkxyz
粉丝 63
博文 6196
码字总数 1876
作品 0
深圳
项目经理
私信 提问
Intel 45nm制程处理器上的SSE4指令集简介

Intel 45nm制程处理器上的SSE4指令集简介 Intel的SSE(Streaming SIMD Extensions, 流式单指令多数据扩展)技术有效增强了CPU的向量运算能力。支持该指令集的处理器有8个128位xmm寄存器,每一...

日久不生情
2017/11/07
0
0
Flat Assembler

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

匿名
2008/11/16
2.8K
0
/proc/cpuinfo文件分析(查看CPU信息)

  在Linux系统中,提供了proc文件系统显示系统的软硬件信息。如果想了解系统中CPU的提供商和相关配置信息,则可以通过/proc/cpuinfo文件得到。本文章针对该文件进行简单的总结。   基于不...

zhiqiangw
2016/11/18
33
0
Intel Software Development Emulator

Intel Software Development Emulator 是一款模拟Intel未来扩展指令集功能的仿真器。仿真器是基于Pin动态二进制仪器系统(和XED)。 它可以模拟在SSE4, AES,PCLMULQDQ中新的指令集功能和RTM...

叶秀兰
2013/12/08
209
0
Flat Assembler 1.70 发布,汇编工具

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

红薯
2012/04/19
1K
10

没有更多内容

加载失败,请刷新页面

加载更多

centos7 Nginx+rtmp 搭建流媒体服务器

一. gcc 安装 安装 nginx 需要先将官网下载的源码进行编译,编译依赖 gcc 环境,如果没有 gcc 环境,则需要安装: yum -y install gcc gcc-c++ 二. PCRE pcre-devel 安装 PCRE(Perl Compatib...

legend3
25分钟前
2
0
“别更新了,学不动了” 之:全栈开发者 2019 应该学些什么?

转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 原文转载自 公众号 infoqchina 对于什么是全栈开发者并没有一个明确的定义。但是,有一件事是...

葡萄城技术团队
42分钟前
6
0
OSChina 周五乱弹 —— 姑娘馋的口水都留下来了。

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @且无需多言 :分享Fall Out Boy的单曲《Disloyal Order Of Water Buffaloes》 《Disloyal Order Of Water Buffaloes》- Fall Out Boy 手机党...

小小编辑
今天
728
14
vue 对对象的属性进行修改时,不能渲染页面 vue.$set()

我在vue里的方法里给一个对象添加某个属性时,我console.log出来的是已经更改的object ,但是页面始终没有变化 原因如下: **受现代 JavaScript 的限制 (而且 Object.observe 也已经被废弃),...

Js_Mei
今天
2
0
开始看《Java学习笔记》

虽然书买了很久,但一直没看。这其中也写过一些Java程序,但都是基于IDE的帮助和对C#的理解来写的,感觉不踏实。 林信良的书写得蛮好的,能够帮助打好基础,看得出作者是比较用心的。 第1章概...

max佩恩
昨天
13
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部