文档章节

SSE指令集系列之三

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:46
字数 653
阅读 8
收藏 0
点赞 0
评论 0

6. SSE整数运算指令

  pavgb  MM,MM/m64

      pavgb XMM,XMM/m128

  把源存储器与目的寄存器按字节无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器。

  源存储器为m128时,内存变量地址必须16字节对齐.

 

  pavgw MM,MM/m64

  pavgw XMM,XMM/m128

  把源存储器与目的寄存器按字无符号整数相加,再除以2,结果四舍五入为整数放入目的寄存器,

  源存储器为m128时,内存变量必须对齐内存16字节.

 

  pextrw r32,MM,imm8

      pextrw r32,XMM,imm8

      从源寄存器中选第imm8(0~3 或 0~7)个字送入目的寄存器的低16位,高16位清零.

      imm8范围为 0~255,当源寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8

  目的寄存器是32位通用寄存器

 

  pinsrw MM,r32/m32,imm8

  pinsrw XMM,r32/m32,imm8

  把源存储器的低16位内容送入目的寄存器第imm8(0~3 或 0~7)个字,其余字不变.

      imm8范围为 0~255,当目的寄存器为'MM'时,有效值= imm8 mod 4,当目的寄存器为'XMM'时,有效值= imm8 mod 8

  源寄存器是32位通用寄存器

     例:

               7    6   5    4   3   2   1   0
    当 XMM0 = 0x ffff ffff ffff ffff ffff ffff ffff ffff
           eax = 0x 1234 5678,

           执行 pinsrw XMM0,eax,3
    则 XMM0 = 0x ffff ffff ffff ffff 5678 ffff ffff ffff


    执行pinsrw XMM0,eax,9
    则XMM0 = 0x ffff ffff ffff ffff ffff ffff 5678 ffff

 

     pmaxsw MM,MM/m64

           pmaxsw XMM,XMM/m128

    把源存储器与目的寄存器按字有符号整数比较,大数放入目的寄存器对应字

    源存储器为m128时,内存变量地址必须16字节对齐.

     pmaxub MM,MM/m64

           pmaxub XMM,XMM/m128

    把源存储器与目的寄存器按字节无符号整数比较,大数放入目的寄存器对应字节,

    源存储器为m128时,内存变量地址必须16字节对齐

     pminsw MM,MM/m64

           pminsw XMM,XMM/m128

    把源存储器与目的寄存器按字有符号整数比较,较小数放入目的寄存器对应字,

    源存储器为m128时,内存变量地址必须16字节对齐

     pminub MM,MM/m64

           pminub XMM,XMM/m128

    把源存储器与目的寄存器按字节无符号整数比较,较小数放入目的寄存器对应字节,

    源存储器为m128时,内存变量地址必须16字节对齐

          小结: SSE整数运算指令是对MMX指令集的扩充。

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/03/27/2984643.html

共有 人打赏支持
abcijkxyz
粉丝 60
博文 6196
码字总数 1876
作品 0
深圳
项目经理
AMD发布Stream SDK v2.0 Beta开发工具

AMD最近发布了ATI Stream SDK v2.0开发工具包的最新Beta版本Stream SDK v2.0 Beta,这个版本将全面兼容OpenCL1.0编程接口界面,更令人欣喜的是,需要的用户可以自由免费地下载该开发工具包,...

红薯
2009/10/14
2.4K
0
Intel 45nm制程处理器上的SSE4指令集简介

Intel 45nm制程处理器上的SSE4指令集简介 Intel的SSE(Streaming SIMD Extensions, 流式单指令多数据扩展)技术有效增强了CPU的向量运算能力。支持该指令集的处理器有8个128位xmm寄存器,每一...

日久不生情
2017/11/07
0
0
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
5.5K
28
Flat Assembler 1.70 发布,汇编工具

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

红薯
2012/04/19
1K
10
cpu指令集包括哪些?

如题!我知道有mmx,sse等等.可是mmx指令集是在96年才有的, 而之前386,486,586等那些呢,包含哪些指令,相关资料在哪下载? 是不是sse1包含mmx,,,,,,,sse2包含sse1,,,,,,,sse3包含sse2 我知道去英...

音乐&编程
2012/09/14
2.1K
3
Intel Software Development Emulator

Intel Software Development Emulator 是一款模拟Intel未来扩展指令集功能的仿真器。仿真器是基于Pin动态二进制仪器系统(和XED)。 它可以模拟在SSE4, AES,PCLMULQDQ中新的指令集功能和RTM...

叶秀兰
2013/12/08
209
0
centos 6.3 64位 mini版本u盘安装停在system_call_fadtpath

centos 6.3 64位 mini版本u盘安装停在systemcallfadtpath, 服务器是dell的powerEdge,磁盘共四个。其中两个做了raid1. 我尝试将系统换成32位的。还是不行。网络安装不行 CPU: Intel 奔腾 G3...

mickelfeng
2014/10/17
207
1
Firefox的64位修改版 - Waterfox 10

64位系统下的64位应用毫无疑问会带来更好的性能,Mozilla的Firefox虽然版本更新极快,但64位版本却始终步履蹒跚,而且它非常早期和不稳定,对于64位系统的朋友们来说用什么来提升浏览器性能呢...

红薯
2012/02/08
543
2
Flat Assembler

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

匿名
2008/11/16
2.8K
0
/proc/cpuinfo文件分析(查看CPU信息)

  在Linux系统中,提供了proc文件系统显示系统的软硬件信息。如果想了解系统中CPU的提供商和相关配置信息,则可以通过/proc/cpuinfo文件得到。本文章针对该文件进行简单的总结。   基于不...

zhiqiangw
2016/11/18
33
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

17.TCP:传输控制协议

介绍 TCP和UDP使用同一网络层(IP),但TCP提供了面向连接、可靠的传输层服务 TCP传输给IP层的信息单位称为报文段或段 TCP通过如下方式保证可靠性: 应用数据被分割成TCP认为最合适发送的数据...

loda0128
3分钟前
0
0
重装Oracle时出现environment variable "PATH"错误的解决办法

在win7 64位下重新安装oracle 11g,一直报environment variable "PATH"的错误,按说明将path里多余的路径删除,但没办法解决。选择忽略错误继续安装,装一半会报CRC错误,还是安装失败。最好...

良言
8分钟前
0
0
TensorFlow 全连接的mnist

全连接的mnist import tensorflow as tf# 导入 MINST 数据集from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_ho......

阿豪boy
9分钟前
0
0
JAVA 三种WebService 规范

JAVA 中共有三种WebService 规范,分别是JAX-WS(JAX-RPC)、JAXM&SAAJ、JAX-RS。 1. Jaxws(掌握) JAX-WS 的全称为 Java API for XML-Based Webservices ,早期的基于SOAP 的JAVA 的Web 服务...

onedotdot
28分钟前
0
0
将博客搬至CSDN

将博客搬至CSDN

xpbob
29分钟前
1
0
Aidl进程间通信详细介绍

目录介绍 1.问题答疑 2.Aidl相关属性介绍 2.1 AIDL所支持的数据类型 2.2 服务端和客户端 2.3 AIDL的基本概念 3.实际开发中案例操作 3.1 aidl通信业务需求 3.2 操作步骤伪代码 3.3 服务端操作...

潇湘剑雨
46分钟前
0
0
python爬虫日志(3)下载图片

import urlliburl='https://xxx.jpg'#图片地址res=urllib.request.urlopen(url)#此函数用于对url的访问data=res.read() #字节流with open(r'D:\1.jpg',"wb") as code: c...

茫羽行
今天
0
0
vue中$emit的用法

1、父组件可以使用 props 把数据传给子组件。 2、子组件可以使用 $emit 触发父组件的自定义事件。 vm.$emit( event, arg ) //触发当前实例上的事件 vm.$on( event, fn );//监听event事件后运...

JamesView
今天
0
0
bash审计系统搭建

step1:使用saltstack工具bash部署>>>>>> # salt -N clienta state.sls audit step2:安装elasticsearch>>>>>> 注意: 1.不能以root用户进行启动,需要创建用户,并对解压的elasticsearch目录赋......

硅谷课堂
今天
0
0
Linux sar性能分析

Linux使用sar进行性能分析 sar简介 sar命令常用格式 sar常用性能数据分析 整体CPU使用统计-u 各个CPU使用统计-P 内存使用情况统计-r 整体IO情况-b 各个IO设备情况-d 网络统计-n sar日志保存-...

易野
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部