文档章节

MMX指令集系列之二----移位运算和乘法指令

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:45
字数 683
阅读 4
收藏 0
点赞 0
评论 0

4. 数据移位指令

  4.1 16位并行左移指令

   psllw MM,MM/m64

   psllw MM,imm8

   把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
   低字移出的位不会移入高字.
   例:
   当MM0 = 0xffff  ffff ffff  ffff, 执行psllw MM0,1
   则MM0 = 0xfffe fffe fffe fffe

 

  4.2 16位并行逻辑右移指令


  psrlw MM,MM/m64

  psrlw MM,imm8


  把目的寄存器按字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高字移出的位不会移入低字.
  例:
  当MM0 = 0xffff  ffff  ffff  ffff, 执行psrlw MM0,1
  则MM0 = 0x7fff 7fff 7fff 7fff

 

4.3 32位并行左移指令


  pslld MM,MM/m64

  pslld MM,MM imm8

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑左移,移出的位丢失.
  低双字移出的位不会移入高双字.
  例:
  当MM0 = 0xffffffff  ffffffff, 执行 pslld MM0,1
  则MM0 = 0xfffffffe fffffffe

 

4.4 32位并行逻辑右移指令


 psrld MM,MM/m64

 psrld MM,imm8
 

  把目的寄存器按双字由源存储器(或imm8 立即数)指定位数逻辑右移,移出的位丢失.
  高双字移出的位不会移入低双字.
  例:
  当 MM0 = 0xffffffff  ffffffff, 执行psrld MM0,1
  则 MM0 = 0x7fffffff 7fffffff


4.5 64位数据逻辑左移和逻辑右移

  psllq MM,imm8

  psrlq MM,imm8



4.6 16位并行算术右移和32位并行算术右移

  psraw MM,imm8

  psrad MM,imm8

  


5. 乘法指令

   pmullw MM,MM/m64

   并行16位按字相乘, 取结果低16位, 放入目的寄存器的对应字.  

  例:
  当 MM0 ==  0x0000 0000 0002 acfe

     MM1 ==  0x0000 0000 0009 cef3, 执行 pmullw,

    则MM0 =  0x0000 0000 0012 991a
    2 * 9 = 18,18 = 0000 0012h,取低16位 0012 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取低16位 991a 为结果.

   pmulhw MM,MM/m64
   并行16位按字相乘, 取结果高16位, 放入目的寄存器的对应字.

  例:
  当MM0 ==  0x0000 0000 0002 acfe

    MM1 ==  0x0000 0000 0009 cef3, 执行 pmulhw,

    则MM0 = 0x0000 0000 0000 0fe7
    2 * 9 = 18,18 = 0000 0012h,取高16位 0000 为结果.
    0x0acfe == -21250,0xcef3 == -12557,-21250*-12557 = 266836250 = 0x 0fe7 991a,取高16位 0fe7 为结果.

 pmaddwd MM,MM/m64
 按字对齐有符号向量点乘.
                     高32位 | 低32位
 目的寄存器:     a0| a1 | a2 | a3
 源寄存器:       b0| b1 | b2 | b3
 目的寄存器结果:  a0*b0+a1*b1 | a2*b2+a3*b3

 

小结:

  1. 移位指令按照16位或32位进行并行移位.也可以直接操作整个64位数。

  2. 右移指令分为逻辑右移和算术右移。左移指令没有算术左移一说。

  3. 只有三种乘法指令,并行乘法的数据单位都是16位有符号数。

 

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/04/23/3588232.html

共有 人打赏支持
abcijkxyz
粉丝 60
博文 6196
码字总数 1876
作品 0
深圳
项目经理
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
5.5K
28
05-ARM体系结构与常用汇编指令

一、ARM体系结构  ARM(Advanced RISC Machines) ,既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。ARM 处理器是一种低功耗高性能的 32 位R...

梦想成大牛
01/05
0
0
ARM指令集详解(超详细!带实例!)

转载:https://www.cnblogs.com/liujiahi/archive/2011/03/22/2196401.html 算术和逻辑指令 ADC : 带进位的加法 (Addition with Carry) ADC{条件}{S} , , 将把两个操作数加起来,并把结果放置...

zjy900507
03/08
0
0
从奔腾I的VCD播放到AI区块链播放器——程序优化的魔法

从上个世纪本腾I电脑播放VCD,通过巧妙的算法优化,可以在损失部分效果的情况下在低性能的电脑上播放VCD。时至今日,硬件性能大幅飙升,许多算法近乎“失传”了。但对于充满好奇心的程序员,...

LiveVideoStack
04/23
0
0
C/C++ 编译器--AsmJit

AsmJit 是一个完整的 JIT(Just-In-Time,运行时刻)的针对 C++ 语言的汇编器,可以生成兼容 x86 和 x64 架构的原生代码,不仅支持整个 x86/x64 的指令集(包括传统的 MMX 和最新的 AVX2 指令集...

匿名
2009/06/27
2.5K
1
实现高性能纠删码引擎 | 纠删码技术详解(下)

作者介绍: 徐祥曦,七牛云工程师,独立开发了多套高性能纠删码/再生码编码引擎。 柳青,华中科技大学博士,研究方向为基于纠删码的分布式存储系统。 前言: 在上篇《如何选择纠删码编码引擎...

七仙女很忙
2017/05/24
0
0
进程,线程,超线程,并发,并行 等概念

进程是操作系统对一个正在运行的程序的抽象,即操作系统为该进程虚拟了独自的处理器资源,内存空间(又称虚拟地址空间)与磁盘空间 线程是进程中多个可以派遣的工作单位(或称执行单元,以C...

lvzjane
2012/11/28
0
1
80x86 寻址方式与指令系统简介

80x86 寻址方式与指令系统简介 【课前思考】   (1) 什么是指令和指令系统?指令在什么时候由哪部分来执行?   (2) 8086汇编语言指令由几部分组成?各部分的作用是什么?   (3) ...

TheRoodToDeath
2017/03/14
0
0
Intel 45nm制程处理器上的SSE4指令集简介

Intel 45nm制程处理器上的SSE4指令集简介 Intel的SSE(Streaming SIMD Extensions, 流式单指令多数据扩展)技术有效增强了CPU的向量运算能力。支持该指令集的处理器有8个128位xmm寄存器,每一...

日久不生情
2017/11/07
0
0
汇编语言指令英文全称

1.通用数据传送指令 MOV----> move MOV dest,src;dest←src MOV指令把一个字节或字的操作数从源地址src传送至目的地址dest。 MOVSX---->extended move with sign data MOVZX---->extended mo......

伽罗kapple
2015/10/24
155
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

win10 上安装解压版mysql

1.效果 2. 下载MySQL 压缩版 下载地址: https://downloads.mysql.com/archives/community/ 3. 配置 3.1 将下载的文件解压到合适的位置 我最终将myql文件 放在:D:\develop\mysql 最终放的位...

Lucky_Me
12分钟前
0
0
linux服务器修改mtu值优化cpu

一、jumbo frames 相关 1、什么是jumbo frames Jumbo frames 是指比标准Ethernet Frames长的frame,即比1518/1522 bit大的frames,Jumbo frame的大小是每个设备厂商规定的,不属于IEEE标准;...

问题终结者
27分钟前
0
0
expect脚本同步文件expect脚本指定host和要同步的文件 构建文件分发系统批量远程执行命令

expect脚本同步文件 在一台机器上把文件同步到多台机器上 自动同步文件 #!/usr/bin/expectset passwd "123456"spawn rsync -av root@192.168.133.132:/tmp/12.txt /tmp/expect {"yes...

lyy549745
27分钟前
0
0
36.rsync下 日志 screen

10.32/10.33 rsync通过服务同步 10.34 linux系统日志 10.35 screen工具 10.32/10.33 rsync通过服务同步: rsync还可以通过服务的方式同步。那需要开启一个服务,他的架构是cs架构,客户端服务...

王鑫linux
35分钟前
0
0
matplotlib 保存图片时的参数

简单绘图 import matplotlib.pyplot as pltplt.plot(range(10)) 保存为csv格式,放大后依然很清晰 plt.savefig('t1.svg') 普通保存放大后会有点模糊文件大小20多k plt.savefig('t5.p...

阿豪boy
40分钟前
0
0
java 8 复合Lambda 表达式

comparator 比较器复合 //排序Comparator.comparing(Apple::getWeight);List<Apple> list = Stream.of(new Apple(1, "a"), new Apple(2, "b"), new Apple(3, "c")) .collect(......

Canaan_
昨天
0
0
nginx负载均衡

一、nginx 负载均衡 拓扑图: 主机信息: 1、负载均衡器1(lb1):192.168.10.205 RHEL7.5 2、负载均衡器2(lb2):192.168.10.206 RHEL7.5 3、web服务器1(web01):192.168.10.207 Centos...

人在艹木中
昨天
0
0
做了一个小网站

做了一个小网站 www.kanxs123.com

叶落花开
昨天
0
0
继社会佩奇之后,又尝试了可爱的蓝胖子,有趣 Python

#哆啦A梦# !/usr/bin/env python3# -*- coding: utf-8 -*-# @Author: dong dong# @Env: python 3.6from turtle import *# 无轨迹跳跃def my_goto(x, y): penup(...

Py爱好
昨天
0
0
shell及python脚本方式登录服务器

一、问题 在工作过程中,经常会遇见需要登录服务器,并且因为安全的原因,需要使用交互的方式登录,而且shell、python在工作中也经常用到,并且可以提供交互的功能。都是利用了expect、spawn...

yangjianzhou
昨天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部