文档章节

SSE3指令集系列----数据加载与算术运算指令

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:46
字数 295
阅读 1
收藏 0
点赞 0
评论 0

1. 数据加载存储指令

       LDDQU  xmm, m128

     从非对齐的内存地址中加载128位数到XMM寄存器,此条指令比SSE2的非对齐加载指令 MOVDQU 要快。

    MOVDDUP xmm, xmm/m64

   加载64bit数据到XMM寄存器的低64位,同时复制到其高64位。

    MOVSHDUP xmm, xmm/m128

    只需复制第二与第四个32位元素从而把数据读入到接收寄存器中

    MOVSLDUP  xmm, xmm/m128

    只需复制第一和第三个32位元素从而把数据读入到接收寄存器中

2.  算术指令

  ADDSUBPD - (Add-Subtract-Packed-Double)

      双精度浮点高位加法,低位减法

     ADDSUBPS(Add-Subtract-Packed-Single)

      单精度浮点高位加法,低位减法。

      输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }

      输出: { A0 - B0, A1 + B1, A2 - B2, A3 + B3 }

3.   数组结构指令(Array Of Structures;AOS)

  • HADDPD (Horizontal-Add-Packed-Double)
    • 输入: { A0, A1 }, { B0, B1 }
    • 输出: { B0 + B1, A0 + A1 }
  • HADDPS (Horizontal-Add-Packed-Single)
    • 输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
    • 输出: { B0 + B1, B2 + B3, A0 + A1, A2 + A3 }
  • HSUBPD (Horizontal-Subtract-Packed-Double)
    • 输入: { A0, A1 }, { B0, B1 }
    • 输出: { A0 - A1, B0 - B1 }
  • HSUBPS (Horizontal-Subtract-Packed-Single)
    • 输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
    • 输出: { A0 - A1, A2 - A3, B0 - B1, B2 - B3 }

 

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/04/23/3588216.html

共有 人打赏支持
abcijkxyz
粉丝 60
博文 6196
码字总数 1876
作品 0
深圳
项目经理
Intel 45nm制程处理器上的SSE4指令集简介

Intel 45nm制程处理器上的SSE4指令集简介 Intel的SSE(Streaming SIMD Extensions, 流式单指令多数据扩展)技术有效增强了CPU的向量运算能力。支持该指令集的处理器有8个128位xmm寄存器,每一...

日久不生情
2017/11/07
0
0
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
5.5K
28
进程,线程,超线程,并发,并行 等概念

进程是操作系统对一个正在运行的程序的抽象,即操作系统为该进程虚拟了独自的处理器资源,内存空间(又称虚拟地址空间)与磁盘空间 线程是进程中多个可以派遣的工作单位(或称执行单元,以C...

lvzjane
2012/11/28
0
1
AMD发布Stream SDK v2.0 Beta开发工具

AMD最近发布了ATI Stream SDK v2.0开发工具包的最新Beta版本Stream SDK v2.0 Beta,这个版本将全面兼容OpenCL1.0编程接口界面,更令人欣喜的是,需要的用户可以自由免费地下载该开发工具包,...

红薯
2009/10/14
2.4K
0
[JVM] 字节码指令集简介

Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的操作码(Opcode)以及跟随其后的零至多个代表此操作所需参数的操作数(Operands)所构成。虚拟机中许多指令并不包含操作数,只...

tequliapop
2016/02/16
327
0
CPU内部组成结构及指令执行过程

计算机的基本硬件系统由运算器、控制器、存储器和输入、输出设备五大部件组成。运算器和控制器等部件被集成在一起统称为中央处理单元(Central Processing Unit,CPU)。 CPU的功能 (1)程序...

邵鸿鑫
2015/05/15
0
0
CUDA学习(八十六)

计算能力6.x: 多处理器由以下部分组成: 64(计算能力6.0)或128(6.1和6.2)用于算术运算的CUDA内核 用于单精度浮点超越函数的16(6.0)或32(6.1和6.2)特殊功能单元, 2(6.0)或4(6.1...

night李
02/24
0
0
连载-第1章绪论 1.2嵌入式处理器

1.1 嵌入式处理器 1.1.1 哈佛结构和冯.诺依曼结构 相信学过计算机技术这门课程的读者都知道,通用CPU采用的是冯.诺依曼结构,而很多嵌入式处理器多采用哈佛结构,那么这两种结构究竟有什么区...

文艺小青年
2017/06/01
0
0
使用 Antlr 开发领域语言 - 开发一个完整的应用

简介: 为了使应用系统能够快速地响应复杂多变的业务规则,通过让用户使用领域语言来自定义业务规则是一种常用的选 择。 然而实现领域语言并非易事,本文使用 Antlr 语言识别工具,从语言定义...

IBMdW
2011/11/03
2.4K
0
如何选择纠删码编码引擎 | 纠删码技术详解(上)

作者介绍: 徐祥曦,七牛云工程师,独立开发了多套高性能纠删码/再生码编码引擎。 柳青,华中科技大学博士,研究方向为基于纠删码的分布式存储系统。 前言: 随着数据的存储呈现出集中化(以...

七仙女很忙
2017/04/13
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

iOS安全应该做哪些事情

1. 尽量使用HTTPS协议。 2. 密码提交的时候,密码使用SHA256加密后传输,MD5等经过哈希碰撞已经可以推算出原文。 3. 密码提交的时候,可以加盐。 4. 密码保存在本地的时候,尽量使用钥匙串保...

HOrange
12分钟前
0
0
react native 注意事项

1. 环境参考官网 android studio 必装 java jdk安装 1.8版本(环境建议自己一步一步配置,切记不要 apt ) 2.有改变编译内容发现 会白屏,然后APP消失,请卸载原来的测试 appinfo (连续两次...

304158
18分钟前
0
0
FOMO游戏代码解析

源代码在此处

怎当她临去时秋波那一转
23分钟前
1
0
EOS智能合约与DApp开发入门

EOS的是Block.One主导研发的一个区块链底层公链系统,它专门为支撑商业去中心化 应用(Decentralized Application)而设计,其代码开源。 比特币被称为区块链1.0,因为它开辟了数字加密货币的...

笔阁
36分钟前
1
0
编译cjson到dll

https://blog.csdn.net/mengzhisuoliu/article/details/52203724 编译完成后 是纯lua实现的json decode 的10倍以上...

梦想游戏人
46分钟前
0
0
JS基础- Date 对象

Date 对象 Date 对象用于处理日期和时间。 创建 Date 对象的语法: var myDate=new Date() 注释:Date 对象会自动把当前日期和时间保存为其初始值。 Date 对象属性 属性 描述 constructor 返...

ZHAO_JH
48分钟前
0
0
Python数据分析numpy(1)

Python开源的科学计算基础库 1.表示N维数组对象ndarray 2.线性代数、傅里叶变换、随机数生成 3.广播函数,整合c++、c 一.数据的维度 1.数据 2.数据维度 3.一维数据 (1)特点 (2)Python中的...

十年磨一剑3344
51分钟前
1
0
csv导入Hive脚本

from pyspark.sql import HiveContexthivec = HiveContext(sc) # 创建一个hivecontext对象用于写执行SQL,sc为sparkcontext# 拼接一个字段类型字符串str_s = 'label String,'...

gulf
53分钟前
0
0
TensorFlow 隐含层 拟合 异或运算

a⊕b = (¬a ∧ b) ∨ (a ∧¬b) 数据 X = [[0, 0], [0, 1], [1, 0], [1, 1]]Y = [[0], [1], [1], [0]] 单层网络只能拟合线性问题,由于异或是非线性问题,需要使用多层网络 输入和输出 [[...

阿豪boy
今天
0
0
SVN 教程

http://www.runoob.com/svn/svn-tutorial.html 记一次 svn 管理的项目迁移工作 之前A服务器上的项目版本管理工具是用的SVN,后来,之前管理linux服务器的员工离职了,这管理服务器的工作也就...

yeahlife
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部