文档章节

SSE3指令集系列

abcijkxyz
 abcijkxyz
发布于 2016/11/22 16:45
字数 284
阅读 4
收藏 0
点赞 0
评论 0

1. 数据加载存储指令

     LDDQU  xmm, m128

     从非对齐的内存地址中加载128位数到XMM寄存器,此条指令比SSE2的非对齐加载指令 MOVDQU 要快。

    MOVDDUP xmm, xmm/m64

   加载64bit数据到XMM寄存器的低64位,同时复制到其高64位。

    MOVSHDUP xmm, xmm/m128

    只需复制第二与第四个32位元素从而把数据读入到接收寄存器中

    MOVSLDUP  xmm, xmm/m128

    只需复制第一和第三个32位元素从而把数据读入到接收寄存器中

2.  算术指令

  ADDSUBPD - (Add-Subtract-Packed-Double)

      双精度浮点高位加法,低位减法

     ADDSUBPS(Add-Subtract-Packed-Single)

      单精度浮点高位加法,低位减法。

      输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }

      输出: { A0 - B0, A1 + B1, A2 - B2, A3 + B3 }

3.   数组结构指令(Array Of Structures;AOS)

  • HADDPD (Horizontal-Add-Packed-Double)
    • 输入: { A0, A1 }, { B0, B1 }
    • 输出: { B0 + B1, A0 + A1 }
  • HADDPS (Horizontal-Add-Packed-Single)
    • 输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
    • 输出: { B0 + B1, B2 + B3, A0 + A1, A2 + A3 }
  • HSUBPD (Horizontal-Subtract-Packed-Double)
    • 输入: { A0, A1 }, { B0, B1 }
    • 输出: { A0 - A1, B0 - B1 }
  • HSUBPS (Horizontal-Subtract-Packed-Single)
    • 输入: { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
    • 输出: { A0 - A1, A2 - A3, B0 - B1, B2 - B3 }

 

 

本文转载自:http://www.cnblogs.com/celerychen/archive/2013/03/29/2988980.html

共有 人打赏支持
abcijkxyz
粉丝 60
博文 6196
码字总数 1876
作品 0
深圳
项目经理
AMD发布Stream SDK v2.0 Beta开发工具

AMD最近发布了ATI Stream SDK v2.0开发工具包的最新Beta版本Stream SDK v2.0 Beta,这个版本将全面兼容OpenCL1.0编程接口界面,更令人欣喜的是,需要的用户可以自由免费地下载该开发工具包,...

红薯
2009/10/14
2.4K
0
Flat Assembler 1.70 发布,汇编工具

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

红薯
2012/04/19
1K
10
cpu指令集包括哪些?

如题!我知道有mmx,sse等等.可是mmx指令集是在96年才有的, 而之前386,486,586等那些呢,包含哪些指令,相关资料在哪下载? 是不是sse1包含mmx,,,,,,,sse2包含sse1,,,,,,,sse3包含sse2 我知道去英...

音乐&编程
2012/09/14
2.1K
3
Flat Assembler

Flat Assembler 是一个快速高效的80x86的汇编工具,支持DOS、Windows、Linux操作系统,支持包括 8086-80486/Pentium instructions with MMX, SSE, SSE2, SSE3, and 3DNow! extensions and x......

匿名
2008/11/16
2.8K
0
Firefox的64位修改版 - Waterfox 10

64位系统下的64位应用毫无疑问会带来更好的性能,Mozilla的Firefox虽然版本更新极快,但64位版本却始终步履蹒跚,而且它非常早期和不稳定,对于64位系统的朋友们来说用什么来提升浏览器性能呢...

红薯
2012/02/08
543
2
(学习心得):进程,线程,超线程,并发,并行 等概念

前言: 此陋文来自最近对阅读《深入理解计算机系统》与《微型计算机体系结构:Intel Core Duo / i 系列微处理器技术应用》两本书的学习体会, 前者从 程序员的视角来探讨计算机系统中各部件的...

shayi
2012/11/26
5.5K
28
Intel 45nm制程处理器上的SSE4指令集简介

Intel 45nm制程处理器上的SSE4指令集简介 Intel的SSE(Streaming SIMD Extensions, 流式单指令多数据扩展)技术有效增强了CPU的向量运算能力。支持该指令集的处理器有8个128位xmm寄存器,每一...

日久不生情
2017/11/07
0
0
关于处理器架构的一点儿知识

日期:2010-06-30 | 分类:Android 版权声明 :转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://navigating.blogbus.com/logs/67535773.html 在关注Android的时候,有一些C...

晨曦之光
2012/03/09
81
0
关于处理器架构的一点儿知识

http://navigating.blogbus.com/logs/67535773.html 在关注Android的时候,有一些CPU架构方面的术语知识需要给自己补充的。主要有ARM、X86/Atom、MIPS、PowerPC,其中ARM在智能手机上面一枝独...

晨曦之光
2012/03/07
421
0
如何查看Linux和Mac机器的系统状态

本文主要介绍命令和参数搭配使用查询和设定Unix系统的。比如CPU型号、支持的指令集、内核最大进程数等等。 sysctl 工具可以直接在Unix系统的terminal中使用,用来检索,并配合相应权限设置。...

Aspirinrin
2017/09/20
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

keepalived配置高可用集群

Linux集群概述 根据功能划分为两大类:高可用和负载均衡 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务 实现高可用的开源软件有:...

TaoXu
7分钟前
0
0
mysql联表批处理操作

1 概述 mysql中的单表增删改查操作,可以说是基本中的基本. 实际工作中,常常会遇到一些基本用法难以处理的数据操作,譬如遇到主从表甚至多级关联表的情况(如一些历史问题数据的批量处理),考虑到...

社哥
10分钟前
0
0
IntelliJ IDEA 详细图解最常用的配置,适合刚刚用的新人。

刚刚使用IntelliJ IDEA 编辑器的时候,会有很多设置,会方便以后的开发,磨刀不误砍柴工。 比如:设置文件字体大小,代码自动完成提示,版本管理,本地代码历史,自动导入包,修改注释,修改...

kim_o
24分钟前
0
0
Google Java编程风格指南

目录 前言 源文件基础 源文件结构 格式 命名约定 编程实践 Javadoc 后记 前言 这份文档是Google Java编程风格规范的完整定义。当且仅当一个Java源文件符合此文档中的规则, 我们才认为它符合...

niithub
26分钟前
0
0
java.net.MalformedURLException异常说明

1.异常片段 Java代码中,在进行URL url = new URL(urllink)操作时,提示以下异常信息,该类异常主要问题出在参数urllink上面。 异常片段1 java.net.MalformedURLException at java.ne...

lqlm
27分钟前
0
0
CentOS7修改mysql5.6字符集

解决办法:CentOS7下修改MySQL数据库字符编码为UTF-8,UTF-8包含全世界所有国家所需要的字符集,是国际编码。 具体操作如下: 1.进入MySQL [root@tianqi-01 ~]# mysql -uroot -p Enter passw...

河图再现
28分钟前
0
0
DevExpress v18.1新版亮点——WPF篇(一)

用户界面套包DevExpress v18.1日前终于正式发布,本站将以连载的形式为大家介绍各版本新增内容。本文将介绍了DevExpress WPF v18.1 的新功能,快来下载试用新版本!点击下载>> Accordion Co...

Miss_Hello_World
31分钟前
0
0
Rancher 2.0集群与工作负载告警

Rancher 2.0操作指南。本文将step by step演示如何使用Rancher 2.0中集成的告警功能,包括设置通知程序、设置集群级别以及工作负载级别的告警。 在Rancher 1.x时期,告警功能是很多Rancher用...

RancherLabs
36分钟前
1
0
Python中字符串拼接的N中方法

python拼接字符串一般有以下几种方法: ①直接通过(+)操作符拼接 s = 'Hello'+' '+'World'+'!'print(s) 输出结果:Hello World! 使用这种方式进行字符串连接的操作效率低下,因为python中...

木头释然
37分钟前
9
0
JAVA排序之归并排序

归并排序思路就是不停拆分数组,直到拆成一个一个元素,之后将拆出来的元素按照拆分顺序反过来的顺序合并,出现前边值大于后边值,则换位置,放入临时数组,最后将临时数组覆盖原数组. public stat...

勤奋的蚂蚁
49分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部