文档章节

非对称加密与安全证书看这一篇就懂了

编辑部的故事
 编辑部的故事
发布于 06/29 11:48
字数 4057
阅读 4446
收藏 161

前几日做支付对接时,被对方文档中的加密方式搞晕乎了一会。意识到证书加密方面的理解不够深入,事后查阅参考资料补习一波。本文是根据期间的学习,以及长期以来的实践做出的总结。

加密方式

密码学是涉及数学、电子信息、计算机等多学科的一门重要学科,是现代互联网安全的基石,也是目前如火如荼的区块链技术的安全保障。概括来说,加密方式可归结为不可逆加密与可逆加密。

不可逆加密

信息摘要(Message Digest)和安全散列(Secure Hash)算法属于此类,常见的算法包括 MD5、SHA1、PBKDF2、bcrypt 等。此类算法可将任意大小的原始数据变换成规定长度的输出,即获取内容的数字指纹,常用于校验原始内容是否被篡改。这类算法的主要特点是:

  • 不可逆性。除非穷举等手段,原则上不存在根据密文推断出原文的算法;
  • 雪崩效应。对输入数据敏感,原始内容的极小改动会造成输出的大差异;
  • 防碰撞性。原则上很难找到两组不同的原文,经过加密后密文相同。

左耳朵耗子的“RSYNC 的核心算法”介绍了 MD5 算法在 rsync 中的具体应用。MD5 和 SHA1 已经被证实不安全(王小云教授在04年找到 MD5 迅速碰撞方法,谷歌在17年完成了 SHA1 的第一次碰撞),实践中建议至少用 SHA-256 算法,或采用对算力不敏感的 scrypt、Argon2 等算法。

哈希算法(安全散列)的一个变种是 HMAC(Hash-based Message Authentication Code)算法,用于解决身份认证和防抵赖。HMAC 算法的输入为一个密钥(通信双方共享)、一种哈希算法(常为经典哈希算法)和原始数据,输出的内容格式取决于所采用的哈希算法。由于只有通信双方知晓密钥,所以可确认信息就是由对方发出。

可逆加密

哈希算法可保证通信中的数据不被篡改,而可逆加密算法是还原出明文的关键。可逆加密算法可分成三类:

  • 基于算法的加密算法,也被称为古典加密算法,如 HTTP 认证中的 base64,比特币生成地址用的 base58(公开的算法也可称作编码方式)。这类算法主要对原始内容进行置换和替换得到密文,安全性依赖于算法是否外泄;
  • 对称加密算法,加密和解密使用同一个密钥。对称加密算法的出现标志密码学进入现代密码学阶段,密文的安全性从依赖于算法转向依赖于密钥。常见的对称加密算法有 DES、3DES、AES;
  • 非对称加密算法,加密和解密使用不同的密钥。非对称加密算法开创了密码学的里程碑,解决了对称加密过程中密钥分发的安全问题,被认为现代密码学最伟大的发明。常见的算法有 RSA、DH(Diffie-Hellman)、椭圆曲线算法(Elliptic curve cryptography,ECC)。

非对称算法设计巧妙,但实际中要结合对称加密使用。原因是某些算法不能加解密(DH、DSA),或者效率太低(RSA),或者能处理的数据大小有限制(RSA)。而对称加密算法的有点是速度快、加密强度高。常用非对称算法获得共享密钥,之后用对称加密处理数据。本文的重点是非对称加密及其衍生概念,下面逐一介绍。

公钥、私钥和证书

除算法外,非对称加密中另外两个重要的概念是公钥和私钥。公钥对外公开,任何人均可持有和使用;私钥自行保管,其安全性是通信安危的关键。例如 OpenSSH 客户端默认会拒绝用权限开放的私钥连接服务器,会出现如下提示:

# 放开私钥权限

chmod 644 ~/.ssh/id_ras

# 连接服务器

ssh server

# openssh 客户端出现如下报错:

Permissions 0644 for '/home/tlanyan/.ssh/id_rsa' are too open.

It is required that your private key files are NOT accessible by others.

This private key will be ignored.

Load key "/home/tlanyan/.ssh/id_rsa": bad permissions

Permission denied (publickey,gssapi-keyex,gssapi-with-mic).

私钥和公钥的作用一般分为两种:

  • 公钥加密,私钥解密,主要用于通信;
  • 私钥加密(签名),公钥解密(验证),主要用于数字签名。

本次做支付对接时,对其算法疑虑的地方是需要用到私钥,按理要用对方的公钥加密才对啊!后来意识到是用作数据签名,用客户端的私钥是正确的。

理论上有了公钥和密钥,双方就可以安全无碍的通信,那常说的证书是怎么回事?

证书,顾名思义,就是证明的文件。例如浏览器和 tlanyan.me 服务器通信,浏览器怎么知道对方就是 tlanyan.me 对应的服务器呢? 在不可信的网络下通信,中立的第三方作用就显现出来了。权威的第三方中立机构( Certificate Authority, CA)收到 tlanyan.me 持有者的证书请求并核验信息后,将持有者的名称、公钥 与 CA 用 私钥生成的数字签名 等信息写成证书颁发给申请者。

用户与服务器通信时,服务器收到请求后将证书发给浏览器,浏览器对证书进行检查(是否过期,能否用 CA 的公钥验证签名等),并向第三方询问是否为真(是否被吊销等),确认无误后,就可以放心地通信了。

证书包含公钥,所以拿到证书意味着就拿到了对方的公钥。几乎所有的浏览器都会对证书进行校验,以确保网页通信中的安全。使用自签发的证书,或者过期、与请求主机不符合的证书,都会导致浏览器发出安全警告,提醒用户潜在的风险,如下图所示:



CURL 等第三方库一般不会对证书进行检查,那么与服务器交互时如何确保通信的对方是真李逵而非李鬼?

答案是客户端预先存一份服务器证书(证书从官网、对方邮件等可信渠道获取),通信时校验服务端发来的证书与本地预存的是否一致。如果不一致,则说明遇到了中间人攻击,或预设的通信方实体已经变更,客户端应对这种情况进行处理,例如打印警告或中断通信。

而在校验一致的情形下,客户端用证书的公钥加密信息发往服务端,如果对方是中间人,其没有通信方的私钥就无法解密信息,也会造成通信失败。所以在私钥不泄露的前提下,内置对方证书是解决中间人攻击的最有效办法,因为 CA 也有可能作假(参考 CNNIC),而浏览器需要与成千上万个网站通信,不可能所有站点证书都内置,所以使用 CA 比较合理。之前做微信支付的对接,不理解微信服务器证书的作用,后来才理解其深意。

许多国外网站使用 HTTPS,照样倒在国内伟大的防火墙之下。根据 HTTPS 加密通信的特点,同时 CA 加持,原则上墙是不可能知道通信的内容。那么在 HTTPS 通信时,墙是怎么识别出来并阻断的?个人认为有三个可切入的点:

  • DNS 污染,返回错误的 IP 地址;
  • 直接把域名的所有 IP 封掉;
  • 根据 HTTPS 的交互流程,客户端和服务器协商密钥阶段的数据均为明文,获取密钥后才会加密数据(包括 URL)。协商阶段的证书必然出现网站主机名,防火墙在这个阶段可识别并阻断。

以上想法出自个人猜测。

总结:通信的私钥应该总是被妥善保管,在不可靠的网络环境下通信,证书能避免中间人攻击。

CSR、PEM、keystore 等

苹果开发会接触到 CSR、证书,安卓开发会用到 keystore,web 开发会用到 PEM、密钥、证书、jks 等。这些都是什么?

CSR(Certificate Sign Request)、公钥、密钥和证书归属为一类。CSR 用来获取证书,包含申请人的公钥、邮件等证明身份的信息。证书颁发机构(可以是自己)收到 CSR 后签发证书,生成的证书中包含公钥、有效期、持有人等信息。私钥可单独生成,也可在生成 CSR 的同时生成。整个过程中,私钥应当都要被妥善保管,不能泄露。

keystore、PEM、cer/crt、key 等文件存储格式可归为一类。Java KeyStore(文件后缀 .keystore 或 .jks)是 Java 常用的存储密钥和证书的文件格式,需要设置文件密码、别名和别名密码,安卓打包和部署 Tomcat 时会用到;PEM(Privacy Enhanced Mail)以文本形式存放私钥和证书(链);cer/crt 和 key 分别用来存放证书和密钥;另外一种常见的格式是 pfx 和 p12,同 jks 格式,这类文件一般是二进制,访问需要密码。

PKI(Public key infrastructure)体系构建在公钥加密基础之上,主要解决证书的颁发和管理问题。证书管理中应用广泛的两个标准是 X509 和 PKCS。遵循 X509 标准的证书文件结尾多为 PEM、der、crt 等;遵循 PKCS 标准的证书常用后缀名是 pfx、p12 等。

本次对接晕乎的第二个地方是一处地方读取密钥需要密码,另一处直接读取。根据存储格式可知原因:访问遵循 PKCS#12 标准的 pfx 文件需要密码,遵循 X509 规范的 PEM 文件则可直接查看内容。

OpenSSL

OpenSSL 是通用的加密库,openssl 是基于它的命令行工具,上文提到的内容基本都在其功能范围内。另一个与 openssl 类似的工具是 GPG(GNU Privacy Guard),区别是 OpenSSL 遵循 X509 标准,GPG 遵循 OpenPGP 标准。两者加密的文件在格式上有所差异,无法解开对方加密过的文件。OpenSSL 和 GPG 内置在大多数 *nix 系统中,可直接使用。

以下示例基于 OpenSSL,GPG 的用法可查看文中最后的参考文献。

openssl 命令的 man 页面描述了其能力范围:

The openssl program is a command line tool for using the various cryptography functions of

OpenSSL's crypto library from the shell. It can be used for

	o  Creation and management of private keys, public keys and parameters

	o  Public key cryptographic operations

	o  Creation of X.509 certificates, CSRs and CRLs

	o  Calculation of Message Digests

	o  Encryption and Decryption with Ciphers

	o  SSL/TLS Client and Server Tests

	o  Handling of S/MIME signed or encrypted mail

	o  Time Stamp requests, generation and verification

接下来看一些简单的 openssl 使用示例:

md5:

echo tlanyan | openssl md5

## 结果与下条命令相同

echo tlanyan | md5sum

aes 加解密:

# 用法

# openssl aes-128-cbc -e -in 加密文件 -out 解密文件 -pass pass:密码

# 例如

echo tlanyan > input

openssl aes-128-cbc -e -in input -out output -pass pass:1234567890abcdef

# 加密的内容在output中

# 解密

openssl aes-128-cbc -d -in output -o origin -pass pa:1234567890abcdef

生成 CSR、签发证书:

# 先生成csr和私钥

# 注意使用-nodes选项,否则私钥会有密码,用在nginx启动时需要手动输入

openssl req -new -out tlanyan.csr -newkey rsa:2048 -nodes -keyout tlanyan.priv.key

# 接下来的交互里填入一些基本信息,完毕后会生成tlanyan.csr和tlanyan.priv.key两个文件

# csr的格式如下:

# -----BEGIN CERTIFICATE REQUEST-----

# xxxx

# -----END CERTIFICATE REQUEST-----

# 密钥文件的格式类似

# 有了csr,接下来为自己签发证书

openssl req -x509 -sha256 -nodes -days 365 -in tlanyan.csr -key tlanyan.priv.key -out tlanyan.crt

# 命令结束后,目录中出现tlanyan.crt的证书文件

# 校验密钥

openssl rsa -in tlanyan.priv.key --check

# 校验csr

openssl req -in tlanyan.csr -verify

# 校验证书

openssl x509 -in tlany.**crt -text -n**ooutPEM

转换各种不同格式的证书:

# 将pem格式转换成pfx/p12格式

openssl pkcs12 -export -out tlanyan.pfx -inkey tlanyan.priv.key -in tlaPEMn.crt

# 将pfx格式转换成pem格式

openssl pkcs12 -in tlanyan.pfx -out tlanyan.cer -nodes

# 生成的tlanyan.cer文件包含了证书和公钥,对应导入前的tlanyan.crt和tnPEM . pri v.key两个文件

pem 和 jks 的格式转换太过复杂, 具体请看 Oracle 的文档。

以上演示的只是 openssl 工具包中的极小一部分命令。更多的用法请参考官方文档。

总结

本文介绍了非对称加密和证书的相关概念,并演示了 openssl 命令的一些基本用法,希望能够帮助到对这方面内容有疑惑的读者。文章涉及内容较多,理解上稍显难度。另外本文参考了不少文章,理解上的不到之处敬请指正。

感谢阅读!

参考

作者介绍

tlanyan,多年 web 开发经验,现为某创业公司技术主管。兴趣爱好广泛,重点关注 web 和服务端开发。个人博客:https://tlanyan.me


本文系作者投稿文章。欢迎投稿。

投稿内容要求

  • 互联网技术相关,包括但不限于开发语言、网络、数据库、架构、运维、前端、DevOps(DevXXX)、AI、区块链、存储、移动、安全、技术团队管理等内容。
  • 文章不需要首发,可以是已经在开源中国博客或网上其它平台发布过的。但是鼓励首发,首发内容被收录可能性较大。
  • 如果你是记录某一次解决了某一个问题(这在博客中占绝大比例),那么需要将问题的前因后果描述清楚,最直接的就是结合图文等方式将问题复现,同时完整地说明解决思路与最终成功的方案。
  • 如果你是分析某一技术理论知识,请从定义、应用场景、实际案例、关键技术细节、观点等方面,对其进行较为全面地介绍。
  • 如果你是以实际案例分享自己或者公司对诸如某一架构模型、通用技术、编程语言、运维工具的实践,那么请将事件相关背景、具体技术细节、演进过程、思考、应用效果等方面描述清楚
  • 其它未尽 case 具体情况具体分析,不虚的,文章投过来试试先,比如我们并不拒绝就某个热点事件对其进行的报导、深入解析。

投稿方式

重要说明

  • 作者需要拥有所投文章的所有权,不能将别人的文章拿过来投递。
  • 投递的文章需要经过审核,如果开源中国编辑觉得需要的话,将与作者一起进一步完善文章,意在使文章更佳、传播更广。
  • 文章版权归作者所有,开源中国获得文章的传播权,可在开源中国各个平台进行文章传播,同时保留文章原始出处和作者信息,可在官方博客中标原创标签。

© 著作权归作者所有

共有 人打赏支持
编辑部的故事

编辑部的故事

粉丝 1142
博文 248
码字总数 430631
作品 0
深圳
运营/编辑
加载中

评论(18)

t
tlanyan

引用来自“方小葱”的评论

引用来自“tlanyan”的评论

引用来自“mark35”的评论

不可逆加密
========
不要自己发明名词。不存在“不可逆加密“——有加密就有对应的解密。
正确名词是“散列算法”也称 HASH算法

@mark35 哈希函数是one-way function
摘要是摘要~加密是加密~
摘要不是"不可逆加密"~
不要觉得很多人使用MD5对密码摘要保存就觉得MD5就是加密算法~
加密需要保留明文的全部信息,反过来说,加密的数据一定是可以解密的~~~~
这是概念性问题~

@方小葱 受教
mark35
mark35

引用来自“tlanyan”的评论

引用来自“mark35”的评论

不可逆加密
========
不要自己发明名词。不存在“不可逆加密“——有加密就有对应的解密。
正确名词是“散列算法”也称 HASH算法

@mark35 哈希函数是one-way function

引用来自“方小葱”的评论

摘要是摘要~加密是加密~
摘要不是"不可逆加密"~
不要觉得很多人使用MD5对密码摘要保存就觉得MD5就是加密算法~
加密需要保留明文的全部信息,反过来说,加密的数据一定是可以解密的~~~~
这是概念性问题~
大学有门课程叫做“数据结构”。非科班的一般分不清 摘要算法、hash算法、散列算法与加密算法的区别

@红薯 这个评论回复模态框的退出设计太弱智了:输入了一长段文字,在取消输入法选择时摁了个ESC然后这个模态框就消失了……消失了! 至少也要判断下输入内容为空才直接关闭模态框啊!
方小葱
方小葱
原因是某些算法不能加解密(DH、DSA),或者效率太低(RSA),或者能处理的数据大小有限制(RSA)。而对称加密算法的有点是速度快、加密强度高。常用非对称算法获得共享密钥,之后用对称加密处理数据。
=====
优先选择对称算法加密大量数据的主要原因其实就是因为效率,不是所谓的"不能解密"和"大小限制",对称加密比如很多移位密码加密的内容长度是有限和固定的~这一点可以通过对数据进行分块(超出固定长度)或者补齐(不足长度时候)来实现~支付行业一般使非对称算法交换秘钥,或校验/签名验证等场景~
方小葱
方小葱

引用来自“tlanyan”的评论

引用来自“mark35”的评论

不可逆加密
========
不要自己发明名词。不存在“不可逆加密“——有加密就有对应的解密。
正确名词是“散列算法”也称 HASH算法

@mark35 哈希函数是one-way function
摘要是摘要~加密是加密~
摘要不是"不可逆加密"~
不要觉得很多人使用MD5对密码摘要保存就觉得MD5就是加密算法~
加密需要保留明文的全部信息,反过来说,加密的数据一定是可以解密的~~~~
这是概念性问题~
t
tlanyan

引用来自“须臾时光”的评论

写错 是id_rsa 私钥
私钥为777,openssh的客户端会提示“bad permission”。这个提示是客户端实现的,不排除某些客户端忽略权限问题
须臾时光
须臾时光
写错 是id_rsa 私钥
须臾时光
须臾时光
我在虚拟机上试了下 id_rsa.pub 权限改为 777 , openssh并没有拒绝服务而是正常连接上服务器了。是不是在某个地方还有个开关
t
tlanyan

引用来自“iman123”的评论

1. 原因是某些算法不能加解密(DH、DSA)这里和上面说的非对称加密算法,加密和解密使用不同的密钥,包括DH\DSA是不是矛盾了
2. echo tlanyan | md5sum有问题,echo tlanyan会多一个换行,应该是 echo -n tlanyan | md5sum 吧

@iman123 dh是密钥交换算法,用两个密钥协商出公共密钥;dsa是签名算法,用私钥签名,公钥验证,也是非对称的;不加-n选项是会将换行符一起计算,感谢指正!
t
tlanyan

引用来自“mark35”的评论

不可逆加密
========
不要自己发明名词。不存在“不可逆加密“——有加密就有对应的解密。
正确名词是“散列算法”也称 HASH算法

@mark35 哈希函数是one-way function
老牛拉货车
老牛拉货车
我是eechen 每条评论我都得百度半天 给我点赞吧 我啥都懂。
SSL协议之数据加密过程详解

前言 总括: 本文详细讲述了SSL协议中的数据加密的过程,数字证书、对称加密、非对称加密和SSL握手过程等概念。 原文博客地址:SSL协议之数据加密过程详解 知乎专栏&&简书专题:前端进击者(...

Damonare
2017/12/31
0
0
区块链100讲:SSL协议之数据加密过程详解

本讲详细讲述了SSL协议中的数据加密的过程,数字证书、对称加密、非对称加密和SSL握手过程等概念。 1 SSL 只要你听过HTTPS,不可能没听过SSL协议吧,SSL协议是一种安全协议。对于互联网协议没...

HiBlock
08/31
0
0
HTTPS安全基础

如何用网络安全的知识来解释HTTPS的加密过程将是这一篇文章重点讲解的内容,首先通过网络安全基础我们知道加密分为对称加密和非对称加密,对称加密速度快,通常用在加密数据,难度在于管理密...

terry_hding
2016/06/21
49
0
kubernetes traefik配置https实践操作记录

1.参考文档 http://traefik.cn/ 2.访问方式简易说明 参考文档 https://tonybai.com/2018/06/25/the-kubernetes-ingress-practice-for-https-service/ 前面一篇:traefik基础部署记录,介绍了...

am2012
08/02
0
0
分布式系列四: HTTP及HTTPS协议

分布式系列四: HTTP及HTTPS协议 非常全面的一篇HTTP的文章: 关于HTTP协议,一篇就够了 还有一个帮助理解HTTPS的文章: 也许,这样理解HTTPS更容易 本文的一些描述摘自这篇文章 HTTP协议 Http...

罪恶斯巴克
09/18
0
0

没有更多内容

加载失败,请刷新页面

加载更多

初级开发-编程题

` public static void main(String[] args) { System.out.println(changeStrToUpperCase("user_name_abc")); System.out.println(changeStrToLowerCase(changeStrToUpperCase("user_name_abc......

小池仔
41分钟前
3
0
现场看路演了!

HiBlock
昨天
6
0
Rabbit MQ基本概念介绍

RabbitMQ介绍 • RabbitMQ是一个消息中间件,是一个很好用的消息队列框架。 • ConnectionFactory、Connection、Channel都是RabbitMQ对外提供的API中最基本的对象。Connection是RabbitMQ的s...

寰宇01
昨天
6
0
官方精简版Windows10:微软自己都看不过去了

微软宣布,该公司正在寻求解决方案,以减轻企业客户的Windows 10规模。该公司声称,企业客户下载整个Windows 10文件以更新设备既费钱又费时。 微软宣布,该公司正在寻求解决方案,以减轻企业...

linux-tao
昨天
6
0
TypeScript基础入门之JSX(二)

转发 TypeScript基础入门之JSX(二) 属性类型检查 键入检查属性的第一步是确定元素属性类型。 内在元素和基于价值的元素之间略有不同。 对于内部元素,它是JSX.IntrinsicElements上的属性类型...

durban
昨天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部