NOSQL

原创
2019/02/18 14:42
阅读数 230

一、NoSQL介绍

前期一直用的数据库mysql,属于关系型数据库。现介绍一款非关系型数据库——NoSQL;NoSQL=Not Only SQL,意为“不仅仅是SQL”,即非关系型数据库。

  • 对于关系型数据库(mysql)来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行地去匹配,当量非常大的时候就很耗费时间和资源,尤其是数据是需要从磁盘里去检索。
  • NoSQL数据库存储原理非常简单(典型的数据类型为k-v),不存在繁杂的关系链,比如mysql查询的时候,需要找到对应的库、表(通常是多个表)以及字段。
  • NoSQL数据可以存储在内存里,查询速度非常快;
  • NoSQL在性能表现上虽然能优于关系型数据库,但是它并不能完全替代关系型数据库;
  • NoSQL因为没有复杂的数据结构,扩展非常容易,支持分布式;
  • NoSQL特点
    • 易扩展;
    • 大数据量,高性能;
    • 多样灵活的数据模型。

1.1 系型数据库和非关系型数据库

  • 关系型数据库

例如京东或者淘宝这些大型电商平台,有着很庞大的数据结构体系,有用户表,商品表,用户信息,商品信息,等当产生一个订单的时候,或者查询数据,是哪个用户,在什么时间,购买了哪些商品,当调取一个用户在某个时间买了什么东西的时候这些数据是存在一定的关联的。

  • 非关系型数据库

NoSQL的存在就是不需要这些错综复杂的理念,一个key对应一个value。例如一个用户下对应着他的采购订单。且数据全部存在闪存中。不需要再次从磁盘中调取。

NoSQL是不可以替代Mysql独立存在的。例如现实运维环境中,我们一台WEB安装了一个Discuz,随着访问量的增加,数据库扛不住那么大的压力;怎么办呢?我们设置一个NoSQL,当用户读取完毕后会直接放在NoSQL中,当用户再次读取的时候,会直接从缓存中读取,不需要再次从数据库中读取。帖子的ID就类似于Key,帖子的内容就类似于Value。

NoSQL因为没有复杂的数据结构,扩展非常容易,支持分布式。所以扩展也比较容易。如果你的A服务器受到瓶颈,增加服务器让让其继续缓存呗,因为不像关系型数据库需要互相关联,NoSQL直接横向扩展即可!

mysql的话只有前面说到的主主,主从,多主多从针对从进行负载均衡。要么就是分库分表,前提是关联的数据库不可以分开,不关联的数据库可以分开。

1.2 常见NoSQL数据库

  • k-v形式的:memcached、redis

适合储存用户信息,比如会话、配置文件、参数、购物车等等。这些信息一般都和ID(键)挂钩,这种情景下键值数据库是个很好的选择。

  • 文档数据库:mongodb

将数据以文档的形式储存。每个文档都是一系列数据项的集合。每个数据项都有一个名称与对应的值,值既可以是简单的数据类型,如字符串、数字和日期等;也可以是复杂的类型,如有序列表和关联对象。数据存储的最小单位是文档,同一个表中存储的文档属性可以是不同的,数据可以使用XML、JSON或者JSONB等多种形式存储。

  • 列存储: Hbase

  • 图存储: Neo4J、Infinite Graph、OrientDB

二、Memcached 介绍

2.1 Memcached概念及特点

Memcached是国外社区网站LiveJournal团队开发,目的是为了通过缓存数据库查询结果,减少数据库访问次数,从而提高动态web站点性能。

  • 数据结构简单(k-v),数据存放在内存里
  • 多线程
  • 基于c/s架构,协议简单(你需要先启动一个服务,然后用这个服务进行通信??)
  • 基于libevent的事件处理
  • 自主内存存储处理(slab allowcation)
  • 数据过期方式:Lazy Expiration 和 LRU
  • Memcached的数据流向

2.2 Memcached的数据流向

常规作业流程是:用户发起请求给NGINX,然后再次调用PHP,PHP和mysql打交道,当用户PHP获取到请求转给NGINX,NGINX再次把请求数据交给用户。

如果并发量很大,请求mysql的队列比较多,耗费资源,时间。

因此如图,增加一个缓存层Memcached。这样访问过的数据全部丢在缓存中,当再次请求这个数据的时候就直接从Memcached读取,少数据库访问次数,以提高动态web应用的速度、提高可扩展性。

2.3 Slab allocation

其原理为

将分配的内存分割成各种尺寸的块(chunk), 并把尺寸相同的块分成组(chunk的集合),每个chunk集合被称为slab。

Memcached的内存分配以Page为单位,Page默认值为1M,可以在启动时通过-I 参数来指定。

Slab是由多个Page组成的,Page按照指定大小切割成多个chunk。

2.4 Growth factor

  • Memcached在启动时通过-f选项可以指定 Growth Factor因子。该值控制chunk大小的差异。默认值为1.25。
  • 通过memcached-tool命令查看指定Memcached实例的不同slab状态,可以看到各Item所占大小(chunk大小)差距为1.25
  • 命令:# memcached-tool 127.0.0.1:11211 display

2.5 Memcached的数据过期方式

Memcached的数据过期方式,有两种形式:

- Lazy Expiration

Memcached 内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。这种技术被称为lazy(惰性)expiration。因此,Memcached不会在过期监视上耗费CPU时间。

- LRU

Memcached会优先使用已超时的记录的空间,但即使如此,也会发生追加新记录时空间不足的情况,此时就要使用名为Least Recently Used(LRU)机制来分配空间。顾名思义,这是删除“最近最少使用”的记录的机制。因此,当内存空间不足时(无法从slab class获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。从缓存的实用角度来看,该模型十分理想。

 三、安装Memcached

2.启动memcached

/usr/bin/memcached -u memcached -p 11211 -m 64 -c 1024

此为默认启动设置:p 端口 m 64M -c 指定最大并发数 -u指定运行memcached服务的用户

如果想要修改上面的用户以及监听端口等可以修改配置文件vi /etc/sysconfig/memcached

命令也可以进行启动

[root@localhost ~]# /usr/bin/memcached -u memcached -p 11211 -m 64 -c 1024

四、查看memcached状态

还可以使用echo stats |nc 127.0.0.1 11211 来进行查看memcached的状态 首先要进行安装nc 命令

如果安装了libmemcached这个库文件可以 memstat --servers=127.0.0.1:11211来查看memcached的状态

五、Memcached语法应用

5.1 Memcached命令行

Memcached类似于mysql一样,同样支持类似于mysql中创建一个库,创建一个表,插入一个表,查看表数据等。

首先需要安装 telnet 命令

[root@localhost ~]# yum install -y telnet

连接 Memcached,进行一些操作:

简单释义:

手动存储一个数据: set key2 0 30 2

其中key2 代表着 key值

  • 0代表着 flags 标记
  • 30代表着 过期时间
  • 2代表着 2个字节

5.2 Memcached语法规则

Memcached语法标准格式:

<command name> <key> <flags> <exptime> <bytes>\r\n <data block>\r\n

  • 注:\r\n在windows下是Enter键
  • <command name> 可以是set, add, replace
    • set表示按照相应的<key>存储该数据,没有的时候增加,有的时候覆盖
    • add表示按照相应的<key>添加该数据,但是如果该<key>已经存在则会操作失败
    • replace表示按照相应的<key>替换数据,但是如果该<key>不存在则操作失败。
  • <key> 客户端需要保存数据的key
  • <flags> 是一个16位的无符号的整数(以十进制的方式表示)。该标志将和需要存储的数据一起存储,并在客户端get数据时返回。客户端可以将此标志用做特殊用途,此标志对服务器来说是不透明的。
  • <exptime> 为过期的时间。若为0表示存储的数据永远不过期(但可被服务器算法:LRU 等替换)。如果非0(unix时间或者距离此时的秒数),当过期后,服务器可以保证用户得不到该数据(以服务器时间为标准)。
  • <bytes> 需要存储的字节数,当用户希望存储空数据时<bytes>可以为0
  • <data block>需要存储的内容,输入完成后,最后客户端需要加上\r\n(直接点击Enter)作为结束标志。

六、Memcached数据导出和导入 

1.我们首先先创建几个数据,当数据导出的时候数据已经过期了,如果想导入的话就要把时间戳进行修改一下才可以导入,不然导入之后为空

2.导出数据

3.导入数据使用nc命令

七、 php连接memcached

7.1 安装memcache扩展

下载memcache包、解压

[root@localhost src]# wget http://www.apelearn.com/bbs/data/attachment/forum/memcache-2.2.3.tgz

执行文件编译安装

./configure --with-php-config=/usr/local/php-fpm/bin/php-config
make
make install

7.2 在php.ini加载memcache

在php.ini添加此语句,让调用此扩展模块

7.3测试

八、memcached中存储session

应用场景:为LNMP架构下做的负载均衡。

假如第一次登录是在A服务器上,第二次登录是在B服务器上,假如使用的是nginx代理upstream可以使用ip_hash;如果使用LVS呢?

解决方法是:把session不存在服务器的磁盘上,而是存在memcached上去。memcached作为一个公共的服务器,任何web服务器都可以连接!

先下载一个php的脚本文件,之后移动到nginx的默认主机下面

为了存放在memcached里面这里要在php.ini里面增加以下内容

下面就要重启并进行检测做的是否正确

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部