RESP协议
简介
Redis 的客户端和服务端之间采取了一种独立名为 RESP(REdis Serialization Protocol) 的协议,作者主要考虑了以下几个点:
- 容易实现
- 解析快
- 人类可读
注意:RESP 虽然是为 Redis 设计的,但是同样也可以用于其他 C/S 的软件。
数据类型及示例
RESP 主要可以序列化以下几种类型:整数,单行回复(简单字符串),数组,错误信息,多行字符串。Redis 客户端向服务端发送的是一组由执行的命令组成的字符串数组,服务端根据不同的命令回复不同类型的数据,但协议的每部分都是以 “\r\n” (CRLF) 结尾的。另外 RESP 是二进制安全的,不需要处理从一个进程到另一个进程的传输,因为它使用了前缀长度进行传输。
知乎上貌似没有这个问题的现成答案,我看了下wikipedia,试着举个例子, c中的strlen函数就不算是binary safe的,因为它依赖于特殊的字符'\0’来判断字符串是否结束,所以对于字符串str = “1234\0123"来说, strlen(str)=4 而在php中,strlen函数是binary safe的,因为它不会对任何字符(包括'\0')进行特殊解释,所以在php中, strlen(str)=8 所以,我理解的二进制安全的意思是:只关心二进制化的字符串,不关心具体格式.只会严格的按照二进制的数据存取。不会妄图已某种特殊格式解析数据。通俗来说就是给你什么东西你就怎么存,好处是反序列化的时候不会有二义性,不会有这个语言认为int4个字节那个语言认为int3个字节的情况发生。序列化byte[]类型,要求两边协商好编解码。
演示
terminal1
terminal2
默认终端编码是utf8,也就是terminal1以utf8编码写入中文,terminal2以utf8编码读出中文,此时我们修改编码为utf7
再执行get操作
可以看到已经乱码了。所以要保证序列化和反序列化使用的同一套编码。
像是很多中间件为了要支持丰富的语言都是二进制安全的,像是zk、hbase、kafka等,使用中间件的两边需要商量好编解码,中间件只认字节数组。所以redis也可以使用图片作为key,当然没人这么干。
在 RESP 中, 一些数据的类型通过它的第一个字节进行判断:
- 单行回复:回复的第一个字节是 “+”
- 错误信息:回复的第一个字节是 “-“
- 整形数字:回复的第一个字节是 “:”
- 多行字符串:回复的第一个字节是 “$“
- 数组:回复的第一个字节是 “*”
单行回复
以 “+” 开头,以 “\r\n” 结尾的字符串形式。e.g.
|
|
响应的客户端库,应该返回除 “+” 和 CRLF 以外的内容,例如上面的内容,则返回 “OK”. e.g.
|
|
错误信息
错误信息和单行回复很像,不过是把 “+” 替换成了 “-“。而这两者之间真正的区别是,错误信息会被客户端视为异常,并且组成错误类型的是错误消息本身。e.g.
|
|
错误信息只在有错误发生的时候才会发送,比如数据类型错误,语法错误,或者命令不存在之类的。而当接收到错误信息的时候,客户端库应该抛出一个异常。e.g.
|
|
整数
这种类型只是只是使用以 “:” 作为前缀,以CRLF作为结尾的字符串来表示整数。e.g. “:666\r\n” 或者 “:999\r\n” 这种的都是整数回复。很多命令都会返回整数回复,例如 INCR LLEN LPUSH 之类的命令。但是多数情况下,返回的整数回复并没有过多实际含义,例如 LPUSH 就只是为了表示插入了几个值,但也有例如 EXISTS 命令是当结果为 true 的时候返回 1,false 返回 0 . e.g.
|
|
多行字符串
多行字符串被服务端用来返回长度最大为 512MB 的单个二进制安全的字符串。以 “$“ 开头, 后跟实际要发送的字节数,随后是 CRLF,然后是实际的字符串数据,最后以 CRLF 结束。所以,例如我们要发送一个 “moelove.info” 的字符串,那它实际就被编码为 “$12\r[http://nmoelove.info](https://link.zhihu.com/?target=http%3A//nmoelove.info)\r\n”。而如果一个要发送一个空字符串,则会编码为 “$0\r\n\r\n” 。某些情况下,当要表示不存在的值时候,则以 “$-1\r\n” 返回,这被叫做空多行字符串,当客户端库接收到这个响应的时候,同样应该返回一个空值(例如 nil)而不是一个空字符串。e.g.
|
|
数组
数组类型可用于客户端向服务端发送命令,同样的当某些命令将元素结合返回给客户端的时候,也是使用数组类型作为回复类型的。它以 “*” 开头,后面跟着返回元素的个数,随后是 CRLF, 再然后就是数组中各元素自己的类型了。最典型的是 LRRANGE 命令,返回一个列表中的元素。e.g.
|
|
演示
使用resp协议与服务端交互,不使用redis-cli
|
|
计算是如何识别的?
计算机看到的其实没有换行,首先看有几个元素,然后根据$
后的宽度进行切割
如果没有nc,也可以这样玩
注意
/dev/tcp
不是磁盘里的文件,而是bash的一个功能,所以需要先切换到bash
|
|
总结
RESP 协议还是相对易于理解的,另外理解了协议也方便对 Redis 一些问题的定位及客户端的实现。