Redis的hmget操作复杂度问题

10 Oct 2016

目前负责的系统，强依赖于Redis，高并的接口压力和瓶颈都主要集中在Redis上，对Redis的操作基本都是hmget，最近遇到了一个性能瓶颈，花了些时间对hmget的源码做了些分析，以此记录下来，供大家参考。

遇到的性能问题

先简单介绍下背景，系统在使用hmget的时候，正常情况下都是请求10个不到的fields，但有些特殊场景会出现一次hmget100多个fields，甚至严重时会出现200个fields，我们在压测时发现一次请求200个fields的性能非常差，本以为200个fields的性能应该比10个fields的性能差1/20左右，但测试的结果却远不止。

难道hmget的操作复杂度不是O(N)?

Redis官网对于hmget的操作复杂度白纸黑字写得很清楚就是O(N)，N为请求的fields个数。

于是抱着怀疑的心态翻出Redis关于hmget的源码(Redis 3.0分支，t_hash.c)：

void hmgetCommand(redisClient *c) {
    robj *o;
    int i;

    /* Don't abort when the key cannot be found. Non-existing keys are empty
     * hashes, where HMGET should respond with a series of null bulks. */
    o = lookupKeyRead(c->db, c->argv[1]);
    if (o != NULL && o->type != REDIS_HASH) {
        addReply(c, shared.wrongtypeerr);
        return;
    }

    addReplyMultiBulkLen(c, c->argc-2);
    for (i = 2; i < c->argc; i++) {
        addHashFieldToReply(c, o, c->argv[i]);
    }
}

代码里最后其实是遍历各个请求的fields，然后调用addHashFieldToReply方法，将value一个一个找出来：

static void addHashFieldToReply(...){
	...
	if (o->encoding == REDIS_ENCODING_ZIPLIST) {
		...
	} else if (o->encoding == REDIS_ENCODING_HT) {
		...
	}
}

看到这段if/else似乎明白了什么，之前的文章Redis内存优化实践里提到的关于hash底层存储结构ziplist，其实它就是一个数组，而数组的查找是需要遍历里面的元素的，和hashtable的O(1)不同。我们系统采用的也正是ziplist的压缩结构 (由于数据量太大，ziplist结构可以省大量内存)。所以，对于ziplist的hmget操作复杂度应该不是O(N)。

让我们来进一步看看源码，验证这个猜测，看进第一个if里对ziplist结构的处理代码：

if (o->encoding == REDIS_ENCODING_ZIPLIST) {
        unsigned char *vstr = NULL;
        unsigned int vlen = UINT_MAX;
        long long vll = LLONG_MAX;

        ret = hashTypeGetFromZiplist(o, field, &vstr, &vlen, &vll);
        if (ret < 0) {
            addReply(c, shared.nullbulk);
        } else {
            if (vstr) {
                addReplyBulkCBuffer(c, vstr, vlen);
            } else {
                addReplyBulkLongLong(c, vll);
            }
        }
} 

看到这里，我们还是先回顾一下之前文章里提到的ziplist数据结构吧：

<zlbytes><zltail><zllen><entry><entry>...<entry><zlend>

除掉头尾，中间都是各个entry直接拼起来，hash里的每个field和value都是一个entry，field的entry后面跟着的就是它的value的entry，而每个entry又分为2个header和content，一个header是前一个entry的长度，另一个header是这个entry的encoding及string content的长度(如果是string的话)，简单来说在ziplist里识别entry是通过长度来判断的。

再看回上面的代码里，针对ziplist的情况，对一个field的value查找分成了两步：一、先通过hashTypeGetFromZiplist方法查找field对应在ziplist里的位置，从而判断出value的位置vstr；二、再通过value entry的header里记录的value的长度，找出对应的value值。

看看hashTypeGetFromZiplist里是如何查找field的:

...
fptr = ziplistIndex(zl, ZIPLIST_HEAD);
if (fptr != NULL) {
        fptr = ziplistFind(fptr, field->ptr, sdslen(field->ptr), 1);
        if (fptr != NULL) {
            /* Grab pointer to the value (fptr points to the field) */
            vptr = ziplistNext(zl, fptr);
            redisAssert(vptr != NULL);
        }
}
...

大致可以看出，查找的过程是从ziplist的第一个entry开始，通过ziplistFind方法查找field，然后推算出field的value在ziplist的位置。ziplistFind方法源码(ziplist.c):

...
while (p[0] != ZIP_END) {
	...
	if (len == vlen && memcmp(q, vstr, vlen) == 0) {
        	return p;
    }
}
...

果然，猜测是对的，ziplist对field的查找就是遍历比较的方式。所以hmget对一个field的查找是O(M)复杂度，M为存储在hash里的实际field总数¹，再根据field找出对应的value值就只是一个根据长度取出具体值的过程。

最后，对于ziplist结构的hmget操作复杂度应该是O(N*M)，N为请求的fields数量，M为这个hash里一共有的fields数量。而对于hashtable结构的hmget操作自然是O(N)了。

问题怎么解决

由于用了ziplist的结构，O(N*M)的复杂度就摆在那里，N和M也没办法减少。换个角度，既然要查那么多fields(在我们的业务场景里，很多fields可能是不存在/没数据的)，所以我们能不能一次hgetall把M个fields都拿出来，应用再自己和N做匹配过滤，那关于hgetall的实现，有兴趣的同学可以研究下，效率比hmget 200个fields高很多。

使用hgetall会不会有其他风险？存储在hash里的fields一旦增多了，效率也会降低；数据量大了，超过一个MTU包大小，效率也会降低；fields数量超过512个，ziplist变hashtable，怎么办？

我们的做法，如果一次请求30个以下fields，继续使用hmget，75%的情况都是这种正常的请求；剩下的超过30个fields，就用hgetall一次拿出来，交给应用处理。同时，需要定期检查redis里的hash数据的长度，防止长度慢慢增加而出现其他的问题。

总结：“知己知彼，方能百战百胜”

对于Hash，Set等数据结构，由于Redis所采用的底层的存储结构可能出现不同，对一些操作的使用需要格外小心。而且这个底层存储结构在数据发生变化后可能还会自我调整，比如hash的entry个数超过512(默认值)后，会从ziplist变成hashtable结构等，这些变化，不仅对存储有影响，对一些操作的效率也一样有影响，所以开发同学必须非常了解自己的应用所存放在redis的数据变化情况，避免掉坑。

M为存储在hash里的实际field总数, 细心的读者会发现，entry既有field也有value，遍历的话应该是field个数的2倍，这里Antirez做了一个小手脚，既然entry是field1,value1,field2,value2这样成对出现，在遍历的fields的时候，可以跳跃式比较，节省了一半。可见，Antirez对待这些细节也是非常认真的。 ↩

Neway's Backyard About Technology

Don't find fault. Find a remedy. -- Henry Ford

Redis的hmget操作复杂度问题

遇到的性能问题

难道hmget的操作复杂度不是O(N)?

问题怎么解决

总结：“知己知彼，方能百战百胜”