什么是 LFU 算法？

更新日期: 2022-03-28阅读量: 6标签: 算法分享

扫一扫分享

上次的文章介绍了 LRU 算法，今天打算来介绍一下 LFU 算法。在上篇文章中有提到， LFU（Least frequently used：最少使用）算法与 LRU 算法只是在淘汰策略上有所不同，LRU 倾向于保留最近有使用的数据，而 LFU 倾向于保留使用频率较高的数据。

举一个简单的例子：缓存中有 A、B 两个数据，且已达到上限，如果数据 A 先被访问了 10 次，然后数据 B 被访问 1 次，当存入新的数据 C 时，如果当前是 LRU 算法，会将数据 A 淘汰，而如果是 LFU 算法，则会淘汰数据 B。

简单来说，就是在 LRU 算法中，不管访问的频率，只要最近访问过，就不会将这个数据淘汰，而在 LFU 算法中，将访问的频率作为权重，只要访问频率越高，该数据就越不会被淘汰，即使该数据很久没有被访问过。

我们还是通过一段 JavaScript 代码来实现这个逻辑。

class LFUCache {
    freqs = {} // 用于标记访问频率
    cache = {} // 用于缓存所有数据
    capacity = 0 // 缓存的最大容量
    constructor (capacity) {
    // 存储 LFU 可缓存的最大容量
        this.capacity = capacity
    }
}

与 LRU 算法一样，LFU 算法也需要实现 get 与 put 两个方法，用于获取缓存和设置缓存。

class LFUCache {
  // 获取缓存
    get (key) { }
  // 设置缓存
    put (key, value) { }
}

老规矩，先看设置缓存的部分。如果该缓存的 key 之前存在，需要更新其值。

class LFUCache {
  // cache 作为缓存的存储对象
  // 其解构为: { key: { freq: 0, value: '' } }
  // freq 表示该数据读取的频率；
  // value 表示缓存的数据；
    cache = {}
  // fregs 用于存储缓存数据的频率
  // 其解构为: { 0: [a], 1: [b, c], 2: [d] }
  // 表示 a 还没被读取，b/c 各被读取1次，d被读取2次
  freqs = {}
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在，则重置缓存的值
      cache.value = value
      // 更新使用频率
      let { freq } = cache
      // 从 freqs 中获取对应 key 的数组
      const keys = this.freqs[freq]
      const index = keys.indexOf(key)
      // 从频率数组中，删除对应的 key
      keys.splice(index, 1)
      if (keys.length === 0) {
        // 如果当前频率已经不存在 key
        // 将 key 删除
        delete this.freqs[freq]
      }
      // 更新频率加 1
      freq = (cache.freq += 1)
      // 更新频率数组
      const freqMap =
            this.freqs[freq] ||
            (this.freqs[freq] = [])
      freqMap.push(key)
      return
    }
  }
}

如果该缓存不存在，要先判断缓存是否超过容量，如果超过，需要淘汰掉使用频率最低的数据。

class LFUCache {
  // 更新频率
  active (key, cache) {
    // 更新使用频率
    let { freq } = cache
    // 从 freqs 中获取对应 key 的数组
    const keys = this.freqs[freq]
    const index = keys.indexOf(key)
    // 从频率数组中，删除对应的 key
    keys.splice(index, 1)
    if (keys.length === 0) {
      // 如果当前频率已经不存在 key
      // 将 key 删除
      delete this.freqs[freq]
    }
    // 更新频率加 1
    freq = (cache.freq += 1)
    // 更新读取频率数组
    const freqMap = this.freqs[freq] || (this.freqs[freq] = [])
    freqMap.push(key)
  }
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在，则重置缓存的值
      cache.value = value
      this.active(key, cache)
      return
    }
    // 判断缓存是否超过容量
    const list = Object.keys(this.cache)
    if (list.length >= this.capacity) {
      // 超过存储大小，删除访问频率最低的数据
      const [first] = Object.keys(this.freqs)
      const keys = this.freqs[first]
      const latest = keys.shift()
      delete this.cache[latest]
      if (keys.length === 0) delete this.freqs[latest]
    }
    // 写入缓存，默认频率为0，表示还未使用过
    this.cache[key] = { value, freq: 0 }
    // 写入读取频率数组
    const freqMap = this.freqs[0] || (this.freqs[0] = [])
    freqMap.push(key)
  }
}

实现了设置缓存的方法后，再实现获取缓存就很容易了。

class LRUCache {
  // 获取数据
    get (key) {
        if (this.cache[key] !== undefined) {
        // 如果 key 对应的缓存存在，更新其读取频率
      // 之前已经实现过，可以直接复用
            this.active(key)
            return this.cache[key]
        }
        return undefined
  }
}

关于 LFU 缓存算法实现就到这里了，当然该算法一般使用双链表的形式来实现，这里的实现方式，只是为了方便理解其原理，感兴趣的话可以在网上搜索下更加高效的实现方式。

原文：https://segmentfault.com/a/1190000041617815

链接: https://www.fly63.com/article/detial/11301

Recommend

About trust in software systems

华为郭平：华为坚持不造车，已上市30多款智能汽车零部件

火锅造神「大败局」，幕后赢家浮出水面丨氪金

网红孵化忙下沉，乡镇区县有商机？

How to Create an Android Library

Good Old Daze

We can do better than “same, but electric”

Enter key does not work after encoding with java

server 端的 cannot assign requested address

蚂蚁SLG成为全球爆款后，爱奇艺“真战狼”手游《Wolf Game》海外开测

About Joyk