Lucene系列(12)索引格式之nvm文件

本文使用 Lucene 代码版本：8.7.0

本文学习一下。nvm 文件的格式与内容。

nvm 与 nvd 文件配合存储了索引中的标准化相关信息。其中 nvm 存储了元数据，nvd 文件存储了标准化后的值及相关 docId 信息。

.pay 文件整体结构

2021-03-18-11-52-53

字段解释：

FileNumber: 域的编号
docsWithFieldOffset: 这个域有值的所有 docId, 在 nvd 文件中开始存储的文件指针，注意有两个特殊值。-1 代表每个文档在这个域都有值，-2 代表所有文档在这个域都没有值。
docsWithFieldLength: 这个域有值的所有 docId，存储在 nvd 文件中的长度。如果 docsWithFieldOffset 为-1/-2 两个特殊值，那么这个值为 0.
jumpTableEntryCount: 把这个域有值的所有 docId 存储为了多少个块。
DenseRankPower: 存储所有的 docId 的时候，使用密集策略的话，存储的块的大小的是 2 的多少次幂。
numBytesPerValue: 每一个值占用的字节数量，因此采用的增量编码，所以使用 docId 的最大最小值的差值，来决定使用 byte, short, int, long 的哪种。
minDocId: 如果每一个值占用的字节数量为 0, 说明所有的 docId 是一样，也就是说只有一个 doc。在这里记录最小值，就意味着存储了所有的 docID.
normsOffset: 如果不是所有 docId 都一样，也就是说有多个 docId。那么这里存一下所有的标准化值在 nvd 文件中存储的起始文件位置。