时间:2021-07-01 10:21:17 帮助过:19人阅读
存储引擎将一些组件捆绑在一起并且提供一些额外的接口用来存储和查询序列化数据。
它由以下这些组件构成,每个组件扮演不同的角色:
内存索引是分区的索引,主要用于快速访问measurements,tags和series。
预写日志是write-optimized存储格式的数据,允许写入持久化,但不易查询,写入时执行附加操作。
文件前缀: _
文件扩展名 : .wal
文件名称看起来大概是这样: _000001.wal
文件名字中的数字是递增的,它是WAL段的索引。
当一个WAL段的大小大于10M时( DefaultSegmentSize = 10 * 1024 * 1024),它会关闭当前段并且创建一个新的段。
每个WAL段存储多个经压缩的写和删除的操作指令。
┌───────────────────────────────────────────────────────────┐ │ WALEntry │ ├──────────────┬──────────┬──────────┬───┬─────────────┬────┤ │ WALEntryType │ Data Len │ Data │...│WALEntryType │... │ │ 1 byte │ 4 bytes │ N bytes │ │ 1 byte │ │ └──────────────┴──────────┴──────────┴───┴─────────────┴────┘
WALEntryType : 用于标记数据操作类型(写入、删除、连续删除)
const ( WriteWALEntryType WalEntryType = 0x01 DeleteWALEntryType WalEntryType = 0x02 DeleteRangeWALEntryType WalEntryType = 0x03 )
Data len : 后面数据的长度
Data :经过snappy压缩后的数据
相关配置参数可以在文件中查看:
influxdb-1.1.0/tsdb/engine/tsm1/wal.go
WAL文件中的数据存储结构如下:
┌────────────────────────────────────────────────────────────────────┐ │ WriteWALEntry │ ├──────┬─────────┬────────┬───────┬─────────┬─────────┬───┬──────┬───┤ │ Type │ Key Len │ Key │ Count │ Time │ Value │...│ Type │...│ │1 byte│ 2 bytes │ N bytes│4 bytes│ 8 bytes │ N bytes │ │1 byte│ │ └──────┴─────────┴────────┴───────┴─────────┴─────────┴───┴──────┴───┘
字段描述如下:
Type(1 byte) : 表示value的类型(支持的类型有:浮点型,整型,布尔型,字符串型)
Key Len(2 bytes) : 指定紧跟其后的Key的长度
Key(N bytes) :key内容
Count(4 bytes) :后面跟的(Time + Value作为一个整体)数据的个数
Time(8 bytes) :单个value的时间戳
Value(N bytes) :需要存储的数据(支持的类型有:浮点型,整型,布尔型,字符串型)
当Value为字符串类型时,Value 由于两部分构成:字符串长度(4Bytes) + 字符串内容(长度由前面决定)
case *StringValue: if curType != stringEntryType { return nil, fmt.Errorf("incorrect value found in %T slice: %T", v[0].Value(), vv) } binary.BigEndian.PutUint32(dst[n:n+4], uint32(len(vv.value))) n += 4 n += copy(dst[n:], vv.value)
缓存是存储在WAL文件中的数据在内存中的一份拷贝,数据按key的方式组织,未压缩。
系统重启时,缓存会通过读取磁盘的WAL文件恢复。
TSM文件是Influxdb中最终存储数据的载体,整体结构如下:
┌────────┬────────────────────────────────────┬─────────────┬──────────────┐ │ Header │ Blocks │ Index │ Footer │ │5 bytes │ N bytes │ N bytes │ 8 bytes │ └────────┴────────────────────────────────────┴─────────────┴──────────────┘
由四部分组成: Header,Blocks,Index,Footer
Header用于标识文件类型及版本号,Blocks用于存储数据,Index为Blocks的索引信息,Footer用于标识Index在TSM文件中的偏移量,便于快速访问。
Header结构如下:
┌───────────────────┐ │ Header │ ├─────────┬─────────┤ │ Magic │ Version │ │ 4 bytes │ 1 byte │ └─────────┴─────────┘
Magic用于标识存储引擎类别,Version用于记录版本号,在influxdb1.1版本中定义如下:
MagicNumber uint32 = 0x16D116D1 Version byte = 1
Blocks结构如下:
┌───────────────────────────────────────────────────────────┐ │ Blocks │ ├───────────────────┬───────────────────┬───────────────────┤ │ Block 1 │ Block 2 │ Block N │ ├─────────┬─────────┼─────────┬─────────┼─────────┬─────────┤ │ CRC │ Data │ CRC │ Data │ CRC │ Data │ │ 4 bytes │ N bytes │ 4 bytes │ N bytes │ 4 bytes │ N bytes │ └─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘
Blocks由多个Block构成,每个Block包含CRC32和Data两部分,其中CRC32用于校验Data的内容是否有问题, Data为存储的数据,Data的长度记录在之后的Index部分中。
Index结构如下:
┌────────────────────────────────────────────────────────────────────────────┐ │ Index │ ├─────────┬─────────┬──────┬───────┬─────────┬─────────┬────────┬────────┬───┤ │ Key Len │ Key │ Type │ Count │Min Time │Max Time │ Offset │ Size │...│ │ 2 bytes │ N bytes │1 byte│2 bytes│ 8 bytes │ 8 bytes │8 bytes │4 bytes │ │ └─────────┴─────────┴──────┴───────┴─────────┴─────────┴────────┴────────┴───┘
Kye Len (2 bytes) : 代表紧随其后的key的长度
Key (N bytes) :Key的内容
Type :数据类型
influxdb-1.1.0/tsdb/engine/tsm1/encoding.go ... const ( // BlockFloat64 designates a block encodes float64 values BlockFloat64 = byte(0) // BlockInteger designates a block encodes int64 values BlockInteger = byte(1) // BlockBoolean designates a block encodes boolean values BlockBoolean = byte(2) // BlockString designates a block encodes string values BlockString = byte(3) // encodedBlockHeaderSize is the size of the header for an encoded block. There is one // byte encoding the type of the block. encodedBlockHeaderSize = 1 )
Count(2 bytes) : 后面跟的(Min Time + Max Time + Offset + Size作为一个整体)数据的个数
Min Time(8 bytes) : block中value的最小时间戳
Max Time(8 bytes) : block中value的最大时间戳
Offset(8 bytes) : 该block在tsm文件中的偏移量
Size(4Bytes) : block的大小
Footer结构如下:
┌─────────┐ │ Footer │ ├─────────┤ │Index Ofs│ │ 8 bytes │ └─────────┘
tsm文件示例:
16 D1 16 D1 01 2C 30 A0 35 00 09 1C 13 E6 C9 EF 89 2E E4 00 10 3F E4 7A E1 47 AE 14 7B C3 F4 01 C7 AE 14 7A E1 47 A0 A6 71 30 0F 00 09 1C 13 E6 C9 F4 31 46 AC 00 10 3F EF AE 14 7A E1 47 AE C3 FC 01 7A E1 47 AE 14 7A F0 00 34 63 70 75 5F 6C 6F 61 64 5F 73 68 6F 72 74 2C 68 6F 73 74 3D 73 65 72 76 65 72 30 31 2C 72 65 67 69 6F 6E 3D 75 73 2D 77 65 73 74 23 21 7E 23 76 61 6C 75 65 00 00 02 13 E6 C9 EF 89 2E E4 00 13 E6 C9 EF 89 2E E4 00 00 00 00 00 00 00 00 05 00 00 00 22 13 E6 C9 F4 31 46 AC 00 13 E6 C9 F4 31 46 AC 00 00 00 00 00 00 00 00 27 00 00 00 22 00 00 00 00 00 00 00 49
参考代码:
curl -i -XPOST http://localhost:8086/query --data-urlencode "q=CREATE DATABASE mydb" curl -i -XPOST ‘http://localhost:8086/write?db=mydb‘ --data-binary ‘cpu_load_short,host=server01,region=us-west value=0.64 1434055562000000000‘
Header部分 : 16 D1 16 D1 01
Blocks部分 :
2C 30 A0 35 00 09 1C 13 E6 C9 EF 89 2E E4 00 10 3F E4 7A E1 47 AE 14 7B C3 F4 01 C7 AE 14 7A E1 47 A0 A6 71 30 0F 00 09 1C 13 E6 C9 F4 31 46 AC 00 10 3F EF AE 14 7A E1 47 AE C3 FC 01 7A E1 47 AE 14 7A F0
Index部分 :
00 34 63 70 75 5F 6C 6F 61 64 5F 73 68 6F 72 74 2C 68 6F 73 74 3D 73 65 72 76 65 72 30 31 2C 72 65 67 69 6F 6E 3D 75 73 2D 77 65 73 74 23 21 7E 23 76 61 6C 75 65 00 00 02 13 E6 C9 EF 89 2E E4 00 13 E6 C9 EF 89 2E E4 00 00 00 00 00 00 00 00 05 00 00 00 22 13 E6 C9 F4 31 46 AC 00 13 E6 C9 F4 31 46 AC 00 00 00 00 00 00 00 00 27 00 00 00 22
00 34 : 后面的52个字符为key
key内容:
63 70 75 5F 6C 6F 61 64 5F 73 68 6F 72 74 2C 68 6F 73 74 3D 73 65 72 76 65 72 30 31 2C 72 65 67 69 6F 6E 3D 75 73 2D 77 65 73 74 23 21 7E 23 76 61 6C 75 65
data类型:0x00
count : 00 02
后面有两个数据
第一个数据:
13 E6 C9 EF 89 2E E4 00 13 E6 C9 EF 89 2E E4 00 00 00 00 00 00 00 00 05 00 00 00 22
这个时间段(13 E6 C9 EF 89 2E E4 00 - 13 E6 C9 EF 89 2E E4)的数据在5( 00 00 00 00 00 00 00 00 05)这个地方存,占用34(00 00 00 22)个byte
第二个数据:
13 E6 C9 F4 31 46 AC 00 13 E6 C9 F4 31 46 AC 00 00 00 00 00 00 00 00 27 00 00 00 22
Footer部分 : 00 00 00 00 00 00 00 49
TSM存储设计可参考如下文件:
influxdb-1.1.0/tsdb/engine/tsm1/DESIGN.md
在替换和删除TSM文件时,它确保TSM文件创建的原子性。
检测那个TSM文件可以压缩,并确保多个并发的压缩互不干扰。
主要用于文件压缩,优化存储空间。
每种文件类型(WAL,TSM,tombstones等)都分别拥有自己格式的读写器。
好,就这些了,希望对你有帮助。
本文github地址:
https://github.com/mike-zhang/mikeBlogEssays/blob/master/2017/20170423_Influxdb数据存储描述.rst
欢迎补充
Influxdb数据存储
标签:时间段 版本 nil ted 扩展 并且 const 写入 snappy