发布网友
共1个回答
热心网友
Measurement,类比传统数据库表,标记数据归属的普通字符串字段。
InfluxDB数据库,类似传统数据库表,是schema载体,通过语法规则创建,并可指定副本数、shard group划分时间范围、保留策略等。
Tag,键值对描述数据特征,如主机监控数据的region、ip,建立倒排索引,提升使用tag作为谓词的查询性能。
Field,键值对表示数据点指标名和值,如CPU使用率,不创建索引,查询时必须扫描数据。
Point,InfluxDB中数据点,一个measurement、多个tag、多个field和时间戳构成,内部拆分为多条数据。
Retention policy(RP),时序数据管理概念,定义数据保留周期、副本数、shard ration,一个database可创建多个RP,默认为autogen,数据写入时可指定RP。
Series,时间线,InfluxDB数据源,逻辑上与measurement和tags关联,物理上由series key组织,表示数据的key-value结构。
关系模型使用二维表描述,需提前定义schema,数据严格遵循schema,所有字段填充,无空洞。
InfluxDB使用时间线模型,适用于时序数据,灵活增减tag和field,数据按series key聚簇,查询时必须知道series key。
InfluxDB存储架构,包含多个retention policy,数据写入时可指定,相同measurement数据可写入不同RP,产生多个shard group,shard作为数据承载最小单元,存储wal、tsm、tsi,wal提高数据可靠性,tsm存储数据,tsi存储倒排索引。
本文概述了InfluxDB相关技术概念,后续将深入探讨技术细节。