在这里插入图片描述

1. 时序数据库核心认知

  • 数据特征:高写入吞吐、时序有序性、保留期(TTL)、降采样与压缩、插值与对齐、窗口聚合。
  • 典型场景:物联网传感器、工业监控、日志/指标(Metrics)、金融行情、车联网。
  • 关键能力评估维度:写入性能、压缩率、查询延迟(最新点/窗口/大范围扫描)、保留策略、分区与冷热分层、流式计算/订阅、运维易用性。
  • 常用数据建模要点
    • 明确设备/标签(tags)与测点字段(columns)分离;
    • 控制标签基数,避免过多高基数 tag;
    • 预设保留期与分区策略;
    • 设计写入批量与乱序容忍窗口。

2. TDengine 快速入门

  • 安装与启动:支持本地包、Docker、K8s(参阅官方快速开始)。
  • 基础对象:Database(含 TTL/压缩/副本)、超级表(STable,定义标签+字段)、子表(具体设备实例)。
  • 基础操作
    • 创建库/表:CREATE DATABASE ...; CREATE STABLE ...; CREATE TABLE USING ... TAGS (...)
    • 写入:INSERT INTO subtable USING stable TAGS (...) VALUES (...); 支持批量/乱序。
    • 查询:SELECT, FIRST/LAST, INTERVAL, SLIDING, FILL, STATE_WINDOW, SESSION_WINDOW
  • 订阅与流式:TMQ(Kafka 协议风格),支持消费组、重平衡、精确一次。
  • 运维要点:监控 taosd,关注内存、WAL、磁盘 IOPS/吞吐,定期检查数据保留与压缩。

3. 学习路线(分阶段)

  1. 概念速读:时序数据特性 + TDengine 核心对象(库/超级表/子表/标签)。
  2. 10 分钟上手:安装 → 建库/建表/写入/查询 → 简单聚合与窗口。
  3. 数据建模进阶:标签设计、分区与 TTL、批量写入与乱序控制。
  4. 查询模式:最近点查询、时间窗口聚合、降采样、补齐、会话窗口。
  5. 性能优化:写入批量/并发、客户端参数、压缩与存储策略、查询索引与标签基数控制。
  6. 流式与集成:TMQ 消费、与 Kafka/MQ、与 Flink/Spark/K8s 的集成模式。
  7. 运维与高可用:多副本、数据迁移/备份、监控指标、告警。
  8. 实战练习:物联网/监控指标示例数据集,完成端到端写入、查询、可视化。

4. 高频知识点速查

  • 窗口/降采样INTERVAL 1m SLIDING 10s FILL(prev/NULL/linear)
  • 会话窗口SESSION_WINDOW(ts_col, 10m) 聚合同一会话内的事件。
  • 标签高基数防范:合并稀疏标签,使用枚举/字典映射;避免把唯一 ID 直接做 tag,可放入字段或分表。
  • TTL/分区:库级 KEEP/DURATION;合理分区避免单分区过大。
  • 写入性能:批量写、压测时控制乱序比例;客户端连接池。
  • 订阅消费:设置消费组,处理重平衡;恰当提交 offset 保证精确一次。
  • 运维监控:关注 WAL、存储使用、写入/查询 QPS、慢查询、负载均衡。

5. 官方/权威资料(精选)

  • 官方文档
    • 中文首页: https://docs.taosdata.com
    • 安装与快速开始: https://docs.taosdata.com/get-started/
    • 数据建模: https://docs.taosdata.com/basic/model/
    • SQL 参考: https://docs.taosdata.com/reference/taos-sql/
    • TMQ/订阅: https://docs.taosdata.com/reference/taos-sql/tmq/
    • 运维与监控: https://docs.taosdata.com/operation/
  • 示例与客户端
    • 多语言示例仓库: https://github.com/taosdata/TDengine/tree/develop/examples
    • Python/Go/Java/C# 等 SDK 参考: https://docs.tdengine.com/zh/develop/connector/
  • 实践文章与博客
    • 官方博客: https://www.taosdata.com/blog
  • 视频/培训
    • B 站官方频道(搜索 “TDengine”)。
  • 社区
    • GitHub: https://github.com/taosdata/TDengine/issues
    • 论坛/问答: https://ask.taosdata.com/

6. 推荐练习路径

  • 练习 1:10 分钟 Demo:安装 → 建库/超级表/子表 → 写入 1 小时模拟传感器数据 → INTERVAL 聚合。
  • 练习 2:标签设计优化:尝试高基数标签与合并策略,对比查询与存储差异。
  • 练习 3:降采样与补齐:用 INTERVAL + FILL 生成 1m/5m 级别指标曲线。
  • 练习 4:会话窗口:基于日志/事件流做会话切分与统计。
  • 练习 5:TMQ 流式:启动 TMQ 消费组,实时消费并落盘/入 Kafka,再对比消费延迟与精确一次。
  • 练习 6:运维监控:采集 taosd 指标,设置慢查询告警和存储阈值。

7. 速查清单

  • 安装后第一步:建库时设定 KEEP/BLOCKS/副本数。
  • 写入:批量、小乱序;遇到乱序过大调宽乱序窗口。
  • 查询:充分利用标签过滤;大范围聚合用合适窗口和 SLIDING
  • 存储:关注压缩率与冷热分层;定期检查磁盘和 WAL。
  • 流式:消费组 + 定期提交 offset;监控重平衡与滞后。
  • 运维:备份/迁移前先降流量;监控 CPU/IO/内存与慢查询。

关于 TDengine

TDengine 专为物联网IoT平台、工业大数据平台设计。其中,TDengine TSDB 是一款高性能、分布式的时序数据库(Time Series Database),同时它还带有内建的缓存、流式计算、数据订阅等系统功能;TDengine IDMP 是一款AI原生工业数据管理平台,它通过树状层次结构建立数据目录,对数据进行标准化、情景化,并通过 AI 提供实时分析、可视化、事件管理与报警等功能。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐