1. 背景与目标

  • 业务目标

    • 15 min/1 h 超短期与日前预测:降低 NMAE/NRMSE,提升 Ramp 事件命中率与校准度(可靠性)。

    • 提供不确定性区间(P10/P50/P90),支持调度、现货交易与弃风风险控制。

    • 产线稳定:缺报/晚报< 0.1%,对异常气象与站端异常具备“降级不失控”的韧性。

  • 痛点

    1. 多源 NWP 在不同季节/时段/天气型态下“优劣互补”,静态权重易失效;

    2. 机组侧非线性与机理缺口(尾流、结冰、限电、偏航失配)导致系统性偏差;

    3. Ramp、阵风等“稀有但关键”场景召回难;

    4. 线下好看、线上抖动(jerk)与解释不足影响生产信心。

核心思路:以“大模型做调度与治理(Router/Planner/Explainer)”,让物理模型 + 机器学习 + 统计校准各司其职,通过策略化路由、情景化权重与在线自校准,实现“稳、准、可理”。


2. 总体架构(四层六组件)

数据层

  • SCADA/AGC(10–15 min),站点元数据(塔筒高度、功率曲线、并网容量、可利用率、扇区信息)、多源 NWP(GFS/GRAPES/ICON/GEM…)、雷达/卫星再分析、历史限电/检修标注。

  • 统一特征库(feature store):支持 DOY/HOD、季节/天气型态、垂直切变α、阵风指标、矢量风一致性、季节软过渡权重等。

模型层(多模态集成)

  • 物理/机理:功率曲线修正、尾流近似、空气密度修正、爬坡率/装机上限约束。

  • 深度时序:Informer/TFT/N-BEATS/TCN;

  • 空间关系:Graph Attention(风场—机组图);

  • 统计校准:分位数回归、Quantile Mapping(季节/扇区)、Conformal Prediction。

大模型智能体层(LLM as Brain)

  1. Data Copilot:数据治理、异常解释、特征建议与自动回填策略生成;

  2. Regime Router:按天气型态/季节/时段/站点画像动态选择/加权基学习器;

  3. Scenario Synthesizer:结合多源 NWP 生成情景集与概率权重;

  4. Explainer:自然语言解释与运维处方(为何偏、怎么调、风险何在)。

融合与服务层

  • 季节化技能矩阵 + 余弦窗 cross-fade 融合、矢量 EMA & anti-jerk 平滑、Ramp 专项加权、区间校准。

  • API/批处理、在线监控、告警与 A/B 发布。


3. 大模型赋能的四个场景

3.1 预测前:数据治理与特征工程

  • 异常数据审计:大模型基于规则库 + few-shot 示例,自动生成“异常类型—建议处理”清单(如:结冰/限电/维护/计量漂移),并产出对应的 SQL/校验表达式。

  • 特征建议:让大模型依据站点画像(地形/风玫瑰/历史误差)给出季节化增益特征(如 α 的 DOY 调制、阵风记忆衰减、云底高度 proxy、前沿过境时滞)。

  • 自动文档化:生成“数据字典 + 实验记录”,降低知识流失。

3.2 预测中:策略调度与模型选择(Regime Router)

  • 大模型将天气摘要(由结构化特征自动生成的“型态描述”)映射到技能矩阵权重模板,再结合近期线上误差,输出每个时段的模型权重/门控Ramp 触发阈值

  • 场景示例:

    • “冷平流 + 强切变 + 夜间稳定层”→ ICON 权重↑、TFT 时滞↑、anti-jerk 权重↑;

    • “锋面过境 + 强阵风概率高”→ Ramp 通道加权↑、分位数带加宽、上行爬坡率松弛。

3.3 预测后:区间校准与解释

  • LLM 汇总概率带覆盖率、可靠性曲线、极值误差,生成简洁可执行的运维建议(如“P90 偏紧,夜间东南风扇区应扩大 1.2× 置信带”)。

3.4 人机协作闭环

  • 线上异常(如连续偏负)触发Auto-Calib Playbook:给出“影响最大前 3 特征 + 建议阈值”,推送灰度分支进行 A/B。


4. 关键算法与细节

4.1 多源 NWP 融合(季节软过渡 + 技能矩阵)

  • 技能矩阵:以 (季节/DOY, HOD, 天气型态, 风向扇区) 为索引,存储各模型的滚动技能(MAE/RMSE/CRPS)。

  • 余弦窗 cross-fade:跨季/跨型态权重平滑,避免权重突跳。

  • 矢量一致性:风速融合用向量合成幅值 (R=\sqrt{u^2+v^2}),风向保持“分散高→主导方向”。

4.2 时空深度模型

  • Informer/TFT:长序列稀疏注意力与多尺度时序分解,输入含:多源 NWP、site meta、历史功率、α、阵风、稳定度 proxy、HOD/DOY。

  • 图模型(GAT):以机组/风场为节点,边权考虑风向相对角、地形通道与历史同步性,实现尾流/区域性误差传播建模。

4.3 机组侧校准与平滑

  • 分位数回归 + Q-Map:按季节/扇区/风速段进行 Quantile Mapping,矫正系统偏差;

  • anti-jerk其中 (\lambda) 随 Ramp 触发与风速不确定性自适应;

  • 阵风记忆:指数衰减记忆项 + Ramp 触发(风速一阶差分/加速度阈值 + 雷达风廓线 proxy)。

4.4 不确定性刻画与校准

  • Pinball Loss

  • CRPS 作为总体区间质量指标;

  • Conformal Prediction:在线滚动残差分布校准 P10/P90 带宽,确保 PICP ≈ 目标置信度;

  • 可靠性诊断:分位数命中率、校准斜率(理想=1)。

4.5 运营约束与异常场景

  • 爬坡率/装机上限、可利用率掩码、限电/检修屏蔽;

  • 结冰/低温:引入温度/湿度/风速与历史事件做异常先验,触发保守策略;

  • 偏航失配:用 nacelle 风向 vs 场外测风差异,做扇区级偏差修正。


5. 工程实现(与现有 15 min 流水线无缝衔接)

5.1 数据与特征库(Feature Store)

  • 主键:site_id / group_id, data_time(UTC+8 对齐轮档), horizon(15 min/1 h/DA);

  • 核心特征(示例):

    • 气象:各模型的 (u,v), gust, shear α, BLH, CAPE, RH, T, SLP;

    • 时空:DOY/HOD、周指示、前缘/后缘标记、距离锋面时长(代理特征);

    • 站点:功率曲线参数、扇区表、可利用率、尾流系数近似;

    • 衍生:矢量 EMA、anti-jerk 状态、季节软过渡权、Ramp 触发标志。

5.2 大模型智能体落地形态

  • 工具化调用(Function-Calling):

    • suggest_features() 返回新增特征与可验证的生成逻辑;

    • route(models, regime) 输出模型权重/门控与区间放缩因子;

    • explain(run_id) 生成“简报级”误差解释与改进处方。

  • 安全网:无结论/置信低 → 回落默认技能矩阵与保守带。

5.3 训练与推理流水线

  • 离线:月更“季节化技能矩阵”;周更深度模型(Informer/TFT);日更 Q-Map 与 Conformal;

  • 在线

    1. 多源 NWP 解码 → 统一特征 → 深度模型逐时段滚推;

    2. Regime Router 产出权重与策略;

    3. 融合 + anti-jerk 平滑 + 区间校准;

    4. 约束裁剪(上限/爬坡)→ 输出 TXT/API。

5.4 伪代码(Router + 融合主干)

def forecast_batch(X, base_models, skill_matrix, router, state):
    # 1) 基学习器输出
    preds = {name: m.predict(X) for name, m in base_models.items()}  # mean + quantiles
    
    # 2) 识别天气型态 & 季节/时段
    regime = detect_regime(X)  # (season, HOD, sector, stability, front_flag, ...)
    
    # 3) LLM 路由(带回退)
    route = router(regime, recent_online_metrics(), skill_matrix)
    weights = route.get("weights", default_weights(skill_matrix, regime))
    rampset = route.get("ramp_params", default_ramp_params())
    q_scale = route.get("quantile_scale", 1.0)
    
    # 4) 融合(矢量一致性 + 余弦窗平滑)
    y_mean = blend_mean(preds, weights, regime, cross_fade=True)
    y_q = blend_quantiles(preds, weights)
    
    # 5) Ramp 专项与 anti-jerk
    y_mean = anti_jerk(y_mean, state, rampset)
    
    # 6) 区间校准(Conformal/季节Q-Map)
    y_p10, y_p50, y_p90 = conformal_calibrate(y_q, scale=q_scale, regime=regime)
    
    # 7) 约束与裁剪
    y_mean, (y_p10, y_p90) = apply_constraints(y_mean, (y_p10, y_p90), capacity, ramp_limit)
    return y_mean, y_p10, y_p90

6. 评估、上线与监控

6.1 指标体系

  • 点预测:MAE/RMSE、NMAE/NRMSE(按装机归一)、r²、分位数段误差(低风/中风/高风)。

  • 区间预测:CRPS、PICP、平均带宽、可靠性曲线斜率。

  • 场景指标:Ramp 命中率(TSS/F1)、阵风时段误差、夜间稳定层偏差、锋面过境窗口误差。

  • 业务指标:弃风率、启停次数与爬坡超限告警减少量。

6.2 验证设计

  • 时序留后验证(purge & embargo),多季滚动窗口;

  • A/B 灰度:路由器上线先在 20–30% 站点灰度,观察 2–4 周;

  • 可靠性图 & 覆盖率:每周自动出图,异常触发回滚。

6.3 监控与自愈

  • 数据漂移(PSI/KS)、误差漂移(EWMA)、分位数覆盖偏差、Ramp 召回告警;

  • 触发 Auto-Calib(Q-Map/Conformal 参数自调)与权重回退


7. 资源与成本控制

  • 训练:深度模型支持混合精度;Router 端 LLM 采用小型指令微调模型蒸馏规则(离线落地到轻量打分器)。

  • 推理:批量化、ONNX/TensorRT;LLM 仅参与策略阶段,不走每步时序回环。


8. 风险与合规模块

  • 缺数与延迟:多源回退、插值上限、保守区间;

  • 误触发:Router 输出带置信度门控,低置信直接回退默认技能矩阵;

  • 追溯与合规:所有策略决策留痕(regime、权重、阈值、解释)。


9. 实施里程碑(12 周示例)

  • W1–2:现网评估 & 指标看板、特征库对齐、异常标签体系;

  • W3–4:技能矩阵与 cross-fade 上线,接入 anti-jerk 与矢量一致性;

  • W5–6:深度主干(Informer/TFT)联调,分位数与 Conformal 校准;

  • W7–8:LLM Router MVP(离线),完成规则蒸馏;

  • W9–10:线上灰度 + A/B,Ramp 专项评估与优化;

  • W11–12:规模化部署、SLA/告警完善、运维手册与解释服务。


10. 附录:落地清单(可直接执行)

  • 必备表/视图

    • features.wind_15min(site_id, data_time, horizon, u/v_*_models..., gust, alpha, HOD, DOY, regime_tags, avail, curtail_flag, ...)

    • metrics.online(site_id, day, horizon, MAE, CRPS, ramp_f1, picp_80, ...)

    • matrix.skill(season, HOD, sector, model, mae, crps, weight)

  • 关键阈值初值

    • ramp 触发:(\Delta v/\Delta t > 2.0~m/s/15min) 或 (\Delta P > 0.12 P_{cap})(按场站可调);

    • anti-jerk (\lambda):默认 0.35,Ramp 时自适应 0.55–0.75;

    • conformal 目标 PICP:P10–P90≈80%(按业务可设 70–90%)。

  • 上线文档:数据字典、策略解释模板、回滚与容错手册。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐