电网负荷调度排期预测如何精准预判未来用电高峰与低谷并优化能源分配

引言：电网负荷调度的核心挑战与机遇

电网负荷调度是现代电力系统运行的核心环节，它直接关系到电力供应的稳定性、经济性和安全性。随着可再生能源的大规模接入、电动汽车的普及以及用户用电行为的多样化，电网负荷的波动性显著增加，精准预判未来用电高峰与低谷成为一项极具挑战性的任务。传统的负荷预测方法往往依赖历史数据的简单统计分析，难以应对复杂多变的现代电网环境。然而，借助先进的数据科学和人工智能技术，我们能够从海量数据中挖掘规律，实现更精准的负荷预测，并在此基础上优化能源分配，提升电网运行效率。

精准预判用电高峰与低谷的意义重大。首先，它有助于电网运营商提前做好发电计划，避免因负荷突增导致的拉闸限电或因负荷过低造成的能源浪费。其次，它为需求侧响应（Demand Response, DR）和虚拟电厂（Virtual Power Plant, VPP）等新型商业模式提供了数据基础，使得电网能够更灵活地调节供需平衡。最后，精准的负荷预测是优化能源分配的前提，能够最大限度地利用清洁能源，降低化石能源消耗，助力“双碳”目标的实现。

本文将深入探讨如何利用现代技术手段精准预判未来用电高峰与低谷，并在此基础上优化能源分配。文章将涵盖数据收集与处理、预测模型构建、优化算法应用以及实际案例分析，并提供详细的代码示例，以期为相关从业者提供一份详尽的实践指南。

一、数据基础：构建高维度的负荷预测数据集

精准的负荷预测离不开高质量、多维度的数据。负荷数据本身（即历史用电量）是核心，但仅仅依赖历史负荷数据是远远不够的。我们需要构建一个包含多种影响因素的高维度数据集，才能捕捉到负荷变化的内在规律。

1.1 核心数据类型

历史负荷数据：这是最基础的数据，通常以15分钟、30分钟或1小时为间隔记录。数据应覆盖足够长的时间周期（如至少2-3年），以包含季节性、周度和日度模式。
气象数据：温度、湿度、风速、光照强度、降雨量等气象因素对负荷影响巨大。特别是空调和采暖负荷，与温度高度相关。应收集与负荷数据时间戳对齐的气象数据，最好包含实时数据和短期预报数据。
日历与时间特征：日期类型（工作日、周末、节假日）、季节、月份、小时等。节假日的用电模式通常与工作日显著不同，需要特别标注。
经济与社会活动数据：对于工业负荷占比较大的区域，宏观经济指标、工业生产指数等可能相关。对于商业和居民负荷，大型活动、特殊事件（如体育赛事、演唱会）也可能产生影响。
可再生能源出力数据：如果电网中包含光伏、风电等，其出力数据（或预测出力数据）也需要纳入考虑，因为它们会影响净负荷（总负荷减去可再生能源出力）。
电价信息：在电力市场环境下，分时电价、实时电价会直接影响用户的用电行为，从而影响负荷曲线。

1.2 数据预处理

原始数据往往存在缺失值、异常值和噪声，需要进行清洗和预处理。

缺失值处理：对于少量缺失，可以采用线性插值、时间序列插值（如季节性插值）或基于邻近点的均值/中位数填充。对于大量缺失，可能需要考虑数据是否有效或剔除该时段。
异常值检测与处理：可以使用统计方法（如3σ原则）或机器学习方法（如孤立森林）检测异常点。异常点可能是记录错误，也可能是真实发生的极端事件。需要结合业务知识判断是修正、剔除还是保留。
数据平滑：对于噪声较大的数据，可以使用移动平均、指数平滑等方法进行平滑处理，但需注意避免过度平滑导致丢失重要波动信息。
数据归一化/标准化：由于不同特征的量纲和取值范围差异巨大，在输入模型前通常需要进行归一化（如Min-Max Scaling）或标准化（如Z-score Standardization），以加速模型收敛并提高预测精度。

1.3 特征工程

特征工程是将原始数据转化为模型更能理解的形式的关键步骤，对于提升预测精度至关重要。

时间特征分解：将时间戳分解为多个维度，如小时（0-23）、星期几（0-6）、月份（1-12）、是否节假日（0/1）、是否工作日（0/1）等。这些特征能帮助模型捕捉周期性模式。
滞后特征（Lag Features）：使用历史负荷作为未来预测的输入。例如，用前一天同一时刻的负荷、前一周同一天同一时刻的负荷、前一天同一时刻的温度等作为特征。这能帮助模型捕捉短期依赖关系。
滑动窗口统计特征：计算过去一段时间内的统计量，如过去3小时的平均负荷、过去24小时的负荷方差、过去7天的最高负荷等。这能帮助模型捕捉负荷的动态变化趋势。
交互特征：将不同特征组合，如“温度-小时”交互项，可以捕捉不同时间段温度对负荷影响的差异（例如，夜间温度低可能需要采暖，而白天可能不需要）。

1.4 代码示例：数据预处理与特征工程（Python）

下面是一个使用Python的pandas库进行数据预处理和特征工程的示例。假设我们有一个包含时间戳、负荷（load）、温度（temperature）和是否节假日（is_holiday）的数据集。

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler

# 1. 模拟数据生成
# 创建一个时间索引，每小时一个点，覆盖一年
date_rng = pd.date_range(start='2023-01-01', end='2023-12-31 23:00:00', freq='H')
df = pd.DataFrame(date_rng, columns=['timestamp'])
df.set_index('timestamp', inplace=True)

# 生成模拟负荷数据：包含趋势、周期性和噪声
df['load'] = 1000 + 10 * np.arange(len(df)) + 200 * np.sin(2 * np.pi * df.index.dayofyear / 365) + \
             150 * np.sin(2 * np.pi * df.index.hour / 24) + np.random.normal(0, 20, len(df))

# 生成模拟温度数据：与季节相关
df['temperature'] = 20 + 10 * np.sin(2 * np.pi * (df.index.dayofyear + 100) / 365) + np.random.normal(0, 2, len(df))

# 生成是否节假日数据（简化：假设每月1号和15号为节假日）
df['is_holiday'] = 0
df.loc[df.index.day.isin([1, 15]), 'is_holiday'] = 1

# 2. 数据清洗（示例：处理异常值，这里简单用滚动中位数替换）
# 假设负荷超过均值+3倍标准差为异常
load_mean = df['load'].mean()
load_std = df['load'].std()
outliers = df['load'] > (load_mean + 3 * load_std)
df.loc[outliers, 'load'] = df['load'].rolling(window=24, center=True).median()[outliers]

# 3. 特征工程
# 时间特征
df['hour'] = df.index.hour
df['day_of_week'] = df.index.dayofweek
df['month'] = df.index.month
df['is_weekend'] = (df.index.dayofweek >= 5).astype(int)

# 滞后特征 (Lag Features)
for lag in [1, 24, 168]:  # 1小时, 24小时(1天), 168小时(1周)
    df[f'load_lag_{lag}'] = df['load'].shift(lag)
    df[f'temp_lag_{lag}'] = df['temperature'].shift(lag)

# 滑动窗口统计特征 (Rolling Window Features)
df['load_rolling_mean_24h'] = df['load'].rolling(window=24).mean()
df['load_rolling_std_24h'] = df['load'].rolling(window=24).std()
df['temp_rolling_mean_3h'] = df['temperature'].rolling(window=3).mean()

# 4. 处理NaN值（由滞后特征和滚动窗口产生的）
df.dropna(inplace=True)

# 5. 数据归一化
features_to_scale = ['temperature', 'hour', 'day_of_week', 'month', 
                     'load_lag_1', 'load_lag_24', 'load_lag_168',
                     'temp_lag_1', 'temp_lag_24', 'temp_lag_168',
                     'load_rolling_mean_24h', 'load_rolling_std_24h', 'temp_rolling_mean_3h']
target = 'load'

scaler = MinMaxScaler()
df[features_to_scale] = scaler.fit_transform(df[features_to_scale])

# 注意：目标变量通常也需要归一化，但为了后续评估，我们可能需要保留原始值或单独处理
target_scaler = MinMaxScaler()
df[target] = target_scaler.fit_transform(df[[target]])

print("预处理和特征工程后的数据前5行：")
print(df.head())
print("\n数据形状：", df.shape)

通过上述步骤，我们构建了一个包含丰富特征的数据集，为后续的模型训练打下了坚实的基础。

二、预测模型：从传统统计到深度学习

有了高质量的数据，下一步就是选择合适的模型进行负荷预测。预测模型的选择取决于数据的特性、预测的时间尺度（超短期、短期、中长期）以及对精度和可解释性的要求。

2.1 传统统计模型

时间序列模型 (ARIMA/SARIMA)：自回归积分滑动平均模型（ARIMA）及其季节性变体（SARIMA）是经典的时间序列预测方法。它们假设数据是平稳的或可通过差分变为平稳，并利用数据自身的过去值和误差项来预测未来。SARIMA能很好地处理日度、周度等季节性模式。
- 优点：模型简单，计算速度快，具有较好的可解释性。
- 缺点：难以处理多变量输入（如温度、节假日），对非线性关系捕捉能力弱，对数据平稳性要求高。
指数平滑法 (ETS)：指数平滑法通过给近期观测值赋予更大的权重来进行预测。其变体如Holt-Winters方法可以处理趋势和季节性。
- 优点：简单直观，对短期预测效果较好。
- 缺点：同样难以引入外部变量，对复杂模式的捕捉能力有限。

2.2 机器学习模型

机器学习模型能够处理高维非线性数据，是目前负荷预测的主流方法之一。

梯度提升树 (Gradient Boosting Trees)：如XGBoost、LightGBM、CatBoost。这些模型通过集成多个弱学习器（决策树）来构建强大的预测模型。
- 优点：预测精度高，能自动处理特征交互，对缺失值不敏感，训练速度相对较快。
- 缺点：模型本身是黑箱，可解释性不如线性模型；对时间序列的依赖关系需要通过特征工程（如滞后特征）显式引入。
支持向量机 (SVM/SVR)：支持向量回归（SVR）通过寻找一个超平面来拟合数据，对小样本、非线性问题有优势。
- 优点：在高维空间中表现良好，泛化能力强。
- 缺点：对参数选择和核函数敏感，训练速度较慢，不适合大规模数据集。

2.3 深度学习模型

深度学习模型能够自动学习数据中的复杂时空特征，特别适合处理大规模、高维度的时序数据。

循环神经网络 (RNN) 及其变体 (LSTM/GRU)：RNN是为处理序列数据而生的网络结构。长短期记忆网络（LSTM）和门控循环单元（GRU）通过引入门控机制解决了RNN的梯度消失/爆炸问题，能够有效捕捉长距离依赖关系。
- 优点：天生适合处理时间序列，能自动学习历史信息中的模式，无需复杂的特征工程。
- 缺点：训练时间较长，模型结构相对复杂，可解释性差。
卷积神经网络 (CNN)：虽然主要用于图像处理，但CNN也可以用于时间序列预测。一维CNN可以像处理信号一样处理时间序列，提取局部模式。
- 优点：并行计算能力强，能有效提取局部特征。
- 缺点：单独使用时对长时序依赖的捕捉不如LSTM。
Transformer：基于自注意力机制（Self-Attention）的模型，最初用于自然语言处理，现已被广泛应用于时间序列预测。它能并行处理整个序列，并根据重要性动态地关注序列的不同部分。
- 优点：并行化程度高，能捕捉全局依赖关系，在超长序列上表现优异。
- 缺点：模型参数量巨大，需要大量数据训练，计算成本高。
混合模型：结合不同模型的优点，如CNN-LSTM（用CNN提取特征，LSTM处理时序）、Attention-LSTM（用Attention机制增强LSTM对关键历史信息的关注）等。

2.4 代码示例：使用LSTM进行短期负荷预测（TensorFlow/Keras）

下面是一个使用LSTM模型进行短期负荷预测的完整示例。我们将使用上一节预处理好的数据。

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, mean_squared_error
import matplotlib.pyplot as plt

# 假设 df 是上一节代码输出的预处理后的DataFrame
# 定义特征和目标
X = df[features_to_scale].values
y = df[target].values

# 定义序列长度（用过去多少个时间步预测未来1个时间步）
SEQ_LENGTH = 24  # 使用过去24小时的数据预测下一小时

# 创建序列数据函数
def create_sequences(X, y, seq_length):
    X_seq, y_seq = [], []
    for i in range(len(X) - seq_length):
        X_seq.append(X[i:i+seq_length])
        y_seq.append(y[i+seq_length])
    return np.array(X_seq), np.array(y_seq)

X_seq, y_seq = create_sequences(X, y, SEQ_LENGTH)

# 划分训练集和测试集（注意：时间序列数据通常按时间顺序划分，避免未来信息泄露）
# 这里为了简单演示，使用随机划分，实际应用中应按时间划分
X_train, X_test, y_train, y_test = train_test_split(X_seq, y_seq, test_size=0.2, random_state=42)

# 构建LSTM模型
model = Sequential([
    LSTM(64, input_shape=(SEQ_LENGTH, len(features_to_scale)), return_sequences=True),
    Dropout(0.2),
    LSTM(32, return_sequences=False),
    Dropout(0.2),
    Dense(16, activation='relu'),
    Dense(1)  # 输出层，预测一个值
])

model.compile(optimizer='adam', loss='mse', metrics=['mae'])
model.summary()

# 训练模型
history = model.fit(X_train, y_train, epochs=20, batch_size=64, validation_split=0.1, verbose=1)

# 评估模型
y_pred = model.predict(X_test)

# 反归一化（将预测值和真实值转换回原始量纲）
# 注意：这里需要使用之前对目标变量归一化的scaler
y_test_original = target_scaler.inverse_transform(y_test.reshape(-1, 1))
y_pred_original = target_scaler.inverse_transform(y_pred)

mae = mean_absolute_error(y_test_original, y_pred_original)
rmse = np.sqrt(mean_squared_error(y_test_original, y_pred_original))
print(f"\n模型评估结果:")
print(f"MAE (Mean Absolute Error): {mae:.2f}")
print(f"RMSE (Root Mean Squared Error): {rmse:.2f}")

# 可视化预测结果（取前100个样本）
plt.figure(figsize=(14, 6))
plt.plot(y_test_original[:100], label='Actual Load', color='blue')
plt.plot(y_pred_original[:100], label='Predicted Load', color='red', linestyle='--')
plt.title('LSTM Load Prediction vs Actual (First 100 Samples)')
plt.xlabel('Time Step')
plt.ylabel('Load (Original Scale)')
plt.legend()
plt.grid(True)
plt.show()

这个示例展示了如何构建一个LSTM模型进行负荷预测。在实际应用中，可能需要更复杂的网络结构、更精细的超参数调优以及对不同时间尺度（如超短期、短期）分别建模。

三、精准预判：识别用电高峰与低谷

仅仅预测出未来的负荷曲线还不够，我们需要从预测结果中精准识别出高峰和低谷时段，并评估其发生的概率和强度。这对于电网调度决策至关重要。

3.1 高峰与低谷的定义

高峰和低谷的定义通常是相对的，可以根据业务需求设定：

绝对阈值法：设定一个固定的负荷阈值，超过该阈值的时段定义为高峰，低于另一阈值的定义为低谷。
相对百分位法：根据历史负荷分布，将超过90%分位数的时段定义为高峰，低于10%分位数的时段定义为低谷。这种方法更具动态性，能适应负荷水平的整体变化。
变化率法：负荷急剧上升或下降的时段也可能被视为需要特别关注的“尖峰”或“谷底”。

3.2 概率化预测

由于预测本身存在不确定性，提供点预测（单一数值）可能不足以支撑高风险决策。概率化预测（Probabilistic Forecasting）能够给出未来负荷的可能取值范围及其概率分布，如分位数预测（Quantile Forecasting）或区间预测（Interval Forecasting）。

分位数回归：通过修改模型的损失函数（如使用分位数损失），可以同时预测多个分位数（如5%、50%、95%）。50%分位数即为中位数预测，5%和95%分位数则构成了一个90%的预测区间。
蒙特卡洛Dropout：在深度学习模型（如LSTM）的测试阶段保持Dropout层开启，进行多次前向传播，得到多个预测结果，这些结果可以看作是来自后验分布的样本，从而构建预测区间。

3.3 峰谷识别算法

在得到概率化预测后，可以结合定义来识别高峰和低谷。

基于点预测的识别：直接对点预测结果应用阈值法或百分位法。
基于概率区间的识别：如果预测区间（如90%置信区间）的上界超过高峰阈值，则认为该时段为高概率高峰。如果下界低于低谷阈值，则为高概率低谷。
异常检测：可以将预测误差视为异常，如果预测误差的分布出现显著偏离（如误差突然增大），可能意味着模型未能捕捉到某种特殊模式（如突发的负荷激增），这本身就是一个重要的信号。

3.4 代码示例：使用分位数回归进行概率预测（LightGBM）

LightGBM支持分位数回归，我们可以用它来预测负荷的多个分位数，从而识别高峰和低谷的范围。

import lightgbm as lgb
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error

# 准备数据（使用之前DataFrame的特征和目标，但不进行归一化，因为LightGBM不需要）
X = df[features_to_scale]
y = df['load'] # 注意：这里使用原始负荷值，因为我们要预测原始值的分位数

# 划分训练集和测试集（按时间顺序）
split_idx = int(len(X) * 0.8)
X_train, X_test = X.iloc[:split_idx], X.iloc[split_idx:]
y_train, y_test = y.iloc[:split_idx], y.iloc[split_idx:]

# 定义要预测的分位数
quantiles = [0.05, 0.5, 0.95]

# 存储不同分位数的预测结果
predictions = {}

for q in quantiles:
    print(f"\n训练分位数 {q} 的模型...")
    # LightGBM的分位数损失函数
    # alpha是分位数，objective='quantile'表示分位数回归
    params = {
        'objective': 'quantile',
        'alpha': q,
        'learning_rate': 0.05,
        'num_leaves': 31,
        'verbose': -1
    }
    
    # 创建LightGBM数据集
    train_data = lgb.Dataset(X_train, label=y_train)
    test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)
    
    # 训练模型
    model = lgb.train(params, train_data, valid_sets=[test_data], num_boost_round=1000, early_stopping_rounds=50, verbose_eval=False)
    
    # 预测
    pred = model.predict(X_test)
    predictions[q] = pred
    
    # 评估（对于中位数）
    if q == 0.5:
        mae = mean_absolute_error(y_test, pred)
        print(f"中位数预测 MAE: {mae:.2f}")

# 可视化概率预测结果（取最后200个样本）
plt.figure(figsize=(15, 7))
plt.plot(y_test.values[-200:], label='Actual Load', color='black', linewidth=2)
plt.plot(predictions[0.5][-200:], label='Median Prediction (50%)', color='blue', linestyle='--')
plt.fill_between(range(200), predictions[0.05][-200:], predictions[0.95][-200:], color='blue', alpha=0.2, label='90% Prediction Interval (5%-95%)')
plt.title('Probabilistic Load Forecasting using Quantile Regression')
plt.xlabel('Time Step (in Test Set)')
plt.ylabel('Load')
plt.legend()
plt.grid(True)
plt.show()

# 识别高峰和低谷示例
# 假设高峰阈值为 1500，低谷阈值为 800
high_threshold = 1500
low_threshold = 800

# 基于95%分位数预测识别高概率高峰
high_prob_peak_times = predictions[0.95] > high_threshold
# 基于5%分位数预测识别高概率低谷
low_prob_valley_times = predictions[0.05] < low_threshold

print(f"\n在测试集中，预测出 {np.sum(high_prob_peak_times)} 个高概率高峰时段。")
print(f"在测试集中，预测出 {np.sum(low_prob_valley_times)} 个高概率低谷时段。")

# 打印前几个高峰时段的预测情况
peak_indices = np.where(high_prob_peak_times)[0][:5]
for idx in peak_indices:
    actual_load = y_test.values[idx]
    pred_interval = (predictions[0.05][idx], predictions[0.95][idx])
    print(f"时间点 {y_test.index[idx]}: 实际负荷={actual_load:.2f}, 预测区间={pred_interval}")

通过概率预测，我们不仅得到了负荷的可能值，还得到了其不确定性范围。结合阈值，我们可以量化未来某个时段成为高峰或低谷的概率，为调度决策提供更丰富的信息。

四、优化能源分配：基于预测的调度策略

精准的负荷预测和峰谷识别最终是为了服务于电网的优化调度。目标是在满足负荷需求的前提下，最小化总成本、最大化清洁能源利用率或减少碳排放。

4.1 优化目标与约束

能源分配优化通常是一个数学规划问题，包含以下要素：

目标函数 (Objective Function)：
- 经济成本最小化：min Σ (C_gen(t) * P_gen(t) + C_start(t) * u(t) + C_penalty * (P_unserved(t)))，其中C_gen是发电成本，P_gen是发电功率，C_start是机组启动成本，u(t)是启停状态，C_penalty是失负荷惩罚，P_unserved是未满足的负荷。
- 碳排放最小化：min Σ (E_carbon(t) * P_gen(t))。
- 可再生能源消纳最大化：min Σ (P_curtail(t))，其中P_curtail是弃风弃光量。
约束条件 (Constraints)：
- 功率平衡约束：Σ P_gen(t) + Σ P_import(t) + Σ P_discharge(t) = Load(t) + Σ P_export(t) + Σ P_charge(t)。这是最核心的约束，必须时刻满足。
- 机组技术约束：爬坡率限制（dP_min/dt <= P_gen(t+1) - P_gen(t) <= dP_max/dt）、最小/最大出力限制、最小启停时间等。
- 电网物理约束：线路传输容量限制、节点电压限制（在潮流计算中）。
- 储能约束：充放电功率限制、荷电状态（SOC）动态约束（SOC(t+1) = SOC(t) + η_charge * P_charge(t) * Δt - (1/η_discharge) * P_discharge(t) * Δt）、SOC上下限。
- 需求侧响应约束：可调节负荷的调节量限制、调节频次限制。

4.2 优化算法

根据问题的复杂度和规模，可以选择不同的优化算法：

线性/混合整数规划 (LP/MIP)：如果发电成本曲线可以线性化或分段线性化，且忽略复杂的电网潮流约束，这类问题可以转化为LP或MIP问题。使用成熟的求解器（如Gurobi, CPLEX, GLPK）可以高效求得全局最优解。
动态规划 (Dynamic Programming)：适用于多阶段决策问题，如储能的充放电策略优化。可以将一天划分为多个时段，从后向前递推求解每个时段的最优决策。
启发式/元启发式算法：对于非线性、非凸、高维度的复杂问题（如包含详细潮流约束的最优潮流），传统数学规划方法难以求解。遗传算法（GA）、粒子群优化（PSO）、模拟退火（SA）等算法可以在可接受的时间内找到满意的近似最优解。
强化学习 (Reinforcement Learning, RL)：RL通过智能体（Agent）与环境（电网）的交互来学习最优策略。智能体根据当前电网状态（负荷、可再生能源出力、储能SOC等）做出调度决策（发电、充放电），并根据决策效果（奖励/惩罚）不断优化策略。RL特别适合处理不确定性高、需要实时决策的场景。

4.3 基于预测的滚动优化

由于预测存在误差，一次性对未来24小时做出精确的调度计划往往不现实。实践中常采用滚动优化（Rolling Optimization）或模型预测控制（Model Predictive Control, MPC）策略：

短期预测：利用预测模型对未来1-4小时的负荷和可再生能源出力进行高精度预测。
优化求解：基于当前状态和短期预测，求解一个时间窗口（如1小时）内的优化问题，得到未来几个时段的调度计划。
执行第一步：只执行优化结果中的第一个时段（如未来15分钟）的调度指令。
滚动更新：进入下一个时段，获取新的实际测量数据，更新状态，重新进行预测和优化。

这种“预测-优化-执行-反馈”的闭环控制方式，能够有效抵抗预测误差和随机扰动的影响，保证电网的实时平衡。

4.4 代码示例：简单的储能充放电策略优化（动态规划）

假设我们有一个电池储能系统，目标是在一天内通过低买高卖（或低谷充电高峰放电）来最大化收益或最小化电网成本。我们使用动态规划来求解。

场景设定：

一天24个时段（每小时一个）。
每个时段的电价已知（或由负荷预测推断，高峰时电价高，低谷时电价低）。
储能容量为100 kWh，充放电效率为90%，最大充放电功率为25 kW。
初始SOC为50%。

import numpy as np
import matplotlib.pyplot as plt

# 1. 定义问题参数
price = np.array([0.3, 0.25, 0.2, 0.15, 0.1, 0.1, 0.15, 0.3, 0.5, 0.6, 0.5, 0.4, # 0-11h
                  0.35, 0.3, 0.3, 0.35, 0.4, 0.5, 0.7, 0.8, 0.7, 0.6, 0.5, 0.4]) # 12-23h
# 模拟一个典型的峰谷电价，高峰在18-20点，低谷在0-5点

battery_capacity = 100.0  # kWh
max_power = 25.0          # kW
charge_efficiency = 0.9
discharge_efficiency = 0.9
initial_soc = 50.0        # %
time_steps = len(price)
soc_states = np.arange(0, battery_capacity + 1, 1) # SOC离散化，步长1kWh
soc_steps = len(soc_states)

# 2. 动态规划求解
# dp[t][s] 表示在t时刻，SOC为s时，从t到23时刻的最大收益
# action[t][s] 记录最优动作：-1充电, 0不操作, 1放电
dp = np.full((time_steps, soc_steps), -np.inf)
action = np.zeros((time_steps, soc_steps))

# 初始化最后一刻的收益为0
dp[time_steps-1, :] = 0

# 从后向前递推
for t in range(time_steps-2, -1, -1):
    for s_idx, soc in enumerate(soc_states):
        # 当前状态：t时刻，SOC = soc
        
        # 选项1：不操作
        # 下一时刻SOC不变，收益为0
        next_s_idx = s_idx
        value_no_op = dp[t+1, next_s_idx]
        best_value = value_no_op
        best_action = 0
        
        # 选项2：充电
        # 需要SOC有空间，且功率不超过限制
        charge_power = min(max_power, (battery_capacity - soc) / charge_efficiency)
        if charge_power > 0:
            cost = charge_power * price[t] # 充电成本
            soc_increase = charge_power * charge_efficiency
            next_soc = soc + soc_increase
            # 找到下一时刻SOC对应的状态索引
            next_s_idx_charge = np.argmin(np.abs(soc_states - next_soc))
            value_charge = -cost + dp[t+1, next_s_idx_charge]
            if value_charge > best_value:
                best_value = value_charge
                best_action = -charge_power # 负值表示充电功率
        
        # 选项3：放电
        # 需要SOC有电量，且功率不超过限制
        discharge_power = min(max_power, soc * discharge_efficiency)
        if discharge_power > 0:
            revenue = discharge_power * price[t] # 放电收益
            soc_decrease = discharge_power / discharge_efficiency
            next_soc = soc - soc_decrease
            next_s_idx_discharge = np.argmin(np.abs(soc_states - next_soc))
            value_discharge = revenue + dp[t+1, next_s_idx_discharge]
            if value_discharge > best_value:
                best_value = value_discharge
                best_action = discharge_power # 正值表示放电功率
        
        dp[t, s_idx] = best_value
        action[t, s_idx] = best_action

# 3. 前向模拟，获取最优策略轨迹
optimal_soc = [initial_soc]
optimal_action = []
current_soc = initial_soc

for t in range(time_steps):
    s_idx = np.argmin(np.abs(soc_states - current_soc))
    act = action[t, s_idx]
    optimal_action.append(act)
    
    if act > 0: # 放电
        current_soc -= act / discharge_efficiency
    elif act < 0: # 充电
        current_soc -= act * charge_efficiency # act是负的
    # SOC不变
    
    optimal_soc.append(current_soc)

optimal_soc.pop() # 移除最后一个多余的SOC

# 4. 结果可视化
plt.figure(figsize=(15, 10))

# 子图1：电价和动作
plt.subplot(2, 1, 1)
plt.plot(price, label='Electricity Price', color='black', marker='o')
plt.title('Electricity Price and Optimal Battery Action')
plt.ylabel('Price ($/kWh)')
plt.grid(True, alpha=0.3)

# 绘制动作
ax2 = plt.gca().twinx()
actions = np.array(optimal_action)
ax2.bar(range(time_steps), actions, color=np.where(actions > 0, 'green', np.where(actions < 0, 'red', 'gray')), alpha=0.5, label='Action (kW)')
ax2.set_ylabel('Action (kW): Green=Discharge, Red=Charge')
ax2.axhline(0, color='black', linewidth=0.5)

# 子图2：SOC变化
plt.subplot(2, 1, 2)
plt.plot(optimal_soc, label='State of Charge (SOC)', color='blue', marker='o')
plt.title('Optimal Battery SOC Trajectory')
plt.xlabel('Hour of Day')
plt.ylabel('SOC (%)')
plt.ylim(0, 100)
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 打印策略
print("Hour | Price | Action (kW) | SOC (%)")
print("-" * 40)
for t in range(time_steps):
    print(f"{t:4d} | {price[t]:5.2f} | {optimal_action[t]:11.2f} | {optimal_soc[t]:6.1f}")

这个动态规划示例展示了如何根据预测的电价（可以由负荷预测推导）来制定最优的储能充放电策略。在实际电网调度中，这个模型会更复杂，需要考虑负荷平衡、多类型电源、电网约束等，但核心思想是一致的：基于预测信息，在满足约束的前提下，优化决策序列以最大化长期收益。

五、综合案例：城市级电网负荷预测与优化调度系统

为了将上述理论和方法串联起来，我们构建一个城市级电网负荷预测与优化调度系统的概念框架。

5.1 系统架构

数据层：
- 数据采集：通过SCADA系统、AMI（高级计量架构）、气象API、公共节假日API等实时/准实时采集数据。
- 数据湖/仓：将原始数据存储在数据湖中，经过ETL处理后存入数据仓库，供上层应用使用。
预测层：
- 短期负荷预测模块：使用LSTM或Transformer模型，滚动预测未来1-48小时的区域总负荷、分区负荷和关键用户负荷。
- 超短期负荷预测模块：使用更轻量级的模型（如XGBoost或小型LSTM），预测未来5-60分钟的负荷，用于实时控制。
- 可再生能源预测模块：预测光伏、风电的未来出力。
- 概率化预测引擎：为上述预测生成分位数预测结果。
优化调度层：
- 日前调度计划：基于未来24-48小时的确定性/概率性预测，使用MIP求解器生成次日的机组组合和经济调度计划。
- 日内滚动优化：基于未来1-4小时的高精度预测，使用MPC或强化学习方法，每15分钟滚动优化一次，调整发电机组出力、储能充放电、需求侧响应资源。
- 实时控制：基于超短期预测和实时量测，通过AGC（自动发电控制）等系统进行秒级/分钟级的频率和功率平衡控制。
可视化与决策支持层：
- Dashboard：展示实时负荷曲线、预测曲线、峰谷识别结果、优化调度指令、系统运行状态（如备用容量、碳排放量）。
- 告警系统：当预测到高概率的严重缺电或严重弃风弃光时，发出告警。
- 模拟推演：允许调度员输入不同的场景（如极端天气、机组故障），模拟其对电网的影响和最优应对策略。

5.2 实施挑战与对策

数据质量与异构性：不同来源的数据格式、频率、质量不一。对策：建立统一的数据接入标准和强大的数据清洗、对齐流程。
模型泛化能力：模型在训练集上表现好，但在新场景（如疫情封控、极端天气）下可能失效。对策：持续监控模型性能（Concept Drift Detection），定期用新数据重训模型；使用迁移学习或集成学习提升泛化性；建立针对极端场景的专用模型或规则库。
计算资源与实时性：大规模优化问题计算量巨大，难以满足实时性要求。对策：使用高性能计算（HPC）或云计算资源；对问题进行简化（如聚合节点、线性化成本）；使用近似算法或启发式算法；将复杂计算离线进行，在线部分只做快速调整。
网络安全与隐私：电网是关键基础设施，数据安全至关重要。对策：采用加密通信、访问控制、数据脱敏等技术；对于联邦学习等分布式AI技术，可以在不共享原始数据的情况下协同训练模型。

5.3 未来展望

AI与物理模型的深度融合：将物理知识（如电网潮流方程、机组物理模型）嵌入到神经网络中（Physics-Informed Neural Networks, PINN），既能利用数据驱动的优势，又能保证预测结果符合物理规律，提高模型的可解释性和外推能力。
边缘智能：将部分预测和优化算法部署在靠近数据源的边缘设备（如智能电表、边缘网关）上，实现分布式、低延迟的本地决策，减轻中心云端的计算压力。
生成式AI的应用：利用生成对抗网络（GAN）或扩散模型（Diffusion Models）生成符合物理规律的合成数据，用于扩充训练集，特别是罕见但重要的场景数据，从而提升模型的鲁棒性。
跨区协同优化：随着特高压电网和区域电力市场的建设，负荷预测和优化调度将从单一城市/省份扩展到跨区域协同，需要更复杂的模型和算法来处理更大规模、更复杂的耦合关系。

结论

电网负荷调度排期预测与能源分配优化是一个复杂但至关重要的系统工程。通过构建高维度的数据集，应用先进的深度学习模型进行精准的负荷与峰谷预测，并结合数学规划或强化学习等优化算法，我们可以显著提升电网运行的经济性、安全性和环保性。从数据到决策的全链路智能化，是构建未来智慧电网的必由之路。尽管面临数据、模型、计算和安全等方面的挑战，但随着技术的不断进步和应用的深入，我们有理由相信，一个更加智能、高效、可靠的电力系统即将到来。