数据集源地址:https://www.kaggle.com/datasets/ashrafkhetran/gold-price-analysis-and-forecasting-yfinance?select=features_full.csv
在这里插入图片描述
我用夸克网盘给你分享了「黄金价格预测数据集」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/cc803AMf8r😕
链接:https://pan.quark.cn/s/c8cc309c1a47
数据集包括以下四个文件:
在这里插入图片描述

结合数据集内容(黄金价格分析场景)和时间序列数据特征,以下是对features_full.csv中13个字段的详细解释,按功能分为4大类:
(以下是AI辅助总结)

一、基础信息字段(时间标识)

用于标记每条数据对应的时间节点,是时间序列分析的核心基础。

字段名称 数据类型 核心意义 应用场景
Date object 交易日期 直观标识每条黄金价格数据对应的具体日期(格式:YYYY-MM-DD)
ds object 时间序列日期 适配时间序列预测模型(如Prophet)的标准日期字段,与Date完全一致,仅为模型兼容性命名

二、目标变量字段(核心价格)

代表黄金价格的核心指标,是分析和预测的核心对象。

字段名称 数据类型 核心意义 关键说明
close float64 黄金收盘价 当日黄金交易结束时的最终价格,是金融分析中最常用的价格指标(单位:美元/盎司,推测)
y float64 预测目标变量 close数值完全一致,是预测任务中定义的“目标值”,专门用于模型训练(如预测未来y值即预测未来收盘价)

三、滞后特征字段(历史价格参考)

通过“历史价格”反映价格的时间关联性,是时间序列预测的核心特征,lag_N代表“前N个交易日的价格”。

字段名称 数据类型 核心意义 业务价值
lag_1 float64 前1个交易日收盘价 反映短期价格趋势(如当日与前一日价格差)
lag_2 float64 前2个交易日收盘价 反映近2日价格波动规律
lag_3 float64 前3个交易日收盘价 捕捉短期(约1周内)价格惯性
lag_5 float64 前5个交易日收盘价 覆盖1个完整交易日周期(通常1周5个交易日)的历史价格
lag_10 float64 前10个交易日收盘价 反映2周内的中期价格趋势
lag_21 float64 前21个交易日收盘价 对应1个自然月(约21个交易日)的历史价格,用于分析月度价格规律

四、滚动平均特征字段(趋势平滑指标)

通过“移动平均”平滑短期价格波动,突出中长期趋势,rolling_mean_N代表“过去N个交易日的平均价格”。

字段名称 数据类型 核心意义 业务价值
rolling_mean_7 float64 过去7个交易日收盘价均值 平滑周内短期波动,反映1周内的价格趋势
rolling_mean_21 float64 过去21个交易日收盘价均值 代表月度价格趋势,常用于判断中期(1个月)价格方向
rolling_mean_63 float64 过去63个交易日收盘价均值 对应3个自然月(约63个交易日)的价格均值,反映长期价格趋势

关键补充说明

  1. 数据一致性验证Dateds完全相同,closey完全相同,均为“同一信息的不同命名”,前者为通用标识,后者为适配特定预测模型(如Prophet)的标准命名。
  2. 数值合理性:价格范围为1127-4976(单位推测为美元/盎司),符合2016年至今黄金价格的实际波动区间(历史数据验证)。
  3. 无缺失值:所有字段均为2465个非空值,数据完整性高,可直接用于建模分析。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐