以下是PlanIQ术语定义
属性化
属性包含绝对信息,按共享特征分组历史数据项(例如产品类别)。属性不是数字属性帮助PlanIQ发现类似项目模式
常表示项目层次元素或商业维度(如SKU逐商店)。属性用生成更精确预测
反向测试
回测试标准技术验证机器学习和时序预测模型历史数据划分成火车机和测试机火车集用于训练预测模型并预测测试集所代表的时间框架预测模型后通过比较测试集预测与实值或已知观察值
回测试时间段等于预测地平线模型培训过程保留此段历史数据并用同期生成预测
反测试结果用于评估预测模型质量
资料收集
数据采集包括历史数据,并可选相关数据和属性用于训练预测模型产生预测结果
分解
预测技术,历史数据划分成不同的构件或变量每一变量转用预测允许您评估变量对预测有多大影响
举例说,你可能想看单价对利润的影响是否比月广告成本小
过期项
过期项PlanIQ假设不再在预测中有效使用,但在数据收集中仍然存在当项目确定为报废时 PlanIQ预测动作不产生预测结果报废项目实例是停产商品,产品不再出售
逻辑寿命结束
PlanIQ计算历史数据尾端零值(轨迹零值),用于特定项,并使用此信息判定项目是否寿命结束其中一个必须是真实的
(1) 每日数据频率有14个余值零
尾值零超出预测地平线例举 :
- 预测地平线3个月
- 后三个月历史数据对特定项为0
- 事实如此
3 PlanIQ计数小数零
- 项目最后三个项为0
- 后退零数超过项目总历史的10%
- 后此项为寿命终结
逻辑同时应用Anaplan预言算法和MVLR算法
可解释性
模型方法使机器学习工具决策行为更容易理解
预测动作
预测动作生成最新实战预测动作从PlanIQ输入预测结果和可解释性信息
预测地平线
未来时间长度预测最大预测地平线由历史数据深度和所选算法确定
预测模型
算法训练从数据采集生成预测
预测时间间隔
预测数据点区间,由输入数据定义(历史相关数据)和选择算法预测时间段可每日、周或月
历史数据(实证)
初级数据类型预测数据强制化必须是数值并包含时间维度实例:单元售出,支出
双参数
参数值控制预测模型学习过程超参数调试是PlanIQ模型配置程序的一部分
拉格
历史时段数预测未来时段PlanIQ需要3个月历史数据(3月、4月、5月)计算6月趋势类似地,为获取2021年3月单年度趋势数据点,PlanIQ从2020年3月至2021年3月需要12个月历史数据
噪声
即余量,噪声数据点偏向预测趋势时间序列预测中噪声随机数据无法预测,偏离时间序列典型行为噪声可有效显示模型质量
相关数据(驱动器)
可选数据集为预测提供附加驱动器(业务因子和值)。相关数据帮助PlanIQ提高预测精度实例有历史资料和前瞻推广相关数据包括:
- 时间维度(例如:历史前向推广)
- 历史数据点通向预测地平线
- 未来数据点覆盖预测地平线长度(可选但推荐提高预测精度)。
稀疏数据
数据集多值为0举例说,如果数据集表示对产品随时间推移的需求,并有需求为零时段
将数据集输入资料收集前,可选择辨别真实零和表示缺失数据零帮助确保预测结果不偏斜更多信息见排除值.
时间序列
相继数据点序列(观察)时间间隔定时
时间序列预测
预测时序未来值基于历史数据类型和其他数据类型