登录社区云,与社区用户共同成长
邀请您加入社区
文章目录问题原因解决方案问题将特征全都标准化到 [0,1],设计了多层 Dense, 训练,发现评估指标一直不下降,而且预测值全部都相同,如下所示:原因看了一下激活函数用的是relu,因为relu的激活小于0全等于0,大于0就保持不变;猜测是全部都小于0,导致全部都等于0,于是对于所有样本都输出同一个预测值。解决方案激活函数改为tanh,性能评估指标发生了变化,预测值也发生变化...
将特征全都标准化到 [0,1],设计了多层 Dense, 训练,发现评估指标一直不下降,而且预测值全部都相同,如下所示:
看了一下激活函数用的是relu,因为relu的激活小于0全等于0,大于0就保持不变;猜测是全部都小于0,导致全部都等于0,于是对于所有样本都输出同一个预测值。
激活函数改为tanh,性能评估指标发生了变化,预测值也发生变化
有“AI”的1024 = 2048,欢迎大家加入2048 AI社区
更多推荐
【自然语言处理与大模型】三种实现多模态技术的路线
抖音私信+豆包智能体+大模型实现抖音后台私信智能人工客服
【VLM】vLLM-Omni多模态推理框架
扫一扫分享内容
所有评论(0)