np.sum维度降维问题：cs231n assignment2 报错"ValueError: non-broadcastable output operand "

报错：ValueError: non-broadcastable output operand with shape (100,1) doesn't match the broadcast shape (100,100)原因：在fc_net.py、TwoLayerNet类中：self.params['b1'] = np.zeros(hidden_dim)b1是一维的s...

人间真正走过~

13605人浏览 · 2019-04-11 19:32:11

人间真正走过~ · 2019-04-11 19:32:11 发布

报错：

ValueError: non-broadcastable output operand with shape (100,1) doesn't match the broadcast shape (100,100)

原因：

在fc_net.py、TwoLayerNet类中：

self.params['b1'] = np.zeros(hidden_dim)  b1是一维的

self.params['b1'] = np.zeros((hidden_dim，1))  b1是二维的

而在layers.py、affine_backward函数中，使用np.sum时，不指定keepdims=True面临降维问题：

db=np.sum(dout,axis=0)  db降维，db变成一维的

db=np.sum(dout,axis=0,keepdims=True)  db仍为二维

而python broadcast方法要求维度必须一致

之后解决方法已经很显然了，令self.params['b1']与db的维度一致即可。

其中关于np.sum维度问题，可参考：https://blog.csdn.net/m0_37390405/article/details/79175273

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

智码AiCoder 给所有AI CLI编程工具一个统一的家-高效会话管理工具

2048 AI社区

搞定 AI Agent 支付难题！MoltsPay【快速安装教程】

想象这样的场景：某 AI Agent 需要调用视频生成 API 完成任务，单次服务费用 0.99 美元。在传统支付模式下，需要用户提前注册账号、绑定银行卡、预存余额，再由 Agent 通过 API Key 调用服务，服务商从用户余额中扣费。全程离不开人工介入，对于 Agent-to-Agent 的自动化交互场景而言，这套流程完全无法适配。而一款名为 MoltsPay 的产品，恰好为 AI Agen