问题描述

在PyCharm中使用强化学习运行Python代码时报错ValueError: expected sequence of length 8 at dim 2 (got 0)。

问题原因

实际上原因就是gym中的env对象的reset、step等方法的返回值作了改动

解决方法

1、第一步:
将代码块中的(记得改的需要是出错的地方,没报错的地方别改)

state = env.reset()

改为

state = env.reset()[0]

2、第二步:
将代码块中的

next_state, reward, done, _ = env.step(action)

修改为

next_state, reward, done, _, __ = env.step(action)

改完之后成功运行!解决!(*^▽^)*

如果觉得博主请各点赞加关注哦~后续还会出很多强化学习相关的文章,有任何问题欢迎沟通交流~~

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐