初始 DQN 程序 所遇到的问题

  最近在看 DQN,但是想试试别人放出来的 code,但是发现,额,各种问题,在此记录,以备不时之需!

  问题1.



[email protected]:~/Documents/DRL/DQN-tensorflow-master$ python main.py --env_name=Breakout-v0 --is_train=True
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:99] Couldn‘t open CUDA library libcudnn.so. LD_LIBRARY_PATH: /home/wangxiao/torch/install/lib:/home/wangxiao/torch/install/lib:/home/wangxiao/torch/install/lib:/home/wangxiao/torch/install/lib:
I tensorflow/stream_executor/cuda/cuda_dnn.cc:1562] Unable to load cuDNN DSO
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcurand.so locally
[*] GPU : 1.0000
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:900] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_init.cc:102] Found device 0 with properties:
name: GeForce GTX 980
major: 5 minor: 2 memoryClockRate (GHz) 1.329
pciBusID 0000:01:00.0
Total memory: 4.00GiB
Free memory: 3.58GiB
I tensorflow/core/common_runtime/gpu/gpu_init.cc:126] DMA: 0
I tensorflow/core/common_runtime/gpu/gpu_init.cc:136] 0: Y
I tensorflow/core/common_runtime/gpu/gpu_device.cc:755] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 980, pci bus id: 0000:01:00.0)
[2016-07-03 09:14:02,576] Making new env: Breakout-v0
{‘_save_step‘: 50000,
‘_test_step‘: 10000,
‘action_repeat‘: 4,
‘backend‘: ‘tf‘,
‘batch_size‘: 32,
‘cnn_format‘: ‘NCHW‘,
‘discount‘: 0.99,
‘display‘: False,
‘env_name‘: ‘Breakout-v0‘,
‘env_type‘: ‘simple‘,
‘ep_end‘: 0.1,
‘ep_end_t‘: 1000000,
‘ep_start‘: 1.0,
‘history_length‘: 4,
‘learn_start‘: 50000.0,
‘learning_rate‘: 0.00025,
‘learning_rate_decay‘: 0.96,
‘learning_rate_decay_step‘: 50000,
‘learning_rate_minimum‘: 0.00025,
‘max_delta‘: 1,
‘max_reward‘: 1.0,
‘max_step‘: 50000000,
‘memory_size‘: 1000000,
‘min_delta‘: -1,
‘min_reward‘: -1.0,
‘model‘: ‘m2‘,
‘random_start‘: 30,
‘scale‘: 10000,
‘screen_height‘: 84,
‘screen_width‘: 84,
‘target_q_update_step‘: 10000,
‘train_frequency‘: 4}

E tensorflow/stream_executor/cuda/cuda_driver.cc:932] failed to allocate 3.58G (3844833280 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
[*] Loading checkpoints...
[!] Load FAILED: checkpoints/Breakout-v0/min_delta--1/max_delta-1/history_length-4/train_frequency-4/target_q_update_step-10000/memory_size-1000000/action_repeat-4/ep_end_t-1000000/min_reward--1.0/backend-tf/random_start-30/scale-10000/env_type-simple/learning_rate_decay_step-50000/ep_start-1.0/screen_width-84/learn_start-50000.0/cnn_format-NCHW/learning_rate-0.00025/batch_size-32/discount-0.99/max_step-50000000/max_reward-1.0/learning_rate_decay-0.96/learning_rate_minimum-0.00025/env_name-Breakout-v0/ep_end-0.1/model-m2/screen_height-84/
0%| | 49970/50000000 [01:06<18:20:10, 756.70it/s]F tensorflow/stream_executor/cuda/cuda_dnn.cc:204] could not find cudnnCreate in cudnn DSO; dlerror: /usr/local/lib/python2.7/dist-packages/tensorflow/python/_pywrap_tensorflow.so: undefined symbol: cudnnCreate
Aborted



那么就搜到了如下的答案: link:http://stackoverflow.com/questions/35702403/tensorflow-0-7-1-with-cuda-toolkit-7-5-and-cudnn-7-0

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"

export CUDA_HOME=/usr/local/cuda

或者,copy the cuDNN libraries to /usr/local/cuda/lib64. 我两个同时执行的,所以 不知道哪个起作用了,好吧,但是再执行,确实是变成了另一个问题,即:



E tensorflow/stream_executor/cuda/cuda_driver.cc:932] failed to allocate 3.58G (3844702208 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
[*] Loading checkpoints...
[!] Load FAILED: checkpoints/Breakout-v0/min_delta--1/max_delta-1/history_length-4/train_frequency-4/target_q_update_step-10000/memory_size-1000000/action_repeat-4/ep_end_t-1000000/min_reward--1.0/backend-tf/random_start-30/scale-10000/env_type-simple/learning_rate_decay_step-50000/ep_start-1.0/screen_width-84/learn_start-50000.0/cnn_format-NCHW/learning_rate-0.00025/batch_size-32/discount-0.99/max_step-50000000/max_reward-1.0/learning_rate_decay-0.96/learning_rate_minimum-0.00025/env_name-Breakout-v0/ep_end-0.1/model-m2/screen_height-84/
0%| | 49983/50000000 [01:04<18:01:04, 770.06it/s]F tensorflow/stream_executor/cuda/cuda_dnn.cc:220] could not find cudnnConvolutionBackwardFilter_v2 in cudnn DSO; dlerror: /usr/local/cuda/lib64/libcudnn.so: undefined symbol: cudnnConvolutionBackwardFilter_v2
Aborted
[email protected]:~/Documents/DRL/DQN-tensorflow-master$



  然后就发现,cudnn 这么多问题!

  于是乎,我就将 cudnn 6.5 换成了 cudnn 7.0 版本,重新配置了一下,然后在执行:

  

  仍然在加载 检查点 (checkpoint),不知道什么时候会断掉?

  额 貌似可以了。。。

  

  Ok 大家发现了吧 原来主要原因在于 cndnn 的版本问题。

时间: 2024-10-13 11:53:23

初始 DQN 程序 所遇到的问题的相关文章

窗体==&gt;&gt;初始Windows程序

初识Windows程序 01.创建Windows程序(VS) 01.打开Visual Studio开发工具 02.选择"文件"→"新建"→"项目" 命令. 03.项目类型选择"Visual C#". 04.模板选择"Windows窗体应用程序". 05."起名"→"确认". 02.认识Windows程序 01.Form1.cs:窗口文件,程序员对窗体编写的代码一般都会

初始window程序

window 操作系统中,处处是窗体 简单 强大 方便 灵活 步骤 新建项目  项目类型 visual C#项目 模板 window应用程序 用partial 将同一个窗体的代码分开放在两个文件中:一个存放在vs自动生成的代码中 冒号表示继承像孩子继承父母的特征所有窗体都继承Form 窗体标题 : Name窗体图标: Icon图片背景Backgroundimage背景颜色 backcolor最大化按钮:MaximinBox最小化按钮:Minimun窗体边框样式 :FROMBorderStyle窗

初始Windows程序

1.属性 窗体标题 Name  窗体的图标 Icon  背景图片 BackgroundImage 背景颜色 BackColor  最大化按钮 MaxIMonBox  最小化按钮 Minimun 窗体边框样式 FormBorderStyle  窗体初始位置 StartPosition 窗体状态 WindowsState  背景图片拉伸 BackgroundImageLayout  窗体标题 Text 窗体显示状态 TopMost  关闭窗口 Close()   帮助按钮 HelpButton 显示

用Tensorflow基于Deep Q Learning DQN 玩Flappy Bird

前言 2013年DeepMind 在NIPS上发表Playing Atari with Deep Reinforcement Learning 一文,提出了DQN(Deep Q Network)算法,实现端到端学习玩Atari游戏,即只有像素输入,看着屏幕玩游戏.Deep Mind就凭借这个应用以6亿美元被Google收购.由于DQN的开源,在github上涌现了大量各种版本的DQN程序.但大多是复现Atari的游戏,代码量很大,也不好理解. Flappy Bird是个极其简单又困难的游戏,风靡

使用inno setup打包程序完整脚本(.net框架检测,重复安装检测)

; 脚本由 Inno Setup 脚本向导 生成!; 有关创建 Inno Setup 脚本文件的详细资料请查阅帮助文档! #define MyAppName "小小鸟软件"#define MyAppVersion "2012.2.29"#define MyAppPublisher "小小鸟科技"#define MyAppURL "http://www.cnblogs.com/IT-SmallBird/"#define MyAp

USART中断接收程序

//usart.h #ifndef __USART_H__ #define __USART_H__ #include "stm32f10x.h" #include <stdio.h> void GPIO_Configuration(void); void NVIC_Configuration(void); void USART_Configuration(void); #endif //usart.c #include "usart.h" //加入以下代

微信小程序+和风天气完成天气预报

<冷暖自知>天气小程序 学无止境,以玩儿玩儿的心态去学习! 前一天晚上写的,写的不太好,第二天马上修改了,如有差错,请多指教. 花半天时间完成简单的小程序应用.适合小程序初学者. 步骤: 申请小程序帐号: 小程序注册入口, 具体操作按照官网步骤执行,相信你会看的很明白的(- 安装微信开发者工具,打开工具填写信息:①项目目录为自己要开发小程序的位置②AppId在微信管理后台的设置-开发设置中③项目名称自己起,填写完成点击完成: 看到默认的初始小程序Hello Horld是不是很兴奋,以上步骤不是

mpvue搭建微信小程序

最初,我电脑已经搭建成功相应的环境配置,于是可以直接创建微信小程序,如第一次,可参考https://www.cnblogs.com/donglt-5211/p/9369098.html搭建 步骤一:创建一个基于 mpvue-quickstart 模板的新项目 vue init mpvue/mpvue-quickstart my-wechat 步骤二:依次运行 cd my-wechat, npm install ,npm run dev; 步骤三:已经生成了------小程序代码的目录,文件夹"d

微信小程序快速开发上手

介绍: 从实战开发角度,完整系统地介绍了小程序的开发环境.小程序的结构.小程序的组件与小程序的API,并提供了多个开发实例帮助读者快速掌握小程序的开发技能,并能自己动手开发出小程序.本书的特色是突出实战,动手操作,快速开发,适合想上手小程序开发的各类人员. 本书特色: 从实战出发,介绍小程序开发的方方面面,提供丰富的开发实例,帮助读者快速上手,开发出自己的小程序. 本书是编者实际开发小程序的经验总结,书中从实战角度出版,介绍了小程序开发的所有知识和开发技能,提供了丰富的开发范例,帮助读者快速上手