[RL學習篇][#2] 簡單的grid_mdp測試程式

下方是用來簡單的測試 grid_mdp.py的程式,執行後會用隨機動作去跑動作。

 1 import gym
 2 import tensorflow
 3 import random
 4 from gym import wrappers
 5
 6 env = gym.make(‘GridWorld-v0‘)
 7
 8 env = wrappers.Monitor(env, ‘./outputs/grid_mdp-experiment-‘, force=True)
 9
10 for episode in range(100):
11     env.reset()
12     for i in range(100):
13         env.render()
14         next_state, reward, done, _ = env.step(random.choice(env.action_space)) # take a random action
15
16         if done :
17             break
18
19     print(‘episdoe: ‘, episode)
20
21 wrappers.Monitor.close(env)

原文地址:https://www.cnblogs.com/lishyhan/p/9052161.html

时间: 2024-10-10 04:33:17

[RL學習篇][#2] 簡單的grid_mdp測試程式的相关文章

[RL學習篇][#3] 自動學習grid_mdp最佳的策略

本文修改 policy_iteration.py程式,讓他可以執行[#1]的程式,並找出最佳動作. 1 # /bin/python 2 import numpy; 3 import random; 4 import gym; 5 #from grid_mdp import Grid_Mdp 6 7 8 class Policy_Value: 9 def __init__(self, grid_mdp): 10 self.v = [0.0 for i in range(len(grid_mdp.e

無心插柳的Linux學習者代言人——蔡德明

誰是「蔡德明」恐怕沒有多少人知道,不過提到「鳥哥」這個稱號,在臺灣的Linux社群幾乎是無人不知無人不曉,蔡德明正是鳥哥的本名.鳥哥究竟多有名? 如果你是有意學習Linux的初學者,卻不知如何下手,10個人當中有9個人會告訴你,先上「鳥哥的Linux私房菜」網站(http://linux.vbird.org) 瞧瞧,或是去書店買一本「鳥哥的Linux私房菜-基礎學習篇」來研讀,因為前者早已是臺灣最具人氣的Linux技術教學網站(從2002年至今,上站人 數已突破380萬人次),後者則是從2003

單元測試 - spring + struts2

google 一下 struts2.unit test,大概會出現「Struts 2 JUnit Plugin」,用它來做單元測試當然沒問題,但是,現在的人寫 JavaEE 誰不用 spring ? 既然已經是 spring + struts2,就不用那麼麻煩了! 這裡舉個簡單的例子,這是一個查詢特定選區各候選人得票統計的小程式,執行出來的畫面如下: source code 已經放在 https://github.com/twleader/DemoSite/tree/master/MVCSite

學習 React.js:用 React.js 和 Flux 創建一個簡單的購物車

Creating A Simple Shopping Cart with React.js and Flux Ken Wheeler (@ken_wheeler) 簡介 歡迎來到學習 React 的第四章這也是最後一章!到現在,我們已經學習了怎樣利用 React 的 API 來創建狀態型組件,如何應用它們,以及如何運用臉書的 Flux 架構來工作的 今天我們將把所有的這一切放到一塊,來創建一個簡單的購物車應用.在現在的電商網站上,產品的詳細頁面相互依賴,而 React 有助於簡化並有效的組織它們

老男孩老師課程學習筆記----ip端口協議 簡單敘述

互聯網上的計算機 都會有一個唯一的32位元的地址, ip地址 我們訪問服務器,就必須透過這個ip地址 局域網也有預留的ip地址 192/10/172開頭.局域網的ip地址也是唯一的 NAT模式,電腦宿主機的ip在局域網是唯一的,選擇的NAT模式創件虛擬機,虛擬機就是一個新的局域網(私有網路). 老師的機器ip是192.168.33.128 端口的簡單概念 , 192.168.33.128 代表一台主機,但是主機上可能會有許多的服務, 一台主機上的不同服務功能,就是透過端口區分,然後讓外部人員訪問

學習筆記:Linux常見題目解析分享

學習題目分享解答 --此篇博客感謝老男孩老師教學,才得以學習完成此篇博客-- 描述linux系統的啟動過程?     (企業面試題) (1)簡單描述(口頭) 1.開機BIOS自檢    --->檢查硬件是否正常   自檢完後 根據啟動順序,教給下一個設備處理 2.MBR引導    ---->(硬盤) 硬盤0柱面0磁道1扇區的前446byte      (1扇區 512字節)   剩下的(512-446 =66)    其中64用來分區表(4個--->意思是4個主分區或4個擴展分區)  最

學習 React.js:用 Node 和 React.js 創建一個實時的 Twitter 流

Build A Real-Time Twitter Stream with Node and React.js By Ken Wheeler (@ken_wheeler) 簡介 歡迎來到學習 React 的第二章,該系列文章將集中在怎麼熟練並且有效的使用臉書的 React 庫上.如果你沒有看過第一章,概念和起步,我非常建議你繼續看下去之前,回去看看. 今天我們準備創建用 React 來創建一個應用,通過 Isomorphic Javascript. Iso-啥? Isomorphic. Java

FMDB與SQLite 數據庫應用示範:打做一隻簡單的電影資料庫 App

原文:http://www.appcoda.com/fmdb-sqlite-database/ 作者:GABRIEL THEODOROPOULOS 譯者:kmyhy 通常在 App 中使用數據庫并處理數據都會是一個重要和嚴肅的話題.在幾個月前我寫了一篇關於如何利用 SwiftyDB 來管理 SQLite 數據庫的文章.今天,我又提起數據庫這個話題,只不過這次我會介紹另一個庫.你也許聽說過了,它就是FMDB. 這兩個庫的功能都是一樣的,都是用來與 SQLite 數據庫打交道并允許你高效地管理你的

【转】簡單講講 USB Human Interface Device

原地址http://213style.blogspot.com/2013/09/usb-human-interface-device.html 恩,發本文的原因是看到了以前畢業的朋友在旁邊的對話框問了一些問題,我想這些問題 不是三言兩語可以解釋完畢,但是我也不想又太細究 HID 內部描述表格的解說與視窗上 HID APIs 家族詳細使用方法,主要以偏向解決問題與實作面上的一些重點,希望可以有些 許幫助,因為詳細的文獻找 USB Complete: The Developer's Guide fo