| 例文 |
dynamic decision processの部分一致の例文一覧と使い方
該当件数 : 2件
The first state transition probability and prescribed first reward are used to obtain a state value function V^π(s) on the basis of dynamic programming in a Markov decision process.例文帳に追加
第一状態遷移確率及び所定の第一報酬を用いて、マルコフ決定過程における動的計画法に基づき、状態価値関数V^π(s)を求める。 - 特許庁
The second state transition probability and the second reward are used to obtain action value function Q^π(s, a) and the state value function V^π(s) on the basis of the dynamic programming in the Markov decision process.例文帳に追加
第二状態遷移確率及び第二報酬を用いて、マルコフ決定過程における動的計画法に基づき、行動価値関数Q^π(s,a)及び状態価値関数V^π(s)を求める。 - 特許庁
| 例文 |
| Copyright © Japan Patent office. All Rights Reserved. |
|
ログイン |
Weblio会員(無料)になると
|
|
ログイン |
Weblio会員(無料)になると
|