<thead id="fflbj"><font id="fflbj"><cite id="fflbj"></cite></font></thead>
    <progress id="fflbj"><thead id="fflbj"><font id="fflbj"></font></thead></progress>

            課程名稱:Python 實現文本解析器培訓

            4401 人關注
            (78637/99817)
            課程大綱:

            強化學習基礎算法培訓

             

             

            強化學習(英語:Reinforcement learning)是非常前沿的學科,

            它可能是實現強(類)人工智能的手段之一。

            了解并掌握基礎的強化學習方法,

            將使得你對人工智能的概念進一步深化。

            1 強化學習概念

            2 Sarsa 強化學習算法

            3 OpenAI Gym 應用

            4 Q-Learning 強化學習算法

            5 策略梯度算法

            1
            強化學習介紹與示例

            1.強化學習介紹

            2.強化學習算法分類

            3.強化學習應用

            4.課外內容推薦

            2
            Q-Learning 強化學習方法實現

            1.QTable的概念

            2.QLearning算法實現

            3.Sarsa學習算法

            4.Sarsa和QLearning區別

            挑戰 1
            實現 Sarsa 學習算法走出迷宮

            1.QTable初始化

            2.QTable更新函數

            3.Sarsa完整算法實現

            3
            OpenAI Gym 環境介紹及使用

            1.Gym環境安裝

            2.Gym環境使用

            3.Gym環境示例

            2
            Gym 玩 Atari 打磚塊游戲

            1.OpenAIGym使用

            2.打磚塊游戲可視化

            4
            策略梯度強化學習方法實現

            1.策略梯度過程推導

            2.策略梯度定理

            3.蒙特卡洛策略梯度算法

            4.ActorCritic策略梯度算法

            5.策略梯度算法實現

            3
            使用策略梯度訓練 CartPole

            1.策略梯度

            2.策略梯度定理

            3.MonteCarlo策略梯度算法

            4.ActorCritic策略梯度


            登錄 后發表評論
            新評論
            全部 第1節 第2節 第3節 第4節 第5節 第6節 第7節 第8節 第9節 第10節 第11節 第12節 第13節 第14節 第15節 第16節 第17節
            我的報告 / 所有報告
            538在线视频二三区视视频