一天搞懂人工智慧如何從無到有、左右互搏，自我學習成長

AlphaGO Zero 不需要任何人類的提供的先備知識，可以從無到有，藉由與自己對弈，在三天之內超越人類，更有甚者，AlphaZero 無師自通，在象棋、西洋棋等棋類遊戲上具備職業頂尖水準；Libratus 賭桌上橫掃頂尖人類職業玩家，成為德州撲克冠軍，有別於這一年來最夯的 CNN、RNN、GAN 等深度學習網路，這些 AI 仰賴的是讓機器能夠從環境中學習規則的增強學習 (Reinforcement Learning)。

逢甲資料科學大講堂本次邀請到師承人工智慧大師吳恩達博士 (Andrew Ng) 與李飛飛博士的台灣人工智慧新星，清大電機的孫民博士，來為各位講解增強學習的基礎、訓練秘訣以及最新發展，本課程將從經典的 Markov Decision Process (MDP) 開始，從傳統增強學習的算法開始，之後逐步講解著名的 Deep Q-Network (DQN) 以及 Policy Gradient (PG) 演算法。最後分享相關領域最新研究發展以及使用增強學習的小訣竅。

想要接觸人工智慧最新銳技術，並且一探電腦如何從環境中自我學習成長的朋友們切勿錯過。

講者簡介

孫民 (Min Sun)

國立清華大學電機工程學系 / 助理教授

孫民博士目前任教於國立清華大學電機系，他擁有史坦福電機碩士 (導師為吳恩達)、密西根安雅堡電機系統組博士 (先後導師為李飛飛以及Silvio Savarese)、以及西雅圖華盛頓大學計算機工程博士後的經歷。他的研究興趣在電腦視覺、機器學習、以及人機互動領域。近年來基於深度學習在電腦視覺的突破，他致力於開發橫跨人工智慧不同子領域的系統，如自動影片文字描述 (視覺 x 自然語言)、以及與人類行為互動的智慧機器 (視覺 x 控制)。相關資訊請參考 aliensunmin.github.io。

2018 年 6 月 2 日 (星期六)

逢甲大學第一國際會議廳 (丘逢甲紀念館 2F)

議程

9:00-9:30	報到
9:30-10:30	MDP 以及傳統增強學習的算法
10:30-10:50	Tea Break
10:50 - 12:30	不需環境資訊 (Model-free) 的增強學習 (包含 DQN)
12:30 - 13:30	午餐
13:30-15:10	直接優化動作政策 (Action Policy) 的 (PG) 演算法
15:10-15:30	Tea Break
15:30-17:00	最新研究發展以及使用增強學習的小訣竅

活動場地路線圖

ゼミナール

チケット種別	販売期間	価格
早鳥票	2018/05/09 12:00(+0800) ~ 2018/05/12 00:00(+0800) 販売終了	TWD$780
一般票	2018/05/12 00:00(+0800) ~ 2018/05/26 00:00(+0800) 販売終了	TWD$980
轉換票 (需有贊助商邀請碼)	2018/05/09 00:00(+0800) ~ 2018/05/31 00:00(+0800) 販売終了	無料

逢甲資料科學大講堂 – 增強學習初探以及最新發展趨勢