一天搞懂人工智慧如何從無到有、左右互搏,自我學習成長
AlphaGO Zero 不需要任何人類的提供的先備知識,可以從無到有,藉由與自己對弈,在三天之內超越人類,更有甚者,AlphaZero 無師自通,在象棋、西洋棋等棋類遊戲上具備職業頂尖水準;Libratus 賭桌上橫掃頂尖人類職業玩家,成為德州撲克冠軍,有別於這一年來最夯的 CNN、RNN、GAN 等深度學習網路,這些 AI 仰賴的是讓機器能夠從環境中學習規則的增強學習 (Reinforcement Learning)。
逢甲資料科學大講堂本次邀請到師承人工智慧大師吳恩達博士 (Andrew Ng) 與李飛飛博士的台灣人工智慧新星,清大電機的孫民博士,來為各位講解增強學習的基礎、訓練秘訣以及最新發展,本課程將從經
想要接觸人工智慧最新銳技術,並且一探電腦如何從環境中自我學習成長的朋友們切勿錯過。
講者簡介
孫民 (Min Sun)
國立清華大學電機工程學系 / 助理教授
孫民博士目前任教於國立清華大學電機系,他擁有史坦福電機碩士 (導師為吳恩達)、密西根安雅堡電機系統組博士 (先後導師為李飛飛以及Silvio Savarese)、以及西雅圖華盛頓大學計算機工程博士後的經歷。他的研究興趣在電腦視覺、機器學習、以及人機互動領域。近年來基於深度學習在電腦視覺的突破,他致力於開發橫跨人工智慧不同子領域的系統,如自動影片文字描述 (視覺 x 自然語言)、以及與人類行為互動的智慧機器 (視覺 x 控制)。相關資訊請參考 aliensunmin.github.io。
2018 年 6 月 2 日 (星期六)
逢甲大學第一國際會議廳 (丘逢甲紀念館 2F)
議程
9:00-9:30 |
報到 |
9:30-10:30 |
MDP 以及傳統增強學習的算法 |
10:30-10:50 |
Tea Break |
10:50 - 12:30 |
不需環境資訊 (Model-free) 的增強學習 (包含 DQN) |
12:30 - 13:30 |
午餐 |
13:30-15:10 |
直接優化動作政策 (Action Policy) 的 (PG) 演算法 |
15:10-15:30 |
Tea Break |
15:30-17:00 |
最新研究發展以及使用增強學習的小訣竅 |