AI聰明更勝人類？不靠人類數據新版AlphaGo Zero超強－grantsherrrq

Google 旗下 DeepMind 開發出來的 AlphaGo，在人類圍棋界打遍世界無對手，但比來卻遭到一名小老弟 100:0 的局數完虐。DeepMind 在《Nature》揭橥比來論文，介紹最新版的 AlphaGo Zero，純粹靠強化學習，就成為最強的棋士。

本來舊版 AlphaGo 開辟時，先靠人類千年的智慧奠基，由曩昔的棋譜強化進修運算，算是綜合各家招數後自成一派。然則最新版的 AlphaGo Zero，研究人員只供給遊戲的劃定規矩，在不依賴人類數據之下自學，成果「無招勝有招」，表現更勝前代 AlphaGo。

Facebook讚好 Facebook買讚好買

DeepMind 作者群在論文中寫道，AlphaGo Zero 證明了即便在最具挑戰的領域，純強化進修的方式也是完全可行的－完全不需要人類供給範例或指導，不供應基本法則之外的任何範疇知識，利用強化學習就能夠超出人類的水準。

另外，純強化學習方式只破費額外很少的練習時間，相較於使用人類數據，實現了更好的漸進機能（asymptotic performance）。

在很多環境下，人類數據，特別是專家數據，常常太甚昂貴，或基本無法獲得。因此，作者認為，如果雷同的手藝可以運用到其他問題上，這些沖破就有可能對社會產生積極的影響。

DeepMind 在論文中指出，在進行了 3 天的自我訓練後，AlphaGo Zero 在 100 局角逐中以 100：0 擊敗了上一版本的 AlphaGo，也就是打敗南韓九段棋士李世乭的版本。之後，再經 40 天的自我訓練後，AlphaGo Zero 變得加倍強大，超出了「Master」版本的 AlphaGo－完勝柯潔的版本。

本文引用自: https://tw.news.yahoo.com/%E4%B8%8D%E9%9D%A0%E4%BA%BA%E9%A1%9E%E6%95%B8%E6%93%9A%E5%8F%8D%E8%80%8C%E

murraytx70780

grantsherrrq

murraytx70780 發表在痞客邦留言(0) 人氣()

E-mail轉寄

grantsherrrq

歡迎光臨murraytx70780在痞客邦的小天地

AI聰明更勝人類？不靠人類數據新版AlphaGo Zero超強

歷史上的今天

留言列表

站方公告

活動快報

【CHLI...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

POWERED BY

grantsherrrq

歡迎光臨murraytx70780在痞客邦的小天地

AI聰明更勝人類？不靠人類數據 新版AlphaGo Zero超強

歷史上的今天

留言列表

站方公告

活動快報

【CHLI...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

POWERED BY

AI聰明更勝人類？不靠人類數據新版AlphaGo Zero超強