這隻新企鵝學生比較頑皮,根本聽不進老師教它的任何知識,自己跟同學們一起去抓魚了。它走到海邊,撲通一聲就跳入海中,玩得不亦樂乎,順手一抓就得到一隻超大魚(且刻意不告訴其他學生和老師),得到了冠軍。
那麽,AlphaGo Zero會贏的背後原因是什麽?老師傳授給學生的先驗知識:「池塘的比較小,河流的魚比較大,海裡的魚最大,海上風浪大,要注意自身安全。」這人類老師基於其經驗而領悟的先驗知識,是基於人類特性而定的最佳方案,僅是人類探索空間的局部最優(local op
tima)而已。但是不一定是<人類+企鵝AlphaGo>探索空間的全域最優(Global optima)。
企鵝AlphaGo承襲了老師的知識,也認爲大海很危險,就沒去大海了。但是它有特殊習性(人類沒有):喜歡玩水。所以它的探索空間大於人類(包括池塘內部),而發現了<人類+企鵝AlphaGo>探索空間的全域最優(池裡抓魚),而勝過了人類學生。
企鵝AlphaGo Zero沒有承襲了老師的知識,不認爲大海有危險(其實企鵝喜歡海浪),就跑去大海了。所以它的探索空間大於<人類+企鵝AlphaGo>,而發現了<人類+企鵝AlphaGo+企鵝AlphaGo Zero>探索空間的全域最優(海中抓魚),而勝過了企鵝AlphaGo和人類。
3. AI思維:給人類教育的三項啓示
第一項啓示
從上所述,AI思維給人類教育的啓示之一是: 學校老師們有兩中學生:人類學生與機器學生。老師們把how-to-do的經驗教給機器學生,其機器經驗迅速勝過人類經驗。這意味著,老師將其how-to-do經驗傳承給人類學生(如棋藝學徒),這些人類學生很可能都輸給機器學生,被機器學生淘汰出局而失業。就如同人類棋藝高手輸給AlphaGo一般。簡而言之,這項啓示就是:機器學生在學習how-to-do經驗上,其能力遠勝於人類學生。
第二項啓示
然而,AlphaGo還不是頂級高手,還輸給了AlphaGo Zero。因爲它非常依賴人類的過去經驗(如歷史棋譜),只要曾經認可能爲錯的,便不再去探索發展,因而往往只找到局部最優(local optima),而不是全域最優的方案。
茲回顧人類的每一次革命性創新都是人類跳出了局部最優的表現。例如,古典力學,麥克斯韋方程,再到廣義相對論等比比皆是。從上所述,AI思維給人類教育的啓示之二是:老師把太多的先驗知識教給學生(包括人類學生和機器學生),可能妨礙學生的創新能力,因爲學生在面對複雜的新情境時會迅速找到局部最優,而停止繼續探索發展,失去跳出局部最優的創新機會。
其實,從一般的教學都可以體會上述的啓示。請試想,如果您是爸爸或媽媽且是游泳教練,您會如何教您自己的小孩學游泳呢?同樣地,如果您是爸爸或媽媽且是網球教練,您會如何教您自己的小孩打網球呢?先練習打牆壁,還是直接進球場,陪他亂打一通呢?再試想,如果您是爸爸或媽媽且英語很流流利,您會如何教您自己的小孩講英語呢?先講解簡單文法和句型,還是直接英語對話,陪他亂講一通呢?
老師引領人類學生自己學習、累積知識和經驗,比老師給予的先驗知識更能發揮學生的天賦創造力。老師引領機器學生自己學習、累積知識和經驗的速度和豐富性讓老師給予的先驗知識顯得微不足道了。
簡而言之,這項啓示就是:過度强調how-to-do先驗知識的傳承,反而會局限學生(無論是人類或機器)對全域最優的探索,因而妨礙其發揮天賦的創新潜能。
第三項啓示
剛才說過了,機器擅長於學習,從how-to-do經驗中學習和領悟,而呈現出智慧。大數據(big data)提供給它極佳的學習材料。機器的智慧很類似人類的<歸納性>智慧,它的思考過程不清晰,所以只産生思考的<結論>知識,而沒有産生思考的<過程>知識。
由於AI機器沒有表現出思考過程,人類也無法全然把握機器智慧的可信度。機器一旦面臨它未曾學習過的情境,就有可能會犯錯。例如,去年一名特斯拉(Tesla)車主在其特斯拉汽車的“自動輔助駕駛”軟件未能在陽光下發現一輛白色卡車後死於撞車事故。這項機器學習的弱點,如果能得到人類智慧的相助,就能達到更完美的境界了。
從上所述,AI給人類教育的啓示之三是:學校老師可以更關注於引導學生how-to-think,包括跨界思維和聯想等。這讓機器(學生)的全域探索能力來協助人類(學生)的創意思考迅速尋找到全域最優的實踐方案。同時也讓人類更多的“思考”來彌補AI機器“智慧”的弱點。於是,人類和AI機器變得相輔相成、達到創新與實踐的最佳組合。
簡而言之,引導人類學生更多how-to-think的演練和信心,可能促進兩種學生在<創新/實踐>上的完美組合。
~ End ~
`