馬斯克又來搞事情 OpenAI要用VR訓練機器人

發布日期：2017-05-18

核心提示：今天，OpenAI宣布了一種新型算法：一次性模擬學習(one-shot imitation learning)，當人類在VR中演示一次某個動作后，機器通過學

今天，OpenAI宣布了一種新型算法：“一次性模擬學習(one-shot imitation learning)”，當人類在VR中演示一次某個動作后，機器通過學習這一動作就可以執行出相同的結果。

OpenAI是Elon Musk于2015年12月宣布成立的非盈利AI項目，科研人員會將大部分研究成果開源共享；主要關注增強學習和無監督學習——谷歌此前名聲大噪的圍棋程序AlphaGo用的就是增強學習；而無監督學習需要機器處理大量沒有標記的數據，自己找到區分不同數據子集、集群、或者相似圖像的辦法，有點像嬰兒學習世界的方式，一直被視作人工智能的真正潛力釋放點。

卷積神經網絡之父Yann LeCun有一個經典比喻：如果人工智能是一塊蛋糕，增強學習(Reinforcement Learning)就是蛋糕上的一粒櫻桃，而監督學習(Supervised Learning)是蛋糕外的一層糖霜，但無監督學習(Unsupervised Learning)才是蛋糕本身。目前我們只知道如何制作糖霜和櫻桃，卻不知道如何做蛋糕。

一次性模擬學習

OpenAI宣布的這種新型算法“一次性模擬學習(one-shot imitation learning)”指的是，當人類在VR中演示一次某個動作后，比如將桌面藍色的小盒子疊放在紅色小盒子上這個動作，機器通過學習這一動作就可以執行出相同的結果，并且不論桌面盒子擺放的順序如何，機器都可以準確執行。

這套學習系統由兩個神經網絡組成：一個視覺網絡(vision network)和一個模仿網絡(imitation network)。

視覺網絡(vision network)獲得的圖像來自機器人的攝像機，此前，這個視覺網絡經過數十萬張模擬圖像的訓練，每張都具有不同紋理、光影效果等(但是從未使用真實圖像進行訓練)；

模擬網絡(imitation network)則必須生成一個與VR演示動作一致的執行步驟，并且推斷出該任務的意圖，使得在初始設定變更時(如盒子的擺放順序調亂時)依舊可以找到藍色的盒子并把它疊在紅盒子上。

目前，學術界與產業界都在尋找使用各種訓練機器人的手法，比如英偉達CEO黃仁勛在上周的GTC大會上也宣布了一款名為ISAAC的增強學習世界模擬器，創造出一個完全虛擬的、專為訓練機器人而打造的世界。

這是一個遵循物理法則但不遵循時間法則的世界，在現實生活中，你想要訓練一臺機器學會打冰球，你要將這個冰球放在機器前面，一遍一遍地教會它；而在虛擬世界里，機器可以在一秒內重復眾多次這樣的動作，而且你還可以同時訓練一堆機器學習打球，然后找到里面最聰明的一個，將它的“大腦”程序復制出來，創建一堆同樣的機器再繼續訓練篩選。

來源：智東西

下一篇：研究周報 | 大勢所趨的純電動乘用車大功率快充需多層面協同
上一篇：豐田資助飛行汽車研發目標在2020年載人飛行

[ 行業搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 違規舉報 ] [ 關閉窗口 ]

同類行業

《現代充電樁》

產量

內蒙古能源突泉縣百萬千瓦風儲基地項目EPC總承包工程招標

銷量

新聞圖說

• 普路通開年拿下首個海外儲能項目	• 新能源企業IPO降溫
• 再擴2000噸！帝科股份高效光伏導電銀漿生產	• 千乘資本領投！漿料一體化供應商星翰科技完
• 3.51億元！京山輕機與天合光能簽訂銷售合同	• 3.49億元！中船風電一子公司100%股權轉讓成
• 節能風電對外投資設立2家子公司！	• 三一重能研究報告：風電整機新銳，兩海戰略
• 6.7億元！電氣風電、三一重能轉讓旗下新能	• 中電國際完成哈薩克斯坦JJE和Dostyk風電項

亚洲国产精品网_影音先锋国产资源_亚洲最大黄色_91精品久久

馬斯克又來搞事情 OpenAI要用VR訓練機器人

內蒙古能源突泉縣百萬千瓦風儲基地項目EPC總承包工程招標