Machine Learning 是如何辨認你的塗鴉?讓 Google 訪問學者解一下
在 Machine Learning 成為一個熱門話題的時侯,怎可以對它完全沒有認知!其中一個很有趣的範疇就是用於圖像辨識的 AI ,以 Google 為例就有 Quick Draw 遊戲與 AutoDraw 應用,那麼背後的原理是什麼呢?這次由 Google 的訪問學者 David Ha 跟我們講解。
利用概念化 ( Generalization) 而不是記憶 (Memorization) 的 Quick Draw!
Google 的其中一個研究項目 Magenta 是希望透過機械學習提升創造音樂、影片、圖像和文字的過程,這個社群中雲集了藝術家、編程人員和機械學習研究人員,他們嘗試在藝術中找尋「規律」,利用神經網絡去輔助創作,而他們其中一位人員 David Ha 早前以 Quick Draw 這個小遊戲背後的架構去講解原理。
當中它使用遞歸神經網絡( recurrent neural network) 去訓練機械學習人類繪畫、理解及表達抽像概念的方式,以總結來說這是一個「概率性」的機制,把物件的特徵化為概念,而不是以某種算法構成草圖的複制品,同時於 Quick Draw 上面已經有超過 5000 萬個資入的資料,這是一個持續學習和更改算法的過程。
到底是如何做到呢?相信大家都會問,David 亦簡單解說了一下架構:由先從人手畫出草圖,再將資訊陣列量化,然後進行編碼學習;中途於 Z 位置加入一些雜訊打亂資料,再把資料解碼輸出成新的圖案,透過對比輸入與輸出的圖片,我們會知道算法是否合理。
David 亦提到 Z 所儲存的樣本相當少,原因是希望增加雜訊比率,因為他們需要的不是從 Input 複雜一個類似的草圖,而是希望算法本身就是歸納物件(例如就是圖中的「貓」)為理念,再輸出全新的圖樣。
而透過機械學習, QuickDraw 有以下特性:
- 理解物件特徵:模型會知道物件的共性,即使輸入三隻眼的貓,圖樣經過計算後仍會輸出正常貓咪的圖樣。
- 插入潛在空間(Laten space interpolation);模型學會構建圖樣(貓)的時侯為身體接上頭、腳和尾巴。
- 向量繪圖類比(Vector drawing analogies) :模型透過組織草圖的潛在空間以表達多種不同的概念。

那麼透過機械學習可以如何幫助藝術創作呢?它可以利用機械生成大量相似但各不相同的設計,可以為幾筆的塗鴉創作更多可能性,亦可以輔助藝術家把物件的概念畫出來。畢竟人類對「貓」、「狗」、「桌子」已經有概定的理念,而萬變不離其中,機械學習到概念之後也可以自我生成。
就像之前的 AutoDraw 可以利用幾筆生成自動圖型,而將來的理想是利用機械生成文字、圖案或是音樂,話雖如此,David 亦提到機械沒有情感與「藝術感」,這單單是一個輔助而已,並不能取代人類的審美能力。
David 更同時提到,只要利用 TensorFlow 這套開源的 Machine Learing 碼就可以打造自己個人的 AI ,更詳細關於圖像的 ML 可以到 Google 參看。
Pingback: ML 使 Google Gboard 輸入法再進化:現在它能畫出 Emoji 了! - TechApple.com