當神經網絡作為一種創造性力量出現時,我們必須領悟它的推理世界
當一個小孩畫一只貓的時候,你會更加了解這個孩子,而不是了解他畫出來的貓。同理,我們使用神經網絡生成圖像,能幫助我們理解神經網絡,是如何對輸入的信息進行處理的。
本文為O'Reilly雜志文章,作者為:JonBruner,程序員、記者。曾任福布斯雜志數據編輯,也曾負責O'Reilly關于數據、人工智能、硬件、物聯網、制造等方面電子雜志書籍的出版。
編譯如下:
通常,人們很難以直觀的方式,解釋神經網絡的功能,但是生成算法提供了一種讓神經網絡解釋自我的方法。
神經網絡常被用作實現一個圖像分類器,能夠用它來區分圖像中是貓還是狗,或者識別消防標志等。不過,在過去的三年中,研究人員從本質上對這些神經網絡進行逆轉,并且取得了驚人的進展。
只需要使用簡單的生成算法,就可以通過大量的圖像數據進行訓練,然后生成類似于訓練圖像的全新圖像。具有創造力的AI已經證明:表面上看,它們在模仿人類的創造力方面已經做的非常出色。
目前的生成AI研究浪潮,建立在生成對抗網絡(GAN)的基礎上,GAN是一種由IanGoodfellow和他的同事在2014年提出的一種神經網絡結構。隨著IanGoodfellow論文的發表,一系列的發明應用隨之而來。
研究人員使用GAN網絡,可以生成從人臉到臥室的一切圖像。通過一項基于GAN叫做pix2pix的技術,可以直接通過衛星圖像生成地圖,可以為黑白照片自動填色,可以將手繪的草圖渲染成逼真的實景。
增強低分辨率而且模糊的監控圖像,只是一個非常模糊的幻想,不過現在已經通過使用GANs成為現實,現在GANs已經可以對低分辨率照片中,可能的結構做出復雜的設想了。
圖1.由生成對抗網絡創建的虛構專輯封面
一個生成對抗網絡,由兩個神經網絡組成:一個學習產生某種數據(如圖像)的生成器,一個學習判斷生成器產生的數據與現實世界數據相比,庫卡機器人驅動器維修,是真還是假的判別器。
生成器和判別器具有相反的訓練目標:判別器的目標為區分真實數據和假數據,而生成器的目標,而生成器被迫生成越來越逼真的輸出,以欺騙判別器。是不是感覺非常有意思?
JonBruner和AditDeshpande,基于TensorFlow演示了一個非常簡單的生成對抗網絡,這個網絡創造出了逼真的手寫數字圖像。圖2為該網絡的學習過程,從隨機噪聲開始,出現了一種原始智慧:首先神經網絡反復產生相同的通用偽數字,然后領會不同數字之前的差異,最終可以創造每一個數字。
圖2生成器經過訓練后,生成手寫數字的動畫演示過程
神經網絡擅于通過豐富的數據進行簡單的推斷,神經網絡通過多層神經元能夠自我組織,并在多層次檢測從紋理片段到基本結構的模式,它還能夠挖掘到人們可能會錯過的模式。
這就是神經網絡的優勢,不過也是解釋它比較困難的根源。
神經網絡雖然能夠注意到人們無法注意到的模式,但是如果的網絡結構過于簡單或者訓練數據不足以表示真實世界的變化,它們也會像人一樣進行不合理的探索。
像多元線性回歸這種簡單的統計模型,是很容易解釋它的原理的,這種函數足夠直觀,大家可以一目了然的掌握它的原理。
但是對于具有多層神經網絡就沒有這么直觀了,多層神經網絡通過訓練集進行自由的自我組織,并且不同層次神經元之間相互關聯,KUKA機器人示教器維修,這種連接方式導致每一層神經元的功能變得模糊,我們就不得而知每層神經元究竟對應什么功能。
這個簡單的生成對抗網絡,確實會像人類一樣進行推理。當你看一張貓的照片時,你能明確地識別出,這是被偽造的一只貓嗎?
你通過快速的觀察得到各種特征:貓的耳朵、貓的胡須、貓的毛發樣式等,總的來說,通過這些特征,你最終得到這是一只貓的結論,神經網絡亦是如此。
正是因為GAN中的生成器,具有多層次處理信息的能力,所以該網絡重構信息后輸出的結果比較真實。圖3是通過GAN生成的臥室圖片,不得不說效果相當棒。不僅床單,地毯和窗戶看著很真實,庫卡機器人,而且他們的位置也是正確的,床單放在床上,地毯鋪在地上,窗戶開在墻上。
圖3GAN生成的臥室圖像
如果你接觸過圖像識別,你可能會對卷積神經元比較熟悉,卷積神經元可以跨圖像掃描,并過濾像素進行模式檢測。卷積層通常將圖像壓縮,但是在GAN的生成器中,卷積層的功能被逆轉,以便按比例擴大數據。
生成器不是用來檢測模式和匹配圖像中的特征的,而是使用反卷積的方式生成基本圖像構建塊,并且再將這些基本構建塊,組裝融合成真實的圖像。比如,這個簡單的GAN生成了一個非常真實的數字9,如圖4所示。
圖4GAN生成非常真實的手寫數字9
通過觀察反卷積濾波器和其對應的輸出,可以發現這些由最后一層反卷積層生成的構建塊,來自圖4中的手寫數字9。
當神經網絡作為一種創造性力量出現時,我們必須領悟它的推理世界
圖5反卷積濾波器及其輸出(生成數字9時)
GANs才三歲而已,顯而易見,GANs在不久的將來會被用作生成各種內容,甚至可能在每個用戶訪問網站的過程中,為其定制圖片或者視頻。當GANs作為一種創造性力量出現時,人們必須去領悟它的推理世界。
還在等什么?快動手去嘗試建立你自己的GANs吧!