選自 arXiv
作者:Oscar Chang, Hod
機器之心合輯
參與:程耀彤、盧
日前,羅馬尼亞科學院的研究人員發(fā)表了一篇論文,從生命的角度看待人工智能的發(fā)展。 論文提出了一種不尋常的自我復制神經網絡,可以實現自我復制,也可以解決輔助任務。 本文使用 MNIST 圖像分類作為輔助任務。
生物生命始于第一次自我復制(, 2011),自然選擇傾向于有利于繁殖的生物,從而產生自我構建的機制。 同樣,如果人工智能主體能夠在不增加機器的情況下復制和構建自己,我們就可以通過自然選擇建立人工智能的自我構建機制。
前言
在發(fā)現 DNA 作為生物復制的化學機制之前,人工自我復制機的概念最早由 John von 在 1940 年代提出。 具體來說,Von 展示了元胞自動機的初始狀態(tài)和轉換規(guī)則的配置,元胞自動機在運行固定步數后形成了初始元胞狀態(tài)的復制品 (Von & Burks, 1966)。 后來(1980)在哥德爾,巴赫:一條辮子中,“quine”這個詞是在哲學家Van Orman Quine之后創(chuàng)造的,用來描述自我復制的表達,例如:“is a ”是一個句子片段(“isa”isa ).
也有很多關于制作數學自我復制器的研究。 值得注意的例子是瓷磚 (, 1959)、分子 (Wang 等人, 2011)、聚合物 (, 2001) 和機器人 (Zykov 等人, 2005)。
在編程語言理論的背景下,quine 是一種復制其自身源代碼的計算機程序。 quine 的一個簡單示例是空字符串,在大多數語言中,編譯器都會將其翻譯成空字符串。 下面的代碼片段是一個不尋常的兩行 quine 的示例。
s = ’s = %rnprint(s%%s)’
print(s%s)
盡管自我復制早已在許多自動機中得到研究,但在神經網絡的研究中顯然有所欠缺,盡管神經網絡是迄今為止已知的最強大的人工智能方法。
本文確定并嘗試解決構建和訓練自我復制神經網絡的挑戰(zhàn)。 具體來說,研究人員建議將神經網絡視為由張量運算序列組成的可微分計算機程序。 研究目標是建立一個輸出自己權重的神經網絡quine。
研究人員使用三種不同的方法測試了論文中提出的方案:基于梯度的優(yōu)化、非基于梯度的優(yōu)化和一種稱為 () 的新方法。 研究人員更進一步,設計了一種神經網絡 quine,它不僅可以進行自我復制,而且還有一個輔助目標。 本文選擇的輔助任務是 MNIST 圖像分類 (LeCun &, 1998),它涉及對 0 到 9 的數字圖像進行分類,通常用作機器學習的“”示例。
研究人員觀察到網絡自我復制能力與其解決輔助任務能力之間的權衡。 這類似于在自然界中觀察到的畜牧業(yè)和其他輔助生存任務之間的平衡。 這兩個目標通常是一致的,并且性激素,例如當昆蟲饑餓時,通常會上調以犧牲進食為代價來優(yōu)化生存。 反之亦然:例如,雌性棕色捕魚蛛的交配行為會導致血糖突然發(fā)生不可逆轉的變化,使其難以交流并容易被雄性蜘蛛吞噬(Drake,2013 年)。
創(chuàng)建網絡
神經網絡如何引用自身?
直接引用()問題:神經網絡由一組參數 Θ 參數化復制物理網絡連接狀態(tài),研究人員的目標是構建一個輸出為 Θ 本身的網絡,這很難直接做到。 假設卷積網絡的最后一層有 A 輸入和 B 輸出。 線性變換中權重矩陣的大小是AB的乘積,當A>1時AB小于B。
研究人員還研究了兩種流行圖像生成模型的開源實現:DCGAN(等人,2016 年)和 DRAW(等人,2015 年)。 兩者分別使用 1200 萬 Knorr 和 100 萬參數生成 784 像素的 MNIST 圖像。
一般來說,參數集 Θ 遠大于輸出的大小。 為了避免這種情況,我們需要一種間接的方式來引用 Θ。
(): (etal., 2009) 是一種神經進化方法,通過用坐標和權重識別每個拓撲連接來描述神經網絡。 研究人員在構建 quine 時采用了相同的策略。 研究人員并沒有讓quine直接輸出自己的權重,而是讓它輸入一個坐標(采用one-hot編碼方式),輸出坐標的權重。
這克服了 Θ 小于輸出的問題,因為我們只為每個坐標 c 輸出標量 Θ_c。
奎因
研究人員將 quine 定義為一種卷積神經網絡,其唯一的工作就是輸出自己的權重。
圖 1:quine 的結構
假設權重個數為A,第一個隱藏層的單元個數為B,則投影矩陣的大小為AB的乘積,當B>1時小于A。 出于這個原因,由于單熱表示,我們不能使投影本身成為網絡的參數。 因此,研究人員決定使用固定的隨機投影將坐標的 one-hot 編碼與隱藏層連接起來。 所有其他連接,即隱藏層之間的連接和最后一個隱藏層與輸出層之間的連接,都是神經網絡的可變參數。
Von 認為一個非平凡的自我復制器必須包含三個組件,它們本身不足以成為一個自我復制器:(1)復制器的描述,(2)可以克隆描述的復制機制,( 3) 一個復制器復制物理網絡連接狀態(tài),它可以復制嵌入復制器本身的機制 (Von & Burks, 1966)。 在這些情況下,將每個比特權重分配給one-hot空間中的一個點的坐標系對應于(1); 神經網絡估計的函數對應于(2); 固定隨機投影對應于(3)。 研究人員選擇 (1)、(2) 和 (3) 的原因解釋如下,請記住,選擇這些選項的替代方案將是未來研究的有趣方向。

圖 2:沒有 one-hot 編碼的 quine 的權重和權重預測對數歸一化圖示
輔助奎因
研究人員將輔助奎因(quine)定義為一種不僅能自我繁殖,還能解決一些輔助任務的奎因。 它負責接收輔助輸入和返回輔助輸出。
圖3:輔助quine的結構
在本文中,選擇圖像分類作為輔助任務。 MNIST 數據集 (LeCun &, 1998) 包含從 0 到 9 的手寫數字的完美圓形圖像(28×28 像素)。該圖像將用作輔助輸入。 可以包括從輔助輸入到網絡的鏈接作為參數而不是隨機投影,但本文僅報告前者的結果。
輔助輸出是十個類別的概率分布,其中概率最大的類別將被選為預測類別。 使用 60,000 張圖像進行訓練,使用 10,000 張圖像進行測試; 不需要驗證集,因為本研究不嘗試嚴格優(yōu)化分類器的性能。 本研究的主要目的是演示神經網絡 quine 的概念,因此 MNIST 是一個合適的輔助任務(這被認為是現代機器學習算法中的一個簡單問題)。
論文:蒯因
論文鏈接:
摘要:自我復制是生物生命的一個重要方面,但在人工智能系統(tǒng)中卻被很大程度上忽略了。 本文介紹了如何改進和訓練自我復制神經網絡。 網絡通過學習輸出自己的權重來復制自己。 該網絡使用可以以基于梯度或非梯度的方式進行優(yōu)化的損失函數。 我們還描述了一種稱為 () 的方法,它通過向網絡注入對其自身參數的預測來訓練網絡,而無需進行顯式優(yōu)化。 通過在再生和優(yōu)化步驟之間交替發(fā)現自我復制網絡的最佳解決方案。 最后,我們介紹了一種自我復制的神經網絡設計,可以解決 MNIST 圖像分類等輔助任務。 我們觀察到網絡的圖像分類能力與其復制能力之間的權衡,但訓練往往會以復制為代價降低其在圖像分類方面的專業(yè)知識。 這類似于在自然界中觀察到的畜牧業(yè)和其他任務之間的平衡。 我們覺得人工智能的自我復制機制是有用的,因為它帶來了通過自然選擇不斷改進的可能性。
