深度學習和量子化學是兩個看似關聯很小的領域,但研究者還是找到了它們之間的共同之處。日前,耶路撒冷希伯來學院的幾位研究者的一篇論文《Deepand:A》介紹了她們的發覺:深度前饋算術電路()所實現的函數和量子多體波函數之間存在某種等價性。機器之心在本文中簡略地編譯介紹了這項研究。
深度前饋網路早已在許多不同的機器學習應用中取得了前所未有的成功。是哪些讓這種網路這么成功?研究正在逐步揭露其中的秘密,但其中大部份依然還是有待解密的重要奧秘。歸納偏置(bias)就是其中之一,其反映了嵌入在網路構架中的先驗知識(prior)。
在這項研究成果中,我們構建了量子化學學領域和深度學習領域的一種基本()聯系。我們使用這些聯系斷定了全新的理論觀察,該觀察是關于頻域網路每一層的通道()的數目在整體的歸納偏置中的作用。具體來說,我們給出了深度前饋算術電路(:)所實現的函數和量子多體波函數(many-bodywave)之間的等價性,這取決于它們共同的基礎張量結構。這有助于將量子糾纏測度()用作深度網路抒發能力(以建模其輸入的復雜相關性結構)的定義良好的測度方式。最重要的是,建立張量網路()方面的深度成為了可能。這些描述讓我們可以進行一個頻域網路的數論剖析(graph-),通過這些方法我們展示了一種通過深度網路的通道數目直接控制深度網路的歸納偏置的方式,這種通道是其基本圖中的相關最小切割(min-cut)。對任何為特定任務設計頻域網路的實踐者來說,這個結果是有好處的。
我們對進行了理論上的剖析,但是在更常見的頻域網路()(涉及到ReLU激活和最大池化)上通過實驗驗證了我們的發覺。不僅前面描述的結果,這項工作也提出了兩個跨學科的橋梁:用良好定義的數論工具對深度前饋網路的描述和與量子糾纏的方式聯接。
圖1:Cohenetal.(2016b)提出了先前的頻域算術電路網路()
3.量子波函數與頻域網路
當描述一個由多個互相作用的粒子所構成的系統(被稱為多體量子系統(many-body))的量子熱學性質時,化學學家須要使用才能表示許多輸入和一個輸出之間的復雜關系的函數。類似地,監督學習或無監督學習等機器學習任務也須要使用才能表示許多輸入(如圖像的許多象素)和一個輸出之間的復雜關系的函數。這一章我們將對這種類比進行公式化。在簡單介紹了物理學家拿來描述多體系統的量子熱學性質的符號以后,我們說明了怎樣將所實現的函數(式2和式3)與N個粒子的量子波函數在物理上等價上去。通過由所帶來的對深度前饋網路的張量描述,這在機器學習和量子化學這兩個看似無關的領域之間建立了一種可靠的結構聯系。我們遵守了(1998)中的相關推論,感興趣的讀者可參閱Hall(2013)獲取對量子熱學的全面物理介紹。
4.糾纏和相關性的檢測
多體波函數和所實現的函數之間的方式聯系(如式8所示)讓我們有機會使用已有的數學看法和工具來剖析頻域網路。對于表征多體波函數的粒子間的相關性結構,化學學家給與了非常的關注,由于其對被觀測系統的化學性質有廣泛的影響。雖然機器學習領域對這個問題的關注較少,但我們可以直觀地理解:在解決一個機器學習問題時,應該考慮表征該問題的相關性,例如數據集中典型圖象的象素之間的相關性。我們應當看見,對于函數的「表達力()」的需求實際上是對該函數建模相關復雜相關性結構的需求量子物理學家丁飛,不管這個函數是頻域網路實現的,還是等價的多體波函數。在這一節,我們首先介紹了化學學家量化相關性的方法,之后討論了可以怎樣將這種方式用于機器學習領域的剖析。
圖2:圖片為8×8大小。a)交錯分區的圖示,b)左右分區的圖示。假如你希望建模圖象(例如腳部圖象)的兩側之間的復雜相關性結構,這么該網路應當支持左右分區的高糾纏檢測(high);假如你希望對毗鄰象素這樣做(如自然圖象),這么應當選擇交錯分區。在第7節,我們說明了這些對頻域網路的歸納偏置的控制可以怎樣通過適當調整每一層的通道數目來實現。
5.張量網路和張量分解
圖3:張量網路(TN/)的簡單介紹。a)該張量網路中的張量用節點表示,節點的度()對應于由其所表示的張量的階數。b)用TN符號表示的一個矩陣乘一個張量。收縮()指數用k表示而且相乘。開放(open)指數用d表示,它們的大小等于由整個網路所表示的張量的階數。所有那些指數的值都在1到它們的聯接維度(bond)之間。收縮()用實線標識。c)一個愈加復雜的事例——一個網路使用在稀疏互連的低階張量上的收縮表示一個更高階的張量。該網路是一種分解()的簡單案例,其在張量剖析社區被稱為張量訓練(train,(2011)),而在匯聚態化學學界則被稱為矩陣積態(state,參見Orús(2014))。
6.一個用作張量網路的頻域網路
圖4:a)張量網路(TN)方式的奇特值分解。Λ節點表示一個對角矩陣、U和V節點表示正交矩陣。b)相當于CP分解的TN。
圖5:相當于HT分解的TN量子物理學家丁飛,其帶有對應于圖1的(N=8)的估算的相同通道池化方案,詳見6.2節
原文鏈接: