《Science》子刊:跨界融合!使用機器學習設計氣體分離聚合物膜
聚合物膜被用於各種氣體分離,聚合物氣體分離膜的滲透性和選擇性通常呈負相關關系。聚合物膜的設計主要基於經驗觀察,這對發現能夠分離特定氣體對的新材料是一種限制。因此,合成新一代聚合物氣體分離膜的挑戰在於設計同時具有高滲透性和選擇性的材料。使用化學合成方法並測試可能的聚合物結構及其潛在的化學修飾非常昂貴且耗時。人們已經開發瞭幾種理論方法和模型來理解聚合物材料中擴散和溶解度,其可以對新一代材料進行更合理的設計。
近日,哥倫比亞大學的Sanat K. Kumar教授團隊聯合南卡大學,馬普所等研究人員在《Science Advances》上介紹瞭一種拓撲的、基於路徑的散列聚合物重復單元機器學習(ML)算法。作者使用約700種聚合物的六種不同氣體的實驗滲透率數據,以預測超過11,000種未經測試的均聚物氣體分離行為。為瞭測試算法的準確性,作者合成瞭該方法預測的兩種最有希望的聚合物膜,發現它們超過瞭CO2/CH4分離性能的上限。這種ML技術使用較小的實驗數據集進行訓練,是一種探索聚合物膜設計的新手段。

作者使用指紋法以數字方式表示聚合物重復單元中的化學連接性。在基團貢獻方法中,所有構造塊都必須先驗定義並保持不變;指紋法本質上是動態的,它們可以演變為包括合成的材料。指紋法還考慮瞭不同單元之間的化學連接性。作者使用RDKit中實現的類似於Daylight的指紋算法將每種聚合物轉變為二進制的“指紋”。這種基於拓撲的方法分析瞭包含一定鍵數量分子的各個片段,然後對每個片段進行散列處理以生成二進制指紋,該指紋可計算地表示該分子。

通過檢查高於CO2/CH4上限的材料及其共同特征,能夠洞悉哪些物理量對提高氣體滲透性和選擇性至關重要。在數據集中的11,325種聚合物中,多硫化物僅占7.00%;但是,它們占越過CO2/CH4上限聚合物的大部分(53.00%)。此外,在突破上限的小組中,聚砜(總計5.30%,18.00%超過上限)和聚酰亞胺(總計17.65%,35.00%超過上限)所占的百分比更大。芳香族聚醚占總預測數據集的30.78%,但僅占突破上限的21.00%。通過創建二維直方圖來進一步分析打破上限的聚合物。發現18.00%屬於聚砜和聚酰亞胺類別,並且17.00%屬於聚砜和聚醚類別。因此在這種情況下,含硫基團,沿主鏈有氧原子或氮環的材料表現最佳。

作者合成瞭P432095和P432092這兩種聚合物,並測試瞭它們的CO2/CH4傳輸性能,以實驗驗證ML數據。通過刮刀將合成的聚合物從溶液中澆鑄成薄膜(≈30μm),並使用恒定體積/可變壓力實驗技術進行測試。如ML模型所預測的,聚合物超過瞭該氣體對的2008 Robeson上限,並且在相同的滲透率值下,P432092和P432095的選擇性分別約為上限的7倍和5.5倍。此外還發現實驗數據點和預測數據點彼此之間具有相對較好的一致性,這表明ML模型可以用作識別未開發的聚合物進行氣體分離的預測工具。

當前使用的ML算法僅針對已經合成的聚合物進行測試。一種更好的方法是在算法中包括聚合物體系結構,然後施加“可合成性”約束作為選擇聚合物進行進一步研究的手段。這種方法對於預測具有合成價值的新聚合物十分重要。