兩棲機器龜登上Nature封面；深度去模糊綜述論文入選IJCV

深度快取演算法能並行實現嗎

機器之心 & ArXiv Weekly Radiostation

參與：杜偉、楚航、羅若天

本週重要論文包括成為 Nature 封面的兩棲機器龜研究，以及澳大利亞國立大學、中山大學等機構的研究者對基於深度學習的影象去模糊技術研究進展的回顧綜述。

Quantum Algorithms for Sampling Log-Concave Distributions and Estimating Normalizing Constants

Multi-environment Robotic Transitions through Adaptive Morphogenesis

Sancus： Staleness-Aware Communication-Avoiding Full-Graph Decentralized Training in Large-Scale Graph Neural Networks

Soft Diffusion： Score Matching for General Corruptions

On Distillation of Guided Diffusion Models

Deep Image Deblurring： A Survey

Dispersion-free highly accurate color recognition using excitonic 2D materials and machine learning

ArXiv Weekly Radiostation：NLP、CV、ML 更多精選論文（附音訊）

論文 1：Quantum Algorithms for Sampling Log-Concave Distributions and Estimating Normalizing Constants

作者：Andrew M。 Childs 等

論文地址：https：//arxiv。org/pdf/2210。06539。pdf

摘要：對數凹取樣（log-concave sampling）在機器學習、物理、統計等領域有著諸多應用。本文基於朗之萬擴散（Langevin diffusion）設計了新的量子演算法，用於取樣對數凹分佈和估計歸一化常數，相比最好的經典演算法對於精度（ε），維度（d），條件數（κ）等引數達到了多項式級加速。

表 1 和表 2 總結了我們的結果和先前經典演算法複雜度的對比。

推薦：NeurIPS 2022 | 馬里蘭、北大等機構提出量子演算法用於取樣對數凹分佈和估計歸一化常數。

論文 2：Multi-environment Robotic Transitions through Adaptive Morphogenesis

作者：Robert Baines 等

論文地址：https：//www。nature。com/articles/s41586-022-05188-w

摘要：近日，來自耶魯大學的研究人員發明了一種兩棲機器人，其靈感來自於海龜和陸龜，該機器人透過一種被稱為「自適應形態發生，adaptive morphogenesis」的過程完成。他們還為這款機器人取了一個特別貼切的名字，英文叫 ART（Amphibious Robotic Turtle），中文為「兩棲機器龜」。該研究於 10 月 12 日登上《Nature》封面。

推薦：耶魯兩棲機器龜登 Nature 封面，一種部件搞定水上、陸地行動。

論文 3：Sancus： Staleness-Aware Communication-Avoiding Full-Graph Decentralized Training in Large-Scale Graph Neural Networks

作者：Jingshu Peng 等

論文地址：https：//www。vldb。org/pvldb/vol15/p1937-peng。pdf

摘要：近年來，圖神經網路（GNN）在社交媒體、電子商務、知識圖譜、推薦系統、生命科學等領域得到了廣泛應用。隨著圖資料規模的快速增長，亟需發展分散式大規模圖神經網路高效訓練技術。現有的方法主要採用中心化的引數伺服器（PS）架構，計算節點間的大量網路通訊成為了訓練的效能瓶頸。

為了克服這一挑戰，本文提出一種陳舊性感知且通訊迴避的去中心化全圖 GNN 訓練框架 SANCUS，實現了高效地分散式圖神經網路訓練。SANCUS 透過利用歷史嵌入，主動創造非同步性，避免大量通訊；設計了跳過廣播（skip-broadcast）機制，訓練時動態重塑通訊拓撲，實現了嵌入的靈活傳輸。為了自適應地維護歷史嵌入，提出了嵌入有界陳舊性指標，並從理論上證明了陳舊性感知訓練框架的收斂性。

實驗結果表明，與 SOTA 方法相比，在不損失精度的前提下，SANCUS 可以節約高達 74% 的網路通訊，平均吞吐量提升至少 1。86 倍。SANCUS 將傳統分散式機器學習中的有界梯度陳舊性泛化到去中心化分散式 GNN 中的歷史嵌入上，理論上新指標可以推廣至其他分散式 GNN 訓練架構。

SANCUS 框架的基本訓練流程，主要包括五個步驟：（1）資料載入，（2）陳舊性邊界檢查，（3）嵌入廣播，（4）GNN 模型計算，以及（5）結果快取。

推薦：VLDB 2022 最佳研究論文：克服通訊挑戰，新框架 SANCUS 實現 GNN 高效訓練。

論文 4：Soft Diffusion： Score Matching for General Corruptions

作者：Giannis Daras 等

論文地址：https：//arxiv。org/pdf/2209。05442。pdf

摘要：近日，在谷歌研究院和 UT-Austin 合作的一篇 arXiv 論文中，幾位研究者認為擴散模型仍有一個重要的步驟：損壞（corrupt）。一般來說，損壞是一個新增不同幅度噪聲的過程，對於 DDMP 還需要重縮放。雖然有人嘗試使用不同的分佈來進行擴散，但仍缺乏一個通用的框架。因此，研究者提出了一個用於更通用損壞過程的擴散模型設計框架。

具體地，他們提出了一個名為 Soft Score Matching 的新訓練目標和一種新穎的取樣方法 Momentum Sampler。理論結果表明，對於滿足正則條件的損壞過程，Soft Score MatchIng 能夠學習它們的分數（即似然梯度），擴散必須將任何影象轉換為具有非零似然的任何影象。

圖左使用 Naive Sampler 取樣的影象似乎有重複且缺少細節，而圖右 Momentum Sampler 顯著提升了取樣質量和 FID 分數。

推薦：Soft Diffusion：谷歌新框架從通用擴散過程中正確排程、學習和取樣。

論文 5：On Distillation of Guided Diffusion Models

作者：Chenlin Meng 等

論文地址：https：//arxiv。org/pdf/2210。03142。pdf

摘要：去噪擴散機率模型（DDPM）在影象生成、音訊合成、分子生成和似然估計領域都已經實現了 SOTA 效能。同時無分類器（classifier-free）指導進一步提升了擴散模型的樣本質量，並已被廣泛應用在包括 GLIDE、DALL·E 2 和 Imagen 在內的大規模擴散模型框架中。

然而，無分類器指導的一大關鍵侷限是它的取樣效率低下，需要對兩個擴散模型評估數百次才能生成一個樣本。這一侷限阻礙了無分類指導模型在真實世界設定中的應用。儘管已經針對擴散模型提出了蒸餾方法，但目前這些方法不適用無分類器指導擴散模型。

為了解決這一問題，近日斯坦福大學和谷歌大腦的研究者在論文中提出使用兩步蒸餾方法來提升無分類器指導的取樣效率。在第一步中，他們引入單一學生模型來匹配兩個教師擴散模型的組合輸出；在第二步中，他們利用提出的方法逐漸地將從第一步學得的模型蒸餾為更少步驟的模型。利用提出的方法，單個蒸餾模型能夠處理各種不同的指導強度，從而高效地對樣本質量和多樣性進行權衡。此外為了從他們的模型中取樣，研究者考慮了文獻中已有的確定性取樣器，並進一步提出了隨機取樣過程。

提出的蒸餾模型只需 4 步就能生成在視覺上與教師模型媲美的樣本，並且在更廣泛的指導強度上只需 8 到 16 步就能實現與教師模型媲美的 FID/IS 分數。

推薦：取樣提速 256 倍，蒸餾擴散模型生成影象質量媲美教師模型，只需 4 步。

論文 6：Deep Image Deblurring： A Survey

作者：Kaihao Zhang 等

論文地址：https：//link。springer。com/article/10。1007/s11263-022-01633-5

摘要：本文提出了一個影象去模糊方向的綜述，澳大利亞國立大學、中山大學、美國加州大學 Merced 分校、日本樂天研究所的研究者回顧了基於深度學習的影象去模糊技術研究進展，回顧了影象去模糊的研究歷史，總結了當前的研究進展，並進行了展望。該綜述被計算機視覺旗艦期刊 International Journal of Computer Vision 接收。

推薦：IJCV 收錄！深度去模糊綜述論文來了。

論文 7：Dispersion-free highly accurate color recognition using excitonic 2D materials and machine learning

作者：DavoudHejazi 等

論文地址：https：//www。sciencedirect。com/science/article/abs/pii/S1369702122002255

摘要：人的眼睛可以看見數百萬種顏色，現在人工智慧也可以。近日，來自美國東北大學的一個跨學科研究團隊使用新的人工智慧技術構建了一種可以識別數百萬種顏色的新裝置 A-Eye，這讓機器視覺領域邁出了一大步，將被廣泛應用於自動駕駛汽車、農業分揀和遠端衛星成像等一系列技術。研究論文發表在了《Materials Today》上。

左上為構建 A-Eye 使用的 2D 材料，右上為 A-Eye 的工作流，圖下為測試顏色與 A-Eye 估計的顏色對比。

推薦：藉助獨特 2D 材料和機器學習，CV 像人一樣「看見」數百萬種顏色。

ArXiv Weekly Radiostation

機器之心聯合由楚航、羅若天發起的ArXiv Weekly Radiostation，在 7 Papers 的基礎上，精選本週更多重要論文，包括NLP、CV、ML領域各10篇精選，並提供音訊形式的論文摘要簡介，詳情如下：

本週 10 篇 NLP 精選論文是：

1。 Longtonotes： OntoNotes with Longer Coreference Chains。（from Andrew McCallum）

2。 Multi-CLS BERT： An Efficient Alternative to Traditional Ensembling。（from Andrew McCallum）

3。 Continual Training of Language Models for Few-Shot Learning。（from Bing Liu）

4。 Improving Sharpness-Aware Minimization with Fisher Mask for Better Generalization on Language Models。（from Dacheng Tao）

5。 HUE： Pretrained Model and Dataset for Understanding Hanja Documents of Ancient Korea。（from Kyunghyun Cho）

6。 Language Models of Code are Few-Shot Commonsense Learners。（from Yiming Yang）

7。 IsoVec： Controlling the Relative Isomorphism of Word Embedding Spaces。（from Philipp Koehn）

8。 Multilingual Representation Distillation with Contrastive Learning。（from Holger Schwenk， Philipp Koehn）

9。 Are All Steps Equally Important？ Benchmarking Essentiality Detection of Events。（from Hongming Zhang， Dan Roth）

10。 SubeventWriter： Iterative Sub-event Sequence Generation with Coherence Controller。（from Hongming Zhang）

本週 10 篇 CV 精選論文是：

1。 Sparse in Space and Time： Audio-visual Synchronisation with Trainable Selectors。（from Andrew Zisserman）

2。 QDTrack： Quasi-Dense Similarity Learning for Appearance-Only Multiple Object Tracking。（from Trevor Darrell）

3。 Retrospectives on the Embodied AI Workshop。（from Ali Farhadi， Li Fei-Fei， Kristen Grauman， Silvio Savarese， Joshua B。 Tenenbaum）

4。 Multi-Modal Human Authentication Using Silhouettes， Gait and RGB。（from Rama Chellappa）

5。 AdaptivePose++： A Powerful Single-Stage Network for Multi-Person Pose Regression。（from Shuicheng Yan）

6。 Contact-aware Human Motion Forecasting。（from Richard Hartley）

7。 CLAD： A realistic Continual Learning benchmark for Autonomous Driving。（from Tinne Tuytelaars）

8。 Trans2k： Unlocking the Power of Deep Models for Transparent Object Tracking。（from Jiri Matas）

9。 DG-STGCN： Dynamic Spatial-Temporal Modeling for Skeleton-based Action Recognition。（from Kai Chen）

10。 IronDepth： Iterative Refinement of Single-View Depth using Surface Normal and its Uncertainty。（from Roberto Cipolla）

本週 10 篇 ML 精選論文是：

1。 Probabilistic Inverse Modeling： An Application in Hydrology。（from Vipin Kumar）

2。 SlenderGNN： Accurate， Robust， and Interpretable GNN， and the Reasons for its Success。（from Christos Faloutsos）

3。 Learning to Optimize Quasi-Newton Methods。（from Marin Soljai）

4。 Q-LSTM Language Model —— Decentralized Quantum Multilingual Pre-Trained Language Model for Privacy Protection。（from Xiangyu Zhang）

5。 Efficient Offline Policy Optimization with a Learned Model。（from Wee Sun Lee， Shuicheng Yan）

6。 Few-shot Relational Reasoning via Connection Subgraph Pretraining。（from Jure Leskovec）

7。 Learning Physical Dynamics with Subequivariant Graph Neural Networks。（from Joshua B。 Tenenbaum）

8。 Learnware： Small Models Do Big。（from Zhi-Hua Zhou）

9。 Make Sharpness-Aware Minimization Stronger： A Sparsified Perturbation Approach。（from Dacheng Tao）

10。 PropertyDAG： Multi-objective Bayesian optimization of partially ordered， mixed-variable properties for biological sequence design。（from Kyunghyun Cho）

THE END

轉載請聯絡本公眾號獲得授權

投稿或尋求報道：content@jiqizhixin。com

原標題：《7 Papers & Radios | 兩棲機器龜登上Nature封面；深度去模糊綜述論文入選IJCV》

兩棲機器龜登上Nature封面；深度去模糊綜述論文入選IJCV

相關文章

猜你喜歡