加州大學洛杉磯分校和美國陸軍研究實驗室的研究人員提出了一種新的方法,通過在數據驅動技術中添加基於物理的意識來增強人工智能驅動的計算機視覺技術。
這項研究發表在《自然機器智能》雜志上,概述了一種混合方法,旨在改善基於人工智能的機器實時感知、交互和響應環境的方式,比如自動駕駛汽車如何移動和操縱,或者機器人如何使用改進的技術進行精確動作。
計算機視覺使人工智能能夠通過解碼數據和從圖像中推斷物理世界的特性來觀察和理解周圍環境。
雖然這些圖像是通過光和力學的物理原理形成的,但傳統的計算機視覺技術主要集中在基於數據的機器學習上,以提高性能。
基於物理學的研究已經在一個單獨的軌道上發展起來,以探索許多計算機視覺挑戰背後的各種物理原理。
將對物理的理解《控制質量、運動等的定律》納入神經網絡的開發中一直是一個挑戰,在神經網絡中,人工智能以人腦為模型,擁有數十億個節點,以處理大量圖像數據集,直到他們了解自己『看到了什麼』。
但現在有一些有希望的研究方向,試圖將物理意識的元素添加到已經強大的數據驅動網絡中。
加州大學洛杉磯分校的這項研究旨在利用數據中的深層知識和現實世界中的物理學知識,創造一種具有增強能力的混合人工智能。
『視覺機器最終是在我們的物理世界中完成任務』該研究的通訊作者、加州大學洛杉磯分校薩穆埃利工程學院電氣和計算機工程助理教授阿丘塔·卡丹比說,『感知物理的推理形式可以使汽車更安全地駕駛,或者使手術機器人更精確』
研究團隊概述了物理學和數據開始結合到計算機視覺人工智能中的三種方式:
將物理融入人工智能數據集為對象添加附加信息,例如它們的移動速度或重量,類似於電子遊戲中的角色。
將物理融入網絡體系結構通過網絡過濾器運行數據,該過濾器將物理屬性編碼為相機拾取的內容。
將物理學納入網絡損失函數利用建立在物理學基礎上的知識,幫助人工智能解釋其觀察到的訓練數據。
這三條調查線已經在改善計算機視覺方面取得了令人鼓舞的結果。
例如,混合方法允許人工智能更精確地跟蹤和預測物體的運動,並可以從被惡劣天氣遮擋的場景中生成準確、高分辨率的圖像。
研究人員表示,隨著這種雙模態方法的不斷進步,基於深度學習的人工智能甚至可能開始自己學習物理定律。