視覺是大自然神奇的恩賜之一,它陪伴我們一起生活了幾億年。對人類來說,這也是一種關(guān)鍵的感覺,但我們常常認(rèn)為是理所當(dāng)然的:直到我們開始失去它,或者我們嘗試為機(jī)器人賦予視覺,發(fā)現(xiàn)其中的艱難與不易。
許多研究實(shí)驗(yàn)室?guī)资陙硪恢痹趯游锖屠ハx中的視覺系統(tǒng)進(jìn)行建模。我們大量研究螞蟻、蜜蜂甚至嚙齒動物。
為了模擬生物系統(tǒng)并使其對機(jī)器人有用,你通常需要了解該視覺系統(tǒng)的行為和神經(jīng)基礎(chǔ)。
行為組成部分是你觀察到動物在做什么,以及當(dāng)你弄亂它可以看到的東西時,該行為如何變化,例如通過嘗試不同的地標(biāo)配置。神經(jīng)元件是動物大腦中用于任務(wù)的視覺學(xué)習(xí)的回路,例如導(dǎo)航。
識別面孔
識別是所有動物和機(jī)器人的基本視覺過程。它能夠識別世界上熟悉的人、動物、物體和地標(biāo)。
由于其重要性,面部識別部分地“融入”到嬰兒等自然系統(tǒng)。所以,我們很早就能識別出面孔。
沿著這些方向,一些人工人臉識別系統(tǒng)基于生物系統(tǒng)是如何起作用的。例如,研究人員創(chuàng)建了一組神經(jīng)網(wǎng)絡(luò),模仿靈長類動物視覺處理的不同層次結(jié)構(gòu),以創(chuàng)建一個能夠進(jìn)行人臉識別的系統(tǒng)。
識別位置
視覺位置識別是任何東西導(dǎo)航世界的重要過程。
地點(diǎn)識別是機(jī)器人或動物觀察周圍世界的過程,并且能夠協(xié)調(diào)它當(dāng)前看到的與某個地方的過去記憶,或者以人類為例,對該地方的描述或期望。
在GPS導(dǎo)航出現(xiàn)之前,我們可能會收到一些指示,例如“直到你看到左邊的教堂然后右轉(zhuǎn)彎”。我們知道一個典型的教堂是什么樣的,因此當(dāng)我們看到它時可以認(rèn)出它。
這種地方識別可能聽起來像一個簡單的任務(wù),直到遇到諸如外觀變化之類的挑戰(zhàn),例如由晝夜循環(huán)或惡劣天氣條件引起的外觀變化。
2視覺識別地點(diǎn)的另一個挑戰(zhàn)是視點(diǎn)變化:如果你從不同的角度查看場景,則會出現(xiàn)什么樣的變化。
在第一次沿著道路回溯路線時會遇到一個極端的例子 —— 你正在從相反的角度遇到環(huán)境中的所有事物。
3盡管存在這些挑戰(zhàn),但想要創(chuàng)建能夠識別地方的機(jī)器人系統(tǒng),就需要視覺系統(tǒng)更深入地了解周圍環(huán)境。
感應(yīng)能力
視覺傳感硬件在過去十年中迅速發(fā)展,部分原因在于智能手機(jī)中功能強(qiáng)大的攝像頭的激增。現(xiàn)代攝像頭如今甚至堪比或超越在更有能力的自然視覺系統(tǒng),至少在某些方面。
例如,消費(fèi)者相機(jī)現(xiàn)在可以在黑暗中看到調(diào)整后的人眼。
新的智能手機(jī)相機(jī)還可以每秒1000幀的速度錄制視頻,從而使機(jī)器人視覺系統(tǒng)的運(yùn)行頻率高于人類視覺系統(tǒng)。
諸如動態(tài)視覺傳感器(DVS)之類的專業(yè)機(jī)器人視覺傳感甚至更快,但僅報(bào)告像素亮度的變化,而不是其絕對顏色。你可以在倫敦海德公園散步時看到不同之處:
并非所有機(jī)器人攝像機(jī)都必須像傳統(tǒng)攝像機(jī)一樣:機(jī)器人專家根據(jù)螞蟻等動物如何看待世界而使用專業(yè)攝像機(jī)。
所需的分辨率?
所有基于視覺的機(jī)器人和動物研究的基本問題之一是“完成工作”需要視覺分辨率(或視敏度)。
對于許多昆蟲和動物如嚙齒類動物而言,它們可以獲得相對較低的視覺分辨率 —— 相當(dāng)于在許多情況下只有幾千像素的相機(jī)(相比之下,現(xiàn)代智能手機(jī)的分辨率從800萬像素到4000萬像素)。
1所需的分辨率根據(jù)任務(wù)的不同而有很大差異,對于某些導(dǎo)航任務(wù),螞蟻和蜜蜂等動物以及機(jī)器人只需要幾個像素。
但是對于更復(fù)雜的任務(wù),例如自動駕駛汽車, 可能需要更高的攝像頭分辨率。
如果汽車想要可靠地識別和預(yù)測人類行人正在做什么或打算做什么,那么可能需要高分辨率的視覺傳感系統(tǒng),以捕獲微妙的面部表情和身體運(yùn)動。
生物啟發(fā)與實(shí)用主義之間的緊張關(guān)系
對于尋求自然靈感的機(jī)器人專家來說,模仿生物學(xué)和利用相機(jī)技術(shù)的不斷進(jìn)步之間存在著持續(xù)的緊張關(guān)系。
雖然生物視覺系統(tǒng)在過去明顯優(yōu)于相機(jī),但技術(shù)的不斷快速發(fā)展使得相機(jī)在許多情況下具有對自然系統(tǒng)的優(yōu)異感測能力。在追求創(chuàng)造高性能和安全機(jī)器人和自動駕駛汽車時,利用這些實(shí)用能力是明智的。
但是生物學(xué)仍將在激勵機(jī)器人專家方面發(fā)揮關(guān)鍵作用。 自然王國非常擅長制造功能強(qiáng)大的視覺系統(tǒng),這些系統(tǒng)消耗的空間、計(jì)算能力和能量資源,而這是大多數(shù)機(jī)器人系統(tǒng)的主要挑戰(zhàn)。
本文圖片來源:The Conversation
2025-06-13 09:41
2025-06-10 11:04
2025-06-10 10:49
2025-06-10 10:08
2025-06-10 10:08
2025-06-08 21:08
2025-06-07 15:24
2025-06-06 13:54
2025-06-06 13:47