
特斯拉(Tesla)早前申請一項突破性專利,其純視覺 AI 系統結合有向距離場(Signed Distance Fields)技術,可從 2D 攝影機數據實現高精度 3D 地圖繪製,有望大幅降低成本並淘汰昂貴的 LiDAR 感應器。這項技術是自動駕駛的重大進展,預計將應用於即將推出的 FSD v14 版本。
突破傳統深度感測限制
Tesla 這項編號 US20250282344 的專利,解決了自動導航系統長期面對的核心挑戰:如何在不依賴昂貴深度感應器的情況下,準確描繪精細空間細節。傳統方法通常需要成本高昂的 LiDAR 裝置,或產生無法有效表現平滑表面和精確距離的粗糙 voxel 模型。
該系統採用 transformer 神經網路架構,將多個攝影機的影像轉換為連續的有向距離場。每個 voxel 包含到最近表面的詳細距離測量數據,而非僅顯示占用狀態。這項創新實現了子 voxel 精度改良,將解析度從 33 厘米提升至 10 厘米,對於自動停車場景中的平滑表面渲染和空間感知至關重要。
智慧停車識別技術
AI 模型可透過 voxel 級別的塗料檢測識別停車位,超越標準線條檢測方法,能識別各種塗料圖案,包括殘疾人士專用符號和消防通道標記。系統整合時間空間數據,結合多個影格資訊追蹤移動狀態,提升整體準確性。
這項技術對解決城市停車難題具有重要意義。研究顯示,駕駛者尋找停車位造成的交通壅塞占城市交通總量高達 30%。美國駕駛者平均每年花費 17 小時尋找停車位,成本約 345 美元(約台幣 10460 元),而紐約市駕駛者更需要 107 小時,成本高達 2243 美元(約 67995 元)。
成本優勢與市場影響
Tesla 的純視覺方案與競爭對手形成鮮明對比。Waymo 第五代自動駕駛計程車搭載 13 個攝影機、4 個 LiDAR、6 個雷達感應器,成本約 20 萬美元(約台幣 606 萬元)。Tesla 承諾的 Cybercab 目標售價僅 3 萬美元(約台幣 91 萬元),成本優勢顯著。
自 2022 年起,Tesla 的全自動駕駛(FSD)功能已完全採用攝影機方案,不再依賴超音波、雷達或 LiDAR 系統。雖然目前 FSD 的脫離率為每 13 英里一次干預,但 Tesla 持續透過純視覺技術改善系統性能。
該專利的主要創新包括:僅透過視覺預測方向距離、將解析度從 33 厘米改良至 10 厘米的子 voxel 精度、voxel 等級的塗料敏感停車識別,以及跨越多個影格(t 至 t-3)的時間空間整合追蹤移動。
業界專家認為,這項技術可能在自動駕駛領域引發重大變革,特別是在降低硬體成本同時,維持高精度 3D 感知能力方面。隨著 Tesla 持續改良其視覺 AI 系統,這項專利技術有望成為未來自動駕駛車輛的核心組件。
(本文由
Unwire HK 授權轉載;首圖來源:
The Tesla Newswire)