編輯註:NVIDIA 自動駕駛實驗室系列視頻,將以工程技術為重點的視角關注實現自動駕駛汽車的各個挑戰以及 NVIDIA DRIVE AV 軟件團隊如何應對這些問題。
對於自動駕駛汽車而言,準確的環境感知至關重要,在處理未知條件時尤為明顯。
本期自動駕駛實驗室視頻中,將討論一種名為 SegFormer 的 Vision Transformer 模型,它能夠在保持高效率的同時生成魯棒的語義分割結果。
觀看視頻,了解 SegFormer 背後的機制,及其具有魯棒性《robustness》和高效性的原理:
00:00:00
使用 SegFormer 實現魯棒的感知技術
00:00:05
準確性和魯棒性對於自動駕駛汽車開發的重要性
00:00:21
什麼是 SegFormer?
00:00:37
卷積神經網絡《CNN》與 Transformer 模型的區別
00:01:33
在 MB 的 Cityscapes 數據集上測試語義分割結果
00:02:22
JPEG 壓縮對 SegFormer 的影響
00:02:40
SegFormer 如何理解未知條件
00:02:56
了解更多關於自動駕駛汽車應用中的分割技術
NVIDIA DRIVE 相關資源
在 GitHub 上獲悉更多細節:
https://github.com/NVlabs/SegFormer
閱讀論文《SegFormer:基於 Transformer 的簡單高效的語義分割設計《SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers》》:
https://arxiv.org/abs/2105.15203
點擊觀看更多 NVIDIA 自動駕駛實驗室系列視頻。
DRIVE 視頻系列 | 體驗新推出的 AV 創新 | NVIDIANVIDIA HomeMenuMenuCloseCloseCloseCaret down iconCaret down iconCaret up iconCaret right iconCaret right iconCaret right iconCaret left iconCaret left iconCaret left iconShopping CartSearch iconNVIDIA 引領人工智能計算NVIDIAWeiboYoukuNVIDIA