他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

      作者:來淘車
      左側寬880
      左側寬880

        來源:量子位

        這是首個基于Transformer的駕駛行為描述框架,可以感知和預測駕駛行為。也就是說,輸入車輛視頻后,這個算法可以判斷車輛行為并告訴你:車在做什么,為什么要這么做。

        還在玩ChatGPT?已經有自動駕駛算法能告訴你“我在干嘛”。

        基于視覺和神經網絡的自動駕駛算法,雖然能通過傳感器數據,以及學習人類的駕駛行為,自主決策并控制車輛。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        但是,算法基于什么做出的決策?特別是出現故障,也就是決策錯誤的時候,算法是怎么想的?這些一直被稱為自動駕駛算法里的“黑匣子”,讓算法缺乏透明度和可解釋性。

        不過,現在有這么一個模型,既能預測車輛控制行為,還能自己解釋“我停車是因為紅燈亮了,并且有行人在過馬路”。

        模型論文入選ICRA 2023,相關模型已開源。

        那么,是一個什么樣的算法?

        ADAPT:駕駛行為感知說明大模型

        這是一種叫ADAPT(Action-aware Driving Caption Transformer)的端到端算法,也是目前第一個基于Transformer的駕駛行為描述框架,可以感知和預測駕駛行為,并且輸出自然語言敘述和推理。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        直白一點說,輸入車輛視頻后,這個算法可以判斷車輛行為并告訴你:車在做什么,為什么要這么做。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        在論文作者提供的測試視頻里,這個算法最終上車的效果是這樣的。(紅色字是車輛行為,藍色字是解釋)

        “車在向前開。因為路上沒有車。”

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        駕駛行為變化后,算法也能及時感知:

        “車靠左邊停下了。因為要停車。”

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        “車開始移動并且靠右行駛。因為路左邊停著車。”

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        算法不僅能識別路口,也能識別騎著車的人。

        “車在十字路口停下了。因為要避開街上騎著自行車的人,”

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        這是怎么實現的?

        多任務框架下的聯(lián)合訓練

        ADAPT框架可以分為兩個部分:車輛行為描述(DCG,Driving Caption Generation)和車輛控制信號預測(CSP,Control Signal Prediction)。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        首先,傳感器端輸入視頻,Video Swin Transformer對車輛視頻進行編碼,得到的視頻特征會輸入進各任務模塊里。

        在DCG模塊,算法利用Vision-Language Transformer生成兩個自然語句,也就是上文中提到的車輛行為描述和原因解釋。

        相同的視頻特征也會輸入進CSP模塊(類似一般基于視覺的自動駕駛系統(tǒng)),輸出車輛實際的控制信號序列,并利用Motion Transformer輸出模型預測的控制信號,比如速度、方向和加速度。

        在單個網絡中,作者利用車輛實際的控制信號序列和模型預測的控制信號序列,兩者的均方誤差作為CSP模塊的損失函數。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        而在多任務框架下,通過聯(lián)合訓練DCG和CSP,可以減少車輛決策和文本描述之間的差異,提高控制信號預測的準確率。

        論文里,作者們在包含控制信號和車輛視頻的大規(guī)模數據集BDD-X上,利用機器評測和人工評測驗證了ADAPT的有效性。

        機器評測方面,使用的是BLEU4、METEOR、ROUGE-L和CIDEr(對應縮寫分別為B4、M、R、C)等多種語言任務常用的指標。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        最終顯示ADAPT達到了當前最優(yōu)(State-of-the-Art)的結果,ADAPT在動作描述方面比原有先進方法CIDEr高出31.7,在原因解釋方面高33.1。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        人工評測分為動作描述、原因解釋和全句三個部分。通過人工判斷,ADAPT在這三部分的準確性分別達到了90%,90.3%和82.7%,證明了ADAPT的有效性。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        在可視化結果里,也能看出ADAPT可以準確識別車輛行為以及決策原因。并且在黑夜、陰雨天等場景下,ADAPT也能保證準確度;即使有雨刷器干擾,ADAPT也可以識別道路上的停止標識。

        為什么需要ADAPT?

        自動駕駛行為的可解釋性

        在基于視覺的自動駕駛算法里,比較常見的解釋圖有視覺注意圖(Attention Map),或者成本量圖(Cost Volume),但不熟悉自動駕駛算法的人容易對這些圖造成誤解。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        因此,ADAPT這種能夠生成自然語言、“說人話”的算法,能夠幫助用戶更好地理解自動駕駛算法在做什么、為什么要這么做,同時還能讓用戶更信任自動駕駛技術。

        而對于算法工程師和研究人員來說,當發(fā)生極端情況時、或者發(fā)生故障(比如判斷錯誤)時,ADAPT可以幫助他們獲得更多信息,進而改進算法。

      他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023

        作者們將進一步研究如何在模擬器和實際車輛上如何部署ADAPT,以及如何利用文本轉語音技術,讓生成的句子轉化為語音,幫助普通乘客,特別是視力障礙乘客使用。

      標簽:

      左側寬880
      左側寬880
      亚洲欧洲日本在线观看| 亚洲女人影院想要爱| 亚洲人成网站在线播放2019| 亚洲国色天香视频| 亚洲激情视频网站| 91午夜精品亚洲一区二区三区| 亚洲综合区图片小说区| 久久精品国产亚洲精品2020| 久久久无码精品亚洲日韩按摩| 亚洲一区中文字幕久久| 久久亚洲春色中文字幕久久久| 久久久久亚洲av无码专区导航| 18亚洲男同志videos网站| 亚洲蜜芽在线精品一区| 亚洲免费观看在线视频| 亚洲午夜一区二区三区| 亚洲日本一线产区和二线| 日韩国产欧美亚洲v片| 日韩成人精品日本亚洲| 亚洲欧洲久久av| 亚洲永久精品ww47| 亚洲国产精品一区二区成人片国内 | 亚洲一区二区三区四区在线观看| 亚洲色四在线视频观看| 亚洲色av性色在线观无码| 亚洲一区在线观看视频| 亚洲欧洲日本在线观看| 亚洲AV日韩AV永久无码色欲| 亚洲高清免费视频| 亚洲精品无码乱码成人| 亚洲一区二区在线视频| 亚洲乱码一二三四区麻豆| 亚洲日韩精品无码AV海量| 亚洲成人影院在线观看| 狠狠亚洲婷婷综合色香五月排名| 亚洲国产精品VA在线看黑人| 亚洲美女精品视频| 亚洲无码一区二区三区| 亚洲国产成人久久综合碰| 亚洲精品一品区二品区三品区| 久久久婷婷五月亚洲97号色|