欧美亚洲丝袜传媒另类_日韩在线免费视频_国内一区在线_亚洲一区二区三区日本久久九

李想詳解AI戰略:從信息工具邁向生產力,理想汽車押注“司機大模型”汽車

TechWeb.com.cn 2025-05-08 10:27
分享到:
導讀

理想汽車在VLA司機大模型的語言能力研發上提速顯著,未來的VLA就是一個像人類司機一樣工作的司機大模型,輔助駕駛的真正突破點是VLA——一個能像人類司機一樣觀察、理解并執行行動的多模態大模型。

TechWeb 文/卞海川

在距離上次“AI Talk”整整130天之后,理想汽車創始人兼CEO李想再度接受張小珺專訪,系統闡述了理想汽車在人工智能,特別是“司機大模型”(VLA)方面的最新進展。

人工智能尚未減少工作時長,核心挑戰仍是“熵增”

“人工智能發展得這么快,但我每天的工作時長并沒有減少。”李想的一句開場白引發共鳴。在他看來,當前大多數人仍將AI視為信息工具,而信息的質量受限于索引機制,尤其是RAG(檢索增強生成)依賴的源頭往往已“失真”,導致“推理很認真,但結果是錯的”。

李想進一步提出AI工具的三層分級:信息工具、輔助工具、生產工具。

“只有成為生產工具,人工智能才真正實現爆發。” 他強調,AI若無法切實改善產出質量、壓縮時間成本,就無法對工作效率產生實質影響。

擁抱DeepSeek,加速理想VLA模型推進9個月

對于中國大模型行業,李想毫不掩飾自己的贊譽:“無論是DeepSeek還是千問,中國AI在基礎模型、推理模型、多模態能力上已經跟美國的距離基本上拉近了。”

李想對DeepSeek以及其創始人梁文鋒給出了高度評價,包括“自律”、“會在全世界范圍之內去研究和學習最佳實踐和最好的方法論的人”。

李想介紹了他從DeepSeek上吸取到的經驗。DeepSeek運用了人類的最佳實踐,比如說DeepSeek V3采用了一個671B的MoE(混合專家模型)。

專家能力如何構建?李想認為,DeepSeek展示了一個最佳實踐:第一步一定要先搞研究。

“任何時候當我們想去改變和提升能力,第一步一定是搞研究,第二步是研發,第三步是把能力表達出來,第四步是能力變成業務的價值。這四個步驟是個極簡的人類最佳實踐,但我們經常做著就忘掉了,看到什么東西就直接去啟動研發,而沒有去搞研究。”李想說道。

正是基于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發上提速顯著,節省了近9個月的時間和數億元成本。

“我們內心很簡單:DeepSeek幫助我們太大,所以我們決定開源自研的星環OS系統作為回饋。”李想表示,就是DeepSeek給我們帶來那么大的幫助,我們應該給對社會貢獻點什么,不讓行業那么卷。說白了純粹是感謝DeepSeek。

為什么有了DeepSeek,理想還要自研基座模型?李想回應說:“核心在場景需求不同,我們要做車載多模態交互,尤其是VLA(視覺語言行動模型)——需要3D/2D視覺融合,疊加汽車、交通、家庭場景的專業語料,這些垂直領域的數據和訓練邏輯,是通用模型沒覆蓋的。”

理想汽車的AI主航道:打造司機級大模型

目前的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA能夠讓AI真正成為司機,成為交通領域的專業生產工具。對理想汽車而言, 未來的VLA就是一個像人類司機一樣工作的司機大模型”。

在李想看來,輔助駕駛的真正突破點是VLA——一個能像人類司機一樣觀察、理解并執行行動的多模態大模型。

他將VLA的發展劃分為三階段:

1. 昆蟲智能階段:依賴規則算法、高精地圖,智能程度有限;比較像螞蟻的行動和完成任務的一個方式。

2. 哺乳動物階段:通過端到端學習模仿人類操作,泛化能力增強;去面對它從來沒有學到的、特別復雜的,其實就會遇到問題。

3. 人類智能階段:VLA具備理解物理世界的能力,結合3D視覺、語言理解和行動執行,“像司機一樣工作”。

李想總結稱,它會像人類一樣的用3D的vision和2D的組合,去看整個真實的物理世界,也包含它能夠去看懂導航軟件是怎么在運行的,而不是像VLM那樣只能看到一張圖片。另外一方面,它有自己的整個腦系統,不但要看到物理世界,還能夠理解這個物理世界。它有它的language,然后它也有它的CoT(思維鏈),有推理的能力。

目前,理想正在訓練一個32B參數量級的VL(視覺-語言)基座模型,加入了高清2D圖像、3D視覺、交通語言語料及VL聯合語料(如導航與行為的關聯)。

基于此前李想對于人工智能的判斷,他認為,只有讓輔助駕駛變成一個真正的司機,它才是一個生產力工具,不只是一個輔助工具。

最新公布的視頻顯示,基于 VLA 模型的輔助駕駛系統,駕駛員可以用語音操控車輛,包括走收費站的人工通道、掉頭、靠邊停車、停在停車場的 C3 區域等等,這都是輔助駕駛從未有過的體驗。

對于行業普遍存在的對輔助駕駛安全性的質疑,李想則表示,“這正是黎明前的黑暗”。他表示,正因為輔助駕駛行業遇到了問題,我最喜歡、最開心的方式,就是去解決行業解決不了的問題,這是我們自己堅決相信的。

李想認為,只要人類會雇傭司機,人工智能技術是把類似這樣的一些功能和角色,去變成真正的生產力、生產工具,然后進行替代。

成長帶來能量,在痛苦中保持正能量

今年7月,理想汽車將迎來成立十周年。李想表示,創業路上苦多于甜,他選擇保留那些有價值的美好片段,用來激勵自己保持正能量。“創業確實不容易,但是沒必要苦哈哈的。苦和甜是一個硬幣的正反面,取決于看哪一面。”他將企業遭遇的打擊視為必須面對的挑戰,也正是這些挑戰,賦予了理想汽車更多的能力。

談及如何成為更有能量的人,李想認為,關鍵在于關注自我,接受自身的優點和不足,并用成長替代改變——成長意味著增強能力。除此之外,李想強調親密關系同樣重要,關注他人的成長也能帶來能量,家人和同事能夠和他形成互補,相互支撐。“我需要家人和同事甚至超過了他們需要我,首先是我需要他們,然后才是他們需要我,我們在一起能夠形成非常強的腦力和心力。”李想表示。

回顧幾次創業經歷,李想表示,從高中創辦個人網站至今,自己的思維方式沒有什么變化:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學習。不同的是,如今面臨的問題更復雜、服務的用戶群體更多、公司規模和組織也更龐大。“幾次創業一路走來,最難時有人相助,遇坑也能迅速爬出,一幫人齊心協力變得更好,這是種幸運,也沒什么可后悔的。”

AI的真正爆發,不僅是技術參數的躍升,更是從“參考”到“生產”的范式轉移。司機大模型,或許正是理想汽車投向未來的一張王牌。

李想 模型 DeepSeek 理想 能力
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。