對(duì)話弋途科技聯(lián)創(chuàng)李盼:AI定義汽車時(shí)代,如何為未來汽車安裝"最強(qiáng)大腦"
藍(lán)鯨新聞5月19日訊(記者 武靜靜)什么是真正的"AI+汽車"?
在科幻電影的世界里,汽車不再是簡(jiǎn)單的交通工具,而是集智能、飛行與自我意識(shí)于一體的未來化身,是未來都市最具標(biāo)志性的“生命體”。還記得《銀翼殺手2049》中的那輛“佩喬飛車”嗎?它不僅能在城市上空自由穿梭,還配備了人工智能駕駛、全息通訊系統(tǒng),甚至能在雨中精準(zhǔn)定位目標(biāo),像一個(gè)沉默冷峻的獵人般與城市共舞。
回到現(xiàn)實(shí),這種幻想并非遙不可及。
AI技術(shù)的飛躍,正推動(dòng)智能汽車從“交通工具”走向“智能終端”進(jìn)化。真正的“AI + 汽車”,不只是語音識(shí)別或自動(dòng)駕駛的加法,而是對(duì)整車智能體系的根本性重構(gòu)。
“我們希望構(gòu)建一個(gè)多端聯(lián)動(dòng)、一腦多端的架構(gòu)。”弋途科技聯(lián)合創(chuàng)始人李盼在接受《藍(lán)鯨科技》采訪時(shí)這樣描述,“AI不應(yīng)被封存在車內(nèi),它應(yīng)該是一個(gè)和用戶始終保持感知連接的智能體,無論是在車上、手機(jī)上,還是在家里,都能無縫銜接,形成統(tǒng)一的大腦。”
這種變革的核心,是將大模型能力深度嵌入整車架構(gòu),打造具有自主決策能力的“移動(dòng)智能體”。它不再只是單點(diǎn)功能的集合,而是一個(gè)具備全局感知與行為決策能力的“類智能生命體”。
這一進(jìn)化,依賴于兩大關(guān)鍵支撐:其一,是以用戶場(chǎng)景為導(dǎo)向,構(gòu)建AI的服務(wù)閉環(huán),讓AI不僅“能聽懂”,更“懂需求”;其二,是實(shí)現(xiàn)整車全域智能協(xié)同——大模型作為中樞,打通座艙交互、智能駕駛、底盤控制、動(dòng)力系統(tǒng)等核心系統(tǒng),形成真正的智能神經(jīng)網(wǎng)絡(luò)。
“未來的助手,應(yīng)該如影隨形,成為個(gè)人的生活助理,隨時(shí)跟隨著個(gè)人。”李盼說,他所設(shè)想的“智能體”,不再局限于車內(nèi)語音交互,而是一個(gè)基于大模型技術(shù)的全時(shí)在線AI,能夠主動(dòng)理解、實(shí)時(shí)服務(wù)、跨設(shè)備響應(yīng),成為用戶的“第二大腦”。
尤其在座艙領(lǐng)域,Agent技術(shù)的落地正在重塑人車交互方式。傳統(tǒng)“播放音樂”“打開空調(diào)”的指令式交互,正被具備理解、規(guī)劃與執(zhí)行能力的AI智能體所取代。比如,“導(dǎo)航到前方咖啡店并提前預(yù)定車位”,這樣復(fù)雜的鏈?zhǔn)椒?wù)指令,已成為現(xiàn)實(shí)。
AI的三次技術(shù)范式遷移——從判別式AI、生成式AI,到如今正在爆發(fā)的Agentic AI(智能體AI)正引領(lǐng)智能汽車進(jìn)入“主動(dòng)服務(wù)”的新階段。而下一步的目標(biāo),是向具備感知和行動(dòng)能力的“具身智能”(Physical AI)邁進(jìn)。
“在五年乃至十年后,汽車就不再只是交通工具,而會(huì)成為一個(gè)巨大的智能移動(dòng)終端,甚至是智能機(jī)器人。”李盼對(duì)未來有著清晰的判斷。他認(rèn)為,真正的AI+汽車,不僅是在技術(shù)架構(gòu)上的躍遷,更是對(duì)用戶關(guān)系和產(chǎn)品認(rèn)知的重構(gòu)。
在這場(chǎng)技術(shù)變革中,創(chuàng)業(yè)公司成為重要的創(chuàng)新引擎。成立于2023年6月的弋途科技,正是這一浪潮的先行者。2024年,公司率先以大模型能力為底座,推出首個(gè)車載AI智能體平臺(tái),在國(guó)內(nèi)主流汽車品牌中實(shí)現(xiàn)量產(chǎn)落地,為智能座艙賦予了真正的“理解力”與“行動(dòng)力”。目前,弋途科技已經(jīng)與北汽、一汽、上汽、五菱、長(zhǎng)城等頭部車廠進(jìn)行合作。
?
近日,藍(lán)鯨科技與李盼進(jìn)行了一次深度對(duì)話,探討他們?nèi)绾卧诩夹g(shù)躍遷的關(guān)鍵節(jié)點(diǎn),抓住機(jī)遇、重構(gòu)智能座艙的體驗(yàn)邊界。
李盼畢業(yè)于上海交通大學(xué),有15年智能網(wǎng)聯(lián)汽車行業(yè)產(chǎn)品規(guī)劃、體驗(yàn)運(yùn)營(yíng)、品牌營(yíng)銷經(jīng)驗(yàn)。曾任國(guó)內(nèi)頭部主機(jī)廠智能化產(chǎn)品總負(fù)責(zé)人,國(guó)內(nèi)頭部車聯(lián)網(wǎng)公司產(chǎn)品項(xiàng)目負(fù)責(zé)人。
李盼曾經(jīng)從0到1搭建智能座艙產(chǎn)品規(guī)劃及Hero car項(xiàng)目落地,操盤了基于智能汽車OS的行業(yè)開放生態(tài)建設(shè)及商業(yè)模式推廣;建立了智能電動(dòng)汽車的用戶全旅程體驗(yàn)運(yùn)營(yíng)模式,在汽車品牌市場(chǎng)方面具備豐富的新媒體運(yùn)作經(jīng)驗(yàn); 擅長(zhǎng)整車智能化產(chǎn)品創(chuàng)新規(guī)劃和定義,AI新技術(shù)應(yīng)用,以及互聯(lián)網(wǎng)科技產(chǎn)業(yè)生態(tài)資源及商業(yè)模式設(shè)計(jì)。?
一、從軟件定義汽車,到AI定義汽車
藍(lán)鯨科技:你們最近發(fā)了新的產(chǎn)品,提到有一個(gè)觀點(diǎn)是讓汽車真正"活"起來,這是一套什么樣的AI系統(tǒng)?
李盼:弋途心界AI全棧系統(tǒng)就是這樣一套讓汽車真正"活"起來的智能系統(tǒng)。
這套系統(tǒng)的核心在于四個(gè)層面的協(xié)同配合。
首先是核心層,弋途心界AI-MIND是專為智能汽車打造的AI決策中樞,它像一位經(jīng)驗(yàn)豐富的"老司機(jī)"般理解所有的用車場(chǎng)景:能通過多維感知實(shí)時(shí)掌握車輛狀態(tài)、環(huán)境信息和用戶需求;具備類人化的快慢思考能力,既能瞬間響應(yīng)簡(jiǎn)單指令,也能深度處理復(fù)雜行程規(guī)劃;獨(dú)有的記憶網(wǎng)絡(luò)可學(xué)習(xí)每位用戶的習(xí)慣偏好,實(shí)現(xiàn)越用越懂你的個(gè)性化服務(wù)。
其次是交互層,交互層圍繞弋途心界AI-HMI與UI Agent能力構(gòu)建。傳統(tǒng)人機(jī)交互以物理按鍵、語音命令為主,仍需大量操作步驟。心界AI-HMI提供了“生成式HMI”與“無感交互”體驗(yàn),支持視覺、語音、行為等多模態(tài)識(shí)別,并通過情境感知和判斷呈現(xiàn)千景千面的界面響應(yīng),刷新交互體驗(yàn),不再是“你操作系統(tǒng)”,而是“系統(tǒng)為你操作”。
第三是服務(wù)層,弋途心界AI-L3智能體通過獨(dú)創(chuàng)的多智能體協(xié)作架構(gòu),將生活助手、用車助手等模塊深度融合,實(shí)現(xiàn)導(dǎo)航規(guī)劃、場(chǎng)景化播客、智能點(diǎn)餐等跨場(chǎng)景服務(wù)的無縫串聯(lián),真正達(dá)成"需求感知-服務(wù)觸發(fā)-閉環(huán)執(zhí)行"的完整鏈條。
最后,AIOA架構(gòu)的存在,實(shí)現(xiàn)了從"軟件定義"到"AI驅(qū)動(dòng)"的范式突破。其革命性創(chuàng)新在于將傳統(tǒng)車載功能模塊轉(zhuǎn)化為可被大模型靈活調(diào)用的"智能積木";同時(shí),基于多智能體協(xié)同架構(gòu),構(gòu)建了統(tǒng)一的"整車能力總線",使得原本孤立的軟件和硬件,在大模型的調(diào)配下實(shí)現(xiàn)智能化組合,實(shí)現(xiàn)汽車AI功能的場(chǎng)景化應(yīng)用。
這套架構(gòu)不僅支整車功能的實(shí)時(shí)智能組合,更通過持續(xù)學(xué)習(xí)機(jī)制不斷進(jìn)化,讓汽車從"功能集合體"進(jìn)化為真正具有適應(yīng)能力的"智能生命體",為行業(yè)提供了可規(guī)模化落地的AI整車解決方案。
藍(lán)鯨科技:關(guān)于如何用AI來改造汽車智能座艙的體驗(yàn),你們的思考是什么?
李盼:過去座艙領(lǐng)域孕育了眾多杰出的企業(yè),其中不乏員工規(guī)模超過千人的大型企業(yè)。
我們?cè)谶@個(gè)領(lǐng)域做了十年,行業(yè)競(jìng)爭(zhēng)確實(shí)激烈。現(xiàn)在,在AI這個(gè)大方向上,我們希望通過數(shù)據(jù)和模型能力,迅速構(gòu)建起AI的感知、理解和推理能力。一旦模型成熟,后續(xù)的迭代將不再像傳統(tǒng)軟件開發(fā)那樣耗時(shí)費(fèi)力,無論是開發(fā)速度還是用戶體驗(yàn),都將迎來質(zhì)的飛躍。這標(biāo)志著一種全新的競(jìng)爭(zhēng)范式的誕生。
正因?yàn)榭吹搅诉@一巨大變革帶來的商業(yè)機(jī)遇,我們也看的比較早,有可以領(lǐng)先半個(gè)身段的競(jìng)爭(zhēng)優(yōu)勢(shì)。
所以公司決定去年布局AI全棧系統(tǒng)方向,借助與語音公司和模型公司的合作,我們迅速推出了面向車載領(lǐng)域的智能體平臺(tái),這是第一步,核心是獲取AI交互的入口。
之后,我們著手籌備構(gòu)建全新一代的產(chǎn)品架構(gòu),本質(zhì)上這是一個(gè)AI操作系統(tǒng)。在這個(gè)系統(tǒng)中,意圖識(shí)別大腦mind,基于mind的理解下,我們構(gòu)建了L3級(jí)智能體AI-HMI。向上構(gòu)建了智能體(Agent)和AI HMI(生成式交互界面),向下則是一套面向AIOA服務(wù)框架。再往下,我們正與全新的跨域芯片和控制器廠商合作,在這些設(shè)備上部署端側(cè)推理模型。
目前,整套架構(gòu)已經(jīng)搭建完成。
藍(lán)鯨科技:Agent或者大模型技術(shù)變量,讓你們看到了哪些智能座艙領(lǐng)域的新機(jī)會(huì)?哪些舊的體驗(yàn)會(huì)被革命?
李盼:智能座艙我們做了十多年,看到非常多的行業(yè)級(jí)問題,主要有三類:
首先,在交互方式上雖然有變化,從大屏觸摸到語音交互,但很多用戶仍然覺得它不夠智能,比如系統(tǒng)聽不懂用戶指令,無法自然流暢的交互。
其次,座艙空間內(nèi)的服務(wù)體驗(yàn)始終未能閉環(huán)。早期,大家都在把各類APP集成到車內(nèi),比如,地圖、語音等基本功能,之后開始探索整車場(chǎng)景。比如出行場(chǎng)景,用戶往往需要在多個(gè)APP之間切換。
一些簡(jiǎn)單的需求,比如叫外賣,或者約會(huì)想找餐廳,這些看起來簡(jiǎn)單的服務(wù),操作起來并不方便,需要在手機(jī)上搜索好信息后,再通過微信發(fā)送到車機(jī)上,然后在車機(jī)上打開,服務(wù)始終未能閉環(huán)。如何形成一個(gè)很好的服務(wù)閉環(huán)?在以前很難做到,而AI技術(shù)的演進(jìn)讓我們看到了智能化閉環(huán)的可能。
當(dāng)車載系統(tǒng)的交互和服務(wù)做到極致時(shí),再隨著自動(dòng)駕駛技術(shù)的提升,一臺(tái)汽車就真正成為了“mobility robot”出行機(jī)器人,這是汽車智能化的終極。這臺(tái)智能汽車不僅會(huì)有一個(gè)“小腦”來控制它的行駛,還必須要有一個(gè)“大腦”,理解人的需求,并服務(wù)人。
二、Agent“再造”智能座艙
藍(lán)鯨科技:AI時(shí)代,智能座艙體驗(yàn)會(huì)有什么不同?
李盼:最初,當(dāng)我們談?wù)撝悄茏摃r(shí),它還處于一個(gè)非常初級(jí)的階段。這個(gè)階段主要是受到移動(dòng)端使用習(xí)慣的影響,比如我們?cè)谑謾C(jī)上習(xí)慣使用iPhone、智能手機(jī)和平板等設(shè)備。一個(gè)簡(jiǎn)單的想法是,既然我們?cè)谝苿?dòng)端能夠享受到各種在線服務(wù),那么在車上,無論是在行駛中還是在任何出行場(chǎng)景下,我們也希望能夠獲得類似服務(wù)。
因此就有了在車上安裝大屏幕,并在屏幕中集成在線應(yīng)用的做法。除了導(dǎo)航,我們還希望在車上聽音樂,聽書。這其實(shí)是用移動(dòng)互聯(lián)網(wǎng)思維在造車。車的智能化發(fā)展,早期被稱為信息娛樂系統(tǒng),主要側(cè)重于信息和娛樂功能。
之后,大家開始考慮是否可以結(jié)合車載硬件,比如氛圍燈、座椅,甚至與駕駛功能做一些聯(lián)動(dòng)。這些事情看起來簡(jiǎn)單,但實(shí)際上非常復(fù)雜,因?yàn)檐囕d系統(tǒng)有很多自身的要求,如安全性、功能性(不能宕機(jī),車機(jī)與手機(jī)不同,它的故障可能會(huì)帶來嚴(yán)重的安全問題)、流暢度和性能等各個(gè)方面。這就是我們?cè)谲浖I(lǐng)域卷了這么多年,一直在努力解決的問題。
手機(jī)提供了多種多樣的服務(wù),無論是計(jì)劃旅游、使用即時(shí)通訊工具與朋友分享位置,還是點(diǎn)外賣,都極為便捷。在將這些服務(wù)搬到車上的過程中,我們遇到了一個(gè)挑戰(zhàn)。在車上,由于駕駛時(shí)需要專注,以及APP之間無法打通,這些事情就變得麻煩起來。車上的APP通常是以APK的形式安裝,它們之間無法直接跳轉(zhuǎn),車廠也很難獲取到足夠的接口來實(shí)現(xiàn)服務(wù)層的跳轉(zhuǎn)。
因此,在車上就會(huì)遇到很多痛點(diǎn)問題,其中之一就是服務(wù)單線程化,即只能進(jìn)行單一的導(dǎo)航等操作。在服務(wù)閉環(huán)中,我們面臨兩大問題。一是在前端,當(dāng)說出復(fù)雜任務(wù)時(shí),語音或車載系統(tǒng)可能無法理解我們的意圖。例如,如果說“我北京的朋友晚上大概七點(diǎn)鐘到虹橋機(jī)場(chǎng),我要去接他”,當(dāng)前的車載系統(tǒng)可能無法理解這個(gè)任務(wù)的全部?jī)?nèi)容。它可能只能識(shí)別出文字,但無法執(zhí)行相應(yīng)的操作,因?yàn)樗焕斫馕覀兊恼鎸?shí)需求。
因此,我們需要尋找解決方案,以實(shí)現(xiàn)車上的服務(wù)閉環(huán),讓駕駛者在行車過程中也能享受到便捷、智能的服務(wù)體驗(yàn)。
從AI終端的角度來看,在思考車載或出行場(chǎng)景時(shí),不再簡(jiǎn)單地將移動(dòng)端的功能搬運(yùn)到車上,而是更多地思考如何為車載場(chǎng)景提供主動(dòng)服務(wù)。
現(xiàn)在車載技術(shù)的發(fā)展速度甚至超過了移動(dòng)端。過去通常是車廠提供一套安卓系統(tǒng),市場(chǎng)方負(fù)責(zé)安裝APP,或者車廠預(yù)裝一些必要的APP,如高德地圖和QQ音樂。然后,車廠會(huì)根據(jù)不同的車型和用戶需求,外接其他APP。
有些車廠采取了更加極致的做法。他們的車載系統(tǒng)就像一個(gè)平板,用戶可以在應(yīng)用市場(chǎng)上自由下載和安裝APP。
AI時(shí)代的邏輯有所不同。首先,整個(gè)交互系統(tǒng)中,它需要擁有一個(gè)“大腦”進(jìn)行思考。其次,交互方式也發(fā)生了變化。無論是現(xiàn)在的AI語音,還是未來的多模態(tài)交互,不再需要用戶按照層級(jí),一步一步地點(diǎn)開APP的各個(gè)界面。用戶只需動(dòng)動(dòng)嘴,所有的指令都會(huì)由智能體自行實(shí)現(xiàn)。
我們產(chǎn)品有一個(gè)點(diǎn)咖啡的視頻,展示了這樣的交互過程。比如,你對(duì)小途說:“今天天氣冷,我想喝一杯咖啡。”它會(huì)問:“你想喝什么”,你說:“美式,熱的,不要加冰。”然后,它會(huì)繼續(xù)詢問你是自取還是送到公司。當(dāng)你確認(rèn)地址后,它會(huì)告訴你訂單已經(jīng)準(zhǔn)備完成,并幫你下單。如果你有優(yōu)惠券,它也會(huì)幫你使用。
整個(gè)過程,你只需要花費(fèi)大約半分鐘到三十秒的時(shí)間進(jìn)行語音交互,這種交互非常自然,不需要刻板地一個(gè)字一個(gè)字地說得非常準(zhǔn)確。交互完成后,接下來的事情你就不需要操心了。我們的美食助理會(huì)在小程序上按照你的需求,一步一步完成點(diǎn)單的動(dòng)作,包括選擇口味、溫度、添加配料,以及選擇地址和下單。
這個(gè)過程,我們稱之為兩段式。第一段是確認(rèn)意圖和需求,第二段是看智能體執(zhí)行任務(wù)。
這樣的情境下,我們并不需要一個(gè)傳統(tǒng)的APP。如果做得更極致一些,所有的一切都通過云端來實(shí)現(xiàn)。目前,我們還在通往這個(gè)目標(biāo)的路上。這也是為什么我們要與各大廠,如騰訊、阿里等進(jìn)行合作,用一套更加先進(jìn)的產(chǎn)品理念,去創(chuàng)造一個(gè)全新的“出行助理”產(chǎn)品。這種AI助理的方式,正在改變?cè)械膽?yīng)用生態(tài),無論是從技術(shù)方式還是產(chǎn)品體驗(yàn)上。
藍(lán)鯨科技:具體談?wù)凙gent怎么改造智能座艙?它的角色是什么,能做什么?
李盼:我們認(rèn)為,智能座艙中,需要一個(gè)管家來理解主人的所有信息和意圖,依據(jù)此來執(zhí)行任務(wù)。這個(gè)管家系統(tǒng)下,會(huì)有不同類別的助理,如會(huì)議助理、美食助理、出行助理(例如旅游達(dá)人)、親子助理等,它們各自負(fù)責(zé)專業(yè)領(lǐng)域內(nèi)的任務(wù),而管家則負(fù)責(zé)綜合協(xié)調(diào)。
目前,我們正在開發(fā)的是這些小助理。我們將每個(gè)應(yīng)用轉(zhuǎn)變?yōu)閷I(yè)的小助理,它們?cè)谧约荷瞄L(zhǎng)的領(lǐng)域能夠高效地完成任務(wù)。這些小助理的發(fā)展有一個(gè)從L1到L5的路線圖。目前,它們處于L2水平,即能夠按照規(guī)則完成既定的任務(wù)。這就像自動(dòng)駕駛的L2級(jí)別,車輛能夠跟隨前車行駛或打燈變道,但還需要人類的監(jiān)督。
當(dāng)智能體發(fā)展到L3級(jí)別時(shí),它將配備一個(gè)更強(qiáng)大的“大腦”。這個(gè)“大腦”能夠感知車內(nèi)外的環(huán)境,包括乘客(如小朋友、老人、駕駛員)的狀態(tài)、表情以及習(xí)慣等。通過對(duì)這些情境信息的完整思考,模型能夠推理出主人的需求,并安排相應(yīng)的事務(wù)。
例如,當(dāng)系統(tǒng)感知到主人今天要去上班或見客戶時(shí),它會(huì)自動(dòng)分發(fā)任務(wù)給各個(gè)小助理。A助理負(fù)責(zé)導(dǎo)航,B助理負(fù)責(zé)調(diào)整車輛設(shè)置(如座椅、空調(diào)),C助理可能是新聞助理,為主人提供定制化的新聞資訊。此外,還有美食助理根據(jù)主人的喜好準(zhǔn)備早餐建議,駕駛助理負(fù)責(zé)駕駛相關(guān)的任務(wù)等。這些小助理會(huì)按照時(shí)序協(xié)調(diào)完成任務(wù)。
在整個(gè)過程中,還需要一個(gè)強(qiáng)大的生成式交互系統(tǒng)。管家在感知和理解主人的需求后,小助理們領(lǐng)取任務(wù)并執(zhí)行。同時(shí),人機(jī)交互也變得實(shí)時(shí)且動(dòng)態(tài),根據(jù)場(chǎng)景變化而調(diào)整。不再像過去那樣需要在一頁(yè)屏上打開多個(gè)APP,而是根據(jù)當(dāng)前需求生成相應(yīng)的卡片或界面,如導(dǎo)航卡片、新聞資訊卡片等。這些卡片會(huì)整合圖文、視頻和文字內(nèi)容,以全新的方式呈現(xiàn)給用戶。因此,在視覺和交互方面,這是一套全新的AI系統(tǒng)。
這個(gè)系統(tǒng)有可以思考的MIND,再加上L3級(jí)智能體,作為我們的助理存在,還有一套全新的、基于AI生成式的HMI(人機(jī)界面)基于AIOA基座共同構(gòu)成。
此外,系統(tǒng)中還包含一些偏工程化的部分。比如,需要一套SV(可能是指某種服務(wù)層或軟件層)來支持,同時(shí)還需要在終端部署一套推理框架,以實(shí)現(xiàn)端到端的部署。
端部署構(gòu)成了我們未來發(fā)展的三條重要路線之一。首先,“大腦”(即算法或系統(tǒng))需要不斷迭代;其次,我的智能體需要不斷迭代其生成式交互能力;最后,承載這些的智能硬件也需要迭代。
這里的硬件不一定非得是屏幕,我們目前正與一些智能終端合作伙伴進(jìn)行探討,未來在車內(nèi),它可能不是一個(gè)屏幕,而是一個(gè)機(jī)器人。這個(gè)機(jī)器人可能在肚子上裝有一個(gè)小型顯示屏,僅需進(jìn)行簡(jiǎn)單的“yes or no”或符號(hào)確認(rèn)交互,其余任務(wù)均由它來處理。
這是我們當(dāng)前的思考和布局。目前,每一層都在進(jìn)行中,特別是在融資后,我們將重點(diǎn)投入到快速產(chǎn)品化、商業(yè)化,并努力形成一定的技術(shù)壁壘。因?yàn)檫@其中需要大量的數(shù)據(jù)來訓(xùn)練模型等。
藍(lán)鯨科技:車載垂域模型的數(shù)據(jù)是從哪里來?
李盼:這些數(shù)據(jù)其實(shí)涉及幾個(gè)方面。首先,我們?cè)谂?strong>構(gòu)建自己的數(shù)據(jù)體系,也會(huì)尋求第三方合作或自主研發(fā)。其次,當(dāng)這些產(chǎn)品應(yīng)用到車輛上后,與車廠的合作就變得至關(guān)重要,這與自動(dòng)駕駛數(shù)據(jù)的飛輪效應(yīng)相似。一旦數(shù)據(jù)飛輪開始轉(zhuǎn)動(dòng),我們需要提供整套系統(tǒng)給車廠,并確保數(shù)據(jù)共享,以便共同優(yōu)化算法。
因此,在與車廠洽談合作時(shí),我們會(huì)重點(diǎn)討論數(shù)據(jù)的具體使用方式。我認(rèn)為,一旦產(chǎn)品上車,用戶平時(shí)如何使用這些數(shù)據(jù)就變得尤為重要。此外,我最近也在思考一些策略,比如,為了提供高度個(gè)性化的推薦,這離不開應(yīng)用本身的一些策略。所以,我們也會(huì)與應(yīng)用提供方進(jìn)行深入交流。
目前,我們的工作重點(diǎn)是搭建好框架,實(shí)現(xiàn)產(chǎn)品化。一方面,我們會(huì)與服務(wù)商、應(yīng)用提供方合作;另一方面,也會(huì)與車廠、主機(jī)廠攜手,雙方共同構(gòu)建一個(gè)數(shù)據(jù)池。
藍(lán)鯨科技:你認(rèn)為智能機(jī)器人和Agent的關(guān)系是什么?
李盼:我們認(rèn)為五年乃至十年后,車就會(huì)成為智能機(jī)器人,或者是一個(gè)巨大的智能移動(dòng)終端。弋途希望在這個(gè)領(lǐng)域里,為這些機(jī)器人打造一個(gè)“大腦”。自動(dòng)駕駛、座艙等各個(gè)領(lǐng)域都會(huì)有一個(gè)智能體,多個(gè)智能體相互協(xié)同,形成一個(gè)整體。這是我們對(duì)整車未來智能化的思考。
這也標(biāo)志著機(jī)器人時(shí)代的一個(gè)全新大終端的到來,這個(gè)終端本身?yè)碛袕?qiáng)大的計(jì)算能力、行動(dòng)能力和感知能力。
過去我們談?wù)撥浖x汽車時(shí),主要關(guān)注的是如何在各個(gè)域(如底盤域)中開發(fā)智能化軟件,定義功能座艙和場(chǎng)景。然而,在AI汽車的發(fā)展趨勢(shì)下,整個(gè)汽車架構(gòu)也將發(fā)生巨大變化,可能會(huì)演變成一套大型的AI操作系統(tǒng)。在這個(gè)系統(tǒng)上,我們將構(gòu)建各種模型,并可能引入AI計(jì)算機(jī),替代過去的域控制器。在這臺(tái)計(jì)算機(jī)上,會(huì)運(yùn)行著終端推理模型,以及其他各種組件,如CPU和GPU,它們共同支持在終端上部署和運(yùn)行模型。結(jié)合終端的場(chǎng)景,將會(huì)有各種智能體出現(xiàn),替代傳統(tǒng)的APP。
從座艙的角度來看,交互智能和服務(wù)智能這兩方面本身就蘊(yùn)含著巨大的機(jī)遇。如今,我們有機(jī)會(huì)利用AI徹底把智能座艙重做一遍,這是一個(gè)巨大的機(jī)遇。
藍(lán)鯨科技:有車廠認(rèn)為助手這個(gè)入口特別重要,選擇自己做,弋途也想做平臺(tái)性的系統(tǒng),怎么競(jìng)爭(zhēng)?
李盼:從整體產(chǎn)業(yè)格局來看,未來幾年肯定會(huì)發(fā)生巨大的變化,特別是在AI領(lǐng)域的布局和競(jìng)爭(zhēng)上。各家企業(yè)一定會(huì)像過去做自動(dòng)駕駛一樣,進(jìn)行資源和精力的投入,展開軍備競(jìng)賽。
這個(gè)過程中,肯定會(huì)涌現(xiàn)出一些在人工智能與汽車深度結(jié)合方面表現(xiàn)出色的企業(yè)。每家公司對(duì)自己的定位可能有所不同,但我認(rèn)為,隨著技術(shù)的發(fā)展,汽車將成為一個(gè)多功能的終端。AI肯定會(huì)成為這些企業(yè)的重要技術(shù)底座。
過去我們講軟件定義汽車,現(xiàn)在已經(jīng)進(jìn)入了AI定義汽車的時(shí)代。在AI定義汽車的時(shí)代,格局會(huì)發(fā)生分化,有的企業(yè)會(huì)像理想一樣脫穎而出。還有一些企業(yè)則專注于造車本身,將AI作為體驗(yàn)或服務(wù)的一部分,采用外部解決方案。我認(rèn)為這種格局從現(xiàn)在到未來都會(huì)存在,不太可能出現(xiàn)某一家汽車AI公司獨(dú)霸市場(chǎng)的情況。
我們的主要任務(wù)是利用好這些模型,無論是開源的還是商業(yè)化的,形成一個(gè)專注于車載領(lǐng)域的模型。這一點(diǎn)非常重要,因?yàn)樵谠S多行業(yè)中,大公司親自下場(chǎng)往往會(huì)擠壓小公司的生存空間。作為創(chuàng)業(yè)公司,需要迅速行動(dòng),在有限的時(shí)間窗口內(nèi)將概念和想法轉(zhuǎn)化為實(shí)際產(chǎn)品和商業(yè)化方案。
在當(dāng)前的格局下,公司和模型公司不太可能親自進(jìn)入汽車領(lǐng)域。因此,我們沒有什么負(fù)擔(dān),產(chǎn)業(yè)也給了我們一個(gè)寶貴的時(shí)間窗口。我們會(huì)抓住這個(gè)機(jī)會(huì),迅速提升內(nèi)部能力,特別是針對(duì)車的模型。這個(gè)模型非常重要,可能是我們未來與車廠互動(dòng)和溝通的關(guān)鍵籌碼。
藍(lán)鯨科技:主機(jī)廠和大模型公司都在發(fā)力智能座艙方向,我們的優(yōu)勢(shì)是什么?
李盼:主機(jī)廠都不會(huì)自己做基礎(chǔ)模型,因此這里存在許多不同層次的合作機(jī)會(huì)。不同的廠家情況各異,有的可能已經(jīng)搭好了框架,我們只需將東西填入;有的則連框架都未建立,那我們就需要提供一整套解決方案。所以,這是一種多樣化的合作模式。
對(duì)于汽車而言,關(guān)鍵在于今天誰在定義框架,誰擁有全棧能力,以及誰能夠分層輸出。像弋途這樣的公司,就擁有這樣的定位:它具備全棧能力,同時(shí)又能分層輸出AI能力,打法非常靈活。由于我們深度了解整個(gè)汽車產(chǎn)業(yè)的分工,所以在創(chuàng)業(yè)初期,我們就保持開放的心態(tài),沒有過于封閉。
三、雙軌策略:商業(yè)化與技術(shù)探索雙線并行
藍(lán)鯨科技:目前的技術(shù)進(jìn)展和商業(yè)化探索進(jìn)展是什么?
李盼:我們目前遵循雙軌策略:一方面推進(jìn)商業(yè)化合作,另一方面也積極探索開源方案。
在商業(yè)化方面,由于一些車廠可能有自己獨(dú)特的想法和需求,比如他們可能偏好使用特定的技術(shù)或解決方案,我們會(huì)基于他們的這些需求,與相關(guān)的模型公司進(jìn)行合作,進(jìn)行針對(duì)性的訓(xùn)練和開發(fā),包括智能方面的相關(guān)工作。
而在開源方面,我們則致力于在現(xiàn)有開源模型的基礎(chǔ)上進(jìn)行演進(jìn),構(gòu)建我們自己的AI能力。這種方式相對(duì)來說更加靈活。同時(shí),我們也在自主部署服務(wù)器,以支持這些工作的進(jìn)行。
出行領(lǐng)域雖然看似垂直專業(yè),但其中包含了眾多場(chǎng)景化的數(shù)據(jù),這些數(shù)據(jù)的質(zhì)量、相關(guān)算法等都需要極其精細(xì)的處理。因此,我們?cè)谶@一領(lǐng)域的工作主要是基于一些開源模型進(jìn)行自定義調(diào)整和優(yōu)化。我們要不斷地調(diào)整這些模型,直到它們達(dá)到最佳狀態(tài)。只有這樣,我們最終推出的產(chǎn)品才能呈現(xiàn)出最優(yōu)的體驗(yàn),從而打動(dòng)客戶。
目前,在商業(yè)化量產(chǎn)方面,由于我們與合作伙伴的合作已經(jīng)比較深入,所以現(xiàn)在基本上已經(jīng)實(shí)現(xiàn)了量產(chǎn)。當(dāng)然,這還只是前期階段,我們還有很多工作要做,但總的來說,進(jìn)展還是比較順利的。
藍(lán)鯨科技:實(shí)現(xiàn)量產(chǎn)的是哪個(gè)產(chǎn)品,具體能做什么?
李盼:我們去年已經(jīng)量產(chǎn)并上車的產(chǎn)品主要偏向于L2級(jí)的智能體。舉個(gè)例子,就像現(xiàn)在做得比較好的聊天功能,它上車后也具備了一些強(qiáng)大的閑聊功能。你可以隨意跟它聊資訊、聊新聞,上至天文,下至地理,無所不聊,甚至還能和小朋友聊天。這種能力確實(shí)很強(qiáng)。
其次,我們與許多應(yīng)用做了深度結(jié)合。比如音樂應(yīng)用,現(xiàn)在它能實(shí)現(xiàn)音樂自由說功能,即使你模糊地搜索歌曲,它也能結(jié)合當(dāng)前情境,比如今天下雨了,它會(huì)為你匹配與下雨天氛圍相關(guān)的歌曲。這方面的能力我們做得很好。
此外,它還有行程規(guī)劃功能。比如你要去迪士尼,它會(huì)幫你安排一天的行程;或者你要自駕游去杭州,它也會(huì)為你規(guī)劃路線。這是利用大模型的能力,再加上我們對(duì)地圖導(dǎo)航UI的信息整合,實(shí)現(xiàn)的行程規(guī)劃功能,非常實(shí)用。
另外,我們還有一個(gè)文生圖功能,這也是結(jié)合場(chǎng)景生成的。比如今天你要帶孩子去迪士尼,想要一張公主城堡的畫,它能為你畫出來。畫出來后,如果你想把它變成壁紙,也能直接生成壁紙。
我們現(xiàn)在也與小程序合作的服務(wù)達(dá)成閉環(huán),比如點(diǎn)咖啡等,這些功能已經(jīng)基本上準(zhǔn)備在一家車廠投產(chǎn)、量產(chǎn)了。
藍(lán)鯨科技:為什么在創(chuàng)立早期就想做生態(tài)?公司的角色定位和分工是什么?
李盼:生態(tài)是我們的一個(gè)重要戰(zhàn)略方向。我們的目標(biāo)是在整個(gè)AI大系統(tǒng)中提供服務(wù),涵蓋了模型、第三方內(nèi)容以及生態(tài)服務(wù)。目前,已經(jīng)構(gòu)建了一套完整的AI系統(tǒng),從模型到內(nèi)容與服務(wù),都與頭部大公司形成了合作,并將它們通過我們搭建的框架與能力引入到車載系統(tǒng)中,共同打造場(chǎng)景化的產(chǎn)品。
生態(tài)對(duì)我們來說具有兩大核心價(jià)值:首先是產(chǎn)品化的價(jià)值。我們與許多生態(tài)伙伴,如歷史上已有合作的公司,在邁向AI汽車時(shí)代時(shí),都在尋求轉(zhuǎn)型。我們攜手這些伙伴,如騰訊出行、喜馬拉雅等,共同創(chuàng)新,將傳統(tǒng)APP或服務(wù)智能化。我們做了許多創(chuàng)新性工作,這些伙伴也愿意投入,與我們一起打磨產(chǎn)品。這樣的產(chǎn)品體驗(yàn)相較于傳統(tǒng)有了極大的提升。
其次是與模型公司的合作價(jià)值。許多模型公司在行業(yè)中提供模型或較粗顆粒度的行業(yè)解決方案。他們希望找到能在車載領(lǐng)域深度耕耘、同時(shí)懂車和AI的伙伴。我們與他們之間有非常好的合作與互動(dòng)。我們可以基于他們的能力,打包成方案推給我們的客戶,他們也很樂意在他們的方案中整合我們的智能體或已落地的方案,共同推向他們的客戶。
從業(yè)務(wù)到產(chǎn)品,我們都是通過生態(tài)來構(gòu)建整個(gè)大的生態(tài)版圖。作為創(chuàng)業(yè)公司我們不可能什么都做。我們的定位是構(gòu)建整個(gè)AI系統(tǒng)框架,每一層都可能有生態(tài)公司參與共建。我們也希望大家一起來共建新的AI汽車生態(tài)。這個(gè)新生態(tài)可能涉及AI的OS、AI的Agent等,應(yīng)該有一個(gè)新的圈子,這個(gè)圈子里,每家都有不同的特長(zhǎng),如模型公司、內(nèi)容服務(wù)公司等。
我們并不是要出來做“帶頭大哥”,而是希望把想法講出去,吸引到更多的人來參與。參與進(jìn)來后,這里面一定會(huì)有若干個(gè)能夠與我們形成很好協(xié)作的伙伴。這也能賦能到我們,同時(shí)這也是互相的,大家可以互相促進(jìn)。
藍(lán)鯨科技:公司未來發(fā)展規(guī)劃是什么?
李盼:我們會(huì)以車輛的智能化、AI化為切入點(diǎn),首先深入打透車載場(chǎng)景。在構(gòu)建起全面的AI能力后,我們會(huì)逐步將這些能力拓展至各個(gè)終端上。
今天,無論是機(jī)器人、玩具,還是耳機(jī)、眼鏡等設(shè)備,它們的核心需求都是相似的:需要交互,需要服務(wù)。在車載這個(gè)相對(duì)封閉且意圖明確的場(chǎng)景中,我們更容易打穿并深化智能車的應(yīng)用。同時(shí),我們也會(huì)將AI能力延展到其他終端上。因此,我們目前也在積極關(guān)注非汽車領(lǐng)域的賽道。
在這個(gè)過程中,我們并非完全脫離汽車,而是希望構(gòu)建一個(gè)多端聯(lián)動(dòng)、一腦多端的架構(gòu)。例如,如果有一個(gè)玩具,孩子可以把它拿到車上,只要它使用的是我們的AI系統(tǒng),里面也包含我們的服務(wù),那么孩子在后排就可以直接與玩具聊天,玩具也能感知孩子的情緒,并幫助他實(shí)現(xiàn)車上的各種動(dòng)作和指令。
這樣,無論我走到哪里,我的AI“大腦”都會(huì)跟著我,我的服務(wù)也會(huì)隨時(shí)跟隨。而不是只有在車上時(shí),我才能享受到整個(gè)助理的體驗(yàn)。這是我們整體的大邏輯。
從AI的視角來看待終端,未來的助理,應(yīng)該如影隨形,成為個(gè)人的生活助理,隨時(shí)跟隨著個(gè)人。