2025-09-12
作為具身智能(Embodied AI)的前沿探索,物理AI(Physical AI),即能夠精準(zhǔn)理解并與現(xiàn)實(shí)世界進(jìn)行物理交互的智能體,其發(fā)展正受限于一個(gè)根本性瓶頸:訓(xùn)練數(shù)據(jù)的維度保真度。
當(dāng)前,人工智能向物理世界的跨越,其成敗不僅取決于算法與算力的持續(xù)突破,很大程度上也受到數(shù)據(jù)質(zhì)量的深刻影響,這是一場(chǎng)關(guān)乎認(rèn)知的革命。如果AI所學(xué)習(xí)的數(shù)字世界從源頭就缺乏物理真實(shí)性,其后續(xù)行為的有效性與可靠性便會(huì)大打折扣。
當(dāng)前3D數(shù)據(jù)在視覺(jué)幾何的還原上已達(dá)到前所未有的逼真度,但其向物理AI的轉(zhuǎn)化仍受限于兩條難以逾越的“數(shù)據(jù)鴻溝”:
1. 物理屬性的真空:現(xiàn)有數(shù)據(jù)資產(chǎn)普遍缺失對(duì)物體內(nèi)在物理屬性如質(zhì)量、材質(zhì)、剛度、摩擦系數(shù)等的定義。AI習(xí)得了一個(gè)視覺(jué)完美的“空杯子”,卻對(duì)其物理本質(zhì)一無(wú)所知,因此無(wú)法形成對(duì)物理規(guī)律的有效認(rèn)知。
2. 功能語(yǔ)義的缺失:在智能體的“眼中”,一把椅子若只被定義為一組三維坐標(biāo)和紋理貼圖,那么它的核心功能“可供支撐”便無(wú)從談起。如門“可以推開(kāi)”、開(kāi)關(guān)“可以按下”被完全忽略。這導(dǎo)致AI無(wú)法理解人類世界的交互邏輯與任務(wù)目標(biāo)。
為跨越這一數(shù)據(jù)鴻溝,Behavision正致力于構(gòu)建一種關(guān)鍵數(shù)據(jù)范式:3D鉸接數(shù)據(jù)。這是一種專為物理AI訓(xùn)練而設(shè)計(jì)的高維數(shù)據(jù)資產(chǎn),旨在從源頭為AI注入物理世界的底層邏輯。
APPEARANCE:高保真的幾何與視覺(jué)信息,是AI進(jìn)行場(chǎng)景理解與目標(biāo)識(shí)別的基礎(chǔ)。
STRUCTURE:定義物體的部件組成與運(yùn)動(dòng)學(xué)骨架,包括部件間的鉸接關(guān)系、自由度與運(yùn)動(dòng)范圍,是AI理解如何與物體進(jìn)行物理交互的前提。
SEMANTICS:標(biāo)注物體及其部件的功能可供性,將抽象的功能與物理結(jié)構(gòu)關(guān)聯(lián),讓AI理解物體的“用途”。
PHYSICS:結(jié)構(gòu)化的物理屬性,通過(guò)與物理仿真引擎深度耦合,精確標(biāo)注質(zhì)量、重心、慣量、材質(zhì)等參數(shù),為AI的物理推理與行為預(yù)測(cè)提供數(shù)據(jù)基石。
子公司智境云創(chuàng)通過(guò)其在3D鉸接數(shù)據(jù)領(lǐng)域的深度研發(fā),正為行業(yè)探索下一代物理AI提供重要的基礎(chǔ)設(shè)施。以高保真、物理可信的數(shù)據(jù)為基石,有望加速一個(gè)能夠更深度理解并服務(wù)于物理世界的智能時(shí)代的到來(lái)。