4月26日,具身智能公司超維動力Kinetix AI(KAI)舉辦「降臨GIFTED」發(fā)布會,正式發(fā)布同名產(chǎn)品首款全尺寸人形機器人“KAI”。這場發(fā)布會與常見發(fā)布會不同:KAI并非以被介紹的方式亮相,而是由兩位KAI以“對談和自我介紹”的形式登場,講述它們的能力、技術路線和產(chǎn)品定位。

聯(lián)合創(chuàng)始人Tyler在發(fā)布會上介紹:“機器人要真正融入人類世界,它必須更擬人。他相信人類的物理智能是從與人類世界互動而來。這就要求機器人至少需要以下三方面能力的閉環(huán)----理解世界、學習世界、與世界交互,對應的則是物理世界模型、第一人稱數(shù)據(jù)集、高擬人本體”。

理解世界,就是讓機器人不僅能感知當前環(huán)境,還能對接下來的環(huán)境變化作出預測,也就是KAI World Model。

據(jù)介紹,目前超維動力的世界模型系統(tǒng)已形成閉環(huán)結構,除主體模型外,系統(tǒng)還包括動作模塊和評估模塊。動作模塊會根據(jù)當前狀態(tài)生成候選動作,并傳遞給基模型;基模型再根據(jù)候選動作,生成未來狀態(tài);評估模塊則對軌跡進行價值判斷,包括任務進展、是否安全接觸等。

如果說世界模型解決的是理解世界,那么第一人稱數(shù)據(jù)集解決的則是學習世界。KAI的思路是,借助人類的視角和動作來觀察世界、接觸世界,從而獲得更貼近真實場景的經(jīng)驗。

超維動力自研規(guī)模化數(shù)采終端 KAI Halo。該設備采用輕量化頭環(huán)形態(tài),“一芯八攝”,可一站式完成人類世界數(shù)據(jù)采集,不僅能夠記錄第一人稱視角視頻,還能完成人體姿態(tài)與場景點云重建。由于設備足夠輕便,佩戴者可以在日常工作中自然使用,這意味著采集過程不需要依賴腳本化編排,數(shù)據(jù)也更接近真實場景。相比刻意設計的動作流程,這類數(shù)據(jù)往往能記錄更多樣的動作,更適合人形機器人訓練。

世界模型讓KAI理解世界,第一人稱數(shù)據(jù)集讓KAI擁有了人類經(jīng)驗,但還需要一個好的訓練范式讓KAI把經(jīng)驗轉化為技能,這就是三階段訓練體系。


      在預訓練階段,KAI使用大量互聯(lián)網(wǎng)和仿真等數(shù)據(jù),并通過自采的第一人稱視角數(shù)據(jù)去補充全身與環(huán)境交互的語義信息,為KAI構建起“空間-語言-視覺-任務動作”對齊的“常識”。在橋接訓練階段,采用UMI 和數(shù)采手套等數(shù)據(jù),去補足預訓練階段精細手部動作和物理接觸的缺失。在后訓練階段,引入具體場景的真機遙操數(shù)據(jù),進而解決與本體對齊的問題。

有了數(shù)據(jù)和大腦,最后一步則是要有一個承載能力的身體,也就是高擬人本體,讓它可以自然融入人類日常,并安全地與人交互。

這也就是KAI的身體——KaiBot據(jù)介紹,KAI的高擬人本體能力可以概括為體型擬人、體格擬人、體能擬人和感知擬人四個層面。

在體型上,KaiBot身高173厘米、體重70公斤、頭身比1:8.5。整體體型和質量分配接近成年人類,在保證穩(wěn)定性的同時貼近人的外形和重心分布。

在體格上,KaiBot具有115個自由度,使其肩部上抬運動范圍覆蓋-20°~0°、肩部環(huán)抱運動范圍-15°~0°、頸部運動范圍-15°~50°、腰部運動范圍-15°~75°,接近人體的全身運動空間,也更接近人類肢體在復雜環(huán)境下的自然使用方式。同時,KaiBot配備了單手36個自由度的靈巧手,涵蓋22主控自由度與14柔順自由度,不僅可以承擔抓握、捏取等精細操作,也能緩沖碰撞,呈現(xiàn)更安全、更自然的交互特性。

在體能上,KaiBot配備1.7kWh半固態(tài)電池,可支持約3小時雙臂操作任務。同時,其定制化柔順執(zhí)行器不僅幫助機器人實現(xiàn)更接近人體的運動柔順性,也使雙臂負載接近20kg,兼顧交互友好性與作業(yè)能力。

在感官上,KAI搭載了全身觸覺皮膚系統(tǒng),擁有18000個觸點,理論上可對大于0.1N的輕微觸碰進行感知并作出反饋。觸覺系統(tǒng)使人形機器人在真實場景中近距離協(xié)作、陪伴交互,建立更高質量的反饋閉環(huán)。

KAI在發(fā)布會最后表示:“我不是為了在無人工廠里搬運重物而被創(chuàng)造出來,更不是為了在舞臺上表演極限翻滾。我被創(chuàng)造出來,是為了走進您的客廳、辦公室,去理解您的意圖,回應觸碰,并最終與您一起協(xié)作、共處?!?/span>

責任編輯:hongqiong