【
智慧城市網(wǎng) 視點(diǎn)跟蹤】隨著“具身智能”“智能
機(jī)器人”于2025年首次寫(xiě)入政府工作報(bào)告,具身智能、智能機(jī)器人、人形機(jī)器人等諸多新概念、新名詞越來(lái)越多地出現(xiàn)在大眾面前。這些看起來(lái)晦澀難懂的科技熱詞,或許很快就將走入商業(yè)場(chǎng)景,甚至我們的家庭。它們的定義是什么,相互之間有怎樣的關(guān)聯(lián),未來(lái)發(fā)展前景如何?中國(guó)信息通信研究院(簡(jiǎn)稱(chēng)“中國(guó)信通院”)《專(zhuān)家談》欄目開(kāi)辟“機(jī)器人”系列專(zhuān)題,邀請(qǐng)多位業(yè)界資深專(zhuān)家多視角探討我國(guó)人工智能+機(jī)器人的發(fā)展形勢(shì)。本期邀請(qǐng)到中國(guó)信通院人工智能研究所安全與具身智能部副主任張蔚敏,圍繞如何理解具身智能、具身智能賦能新型工業(yè)化的核心價(jià)值、具身智能的智能水平所處階段以及在邁向大規(guī)模應(yīng)用中的技術(shù)瓶頸和破解路徑等展開(kāi)深度解讀。
一、如何理解具身智能?
具身智能是一種智能理論和范式,強(qiáng)調(diào)智能行為依賴(lài)于身體和環(huán)境的互動(dòng),具有鮮明的身體性和情境性。而機(jī)器人則是這一理論在工程實(shí)踐中的載體和試驗(yàn)田。智能機(jī)器人和人形機(jī)器人都是具身智能的分支。
二、具身智能如何重塑制造業(yè)核心環(huán)節(jié)?
先前,機(jī)器人已經(jīng)借助人工智能技術(shù)逐漸擺脫固定機(jī)械操作的束縛,提升了自動(dòng)化作業(yè)能力。但主要適用于結(jié)構(gòu)化、確定性的場(chǎng)景,在面對(duì)復(fù)雜、變化多的生產(chǎn)環(huán)境時(shí),柔性不足、適應(yīng)性差的問(wèn)題依然突出。具身智能的發(fā)展,讓機(jī)器人等物理實(shí)體能夠自主感知、計(jì)劃和執(zhí)行任務(wù),具備了多功能、多任務(wù)的靈活作業(yè)能力??梢哉f(shuō),具身智能為解決工業(yè)生產(chǎn)中“柔性不足、頻繁換線(xiàn)”兩大難題,提供了新的解決方案,也契合我國(guó)制造業(yè)小批量、多品種的新制造形態(tài)發(fā)展需求。
三、具身智能的智能水平處于什么階段?
智能水平主要由模型能力決定。端到端視覺(jué)語(yǔ)言動(dòng)作模型(VLA)是作為大家重點(diǎn)探索的方向,還處于“幼兒園”階段。拆解來(lái)看VLA的三個(gè)重要能力,一是用視覺(jué)看世界的能力,僅能識(shí)別有什么物品,但無(wú)法理解何處施力,施多大的力。二是用語(yǔ)言和人類(lèi)溝通的能力,更支持明確、具體、結(jié)構(gòu)化的任務(wù)指令,例如能理解“拿起一個(gè)蘋(píng)果”,但很難理解“給我一個(gè)水果”。三是用動(dòng)作執(zhí)行任務(wù)的能力,現(xiàn)在會(huì)做的是移動(dòng)、抓取和放置等簡(jiǎn)單技能的組合,且操作對(duì)象以剛性物品為主。本體性能、網(wǎng)絡(luò)通信等決定了智能在實(shí)際任務(wù)表現(xiàn)的上限。一方面,本體技術(shù)還需進(jìn)一步收斂。以人形機(jī)器人為例,目前的技術(shù)成熟度還處于早期,完賽率30%的人形機(jī)器人馬拉松暴露出了電機(jī)發(fā)熱、關(guān)節(jié)可靠性、本體結(jié)構(gòu)穩(wěn)定性等硬件限制。另一方面,從執(zhí)行固定程序到自適應(yīng)場(chǎng)景執(zhí)行任務(wù),需要綜合機(jī)器人的算力、網(wǎng)絡(luò)、成本、能耗等各因素。構(gòu)建分布式、可泛化具身智能,需要均衡硬件、網(wǎng)絡(luò)、算力三要素供給代價(jià),才能有望破繭工業(yè)線(xiàn),進(jìn)入百姓家。
四、具身智能機(jī)器人在邁向大規(guī)模應(yīng)用時(shí),面臨的技術(shù)瓶頸是什么?
一是模型Scalability面臨不確定性。目前還沒(méi)有足夠證據(jù)能證明,擴(kuò)展數(shù)據(jù)對(duì)提升模型的泛化性絕對(duì)有用。而且,要讓模型具備泛化性,又足夠可靠,是系統(tǒng)性工程,涉及數(shù)據(jù)、訓(xùn)練方法、模型架構(gòu)等。二是實(shí)際可用的動(dòng)作數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠。現(xiàn)有具身智能數(shù)據(jù)集無(wú)論是開(kāi)源的、合成的還是真機(jī)采集的,都很難規(guī)?;褂?。數(shù)據(jù)和本體強(qiáng)綁定、和生產(chǎn)環(huán)境強(qiáng)相關(guān),存在嚴(yán)重的數(shù)據(jù)孤島現(xiàn)象。在一個(gè)數(shù)據(jù)集上訓(xùn)練好的模型部署到不同的本體型號(hào)時(shí),性能表現(xiàn)會(huì)大打折扣,即使同一型號(hào)本體,在不同實(shí)驗(yàn)室或搭建環(huán)境下的性能表現(xiàn)也完全不同。三是要解決全身運(yùn)動(dòng)控制問(wèn)題。全身關(guān)節(jié)的協(xié)同控制需要在幾十毫秒內(nèi)完成高維動(dòng)作空間的復(fù)雜計(jì)算,對(duì)關(guān)節(jié)電機(jī)控制性能、運(yùn)動(dòng)控制模型的精度和實(shí)時(shí)性都有較高的要求。另外目前在處理需要精確力控、豐富接觸的操作任務(wù)時(shí),如整理線(xiàn)束、塑料袋打包等,仍有較大挑戰(zhàn)。
五、如何破解具身智能產(chǎn)業(yè)化問(wèn)題?
具身智能的發(fā)展特別是人形機(jī)器人更需要對(duì)其進(jìn)行有耐心的長(zhǎng)期投入和關(guān)鍵布局,建議:
一是注重多學(xué)科交叉研究,包括計(jì)算機(jī)科學(xué)、控制科學(xué)、認(rèn)知科學(xué)、機(jī)器人學(xué)等。只有加強(qiáng)多學(xué)科之間的交流與合作、整合各學(xué)科的優(yōu)勢(shì)資源,才能共同攻克具身智能領(lǐng)域的關(guān)鍵科學(xué)問(wèn)題和技術(shù)難題。中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)已成立具身智能工作組,以搭建各方合作交流平臺(tái)為目標(biāo),圍繞評(píng)估規(guī)范、產(chǎn)業(yè)生態(tài)建設(shè)、應(yīng)用推廣供需對(duì)接、以賽促用等工作任務(wù),推動(dòng)具身智能產(chǎn)業(yè)生態(tài)各方協(xié)作,加速我國(guó)具身智能產(chǎn)業(yè)化進(jìn)程。
二是重視標(biāo)準(zhǔn)研制和評(píng)估反饋機(jī)制明確智能能力升級(jí)方向。通過(guò)科學(xué)、高效、準(zhǔn)確的標(biāo)準(zhǔn)化研究,可以有效推動(dòng)產(chǎn)業(yè)技術(shù)升級(jí)和規(guī)模應(yīng)用。MIIT TC1(工業(yè)和信息化部全智能標(biāo)準(zhǔn)化技術(shù)委員會(huì)) WG6具身智能工作組,從系統(tǒng)研發(fā)支撐、系統(tǒng)智能技術(shù)、系統(tǒng)集成和系統(tǒng)應(yīng)用四方面統(tǒng)籌推進(jìn)國(guó)內(nèi)具身智能產(chǎn)業(yè)標(biāo)準(zhǔn)體系建設(shè)工作,圍繞具身智能智能化分級(jí)、數(shù)據(jù)集質(zhì)量、接口、訓(xùn)練場(chǎng)、基準(zhǔn)測(cè)試和重點(diǎn)產(chǎn)品如人形機(jī)器人等體系化推進(jìn)標(biāo)準(zhǔn)化工作。
三是與產(chǎn)業(yè)鏈上下游協(xié)同。一是推動(dòng)實(shí)現(xiàn)“數(shù)據(jù)—模型—本體”的閉環(huán),通過(guò)本體沉淀數(shù)據(jù),驅(qū)動(dòng)模型迭代升級(jí),進(jìn)一步強(qiáng)化本體性能躍遷。二是形成“需求牽引—應(yīng)用驗(yàn)證—反饋迭代”的閉環(huán),面向制造、物流、醫(yī)療、家庭等重點(diǎn)行業(yè)半結(jié)構(gòu)化場(chǎng)景,推動(dòng)具身智能試點(diǎn)示范。三是加深生態(tài)協(xié)作機(jī)制,構(gòu)建“基礎(chǔ)設(shè)施—技術(shù)服務(wù)—產(chǎn)品服務(wù)—行業(yè)應(yīng)用”閉環(huán),通過(guò)行業(yè)聯(lián)盟、標(biāo)準(zhǔn)化組織等,建立產(chǎn)業(yè)鏈協(xié)作機(jī)制,推動(dòng)技術(shù)、標(biāo)準(zhǔn)、應(yīng)用的同步演進(jìn)。
版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明“來(lái)源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來(lái)源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。