一套符合通用標(biāo)準(zhǔn)、由模型驗(yàn)證有效且具備通用性的數(shù)據(jù)集,已成為當(dāng)前具身智能行業(yè)最大的剛需。
自1950年由艾倫·圖靈提出具身智能概念以來,經(jīng)過70多年的探索實(shí)踐,具身智能已經(jīng)逐步走近人類生產(chǎn)生活的方方面面。作為具身智能的重要載體,具身智能機(jī)器人賽道今年異?;鸨?,受到學(xué)術(shù)、產(chǎn)業(yè)、資本以及各國政府的廣泛關(guān)注與支持。
正如ChatGPT需要海量文本數(shù)據(jù)來訓(xùn)練一樣,高質(zhì)量、多樣化數(shù)據(jù)集是實(shí)現(xiàn)具身智能快速突破和具身機(jī)器人快速落地應(yīng)用的關(guān)鍵。優(yōu)質(zhì)的數(shù)據(jù)集能夠加速具身智能模型的訓(xùn)練與部署,幫助其控制各種類型的機(jī)器人遵循不同的指令,對(duì)復(fù)雜任務(wù)進(jìn)行基本推理,并有效地完成這些任務(wù)。
但不同于大語言模型可以使用互聯(lián)網(wǎng)海量信息作為訓(xùn)練數(shù)據(jù),機(jī)器人所用的具身智能模型并無現(xiàn)成數(shù)據(jù)可供直接使用。一套符合通用標(biāo)準(zhǔn)、由模型驗(yàn)證有效且具備通用性的數(shù)據(jù)集,已成為當(dāng)前具身智能行業(yè)最大的剛需。
2024年12月27日,國家地方共建具身智能機(jī)器人創(chuàng)新中心(以下簡稱“創(chuàng)新中心”)與北京大學(xué)計(jì)算機(jī)學(xué)院聯(lián)合推出了一個(gè)大規(guī)模多構(gòu)型具身智能數(shù)據(jù)集和Benchmark——RoboMIND,基于成型標(biāo)準(zhǔn)采集,經(jīng)多個(gè)模型訓(xùn)練驗(yàn)證有效,支持多本體多任務(wù)并具備通用性,充分解決了目前全球開源數(shù)據(jù)集,量大但數(shù)據(jù)質(zhì)量參差不齊、通用性復(fù)用性差、部分?jǐn)?shù)據(jù)實(shí)測(cè)效果不理想等問題,有效滿足復(fù)雜場(chǎng)景具身智能高效率和針對(duì)性的訓(xùn)練。
適用于多平臺(tái)、多場(chǎng)景、多技能的數(shù)據(jù)集價(jià)值更大
當(dāng)前具身智能本體形態(tài)多種多樣,應(yīng)用場(chǎng)景千差萬別,對(duì)于具身智能訓(xùn)練數(shù)據(jù)的需求也更為多元。目前業(yè)內(nèi)仍有部分?jǐn)?shù)據(jù)集主要聚焦在特定機(jī)器人、特定場(chǎng)景和特定技能等方面,在整體通用性上有待提升。
創(chuàng)新中心發(fā)布的RoboMind數(shù)據(jù)集,采用了包括含單臂機(jī)器人、雙臂機(jī)器人、人形機(jī)器人,手臂末端使用夾爪或者靈巧手等多種形態(tài)的機(jī)器人本體進(jìn)行數(shù)據(jù)采集,包含了涉及279項(xiàng)不同的任務(wù)多類場(chǎng)景,涵蓋了高達(dá)61種不同的物體,覆蓋了家居、廚房、工廠、辦公、零售等大部分生活服務(wù)場(chǎng)景,對(duì)科研突破和場(chǎng)景應(yīng)用均十分友好。創(chuàng)新中心持續(xù)采集長程復(fù)雜任務(wù),目前已經(jīng)積累數(shù)十萬條高質(zhì)量數(shù)據(jù),以真機(jī)數(shù)據(jù)為主,配以仿真遙操作數(shù)據(jù)。在數(shù)據(jù)質(zhì)量與使用價(jià)值上,一條數(shù)據(jù)等同于目前現(xiàn)有數(shù)據(jù)集的多條存量數(shù)據(jù)。創(chuàng)新中心計(jì)劃首批開源10萬條,后續(xù)逐步釋放,涵蓋更多機(jī)器人本體和場(chǎng)景任務(wù)。
據(jù)谷歌Open X-Embodiment公開資料顯示,其數(shù)據(jù)集匯集了來自各個(gè)機(jī)構(gòu)的數(shù)據(jù),整合了70余個(gè)獨(dú)立數(shù)據(jù)集,合計(jì)百萬量級(jí)數(shù)據(jù)片段,涵蓋了從單臂機(jī)器人到雙臂機(jī)器人,再到四足機(jī)器人等多種不同形態(tài)的機(jī)器人。值得一提的是,雖然OpenX發(fā)布數(shù)據(jù)集高達(dá)百萬條量級(jí),但是大小只有3TB左右,且數(shù)據(jù)質(zhì)量和一致性差,真正可用的有效數(shù)據(jù)不足一半。此外,其實(shí)測(cè)效果較差,在其官方的小參數(shù)量模型(RT-1 35M)上,甚至不如原版RT-1的13萬條數(shù)據(jù)訓(xùn)練的效果。創(chuàng)新中心本次發(fā)布的數(shù)據(jù)集大小是20TB,并且保證了所有數(shù)據(jù)的統(tǒng)一可用,在benchmark測(cè)試中大小模型已跑通了數(shù)據(jù)集中涵蓋的所有機(jī)器人本體。
多款模型驗(yàn)證有效,具身智能數(shù)據(jù)集邁入下一個(gè)階段
當(dāng)前市場(chǎng)上已有多家機(jī)構(gòu)開源具身智能數(shù)據(jù)集,但由于是多個(gè)數(shù)據(jù)集整合,存在一定數(shù)據(jù)格式不統(tǒng)一,數(shù)據(jù)質(zhì)量參差不齊,需要進(jìn)行大量的二次調(diào)試、整合,難以有效滿足復(fù)雜場(chǎng)景具身智能高效率和針對(duì)性的訓(xùn)練等問題,并且基于開源的數(shù)據(jù)集測(cè)試訓(xùn)練效果也不盡相同。經(jīng)過驗(yàn)證后“能用”、“好用”的高質(zhì)量具身智能數(shù)據(jù)集成為了行業(yè)關(guān)注的重點(diǎn),也是許多高校、科研機(jī)構(gòu)和企業(yè)重點(diǎn)攻克的難題。
創(chuàng)新中心發(fā)布的RoboMIND,已在主流單任務(wù)模仿學(xué)習(xí)模型(如ACT、BAKU)和具身多模態(tài)大模型(如OpenVLA、RDT-1B)進(jìn)行了評(píng)測(cè),經(jīng)多本體和多任務(wù)的系統(tǒng)評(píng)測(cè),證明RoboMIND數(shù)據(jù)集有效提升了模仿學(xué)習(xí)模型在現(xiàn)實(shí)場(chǎng)景下任務(wù)的成功率,率先進(jìn)入了數(shù)據(jù)集使用的下一個(gè)階段。
行業(yè)引領(lǐng)者,創(chuàng)新中心打造國內(nèi)首個(gè)具身智能數(shù)據(jù)采集標(biāo)準(zhǔn)
具身智能數(shù)據(jù)采集需要投入大量時(shí)間和資源進(jìn)行機(jī)器人操作實(shí)踐或者仿真模擬,來收集視覺、觸覺、力覺、運(yùn)動(dòng)軌跡以及機(jī)器人本體狀態(tài)等多源異構(gòu)數(shù)據(jù)。目前業(yè)內(nèi)發(fā)布的數(shù)據(jù)集標(biāo)準(zhǔn)不一,存在數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)通用性復(fù)用性差、部分?jǐn)?shù)據(jù)實(shí)測(cè)效果不理想等問題。
今年11月,作為行業(yè)的引領(lǐng)者,國家地方共建具身智能機(jī)器人創(chuàng)新中心牽頭立項(xiàng)《人工智能 具身智能 數(shù)據(jù)采集規(guī)范》工信部行業(yè)標(biāo)準(zhǔn),這是國內(nèi)第一個(gè)具身智能數(shù)據(jù)集的行業(yè)標(biāo)準(zhǔn),規(guī)范了具身智能數(shù)據(jù)集采集的格式,使不同公司采集的數(shù)據(jù)可以互相共享開源,能夠加速模型“涌現(xiàn)”。創(chuàng)新中心未來還將設(shè)計(jì)一系列數(shù)據(jù)集標(biāo)準(zhǔn),為模型泛化保駕護(hù)航。
在12月的具身智能創(chuàng)新發(fā)展研討會(huì)上,創(chuàng)新中心正式發(fā)布了《具身智能標(biāo)準(zhǔn)化研究報(bào)告》、《具身智能數(shù)據(jù)集及評(píng)測(cè)研究報(bào)告》(即RoboMIND)兩項(xiàng)重磅報(bào)告,為行業(yè)的標(biāo)準(zhǔn)化與數(shù)據(jù)集建設(shè)提供指引。具身智能數(shù)據(jù)集采集標(biāo)準(zhǔn)的建立將進(jìn)一步明確具身智能數(shù)據(jù)要求及質(zhì)量等,從而加速具身智能行業(yè)的良性發(fā)展。
作為訓(xùn)練具身智能大模型的重要原料,數(shù)據(jù)集采集是否符合標(biāo)準(zhǔn)、在訓(xùn)練上是否“能用”、“好用”,是否能更有效支持模型泛化,已經(jīng)成為機(jī)器人變“聰明”的關(guān)鍵。本次創(chuàng)新中心數(shù)據(jù)集的開放和benchmark的發(fā)布,在標(biāo)準(zhǔn)化、有效性和通用性方面均給出了令人矚目的突破性結(jié)果,并為此后行業(yè)的高質(zhì)量數(shù)據(jù)集采集打下了堅(jiān)實(shí)基礎(chǔ)。具身智能行業(yè)有望以此為開端,在2025年實(shí)現(xiàn)更多的落地應(yīng)用。
新時(shí)代鞋服物流與供應(yīng)鏈面臨的變革和挑戰(zhàn)03月07日 20:38
點(diǎn)贊:這個(gè)雙11,物流大佬一起做了這件事11月22日 21:43
物流管理機(jī)構(gòu)及政策分布概覽12月04日 14:10
盤點(diǎn):2017中國零售業(yè)十大事件12月12日 13:57
2017年中國零售電商十大熱點(diǎn)事件點(diǎn)評(píng)12月28日 09:58