服務熱線
新一輪科技浪潮的推動下,具身智能(Embodied Intelligence, EI)這一智能系統與物理實體相結合的科技創新產物,正悄然改變著世界。它不僅超越了單純的技術革命范疇,更預示著未來對人類生活方式、制造模式乃至社會結構都將帶來一次深刻的重塑。
據不完全統計,僅2024年上半年,關于具身智能的研討已多達500余次。來自不同領域的行業精英、產業高管、高校學者,都在試圖找到具身智能技術進化的規律性與確定性。
盡管從2020年以來,斯坦福、伯克利、MIT、CMU、谷歌、微軟、亞馬遜、OpenAI、英偉達等眾多學者與企業家,對該領域的進化路徑孜孜以求。但至今尚未找到機器人或具身智能的通用大模型Scaling Law。
盡管訓練參數還在“無限”增加,這一現狀甚至不可避免地導致算力需要“無限”增加,能源也需要“無限”增加,相關大模型的單次訓練成本已經少則1千萬美元,多則接近上億美元。但大力并沒有出奇跡,諸如功能、安全、質量以及實時性等關鍵指標并沒有明顯提高。
一種對技術與供應鏈迭代的“無力感”,在業界蔓延。7月22日,馬斯克在推特上宣布,特斯拉Optimus人形機器人二代因未能獲得高性價比的成熟供應鏈支持,而推遲發布。據悉,這代機器人將自主設計全新雙手、FSD芯片等核心零部件,以便提高30%的行走速度、減輕10kg的重量,并將成本控制在1萬美元,售價控制在2萬美元左右。但供應鏈因素直接導致了馬斯克的夢想,被延遲實現。
在中國,人形機器人也是熱鬧非凡,一級市場可落地產品尚待成熟,二級市場卻已率先上揚;人形樣機尚未明確具體的應用場景,量產之路也大受供應鏈掣肘,人形機器人的價格戰卻已打響。此外,隨著7月武漢蘿卜無人出租車在指定區域以低速模式嘗試商業化短途打車服務,人們開始對未來社會的就業問題產生擔憂。
在這樣的背景下,“2024科技創變者大會”即將開啟。政產學研金多方力量的匯聚與助力,推動了這次大會的籌備工作。在此我由衷地感謝北京市科委、中關村管委會各位領導的鼎力支持,還有海淀區、中關村科學城管委會以及東升鎮領導的竭力相助,感謝參與并貢獻智慧的各位知名大學院所頂級專家、奮斗在科研一線的青年科學家、大廠杰出的企業家、資深投資人、獨角獸企業的CEO以及初創企業的創變者們。
8月8日,期待與各界精英在北京中關村東升科技園萬麗酒店相聚一堂,聚焦《具身智能 產業智變新引擎》這一主題,圍繞具身智能如何實現高質量發展并探索出一條有效的進化路徑展開深入探討。以下為本次大會的核心議題與前置性思考:
什么是具身智能?它是未來社會的長期剛性需求嗎?它是推動新質生產力的重要引擎嗎?
沿著熱潮的方向出發,你會發現,當下幾乎所有的困惑與糾結都聚焦在人形機器人身上。這個“笨手笨腳的家伙”距離能力爆發到底還要多久?人類還有沒有超級場景留給它?未來,真如馬斯克所言,全球將有200億臺套人形機器人的市場嗎?也許,將視野打開,答案也躍然紙上了。
我想,擁有智慧大腦的人形機器人,固然是具身智能的一種形態。但是具身智能并不局限于“AI+人形機器人”這一范疇,它同樣涵蓋“AI+通用機器人結構”、“AI+高端制造裝備”等多種形式。
自1950年圖靈在其論文《計算機器與智能》中提出“非具身或具身智能”概念以來,具身智能這一概念逐漸被廣義理解為:智能系統通過物理實體(機器人、無人機、無人車、制造裝備甚至各類終端設備等)與環境互動時所展現的一種智能能力。簡單理解,具身智能是生成式AIGC與機器人RT的融合,通過人機或環境交互,基于底層模型與數據驅動的離線或在線感知學習、認知判斷、智能控制等技術,提升智能機器在本體層、環境層、任務層的人機交互、決策推理及操作行動等智能化水平,并增強其適應不同環境的泛化能力。
而具身智能突出的特點主要體現在兩個方面:一方面,它具備人機交互、自然語言理解與認知能力,通過機器學習或大模型,讓機器按照人的意圖,將目標分解系列化的子目標或思維鏈,以完成相應的復雜任務;另一方面,具身智能可通過感知、認知、決策,與時變環境及對象進行實時校準互動,在非結構化的復雜環境中,它能夠實時在線學習、識辨或修正補償時變環境。由此看來,只要把感知、學習、判斷和認知能力有效嵌入到任何形態的硬件中,都可以被視為廣義上的具身智能。
將具身智能落地到服務、制造、商務等多元化的場景中,面對錯綜復雜的動態環境,我們進而發現具身智能以其自主感知、快速決策、行動與學習迭代的技術能力,展現出前所未有的靈活性和適應性潛力。這不僅有望為傳統工業帶來新一輪革命性影響,更是未來社會的長期剛性需求。
在這個“布局未來”的過程中,具身智能領域的企業百花齊放,他們各自在奮斗與攻克中展現獨特風采。有的專注于人形機器人的研發,力求在人機交互、情感識別等方面取得突破;有的則深耕于高端制造裝備領域,通過優化算法、提升精度和效率,推動制造業的智能化升級。
從無人快遞車,到無人外賣車,再到如今的蘿卜快跑;從智能家電,到智能家居,再到智慧城市;從智能裝備,到智能制造,再到柔性供應鏈……實際上,具身智能已經潛移默化的深入到人類社會的方方面面。
但未來,隨著社會發展的不斷演進,一系列趨勢性變化凸顯了具身智能的長期剛性需求。由于人們不愿意從事單獨枯燥繁重甚至危險勞動,同時智慧城市人口在不斷增加,這對工業制造的效率要求越來越高,社會化智能服務更是期待著更加便捷的模式出現。此外,老齡化社會的加劇將引發更為迫切的康養需求,搶險救災等高風險工作也亟待智能化的解決方案。從這樣的必然趨勢看,具身智能是長期的剛性需求。未來在工業制造、商業服務、家庭服務甚至國防軍事等方面,將具有廣泛的應用市場。
基于上述分析,我愈發認定:具身智能將成為未來新質生產力的一個重要引擎。其將AIGC+RT兩者結合,極大的推動了機器人、制造裝備、智能終端以及其大腦的進一步進化、泛化與遷移,有望將“一腦多機”與“一腦多型”的技術創想變為現實。我們相信,語言“認知”世界,具身智能工具“改造”世界!它終將改變人、工具、社會三者之間的生產關系,極大提高生產力效率,這一變革不僅對促進我國實體經濟的高質量增長發揮作用,更將對未來國際產業競爭格局與我國綜合新質生產力的發展產生重大影響。
具身智能百花齊放,創新的熱點方向又有哪些?
盡管大模型在通用性和知識覆蓋廣度上擁有優勢,但其泛化能力在某些特定場景的局限性依舊存在。疊加經濟性、落地性等一系列現實問題,行業走向了多模態、專業化、輕量化的探索之路。
圍繞這些方面,近期領域內的研究取得了多項引人注目的進展。在法國,Mistral模型以70億參數擊敗了擁有130億參數的LLama模型,展示了參數效率的提升;在中國,面壁智能的MiniCPM模型以僅24億參數就達到了接近1750億參數GPT-3的性能水平,其背后的首席科學家——清華大學劉知遠教授,更是提出“知識密度=模型能力/模型參數”的創新概念,強調模型效率的重要性。
此外,年輕科學家馬毅教授預告將在斯坦福大學主持召開“簡約與學習”的學術會議,聚焦于低維結構的研究,這進一步推動AI模型向更加精簡、高效的方向發展。
而在7月30日的SIGGRAPH大會上,黃仁勛與扎克伯格的對話也聚焦于小模型或分段模型的應用前景上。黃仁勛不僅展示了英偉達在具身智能領域的布局,還透露了由90后華人博士Jim Fan領導的具身智能實驗室的研究成果:基于定義具身智能結構,感知環境、潛在學習完成技能等相互嵌入的動態Agents思路。
另一方面,7月25日,斯坦福大學計算機系的李飛飛教授在短短三個月內就完成了一個AI獨角獸企業的誕生,該企業利用“三維空間智能技”實現了機器對環境的理解與導航能力,通過模擬貓與桌子上玻璃杯等物體的空間、幾何及關系作用,探索了機器“看”與“做”的良性閉環。
7月29日,騰訊RoboticsX實驗室張正友團隊在《自然機器智能》(Nature子刊)封面發表了重要研究成果,該團隊成功將生成式AI-Agent嵌入機器人智能控制系統中。在本體、環境、任務三個層面中,通過快速系統1處理90%的簡約感知、認知和行動決策,同時利用復雜認知慢系統2進行知識學習、歸納、推理及決策,實現了機器在本體、環境和任務三個層次上的高效協同。
伴隨著具身智能的發展,科學家們對規律的渴求還遠不止于此。目前,盡管任務規劃的Scaling Law已有一定進展,但環境空間和操作本體的Scaling Law仍處于探索階段。是堅定不移?還是轉變路徑?雖沒有絕對答案,但我堅信中國的工程師紅利即將在其中發揮作用。
甚至在不久的將來(3-5年),我們是不是就將見證一個全新的智能時代到來呢?那時候,API免費,AI服務80%由機器完成,20%通過人工對齊完成,通用的AI服務或產品會不會就像水、電、煤氣等基礎設施一樣,無處不在,觸手可得?當終端客戶已經不知道他所獲得的咨詢與解決方案來自哪個具體大模型公司時,這又會引發科技創新領域中怎樣的連鎖反應呢?
如今,科技創新的浪潮以前所未有的速度席卷全球,顯著縮短了從科研探索到商業應用的周期。昔日需數十載方能達成的技術飛躍,如今幾年間甚至更短便能觸手可及。科技創新的加速,不僅體現在時間維度上,更體現在探索的深度與覆蓋的廣度上。當多學科交叉融合成為新常態,基礎科學、工程技術、經濟學及人文社科等領域的深度融合,構建了一個多元共生、相互推動的創新生態,驅動著科技與產業不斷向前躍進。新技術、新業態、新模式不斷涌現,不僅為傳統產業注入創新活力,同時也催生了一批高技術含量、高附加值、高成長性的新興產業,成為推動未來經濟發展的新引擎。
與此同時,市場快速變化與競爭也在日益激烈。面對挑戰,小微企業需要聚焦于細分領域,深耕細作,以“專精特新”為路徑,鍛造核心競爭力;而大型企業則可依托資源優勢,構建平臺型或鏈主型生態系統,整合上下游資源,實現規模效應與協同效應的雙贏,穩固市場領先地位。
另一方面,具身智能領域的“行業依附性”特點,又將深入挖掘應用場景的價值提到了更重要的位置上。技術創新,只有與產業需求緊密結合,才能推動具身智能產品的不斷升級。這一過程不僅是技術的精進,更是對市場需求的精準把握與快速響應。同時,具身智能形態作為未來發展的重要趨勢,其確立對于企業的長遠發展具有關鍵意義。通過場景資源、融資資源等多方資源的交叉融合與螺旋式迭代發展,方能避免“醒得早,起得晚”的遺憾,防止在時代的洪流中被邊緣化甚至淘汰。
回望歷史長河,每一次科技的里程碑式突破,都無可避免地伴隨著質疑的眼光和挑戰的洗禮。數百年前,世界第一艘輪船“克萊蒙特號”在眾人懷疑的目光中入水,它搖搖晃晃地模樣仿佛隨時都會淪為笑柄。然而,正是這份“不在乎他人眼光”的探索精神,讓人類得以跨越海洋的阻隔。
在眼前的具身智能浪潮中,顛覆傳統、重塑未來的歷史再次上演。我無比相信:擁抱變革,穿越周期,堅定信念的創變者們,終將是這次浪潮的贏家!
讓我們懷揣著對具身智能的美好期待,在8月8日的“2024科技創變者大會”上,不見不散。