![](https://s4.itho.me/sites/default/files/styles/picture_size_large/public/field/image/0211-p0_vision-language-action_flow_model_robot_control_by_physical_intelligence_960.jpg?itok=tjzfGX3E)
Physical Intelligence
Hugging Face宣布,新創公司Physical Intelligence開發的π0(念作Pi-Zero)機器人模型已可整合到Hugging Face的開發套件LeRobot。
π0(以下將稱Pi0)與π0-FAST是LeRobot儲存庫的第一批機器人基礎模型,使Hugging Face生態系有了通用機器智慧(generalist robotic intelligence)模型。
人形機器人新創公司Physical Intelligence成員來自Google DeepMind、Tesla和X,公司宗旨是開發出能結合通用人工智慧(AGI)的機器人,讓用戶透過AI助理下指令代為執行任務。這家新創公司在最新募資中獲得4億美元投資,使公司市值來到了24億美元。最新一批金主包括了OpenAI和Jeff Bezos及數家投資銀行。
最新發表的Pi0是一種為通用型機器人控制而設定的視覺語言行為(Vision-Language Action,VLA)模型。VLM和VLA模型都是以transformer為基礎,最大差別在行為表現。VLM雖也可處理和生成多模態(圖片和文字)表現,但欠缺和真實世界的互動。VLA則是以機器人資料訓練的模型。該公司的通用型機器人模型進一步以不同種機器人資料訓練而成,可提升模型的適應性、效率和效能。
Physical Intelligence說明,Pi0在預訓練的VLM模型上使用新的流匹配(flow-matching)架構,以承襲Internet規模的語義知識來生成行為,使機器人可以不同形貌執行靈巧的操作任務。明確而言,Pi0以7種機器平臺和68種不同任務的資料訓練。而且在預訓練後具有強大的零樣本和微調效能,它能依據人類語言指令和高階VLM策略(policy),以及微調來學習新技能。以Pi0模型為基礎的機器人可執行複雜的真實世界任務,像是摺疊衣服、清理桌面、將商品裝袋、組合紙箱或收拾物體。
圖片來源/Physical Intelligence
Hugging Face執行長Clement Delangue指出,這是第一次機器人基礎模型透過開源平臺開放大眾使用。該公司希望藉此模型改變機器人學習和執行任務的作法。
π0與其自動迴歸版的π0-FAST(Frequency-space Action Sequence Tokenization)模型,都已可在Hugging Face LeRobot儲存庫存取。
熱門新聞
2025-02-08
2025-02-10
2025-02-08
2025-02-11
2025-02-10
2025-02-10
2025-02-08