日本の物流業界が慢性的な労働力不足に直面する中、AGV(無人搬送車)やAMR(自律走行搬送ロボット)による「移動」の自動化は一定の普及を見せています。しかし、棚からのピースピッキング、形状の異なる荷物の仕分け、トラックへの積み下ろしといった「手」を使う非定型作業は、依然として人間の柔軟な判断力と手先の器用さに依存しているのが実情です。
なぜ、最新のロボットであってもこうした非定型作業の完全自動化が難しいのでしょうか。その根本的な原因は、ハードウェアの性能不足ではなく、ロボットの「脳」を鍛えるための良質な学習データが圧倒的に不足している「データ飢餓」にあります。
この物流自動化の最大のボトルネックを破壊する可能性を秘めたニュースが、中国から飛び込んできました。エンボディドAI(身体性AI)スタートアップの「霊初智能(PsiBot)」が、約460億円という巨額の資金調達を実施したのです。同社が開発した独自の「外骨格触覚グローブ」は、人間の作業データを従来の10分の1のコストで収集することを可能にしました。
本記事では、この海外の先進事例を紐解きながら、世界のロボット開発トレンドと、日本の物流企業が次世代の自動化に向けて今すぐ取るべき戦略を解説します。
ロボットの「データ飢餓」を救う中国発のブレイクスルー
これまで、AIといえばChatGPTに代表されるような、インターネット上のテキストや画像データを学習するデジタル空間の技術でした。しかし現在、世界の投資マネーは物理空間で自律的に動く「エンボディドAI」へと急速にシフトしています。
非定型作業の自動化を阻む学習データの壁
物流現場におけるバラ積み荷物のピッキングや梱包作業は、対象物の形状や重さ、表面の摩擦係数が毎回異なります。従来の産業用ロボットは「決められた座標に移動して掴む」というプログラム制御で動いていたため、少しでも荷姿が変わるとエラーを起こして止まってしまいました。
この課題を克服するためには、ロボット自身がカメラで状況を認識し、自律的に判断して腕を動かすAIが必要です。しかし、物理世界での「掴む」「置く」「避ける」といった動作のデータはインターネット上には存在しません。ロボットに実機を操作させて試行錯誤させるか、人間が専用のコントローラーを使って遠隔操作(テレオペレーション)で手本を示すしかなく、これが途方もない時間とコストを消費する要因となっていました。
参考記事: バラピッキングとは?基礎知識から効率化・自動化の最新動向まで徹底解説
エンボディドAIへ向かう巨額投資の潮流
「良質な物理データさえ集まれば、ロボットは人間のように動けるようになる」。この仮説のもと、世界中でエンボディドAIの開発企業に数百億円単位の資金が流れ込んでいます。ハードウェアの関節やモーターを改良する段階から、AIモデルを学習させるための「データ収集基盤の構築」へと、技術競争の主戦場が完全に移行したのです。
参考記事: 「身体性AI」へ投資殺到。物流現場を変える数百億円調達の正体
米中欧で異なるロボット開発アプローチの現在地
エンボディドAIの開発競争において、各国はそれぞれ得意とする産業基盤を背景に異なるアプローチをとっています。海外の最新動向を正確に把握することは、日本企業が適切な技術パートナーを選定する上で極めて重要です。
主要国における物理AI開発のトレンド比較
| 地域 | 開発の主流アプローチ | ターゲット市場と主な強み | 物流・産業現場への影響 |
|---|---|---|---|
| 米国 | ソフトウェア主導の汎用AI開発 | 巨大な計算資源による基盤モデル構築 | 既存ハードへの高度なAI搭載により柔軟な非定型作業を実現 |
| 中国 | ハードの量産とデータ収集基盤の構築 | サプライチェーンを活かした低コスト化 | 圧倒的安価での大規模現場実装と膨大な実証データの蓄積 |
| 欧州 | 産学連携による人間との安全協調 | 厳格な労働安全基準への適合 | 既存ラインでの人と機械の共存を前提としたエルゴノミクスの追求 |
米国がシリコンバレーの計算資源を活かした「脳(AIモデル)」の開発に特化する一方、中国は圧倒的なスピードでハードウェアを量産し、実際の現場に投入してデータをかき集める「力技」を得意としています。今回のPsiBotの事例は、まさに中国が得意とする「データ収集の力技」を極限まで洗練させた結果と言えます。
PsiBotの460億円調達と触覚グローブの革新性
2024年9月に設立されたばかりの霊初智能(PsiBot)が、国有資本や産業資本からエンジェルラウンドおよびプレシリーズAで計20億元(約460億円)という異例の巨額資金を調達しました。彼らが高く評価された理由は、単なるロボットメーカーではなく、エンボディドAIのための「究極のデータ収集インフラ」を構築した点にあります。
視覚・言語・動作を統合するVLAモデルの威力
PsiBotのコア技術は、視覚(Vision)、言語(Language)、動作(Action)を統合して制御する「VLAモデル」です。これは、「赤い箱を隣のパレットに移して」という人間の音声指示(言語)と、カメラから入力される現場の映像(視覚)をAIが同時に処理し、ロボットの関節モーターに直接出力(動作)を指示するエンドツーエンドの強化学習AIです。
同社が開発したAIモデル「Psi R」シリーズは、複数のステップにまたがる複雑な長期的タスク(ロングホライズン・タスク)への対応を業界に先駆けて実現しています。
データ収集コストを1/10にする「FastUMI Pro」の衝撃
VLAモデルを賢くするためには、人間がお手本となる動き(デモンストレーションデータ)を大量にAIへ入力する必要があります。これまで主流だった遠隔操作アームによるデータ収集は、数千万円もする専用機材が必要なうえ、操作が難しく、1日に数時間分のデータしか集められませんでした。
PsiBotはこの常識を根本から覆すソリューション「Psi-SynEngine」と、データ収集用外骨格触覚グローブ「FastUMI Pro」を開発しました。
- 携帯性と直感的な操作性
人間がこのグローブを背負って装着し、自分の手で直接荷物を掴んだり移動させたりするだけで、その自然な動きがAIの学習データとして記録されます。
- 高精度なデータ同期機能
手の関節(21自由度)の動き、指先の高精度な触覚情報、そして頭部および手元のカメラから得られる視覚データが、ミリ秒単位で完全に同期して構造化データとして保存されます。
このグローブの導入により、高価な遠隔操作設備が不要となり、データ収集コストは従来の約10分の1に激減しました。さらに、人間が普段通りのスピードで作業できるため、データ収集効率は5倍に跳ね上がっています。
100万時間のデータ蓄積がもたらすロングホライズン対応
PsiBotはすでに北京で約100セットのデータ収集グローブを現場に配置しており、2025年内にも大規模なデータ収集を本格化させます。最終的な目標は「100万時間以上」の人間動作データの蓄積です。
一般的なAI研究において、ロボットの学習データセットは数千時間規模でも「大規模」と呼ばれます。100万時間という桁違いの物理データがVLAモデルに注入されれば、物流現場で発生するあらゆる例外処理や複雑な作業パターンをAIが網羅的に学習することになり、真の意味での自律型ロボットが完成する日も遠くありません。
参考記事: 半年で460億円調達!中国の車輪式AIロボに学ぶ物流DXと自動化3つの戦略
日本の物流企業が直視すべき3つの示唆
設立間もないスタートアップが460億円を調達し、物理空間のデータを根こそぎ収集しようとしている海外の現実に対し、日本の物流企業はどう対応すべきでしょうか。「中国のスケールが違う話だ」と傍観している余裕はありません。
職人の「暗黙知」をデジタル化するウェアラブル戦略
日本の物流現場は、長年にわたり現場作業員の「高いスキルと気配り」によって支えられてきました。破れた段ボールをテープで補修する、荷物の形状に合わせてパレットへの積み方を臨機応変に変えるといった職人技は、データ化されていない「暗黙知」として現場に眠っています。
PsiBotの触覚グローブが示すように、これからは「人間の動きそのものをデジタルデータ化する」ことが競争力の源泉となります。日本企業も、スマートウォッチやカメラデバイス、あるいは簡易的なセンサーグローブを作業員に装着させ、日々のピッキングやデバンニング作業の映像と動作データを自社の資産として蓄積し始める必要があります。
完璧なロボットを待つ姿勢からの脱却
日本の企業が陥りがちなのが、「自社の複雑な要件をすべて満たす完璧なロボットが発売されるまで待つ」という姿勢です。しかし、エンボディドAIの進化は「走りながらデータを集めて賢くなる」のが基本スタイルです。
海外では、未完成であっても現場にプロトタイプを投入し、データ収集ツールとして活用しながらソフトウェアのアップデートで性能を向上させていくアプローチが主流です。日本企業もPoC(概念実証)のハードルを下げ、まずは「一部の作業データをAIに学習させるための端末」として、最新のAIロボットをスモールスタートで現場に招き入れる決断が求められます。
ハードウェア購入から「データ育成」への投資転換
今後のロボット選定において、モーターのトルクや関節の耐久性といったハードウェアスペックは、差別化の要因ではなくなります。重要なのは、「そのロボットがどれだけ柔軟に現場のデータを吸収し、VLAモデルをアップデートできるか」というソフトウェア側のエコシステムです。
経営層やDX推進担当者は、ロボット導入の予算を「単なる機械の購入費」として捉えるのではなく、「自社の現場に特化したAIを育成するためのプラットフォーム投資」へと発想を転換しなければなりません。将来、PsiBotのような汎用AIモデルが日本に上陸した際、自社のWMS(倉庫管理システム)とスムーズにデータ連携できるオープンなシステム基盤を今から整備しておくことが不可欠です。
まとめ:身体性AI時代を勝ち抜くためのデータ基盤構築
中国PsiBotによる約460億円の資金調達と、外骨格触覚グローブを用いたデータ収集コストの「10分の1化」は、世界のロボット開発が新たな次元へ突入したことを強烈に示しています。
物流作業の自動化を阻んでいた「良質な学習データの不足」という最大の壁は、人間の動作を直接インストールするウェアラブルデバイスと巨額の資本力によって、驚異的なスピードで取り払われようとしています。100万時間におよぶ動作データがAIの頭脳に流し込まれた時、非定型作業を人間以上に正確かつスピーディにこなすロボットが現実のものとなります。
日本の物流企業にとって、今この瞬間は静かな「助走期間」です。海外のメガトレンドを敏感にキャッチアップし、現場の属人的なオペレーションを標準化・データ化する取り組みをいち早く始めた企業だけが、数年後に訪れるエンボディドAIの実戦配備という荒波を乗りこなし、圧倒的な競争優位性を確立することができるでしょう。
出典: 36Kr Japan


