ユーロ

ブログ
Amazonは、自社のロボット艦隊を強化し、100万台目のロボットを導入するために、AI基盤モデルを立ち上げました。Amazonは、自社のロボット艦隊を強化し、100万台目のロボットを導入するために、AI基盤モデルを立ち上げました。">

Amazonは、自社のロボット艦隊を強化し、100万台目のロボットを導入するために、AI基盤モデルを立ち上げました。

Alexandra Blake
によって 
Alexandra Blake
11 minutes read
ロジスティクスの動向
9月 18, 2025

提言:拡張性のあるAI基盤モデルを導入し、ロボット群、すなわち人型ロボットや作業員をシミュレーションと並行して連携させ、今日からデータ収集を開始すべきです。.

Amazon の AI 基盤モデルは、知覚、計画、制御を統合し、ヒューマノイドと人間労働者が連携して大規模に稼働するフリートを推進します。これは、以下を利用します。 tdmpc, リアルタイムフィードバックに合わせて調整されたモデル予測制御アプローチを用い、エージェントとサイト間でタスクをルーティングしながら、実行します。 シミュレーション 実行前に選択肢を検証するため。.

このマイルストーンは、数千もの継続的オペレーションを制御する単一のスケーラブルなポリシーセットによって支えられています。それは~を記録します。 エピソードインデックス 各ミッションにおいて、チームが結果を比較検討できるようにする。 シミュレーション そして、実際のランニングに。知覚データを組み合わせることによって、, tdmpc 計画、そして lower 強固なアクションへの道筋として、環境が変化する中でフリートは安定したパフォーマンスを提供します。今回の展開は約100万台目のロボットに到達し、取り組みの規模を強調するものです。.

このアプローチを採用しようとするチームにとって、, 活用する 知覚、計画、およびアクチュエータ制御を公開するAPIを選択します。 available に適合するモジュール products スタックを使用します。 single 統合レイヤーへ 収集 テレメトリー、実行 シミュレーション, 、迅速に検証します。 エピソードインデックス-driven チェック。これにより、決定を透明にし、人間の同僚と並んで労働者のニーズに沿ったものにすることで、DevOps を削減します。.

メトリクスと成功の定義についてですが、 エピソードインデックス ログは、スループット、安全性、および稼働時間全体にわたる急速な改善を示しており、AI基盤モデルにより、関係者への価値実証が実現可能になります。同様に重要なのは、このアプローチが以下をサポートすることです。 single 新規ロールアウトのケイデンス products, 、そして労働者や人型ロボットと並行して将来の進歩を計画する方法を明確にする。.

日常的なロボット操作のためのAI基盤モデルの展開

日常的なロボット操作のためのAI基盤モデルの展開

Recommendation: AI基盤モデルを、2つの工場内の限定されたロボット群にデプロイし、4週間の評価を行う。アップデートのプッシュにはプッシュチャネルを使用し、モデルアーティファクトとログには単一のディレクトリを使用する。.

段階的な導入計画:まず工場Aで6台から始め、次に工場Bでさらに6台を追加し、安定した動作が確認されたら拡張する。スループットと移動精度を追跡し、評価のために画像とビデオストリームを収集する。KPI指標とアラート閾値を維持し、リアルタイムで異常を検出し、閾値を超えた場合にのみオペレーターが介入できるようにする。.

データ管理は、共通のディレクトリ構造(models/, assets/, logs/, results/)を中心に展開する。追跡可能性を確保するため、イベントにint64識別子でタグ付けし、問題分析を支援するために画像やビデオフレームを保存する。基礎モデルの出力をグラウンドトゥルースと比較するための簡単な評価ベンチを使用し、継続的なチューニングのために計算リソースとメモリを確保する。.

運用上の利点としては、手作業による介入や外部依存を減らすインテリジェントな制御が挙げられます。このプログラムは、迅速な障害検出と予測保守の改善を通じて損失を削減することで、真のメリットを実証する必要があります。施設でのソーラー充電のセットアップは、特に複数のシフトにわたって展開する場合、稼働時間を延長し、アイドル期間を短縮することができます。.

チームの連携は統合チームのシンシアにかかっており、彼女がパイロットを主導し、指標を調整し、毎週のレビューを監督します。ドキュメントのデプロイメントは中央ディレクトリに記録し、pushtを使用して更新をプッシュすると同時に、変更の明確で監査可能な証跡と各イテレーションのint64イベントIDを保持します。.

避けるべき一般的な落とし穴としては、エッジケース問題の処理を怠ること、モデル評価のための予備能力を過小評価すること、AIの出力と実際のロボットの動作との間のキャリブレーションの欠落などが挙げられます。計算能力とストレージに余裕を持たせ、実験ごとに別々のログを保持し、自動移動中の衝突を防ぐための安全チェックを実装してください。.

AI基盤モデルは、倉庫およびフルフィルメントロボットとどのように統合されるか

AI基盤モデルをエッジと中央コントロールプレーンにインストールし、Amazonの大規模な倉庫ロボット群を同期させ、注文処理能力を劇的に向上させます。その基盤は、知覚、計画、制御を強化し、リアルタイムで動きを誘導し、全サイトで高いケイデンスを維持します。.

カメラを搭載したロボットがデジタル信号を基盤モデルに送り、基盤モデルはpytorchベースのモデルで高速な推論を実行します。これらの信号により、通路のスキャンから商品のピッキング、そしてステージングポイントへの配送まで、安全かつ効率的なタスク実行が可能になります。.

サイトを跨ぐ共通ワークフローでは、検索でアイテムを見つけ、在庫状況を確認し、移動距離を最小限に抑える経路を計画します。このアプローチは進捗状況を監視し、変化に適応することで、オペレーターは例外に集中でき、シンプルかつ自信を持って作業できます。.

効率的な展開には、エッジデバイスにfoundationをインストールし、それらをマシンコントローラーに参加させ、過去の注文から作成されたデータでモデルを調整します。照明や埃を調整するために環境センサーを使用し、ドリフトを避けるためにカメラのキャリブレーションを維持します。複数サイトからデータを調達することで学習が加速し、大規模施設全体で機能する単一の首尾一貫したモデルに統合されます。.

実際には、この設定により、単純で反復可能な手順でdeepfleetの運用を強化します。ベースモデルをコピーし、機器にインストールし、集中型ダッシュボードでパフォーマンスを監視します。Marsルーティングロジックは長い通路の移動をガイドし、共通の監視機能は環境条件とカメラフィードをチェックします。迅速なフィードバックループにより、システムは移動距離を有意な割合で削減し、注文処理全体の速度を向上させます。同時に、ピッキング、梱包、および出荷を含むサイトやタスク全体で、高い精度と予測可能な動作を維持します。.

データソース、トレーニングパイプライン、およびデプロイメントのためのバージョン管理

データソースをバージョン管理されたカタログに集約し、リリースごとにデータセットのバージョンをロックします。これには、センサーストリーム、シミュレーション実行、ログ、およびソーシャルインタラクション記録が含まれます。タスク、環境(工場フロアや火星シナリオを含む)、ロボットタイプ、およびサービス提供コンテキストでデータをタグ付けします。決定論的な分割を使用して、トレーニング中のダウンタイムを最小限に抑え、学習における評価と進歩をサポートするために、来歴をキャプチャします。このアプローチは、チーム間でデータを再利用できるように配慮し、実験例の再現性を維持し、異分野適応を加速させる可能性があります。.

明確なコンポーネントを備えたモジュール式トレーニングパイプラインを設計する:取り込み、拡張、正規化、モデルトレーニング、評価、およびデプロイメントフック。現実的なデータに焦点を当てる:センサーノイズ、多様な照明、および動的なエージェント。ヒューマノイド、ロボットプラットフォーム、および自律システム全体で検証し、堅牢な学習を保証する。早期テストサイクルと構造化された評価を使用して、ダウンタイムを削減し、現場展開前にパフォーマンスを証明する。配達サービスや防衛シミュレーションなどのタスクを中心に焦点を絞ったデータセットを構築し、社会的な状況におけるスキルを向上させる。.

バージョン管理とデプロイの連携:コードにはGitを、データセットにはデータバージョニングのアプローチを使用する。ライブラリにモデルレジストリとデフォルト環境の設計図を保持する。サンプルプログラムを作成し、明確なタグ/ブランチスキームを維持して、すべてのデプロイでコードのコミット、データのバージョン、モデルのバージョンを固定する。自律システムの場合は、防御関連のコンポーネントを厳格なアクセス制御と監査可能性で分離する。ロールバック計画と継続的な評価を使用し、ドリフトを監視する。.

アスペクト Guidance
Data sources 中央カタログ、Provenance (来歴)、環境タギング、火星シナリオや工場フロアを含む。チーム横断、デリバリーおよびサービスコンテキスト。.
トレーニングパイプライン モジュール式コンポーネント、リアリズム重視、評価頻度、ダウンタイム管理、ロボットおよびヒューマノイドプラットフォームに合わせた学習目標。.
バージョン管理 コードのためのGit、データバージョニング、モデルレジストリ、ライブラリ内のデフォルト環境、サンプルプログラム、明確なロールバック戦略。.
Governance and metrics 早期検証;継続的評価;スキル追跡;防御的考察;自律制御。.

フリート全体にわたるリアルタイムな知覚、計画、および行動選択

中央センターから展開された艦隊に指示を配信する、プッシュ型プランナーを備えたインデックス化された知覚スタックを実装します。統一されたメッセージ形式と決定論的なタイミングバジェットを使用します。目標は、知覚から行動までのレイテンシを40ミリ秒未満、センターでの計画更新を100Hz、エッジデバイスでの更新を50Hzにすることです。この設定により、さまざまなサイトでラストマイルの配達指示が整合され、センサーの故障を早期に検出するための自動ヘルスチェックも行われます。.

フリート全体のリアルタイム知覚は、同期されたビデオストリームとセンサー信号に依存しており、これらはドライブやグリッパーからの電気的フィードバックと融合されます。各ユニットは、インデックス化された状態と、その能力、応答する能力と感情的な準備、およびタスクタイプに関するプログラムされたメッセージをエクスポートします。この融合されたビューにより、センターは信頼できる状況を維持し、指示が理解され、プロセスが整合性を保つことができます。.

計画は艦隊全体で並行して実行されます。中央プランナーがセンター全体の配送目標によって目標を設定し、エッジプランナーが各ロボットの動作を数十ミリ秒以内に再評価します。このシステムは、実績のあるヒューリスティクスと、衝突や危険な動きを防ぐ防御ルールとともに、シンプルで安全な動作を模倣しています。行動選択は効率的な運用を優先し、会社の全体的なスループットを向上させ、艦隊間の連携における複雑さを軽減します。.

初期段階のパイロット運用には、明確な要件と緊密なフィードバックループが不可欠です。展開は数週間にわたるテスト期間を要します。まずは管理されたセンターで開始し、その後、実際の運用と並行して拡大します。サイクルごとのレイテンシー、タスクの成功率、および安全に関する事象を追跡します。目標は、レイテンシー40ms未満、タスク完了率99.9%、および誤検出1%未満です。ビデオレビューと軽量なプロセスを用いてポリシーを改良し、納期厳守とチームの需要への足並みを揃えます。ダッシュボードによると、レイテンシーは目標範囲内です。.

安全プロトコル、故障処理、および手動オーバーライド手順

安全プロトコル、故障処理、および手動オーバーライド手順

推奨事項:フェイルセーフ故障応答を実装し、故障検出から2秒以内にロボットを即座に停止させ、手動オーバーライドを作動させること。これをテストエピソードで検証し、episode_indexログをキャプチャし、外部入力なしで動作可能な安全な状態への具体的な経路を確保すること。.

  • 故障検出と分類:すべての安全に関わる重要な軸に対して冗長センサーを使用し、警告、故障、重大の3段階の故障分類を適用する。トレーサビリティと事故後の分析のために、すべてのイベントにepisode_indexをタグ付けする。センサーフュージョンと設定可能な閾値を活用し、コードを変更することなくハードウェアの調達変更に対応する。.
  • 安全停止と封じ込め:重大な故障が発生した場合、すべてのアクチュエータにゼロ速度を指示し、ハードウェアインターロックを適用し、サポートされている場合はロボットを安全な姿勢に移行させます。ブレーキが負荷下で保持されていることを確認し、モーター電流を監視して制限内に収まるようにします。ロボットが静止している間は、オペレーターにステータスフィードを維持し、制御面を再構成して指定された停止ゾーンへの安全な経路で動作できるようにします。.
  • 手動オーバーライド手順:高速ハードウェア緊急停止とソフトウェアスーパーバイザーモードの、2つの独立したオーバーライドチャネルを提供すること。手順:1) 役割ベースのアクセスを確認する;2) オーバーライドを作動させる;3) オペレーターパネルの状態変化を確認する;4) コントロールを行い、制御された診断を実行し、必要に応じて安全な場所に誘導する。すべてのアクションは、ログに記録し、現在のepisode_indexに関連付けること。オペレーターは、オーバーライドの信頼性を監視し、クリアランス後に自律制御を再開できるように準備しておくこと。.
  • 監視と診断:手動オーバーライド中も継続的な監視を実行します。ライブセンサーデータをベースラインプログラムと比較し、偏差を警告します。健全性フラグが定義された期間を超えて持続する場合は、ウォッチドッグを使用してシャットダウンします。オペレーターに明確な視覚的および聴覚的なキューを表示し、継続的な診断トレイルを維持します。.
  • 複合的な安全アーキテクチャ:ハードウェアインターロック、ソフトウェア安全制約、および安全定格コントローラースタックを装備します。ハードウェアおよびソフトウェアベースの保護機能は、自律モードと手動モードの両方で動作する必要があり、サブシステムが故障した場合でもフォールトを管理し続けるように設計する必要があります。.
  • 運用継続性と適応性:障害が検出された場合、影響を受けた部分を隔離し、制御パスを再構成し、安全であればロボットを縮退モードで動作させる。制御ループが安全モードに切り替わり、条件が許せば自律的に再開できるようにする。.
  • 部品、調達、およびメンテナンス:安全上重要なコンポーネントの予備部品を常備すること。事前認証済みのモジュールとテスト済みの交換品を使用し、調達の変更はエンジニアリングログに記録すること。現在のプログラムおよび構成との互換性を定期的に検証すること。.
  • ケース訓練とトレーニング:センサーの脱落、アクチュエーターの作動不良、通信途絶をシミュレートする訓練を四半期ごとに実施する。エンジニアと状況を分析し、episode_indexとSOPを更新し、次回のソフトウェアリリースで改善を実施する。.
  • ドキュメントとトレーサビリティ:故障、オーバーライド、および是正措置の一元化された検索可能なログを保持します。タイムスタンプ、エピソードインデックス識別子、およびオペレーターのメモを含めます。このデータを使用して、安全テストと検証ケースを改善します。.

スケール後のパフォーマンスモニタリング、KPI、およびコスト・トゥ・サーブへの影響

リアルタイムな指標とコスト・トゥ・サーブモデルを備えた集中型KPIダッシュボードを構築し、規模拡大の意思決定を支援します。シフトごとのタスク完了数、ロボットの稼働時間、タスクごとの電気エネルギーを追跡して進捗状況を把握します。標準的な指標のライブラリ上にフレームワークを構築し、サイト全体のさまざまな状況に合わせて適応させます。ダッシュボードは観察期間内の問題を表面化させ、リーダーや従業員が迅速に行動できるようにする必要があります。.

パフォーマンスとコストの両方の影響を反映するKPIを定義します:ロボットあたりのスループット、平均修理時間 (MTTR)、平均故障間隔 (MTBF)、タスク実行の精度、タスクあたりのエネルギー使用量、1,000タスクあたりのメンテナンスコスト、および納期遵守率。タイムスタンプ付きの台帳を使用して変更を追跡し、各観察結果をエンジニアリング分析スタックにおける具体的なアクションに結び付けます。.

FFmpegでビデオとセンサーのストリームを処理し、フリート全体の品質チェックとアライメントをサポートします。各ウィンドウで、モーション、物体認識、パスの精度に関する観測値を計算します。ドリフトの検出能力は、計画されたアクションと実際のアクションを比較するだけで向上します。これにより、チームは明確なデータに基づいた動きで、変化する状況に対応できます。.

規模拡大後のコストへの影響:フリート拡張により、タスクあたりの固定費が削減され、メンテナンスにかかる間接費がより多くの作業に分散されます。拠点、タスクの種類、動力源別にコストをモデル化します。従業員の労務費、電気および金属製ハードウェアの減価償却費、部品交換費用を含めてください。ルーティング、スケジューリング、自動化が改善されると、タスクあたりのコストが約20〜35%削減可能です。その結果は明らかであり、自動化に投資する理由です。.

次の四半期に向けた具体的なステップ:データパスを計測し、閾値を設定し、日次の進捗状況レポートを発行し、モデルを検証するために中規模サイトでパイロットを実施します。チームが結果を更新できるタイムスタンプ付きのアクションログを作成し、議論から現場の変更に決定を移行するために毎週のレビューをスケジュールします。比較のためのウィンドウを維持し、観察が追跡可能であるように、ライブラリ内の各調整を文書化します。.