機器人技術(shù)正經(jīng)歷一場變革,逐步脫離專用機器時代,邁入通用機器人時代。這一轉(zhuǎn)變意味著機器人不再局限于單一用途、功能固定的形態(tài),而是向更具備適應(yīng)性的機器人演進,以在不同環(huán)境中執(zhí)行多樣化任務(wù)。受人類認知模式啟發(fā),具備適應(yīng)性的機器人能夠?qū)⒖焖俜磻?yīng)能力與高階推理規(guī)劃能力相結(jié)合,以更高效地學習與適應(yīng)環(huán)境。

這一模式為機器人在不同行業(yè)的靈活應(yīng)用打開了大門,不僅降低了成本,其實際應(yīng)用范圍也遠超專用機器人的能力邊界。NVIDIA 在 2025 年 GTC 大會上正式推出 NVIDIA Isaac GR00T 平臺,為這場變革奠定了基礎(chǔ)。該平臺整合了機器人基礎(chǔ)模型、合成數(shù)據(jù)工作流、仿真環(huán)境與運行時計算機,為通用機器人發(fā)展提供全方位支撐。

今天,我們興奮地宣布 NVIDIA Jetson AGX Thor 開發(fā)者套件與 NVIDIA Jetson T5000 模組正式公開發(fā)售。這將為全球開發(fā)者賦能,助力打造物理 AI 的未來。借助 Jetson Thor,機器人無需為每項新任務(wù)重新編程。Jetson Thor 是面向物理 AI 的卓越平臺,這一超級計算機可支持生成式推理,同時具備多模態(tài)、多傳感器處理能力。將 Jetson Thor 集成至下一代機器人中,能為基礎(chǔ)模型提速,使其在物體操作、導航、執(zhí)行復雜指令等挑戰(zhàn)性任務(wù)中具備更高的靈活性。

打造通用人形機器人需具備哪些條件?

打造一款典型的通用人形機器人,需構(gòu)建四個核心層級:

1. 打造人形機器人需整合一系列硬件與軟件組件

NVIDIA Jetson Thor 為什么是物理 AI 與人形機器人的卓越平臺?

NVIDIA Jetson AGX Thor 開發(fā)者套件具備無可比擬的性能與可擴展性。該套件使用 NVIDIA Blackwell 架構(gòu) GPU,具備 128 GB 內(nèi)存,AI 計算性能最高可達 2070 FP4 TFLOPS,可輕松運行最新的生成式 AI 模型,所有這些都在 130 瓦的功率范圍內(nèi)實現(xiàn)。與 NVIDIA Jetson AGX Orin 相比,其 AI 計算性能提高至 7.5 倍,能效提高至 3.5 倍。

借助全新的 Blackwell 多實例 GPU(MIG)與性能強勁的 14 核 Arm Neoverse-V3AE CPU,Jetson Thor 能為低延遲、實時性應(yīng)用提速。此外,該平臺還集成了一整套加速器,包括第三代 Programmable Vision Accelerator(PVA)、雙編碼器與解碼器、光流加速器等。

在高速傳感器融合方面,開發(fā)者套件提供豐富的輸入輸出(I/O)接口選項,包括 1 個支持 4 路 25GbE 的 QSFP 插槽、1 個有線 Multi-GbE RJ45 接口、多個 USB 端口及其他連接接口。同時,其設(shè)計可與現(xiàn)有人形機器人平臺無縫集成,支持便捷的有線連接,能夠快速啟動原型開發(fā)。

Transformer 引擎與 FP4 支持

Jetson Thor 基于 NVIDIA Blackwell 架構(gòu)打造,引入原生 FP4 量化技術(shù),并搭配下一代 Transformer 引擎,該引擎可在 FP4 與 FP8 精度之間動態(tài)切換,以實現(xiàn)最優(yōu)性能。通過將 4 位權(quán)重、激活值與更高內(nèi)存帶寬相結(jié)合,Jetson Thor 能同時加速生成式 AI 工作負載中的預(yù)填充與解碼過程。

多實例 GPUMIG

Jetson Thor 引入 MIG 技術(shù),可將單塊 GPU 劃分為多個相互隔離的實例,每個實例擁有專屬資源。這一技術(shù)能為關(guān)鍵工作負載預(yù)留計算資源,同時并行運行對時間敏感度較低的任務(wù),確保性能的可預(yù)測性,對于需兼顧多重關(guān)鍵任務(wù)的機器人應(yīng)用而言,這一特性尤為重要。

表 1 與表 2 分別展示了 Jetson T5000 模組及 NVIDIA Jetson AGX Thor 開發(fā)者套件載板的核心特性與接口規(guī)格。

NVIDIA Jetson T5000 NVIDIA Jetson T4000*
AI 性能2070 TFLOPS (Sparse FP4) 1035 TFLOPS (Dense FP4 | Sparse FP8 | Sparse INT8) 517 TFLOPs (Dense FP8 | Sparse FP16)1200 TFLOPS (Sparse FP4) 600 TFLOPS (Dense FP4 | Sparse FP8 | Sparse INT8) 300 TFLOPS (Dense FP8 | Sparse FP16)
GPU2560 核 NVIDIA Blackwell 架構(gòu) GPU,包括 96 個第五代 Tensor Core 支持 MIG,含 10 個 TPC1536 核 NVIDIA Blackwell 架構(gòu) GPU,包括 64 個第五代 Tensor Core 支持 MIG,含 6 個 TPC
CPU14 核 Arm Neoverse-V3AE 64 位 CPU12 核 Arm Neoverse-V3AE 64 位 CPU
內(nèi)存128 GB 256 位 LPDDR5X,內(nèi)存帶寬 273 GB/s64 GB 256 位 LPDDR5X,內(nèi)存帶寬 273 GB/s
頻率1.57 GHz max GPU 2.6 GHz max CPU1.57 GHz max GPU 2.6 GHz max CPU
存儲支持通過 PCIe 接口連接 NVMe
支持通過 USB3.2 接口連接 SSD
支持通過 PCIe 接口連接 NVMe
支持通過 USB3.2 接口連接 SSD
視覺加速器PVA v3.0PVA v3.0
視頻編碼最高支持 6 路 4Kp60(H.265/H.264)最高支持 6 路 4Kp60(H.265/H.264)*
視頻解碼最高支持 4 路 8Kp30(H.265)
最高支持 4 路 4Kp60(H.264)
最高支持 4 路 8Kp30(H.265)*
最高支持 4 路 4Kp60(H.264)*
攝像頭通過 HSB 接口支持最多 20 路攝像頭
通過 16 通道 MIPI CSI-2 接口支持最多 6 路攝像頭
通過虛擬通道支持最多 32 路攝像頭
支持 C-PHY 2.1(10.25 Gbps)、D-PHY 2.1(40 Gbps)
通過 HSB 接口支持最多 20 路攝像頭
通過 16 通道 MIPI CSI-2 接口支持最多 6 路攝像頭
通過虛擬通道支持最多 32 路攝像頭
支持 C-PHY 2.1(10.25 Gbps)、D-PHY 2.1(40 Gbps)
顯示4 路共享 HDMI2.1 接口
VESA DisplayPort 1.4a(HBR2、MST)
4 路共享 HDMI2.1 接口
VESA DisplayPort 1.4a(HBR2、MST)
功耗40W – 130W40W – 70W

1. NVIDIA Jetson AGX Thor 開發(fā)者套件模組規(guī)格

注:帶*的參數(shù)為初步數(shù)據(jù),可能存在變動

NVIDIA Jetson AGX Thor 開發(fā)者套件規(guī)格參數(shù)
集成式 NVIDIA Jetson 模組NVIDIA Jetson T5000 模組
存儲在 M.2 Key M 插槽上集成 1TB NVMe
攝像頭通過 QSFP 插槽連接 HSB 攝像頭
USB 攝像頭
PCIe支持 x4 PCIe Gen5 的 M.2 Key M 插槽(搭載 1TB NVMe)
支持 x1 PCIe Gen5 的 M.2 Key E 插槽(搭載 Wi-Fi 6E 和藍牙模組)
USB2 個 USB Type-A 3.2 Gen2 接口
2 個 USB Type-C 3.1 Gen1 接口
1 個 USB Type-C 接口(僅用于調(diào)試)
網(wǎng)絡(luò)1 個 5GBe RJ45 接口
1 個 QSFP28 接口(支持 4 路 25GbE)
Wi-Fi802.11ax Wi-Fi 6E
顯示1 個 HDMI 2.0b 接口
1 個 DisplayPort 1.4a 接口
其他 I/O2 個 13-pin CAN header
2 個 6-pin Automation header
2 個 5-pin JTAG Connector
1 個 4-pin Fan Connector(12V、PWM)
2 個 5-pin Audio Panel header
2-pin RTC 備用電池 Connector
Microfit Power Jack Power、Force Recovery 和 Reset buttons
機械尺寸243.19 mm x 112.40 mm x 56.88 mm (高度含支撐腳、載板、模組與散熱解決方案)

2. NVIDIA Jetson AGX Thor 開發(fā)者套件載板規(guī)格

2. NVIDIA Jetson Thor 模組的組件構(gòu)成

Jetson Thor 如何為邊緣端生成式 AI 提速?

Jetson AGX Thor 是全新的機器人計算機,其架構(gòu)從底層重新設(shè)計,專為驅(qū)動下一代人形機器人打造。該平臺支持各類生成式 AI 模型,既包括 NVIDIA Isaac GR00T N1.5 這類視覺語言動作模型(VLA),也涵蓋所有主流大型語言模型(LLM)視覺語言模型(VLM)

為提供無縫的云端到邊緣端銜接體驗,Jetson Thor 可運行 NVIDIA 面向物理 AI 應(yīng)用的 AI 軟件棧,包括面向機器人的 NVIDIA Isaac、面向視覺 AI 智能體的 NVIDIA Metropolis,以及面向傳感器處理的 NVIDIA Holoscan。開發(fā)者還可以借助視頻搜索與總結(jié)(VSS)的 NVIDIA 代理式 AI 工作流等,在邊緣端構(gòu)建 AI 智能體。

3. Jetson Thor 支持各類 AI 框架與生成式 AI 模型

為什么生成式推理與多模態(tài)傳感器處理對物理 AI 至關(guān)重要?

生成式推理模型對于需要仿真可能的動作序列、預(yù)測結(jié)果、基于語言或視覺線索推理、靈活生成高階規(guī)劃或低階運動策略的機器人平臺至關(guān)重要。這些模型能讓機器人系統(tǒng)在真實場景中具備更高靈活性、更強適應(yīng)性,以及接近人類水平的穩(wěn)健推理能力。

NVIDIA Jetson Thor 在生成式推理領(lǐng)域?qū)崿F(xiàn)了巨大飛躍,與 Jetson Orin 相比,其推理速度提升最高達 5 倍。借助 FP4 精度優(yōu)化與推測解碼技術(shù),開發(fā)者還能在 Jetson Thor 上進一步實現(xiàn) 2 倍的性能提升。

4. 在生成式推理方面,Jetson Thor 速度較 Jetson Orin 最高提升至 5

Jetson Thor 還能無縫處理多個生成式 AI 模型與大量多模態(tài)傳感器輸入,實現(xiàn)實時響應(yīng)。圖 5 通過 Qwen2.5-VL-3B VLM 與 Llama 3.2 3B LLM 兩款模型展示了這一能力,測試中兩款模型需同時處理 16 個并發(fā)請求。結(jié)果顯示,兩款模型的“首 token 生成時間(Time to First Token,TTFT)”均遠低于 200 毫秒,“輸出 token 生成時間(Time per Output Token,TPOT)”均遠低于 50 毫秒——而這兩項指標正是衡量系統(tǒng)響應(yīng)速度的核心標準。

5. Jetson Thor 在處理多個生成式 AI 模型與大量多模態(tài)傳感器輸入時,仍能保持實時響應(yīng)

Jetson Thor 不僅支持 Blackwell 架構(gòu)原生 FP4 精度,還能啟用推測解碼等高級技術(shù)。在推測解碼技術(shù)中,先由小型草稿模型生成候選 tokens,再由大型模型驗證 tokens 的有效性。這種方式在保證生成準確性的同時,能加速生成式 AI 推理過程,最終實現(xiàn)更快、更高質(zhì)量的輸出。

圖 4 顯示了在采用 FP4 量化與基于 Eagle 的推測解碼技術(shù)后,Qwen2.5-VL-7B 模型在 Jetson Thor 上的推理速度較采用 W4A16(4 位權(quán)重、16 位激活值)配置的 Jetson Orin,最高提升至 3.5 倍。

此外,如表 3 所示,在 LLM、VLM、VLA 等各類生成式 AI 模型上,Jetson Thor 的加速性能均實現(xiàn)突破,較 Jetson Orin 提升最高至 5 倍。

模型類型模型Jetson AGX Thor (output tokens/sec)Jetson AGX Orin (output tokens/sec)性能提升倍數(shù)
LLM
LlamaLlama 3.1 8B150.8112.331.34
Llama 3.3 70B12.647.381.71
QwenQwen3-30B-A3B226.4276.692.95
Qwen3-32B79.116.844.70
DeepSeekDeepSeek-R1-Distill-Qwen-7B304.76180.411.69
DeepSeek-R1-Distill-Qwen-32B82.6316.964.87
VLM
QwenQwen2.5-VL-3B356.862161.65
Qwen2.5-VL-7B252154.021.64
LlamaLlama 3.2 11B Vision69.6344.221.57
VLA
GR00TGR00T N146.718.52.52
GR00T N1.541.515.22.74

3. Jetson Thor Jetson AGX Orin 的基準測試對比

基準測試配置說明:序列長度 2048,輸出序列長度 128;最大并發(fā)數(shù) 8;LLM VLM 模型基于 VLLM 框架運行,VLA 模型基于 TensorRT 框架運行;Jetson AGX Thor Jetson AGX Orin 均采用 MAXN 功耗模式。

Jetson 軟件如何為邊緣端 AI 提速?

Jetson 軟件通過提供一套高度集成的全棧軟件平臺,為邊緣端 AI 性能提速。該平臺針對機器人、醫(yī)療、物流、自主系統(tǒng)等領(lǐng)域的實時、高吞吐量應(yīng)用進行優(yōu)化,可滿足多樣化場景需求。

Jetson 軟件以 JetPack 7 為核心驅(qū)動,搭載 Linux 6.8 內(nèi)核、Ubuntu 24.04 LTS 操作系統(tǒng)及最新 NVIDIA AI 棧,能夠?qū)崿F(xiàn)低延遲、確定性的高階生成式 AI 模型運行,為物理 AI 應(yīng)用提供支撐。它融合了硬件加速計算與系統(tǒng)級優(yōu)化能力,能夠讓人形機器人、自主機器、工業(yè)自動化系統(tǒng)等復雜系統(tǒng)具備響應(yīng)能力及智能行為。

憑借集成式 Holoscan Sensor Bridge、MIG 支持以及 Preemptable Realtime Kernel 等特性,Jetson 軟件顯著提升了高速傳感器融合、運動規(guī)劃等任務(wù)的性能與效率。在 Jetson AI Lab 及廣泛生態(tài)系統(tǒng)的支持下,Jetson 軟件大幅縮短了邊緣 AI 與機器人應(yīng)用的性能達標時間(time-to-performance)。

Jetson Thor 平臺支持全新的 Cosmos Reason——這是一款面向物理 AI 與機器人的開源、可定制、70 億參數(shù)推理型 VLM。

7. Jetson 軟件棧

采用 SBSA 架構(gòu)設(shè)計的 JetPack 7

借助 JetPack 7,Jetson 軟件實現(xiàn)了與服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu)(Server Base System Architecture,SBSA)的對齊,使 Jetson Thor 的設(shè)計達到 Arm 服務(wù)器設(shè)計的行業(yè)標準。SBSA 對標準化的關(guān)鍵硬件與固件接口,能提供更完善的操作系統(tǒng)支持、更簡便的軟件遷移能力,以及更順暢的企業(yè)級集成體驗。在此基礎(chǔ)上,Jetson Thor 可以支持在所有 Arm 目標平臺上統(tǒng)一安裝 CUDA 13.0,不僅簡化了開發(fā)流程、減少了版本碎片化問題,還確保了從服務(wù)器級系統(tǒng)到 Jetson Thor 平臺的體驗一致性。

NVIDIA Isaac 如何端到端加速機器人開發(fā)?

NVIDIA Isaac 是開源的機器人平臺,包含一系列 CUDA 加速庫、框架與 AI 模型,可用于開發(fā)自主移動機器人、機械臂、人形機器人等各類機器人產(chǎn)品?,F(xiàn)代機器人需要一個由控制、視覺與語言模型構(gòu)成的高級“大腦”,能夠通過實時處理多模態(tài)數(shù)據(jù),實現(xiàn)從感知到動作的無縫銜接。

Jetson Thor 專為運行 Isaac GR00T N1.5 這類高負載模型而設(shè)計,能為人形機器人提供實時人機交互、空間感知與穩(wěn)健的環(huán)境感知能力。Isaac 平臺與 Jetson Thor 協(xié)同配合,可實現(xiàn)在邊緣部署具備可擴展性的多模態(tài) AI,為工業(yè)與科研領(lǐng)域的機器人技術(shù)創(chuàng)新提速。

8. NVIDIA Isaac GR00T 端到端加速機器人開發(fā)

如何借助 VSS 從邊緣攝像頭中獲取有價值的信息?

NVIDIA Metropolis 中用于視頻搜索與總結(jié)的(VSS)NVIDIA Blueprint,為開發(fā)者提供了構(gòu)建和部署視頻分析 AI 智能體的工具。這類 AI 智能體可通過分析實時攝像頭流,實現(xiàn)情境化實時警報、視頻總結(jié)與智能問答功能。

VSS 正為多領(lǐng)域視覺智能體應(yīng)用提供支撐:在制造業(yè)中用于視覺檢測與工人安全監(jiān)測;在體育賽事直播中用于提升粉絲互動體驗與運動員數(shù)據(jù)分析;在道路事件處理中則可縮短應(yīng)急響應(yīng)時間。

9. VSS 應(yīng)用場景包括制造業(yè)視覺檢測、工人安全監(jiān)測,以及縮短道路事件應(yīng)急響應(yīng)時間

Jetson Thor 上的 Holoscan 如何用于實時傳感器處理?

NVIDIA Holoscan 是一款 AI 傳感器處理平臺,提供軟件定義的實時 AI 所需的全棧加速基礎(chǔ)設(shè)施。它可以簡化企業(yè)級硬件上邊緣 AI 的部署流程并提升可擴展性,為實時 AI 應(yīng)用提供高性能邊緣解決方案。

在 Jetson Thor 上運行 Holoscan,可對并發(fā) AI 工作流進行安全分區(qū)與隔離——這一特性能為關(guān)鍵任務(wù)應(yīng)用提升確定性及容錯能力,并提供數(shù)據(jù)防泄漏保護。如此一來,開發(fā)者可在不影響安全性的前提下持續(xù)推進 AI 創(chuàng)新,使得 Holoscan 成為受監(jiān)管領(lǐng)域內(nèi)實時動作控制的可信操作層。

現(xiàn)代機器人依賴各類傳感器實現(xiàn)智能運行,包括攝像頭、IMU、執(zhí)行器等,每一種傳感器對機器人的正常工作都至關(guān)重要。借助 NVIDIA Holoscan Sensor Bridge,無論任何傳感器類型,都能通過以太網(wǎng)將所有傳感器無縫連接至 NVIDIA Jetson 平臺。Jetson Thor 支持全新的以太網(wǎng)攝像頭技術(shù),可將傳感器數(shù)據(jù)直接傳輸至 GPU 內(nèi)存,大幅降低延遲并減少 CPU 占用率。這種方式用簡潔的軟件定義 API 替代了傳統(tǒng)驅(qū)動的復雜邏輯,使實時邊緣 AI 應(yīng)用(無論是機器人、工業(yè)自動化系統(tǒng)還是先進醫(yī)療系統(tǒng))能夠?qū)崿F(xiàn)精準同步與穩(wěn)健擴展。

助力縮短產(chǎn)品上市時間的全方位生態(tài)系統(tǒng)

Jetson 生態(tài)系統(tǒng)包括超過 1,000 個合作伙伴,為幫助開發(fā)者更快地將解決方案推向市場,不同類型的合作伙伴可以提供針對性的支持服務(wù),為開發(fā)流程的各個階段提供必要的支持。

合作伙伴類型服務(wù)
獨立軟件供應(yīng)商(ISV)應(yīng)用軟件
云服務(wù)提供商(CSP)及軟件工具平臺操作系統(tǒng)、設(shè)備管理、AI 模型定制與遷移服務(wù)
平臺軟件及 AI 服務(wù)平臺操作系統(tǒng)、系統(tǒng)軟件
硬件合作伙伴(OEM / ODM、系統(tǒng)集成商、設(shè)計公司等)載板、COTS、定制化系統(tǒng)、一站式設(shè)計服務(wù)、連接模塊
傳感器攝像頭(MIPI / GMSL、以太網(wǎng)接口、USB)、激光雷達、IMU、音頻設(shè)備、以及 ISP 調(diào)試服務(wù)
分銷商Jetson 模組與開發(fā)者套件

4. Jetson 生態(tài)系統(tǒng)包含超過 1,000 個合作伙伴

10. NVIDIA 合作伙伴提供靈活的合作模式,開發(fā)者可根據(jù)自身設(shè)計需求選擇特定組件與服務(wù)

即刻開始,使用 NVIDIA Jetson Thor 開發(fā)物理 AI

Jetson AGX Thor 開發(fā)者套件集成至現(xiàn)有機器人,即可加速軟件開發(fā)。開發(fā)者無需等待完整的系統(tǒng)集成,即可開始創(chuàng)建并測試應(yīng)用。

https://youtu.be/iYT2haVIgSM

視頻 1. 了解如何使用 NVIDIA Jetson AGX Thor 開發(fā)者套件

加入全球超 200 萬開發(fā)者的行列,開啟下一代物理 AI 項目的開發(fā)。Jetson AGX Thor 開發(fā)者套件(售價為 3,499 美元)以及 Jetson T5000 量產(chǎn)級模組,已經(jīng)可以通過 NVIDIA 全球授權(quán)分銷商購買

開始使用 NVIDIA Jetson AGX Thor 開發(fā)者套件,下載最新的 JetPack 7。

通過 Jetson 下載中心以及生態(tài)系統(tǒng)合作伙伴,獲得全面的文檔、支持資源和工具。如果有任何問題或者需要幫助,請通過 NVIDIA 開發(fā)者論壇與行業(yè)專家級其他開發(fā)者聯(lián)系。

分享到

songjy

相關(guān)推薦