Try NVIDIA NIM APIs

nvidia cosmos-reason1-7b

Reasoning vision language model (VLM) for physical AI and robotics.

video understanding synthetic data generation autonomous vehicles industrial physical ai vision language model reasoning robotics smart cities nvidia

nvidia cosmos-transfer1-7b

Generates physics-aware video world states for physical AI development using text prompts and multiple spatial control inputs derived from real-world data or simulation.

synthetic data generation autonomous vehicles physical ai robotics video-to-world nvidia

nvidia cosmos-predict1-7b

Generalist model to generate future world state as videos from text and image prompts to create synthetic training data for robots and autonomous vehicles.

synthetic data generation autonomous vehicles physical ai robotics text-to-world image-to-world nvidia

nvidia cosmos-predict1-5b

Generates future frames of a physics-aware world state based on simply an image or short video prompt for physical AI development.

synthetic data generation physical ai policy evaluation robotics video-to-world nvidia

nvidiacosmos-reason1-7b

nvidiacosmos-transfer1-7b

nvidiacosmos-predict1-7b

nvidiacosmos-predict1-5b

nvidia cosmos-reason1-7b

nvidia cosmos-transfer1-7b

nvidia cosmos-predict1-7b

nvidia cosmos-predict1-5b