Try NVIDIA NIM APIs