nvidia-nemotron-nano-9b-v2 Model by NVIDIA | NVIDIA NIM

nvidia/nvidia-nemotron-nano-9b-v2

Prototype

Start building with a free API endpoint.

PythonNodeShell

from openai import OpenAI

client = OpenAI(
  base_url = "https://integrate.api.nvidia.com/v1",
  api_key = "$NVIDIA_API_KEY"
)

completion = client.chat.completions.create(
  model="nvidia/nvidia-nemotron-nano-9b-v2",
  messages=[{"role":"user","content":""}],
  temperature=0.6,
  top_p=0.95,
  max_tokens=2048,
  frequency_penalty=0,
  presence_penalty=0,
  stream=False,
  extra_body={
    "min_thinking_tokens": 1024,
    "max_thinking_tokens": 2048
  }
)

reasoning = getattr(completion.choices[0].message, "reasoning_content", None)
if reasoning:
  print(reasoning)
print(completion.choices[0].message.content)

Deploy

Ready to scale? Choose your deployment path.

Partner EndpointsSelf-Hosted Deployments

Available Integrations

Deploy this model now on your endpoint provider of choice