nsys profile -t cuda,osrt,nvtx,cudnn,cublas --cuda-graph-trace=node -o {name} -w true -f true python {file_name}