Why I am getting tensor of NaN values in PyTorch Huggingface inference?

Asked Oct 07 '22 at 04:35

Active Oct 07 '22 at 04:35

Viewed 143 times

I am fine-tuning distil-bert model for 200k iterations. Once it saves the checkpoint file, I do the inference. However, my inference vector for any random text is Nan. An example output is below. Does anyone have any idea ?

tensor([[[nan, nan, nan, ..., nan, nan, nan], [nan, nan, nan, ..., nan, nan, nan], [nan, nan, nan, ..., nan, nan, nan], ..., [nan, nan, nan, ..., nan, nan, nan], [nan, nan, nan, ..., nan, nan, nan], [nan, nan, nan, ..., nan, nan, nan]]], grad_fn=)

asked Oct 07 '22 at 04:35

Ramraj Chandradevan

Hey, please post the code you used – Theodor Peifer Oct 07 '22 at 06:30

Why I am getting tensor of NaN values in PyTorch Huggingface inference?

0 Answers0