Adding Spaces to Language Model Output for User-Friendly Display

Asked Aug 05 '23 at 13:29

Active Aug 05 '23 at 13:29

Viewed 9 times

large language models generate a list of tokens, but to show these tokens to a user we need to add spaces between these tokens, so how do we know where to put these spaces to show an appropriate text?

example this text was tokenized using OpenAI tokenizer,

in the text "and (2) it doesn't support GPT-4" how did we know we should add a space before "(" and not before "2" also not before ")"

asked Aug 05 '23 at 13:29

hakim47

Adding Spaces to Language Model Output for User-Friendly Display

0 Answers0