Inria comment:
Implémenter des contrôles de cohérence pour respecter les consignes des fonctions NLP
émulées (e.g. nombre de mots dans un résumé, format de sortie etc. ...)
This could be done using regex or weight on tokens (logit_bias).
It would slow down OpenAI API are require local GPU.
Inria comment:
This could be done using regex or weight on tokens (logit_bias).
It would slow down OpenAI API are require local GPU.