- Pour obtenir des exemples de code et des flux de travail, consultez le notebook Google Colab.
- Pour en savoir plus sur les points de terminaison de l’API de Serverless RL, consultez la référence de l’API Serverless RL.
Comment utiliser Serverless RL
Effectuez le post-entraînement de modèles avec Serverless RL à l’aide du framework ART d’OpenPipe et de l’API Serverless RL pour l’apprentissage par renforcement.
Utilisez Serverless RL via le framework ART d’OpenPipe et l’API Serverless RL.
Pour commencer à utiliser Serverless RL, assurez-vous de remplir les prérequis pour utiliser les outils W&B, puis suivez le démarrage rapide d’ART.