Libri di Sandip Kulkarni
-
A Practical Guide to Reinforcement Learning from Human Feedback: Foundations, aligning large language models, and the evolution of preference-based methods
Venditore: FeltrinelliPackt Publishing Limited, 2026Libri in Inglese | Science, Computer & TechnologyDisponibilità in 3 settimane59,49 €
Informazioni sull’ordinamento
Vengono mostrati per primi i prodotti che rispondono a questi criteri: rilevanza rispetto alla ricerca, dati di venduto, disponibilità, data di pubblicazione, tipologia di prodotto, personalizzazione ad eccezione delle sponsorizzazioni.