Workers AI est la plateforme de Cloudflare pour exécuter des modèles d’apprentissage automatique — modèles de langage, embeddings, modèles d’image et de parole — sur son propre réseau de GPU, appelés depuis l’intérieur d’un Worker. Elle permet d’ajouter de l’inférence à une application sans gérer de GPU ni acheminer chaque requête vers un fournisseur de modèles tiers.
Pour bien des fonctionnalités, Workers AI est la façon la plus simple et la moins coûteuse d’ajouter un modèle, parce que l’inférence s’exécute sur la même plateforme que le reste de l’application et que les données n’en sortent pas. Pour d’autres, un modèle de pointe d’Anthropic ou d’OpenAI convient mieux ; le choix d’ingénierie porte sur le coût, la qualité et l’endroit où les données ont le droit d’aller.
Nous mesurons ce compromis au lieu de le deviner — voyez la comparaison coût-qualité ci-dessous.
— Lectures connexes
— Autres définitions
Vous voulez que ce soit construit ou corrigé correctement ?
Décrivez en deux paragraphes ce sur quoi vous travaillez — nous répondons par écrit dans un délai d’un jour ouvrable, avec un avis franc sur notre capacité à aider.