Workers AI es la plataforma de Cloudflare para ejecutar modelos de aprendizaje automático — modelos de lenguaje, embeddings, modelos de imagen y de voz — en su propia red de GPU, invocados desde dentro de un Worker. Te permite añadir inferencia a una aplicación sin gestionar GPU ni enrutar cada petición a un proveedor de modelos externo.
Para muchas funciones, Workers AI es la forma de menor fricción y menor costo de añadir un modelo, porque la inferencia corre en la misma plataforma que el resto de la aplicación y los datos no salen de ella. Para otras, un modelo de frontera de Anthropic o de OpenAI encaja mejor; la decisión de ingeniería tiene que ver con el costo, la calidad y dónde se permite que vayan los datos.
Medimos esa contrapartida en lugar de suponerla — consulta la comparación de costo y calidad más abajo.
— Lecturas relacionadas
— Más definiciones
¿Quieres construirlo o repararlo como es debido?
Cuéntanos en dos párrafos en qué estás trabajando — respondemos por escrito en un día hábil, con una respuesta directa sobre si podemos ayudarte.