— ਪਰਿਭਾਸ਼ਾ

Production RAG pipeline

Retrieval-Augmented Generation

ਰਿਟ੍ਰੀਵਲ-ਔਗਮੈਂਟਡ ਜਨਰੇਸ਼ਨ (RAG) ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਸਿਰਫ਼ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਸਿੱਖੀ ਗੱਲ ਉੱਤੇ ਭਰੋਸਾ ਕਰਨ ਦੀ ਥਾਂ, ਬੇਨਤੀ ਦੇ ਸਮੇਂ ਤੁਹਾਡੇ ਆਪਣੇ ਡੇਟਾ ਵਿੱਚੋਂ ਲੱਭੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ RAG ਪਾਈਪਲਾਈਨ ਉਸਦੇ ਆਲੇ-ਦੁਆਲੇ ਦਾ ਇੰਜੀਨੀਅਰ ਕੀਤਾ ਸਿਸਟਮ ਹੈ — ਇੰਜੈਸ਼ਨ, ਚੰਕਿੰਗ, ਐਂਬੈਡਿੰਗ, ਇੱਕ ਵੈਕਟਰ ਸਟੋਰ, ਰਿਟ੍ਰੀਵਲ, ਅਤੇ ਸੁਰੱਖਿਆ ਸੀਮਾਵਾਂ — ਜੋ ਇੱਕ ਡੈਮੋ ਵਜੋਂ ਨਹੀਂ ਸਗੋਂ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਚੱਲਣ ਲਈ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ।

RAG ਉਹ ਤਰੀਕਾ ਹੈ ਜਿਸ ਨਾਲ ਇੱਕ ਅਸਿਸਟੈਂਟ ਤੁਹਾਡੀ ਖ਼ਾਸ ਸਮੱਗਰੀ ਬਾਰੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ — ਇੱਕ ਨੀਤੀ ਲਾਇਬ੍ਰੇਰੀ, ਇੱਕ ਉਤਪਾਦ ਕੈਟਾਲਾਗ, ਇੱਕ ਦਸਤਾਵੇਜ਼ ਸੰਗ੍ਰਹਿ — ਹਵਾਲਿਆਂ ਸਮੇਤ, ਅਤੇ ਮਾਡਲ ਨੂੰ ਮੁੜ-ਟ੍ਰੇਨ ਕੀਤੇ ਬਿਨਾਂ। ਇੱਕ ਵੀਕਐਂਡ ਡੈਮੋ ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਵਿਚਲਾ ਫ਼ਰਕ ਮਾਡਲ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਹਰ ਚੀਜ਼ ਹੈ: ਦਸਤਾਵੇਜ਼ ਕਿਵੇਂ ਚੰਕ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਰਿਟ੍ਰੀਵਲ ਅਸਲ ਕਾਰਪਸ ਅਨੁਸਾਰ ਕਿਵੇਂ ਟਿਊਨ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਵਾਬ ਕਿਵੇਂ ਆਧਾਰਿਤ ਅਤੇ ਪਰਖੇ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਜਦੋਂ ਇਹ ਭਟਕਦਾ ਹੈ ਤਾਂ ਪੂਰੇ ਸਿਸਟਮ ਉੱਤੇ ਕਿਵੇਂ ਨਜ਼ਰ ਰੱਖੀ ਜਾਂਦੀ ਹੈ।

ਅਸੀਂ ਇਨ੍ਹਾਂ ਨੂੰ Cloudflare (Vectorize, Workers AI, D1) ਉੱਤੇ ਬਣਾਉਂਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਮੁਲਾਂਕਣ ਹਾਰਨੈੱਸ ਡਿਪਲੋਇ ਨਾਲ ਜੁੜੇ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਜੋ ਕੋਈ ਖ਼ਰਾਬੀ ਚੁੱਪ-ਚਾਪ ਘਟੀਆ ਹੋਣ ਦੀ ਥਾਂ ਉੱਚੀ ਆਵਾਜ਼ ਵਿੱਚ ਫੇਲ੍ਹ ਹੋਵੇ।

ਇਸਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਬਣਵਾਉਣਾ ਜਾਂ ਠੀਕ ਕਰਵਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ?

ਦੋ ਪੈਰਿਆਂ ਵਿੱਚ ਦੱਸੋ ਕਿ ਤੁਸੀਂ ਕਿਸ ਉੱਤੇ ਕੰਮ ਕਰ ਰਹੇ ਹੋ — ਅਸੀਂ ਇੱਕ ਕਾਰਜ ਦਿਨ ਦੇ ਅੰਦਰ ਇਸ ਬਾਰੇ ਸਿੱਧੇ ਜਵਾਬ ਨਾਲ ਲਿਖਤੀ ਜਵਾਬ ਦਿੰਦੇ ਹਾਂ ਕਿ ਕੀ ਅਸੀਂ ਮਦਦ ਕਰ ਸਕਦੇ ਹਾਂ।