ਰਿਟ੍ਰੀਵਲ-ਔਗਮੈਂਟਡ ਜਨਰੇਸ਼ਨ (RAG) ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਸਿਰਫ਼ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਸਿੱਖੀ ਗੱਲ ਉੱਤੇ ਭਰੋਸਾ ਕਰਨ ਦੀ ਥਾਂ, ਬੇਨਤੀ ਦੇ ਸਮੇਂ ਤੁਹਾਡੇ ਆਪਣੇ ਡੇਟਾ ਵਿੱਚੋਂ ਲੱਭੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ RAG ਪਾਈਪਲਾਈਨ ਉਸਦੇ ਆਲੇ-ਦੁਆਲੇ ਦਾ ਇੰਜੀਨੀਅਰ ਕੀਤਾ ਸਿਸਟਮ ਹੈ — ਇੰਜੈਸ਼ਨ, ਚੰਕਿੰਗ, ਐਂਬੈਡਿੰਗ, ਇੱਕ ਵੈਕਟਰ ਸਟੋਰ, ਰਿਟ੍ਰੀਵਲ, ਅਤੇ ਸੁਰੱਖਿਆ ਸੀਮਾਵਾਂ — ਜੋ ਇੱਕ ਡੈਮੋ ਵਜੋਂ ਨਹੀਂ ਸਗੋਂ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਚੱਲਣ ਲਈ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ।
RAG ਉਹ ਤਰੀਕਾ ਹੈ ਜਿਸ ਨਾਲ ਇੱਕ ਅਸਿਸਟੈਂਟ ਤੁਹਾਡੀ ਖ਼ਾਸ ਸਮੱਗਰੀ ਬਾਰੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ — ਇੱਕ ਨੀਤੀ ਲਾਇਬ੍ਰੇਰੀ, ਇੱਕ ਉਤਪਾਦ ਕੈਟਾਲਾਗ, ਇੱਕ ਦਸਤਾਵੇਜ਼ ਸੰਗ੍ਰਹਿ — ਹਵਾਲਿਆਂ ਸਮੇਤ, ਅਤੇ ਮਾਡਲ ਨੂੰ ਮੁੜ-ਟ੍ਰੇਨ ਕੀਤੇ ਬਿਨਾਂ। ਇੱਕ ਵੀਕਐਂਡ ਡੈਮੋ ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਵਿਚਲਾ ਫ਼ਰਕ ਮਾਡਲ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਹਰ ਚੀਜ਼ ਹੈ: ਦਸਤਾਵੇਜ਼ ਕਿਵੇਂ ਚੰਕ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਰਿਟ੍ਰੀਵਲ ਅਸਲ ਕਾਰਪਸ ਅਨੁਸਾਰ ਕਿਵੇਂ ਟਿਊਨ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਵਾਬ ਕਿਵੇਂ ਆਧਾਰਿਤ ਅਤੇ ਪਰਖੇ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਜਦੋਂ ਇਹ ਭਟਕਦਾ ਹੈ ਤਾਂ ਪੂਰੇ ਸਿਸਟਮ ਉੱਤੇ ਕਿਵੇਂ ਨਜ਼ਰ ਰੱਖੀ ਜਾਂਦੀ ਹੈ।
ਅਸੀਂ ਇਨ੍ਹਾਂ ਨੂੰ Cloudflare (Vectorize, Workers AI, D1) ਉੱਤੇ ਬਣਾਉਂਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਮੁਲਾਂਕਣ ਹਾਰਨੈੱਸ ਡਿਪਲੋਇ ਨਾਲ ਜੁੜੇ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਜੋ ਕੋਈ ਖ਼ਰਾਬੀ ਚੁੱਪ-ਚਾਪ ਘਟੀਆ ਹੋਣ ਦੀ ਥਾਂ ਉੱਚੀ ਆਵਾਜ਼ ਵਿੱਚ ਫੇਲ੍ਹ ਹੋਵੇ।
— ਸੰਬੰਧਿਤ ਪੜ੍ਹਾਈ
— ਹੋਰ ਪਰਿਭਾਸ਼ਾਵਾਂ
ਇਸਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਬਣਵਾਉਣਾ ਜਾਂ ਠੀਕ ਕਰਵਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ?
ਦੋ ਪੈਰਿਆਂ ਵਿੱਚ ਦੱਸੋ ਕਿ ਤੁਸੀਂ ਕਿਸ ਉੱਤੇ ਕੰਮ ਕਰ ਰਹੇ ਹੋ — ਅਸੀਂ ਇੱਕ ਕਾਰਜ ਦਿਨ ਦੇ ਅੰਦਰ ਇਸ ਬਾਰੇ ਸਿੱਧੇ ਜਵਾਬ ਨਾਲ ਲਿਖਤੀ ਜਵਾਬ ਦਿੰਦੇ ਹਾਂ ਕਿ ਕੀ ਅਸੀਂ ਮਦਦ ਕਰ ਸਕਦੇ ਹਾਂ।