रिट्रीवल-ऑगमेंटेड जेनरेशन (RAG) एक तकनीक है जिसमें भाषा मॉडल केवल प्रशिक्षण में सीखी गई बातों पर निर्भर रहने के बजाय, क्वेरी के समय आपके अपने डेटा से प्राप्त दस्तावेज़ों के आधार पर उत्तर देता है। एक production RAG पाइपलाइन उसके चारों ओर का इंजीनियर किया गया तंत्र है — इन्जेशन, चंकिंग, एम्बेडिंग, एक वेक्टर स्टोर, रिट्रीवल और गार्डरेल — जो किसी डेमो के रूप में नहीं, बल्कि भरोसेमंद ढंग से चलने के लिए बनाया जाता है।
RAG वह तरीका है जिससे कोई सहायक आपकी विशिष्ट सामग्री — एक नीति-पुस्तकालय, एक उत्पाद सूची, एक दस्तावेज़ीकरण समूह — के बारे में, उद्धरणों के साथ और किसी मॉडल को दोबारा प्रशिक्षित किए बिना, प्रश्नों के उत्तर देता है। एक सप्ताहांत के डेमो और production के बीच का अंतर मॉडल के इर्द-गिर्द का सब कुछ है: दस्तावेज़ कैसे चंक किए जाते हैं, रिट्रीवल को असल कॉर्पस के अनुरूप कैसे ट्यून किया जाता है, उत्तरों को कैसे आधार और मूल्यांकन दिया जाता है, और जब यह बहकने लगे तब पूरे तंत्र की निगरानी कैसे होती है।
हम इन्हें Cloudflare (Vectorize, Workers AI, D1) पर मूल्यांकन-हार्नेस के साथ बनाते हैं जो डिप्लॉय में जुड़े होते हैं, ताकि कोई गिरावट चुपचाप ख़राब होने के बजाय खुलकर विफल हो।
— और परिभाषाएँ
इसे सही ढंग से बनवाना या ठीक करवाना चाहते हैं?
दो पैराग्राफ़ में बताएं कि आप किस पर काम कर रहे हैं — हम एक कार्यदिवस के भीतर लिखित में जवाब देते हैं, इस सीधे उत्तर के साथ कि क्या हम मदद कर सकते हैं।