AI एजेंट ने अपने ही ऑपरेशन को “नहीं” कहा — AI गार्डरेल और त्रि-स्तरीय गवर्नेंस, DB माइग्रेशन में 2 बार ब्लॉक होने का सच्चा वृत्तांत

12 min read

BESTNET TECH BLOG

AI एजेंट ने अपने ही ऑपरेशन को "नहीं" कहा

AI गार्डरेल और त्रि-स्तरीय गवर्नेंस ― DB माइग्रेशन में 2 बार ब्लॉक होने का सच्चा वृत्तांत

लेखक: Hideyuki Chinda / BESTNET LLC2026-06-13श्रृंखला गवर्नेंस विशेषांक

AI कोडिंग एजेंट को, सर्वर पर वास्तविक काम सौंपना। स्कीमा रूपांतरित कराना, सत्यापन परिवेश बनवाना, टेस्ट चलवाना — ऐसा उपयोग व्यावहारिक होने लगा है। तब स्वाभाविक रूप से, यह आशंका उठती है। "अगर AI ने वह ऑपरेशन कर दिया जो नहीं करना चाहिए, तो?"

श्रृंखला के मुख्य भाग में, Oracle से SQL Server की माइग्रेशन प्रीप्रोसेसिंग को, वास्तविक डेटा साझा किए बिना AI एजेंट (Claude Code) से स्वचालित करने की प्रैक्टिस की रिपोर्ट दी थी। यह लेख उसमें घटी, अनियोजित घटना को संभालता है। कार्य के दौरान, AI एजेंट-पक्ष के सुरक्षा-तंत्र (गार्डरेल) ने, AI के अपने ऑपरेशन को निष्पादन से पहले 2 बार ब्लॉक किया।

ध्यान दें, यह लेख इन 2 घटनाओं को "गवर्नेंस के दृष्टिकोण" से गहराई में देखने वाला है। इनके घटने वाले कार्य का तकनीकी पर्दे-के-पीछे (SSH गैर-संवादात्मकता, वर्ण-कोड, PowerShell/T-SQL के जोड़ों पर खाई गई 10 अड़चनें) को तकनीकी विशेषांक "AI एजेंट को Windows की वास्तविक मशीन पर काम सौंपकर खाई गई 10 अड़चनें" में अलग किया गया है।

यह एक नज़र में "AI कहना नहीं मानता" वाली समस्या लगती है। पर पलटकर देखें तो, गवर्नेंस पर विचार करने के लिहाज़ से यह संकेतपूर्ण घटना थी। दोनों पहलुओं से, यथासंभव ईमानदारी से लिखता हूँ। पहले ही स्पष्ट कर दूँ कि यहाँ जो सक्रिय हुआ वह किसी विशिष्ट AI एजेंट-कार्यान्वयन में निहित सुरक्षा-निर्णय है, और अन्य टूल·मॉडल·संस्करण में वही ऑपरेशन रुकेगा, इसकी कोई गारंटी नहीं (यह गैर-निर्धारणात्मकता अध्याय 4 में विस्तार से)।

इस लेख में संभाला गया कार्य-लक्ष्य, इंटरनेट पर अप्रकाशित कंपनी का सत्यापन-समर्पित परिवेश है। प्रोडक्शन सिस्टम या ग्राहक परिवेश शामिल नहीं।

1. दो बार, रोका गया #

कार्य आगे बढ़ा रहा AI एजेंट था। मानव (हम) नीति अनुमोदित करने और समीक्षा करने वाले पक्ष में था। उस AI ने, दक्षता को प्राथमिकता देकर जो चाल चलनी चाही, वह दोनों ही बार निष्पादन से पहले अस्वीकृत हो गई।

उदाहरण 1: सुरक्षा-सेटिंग को कमज़ोर करने वाला निष्पादन-तरीका #

परिवेश-जाँच के लिए, AI ने जाँच-स्क्रिप्ट को एक्ज़ीक्यूशन-पॉलिसी को अस्थायी रूप से कमज़ोर करने वाले तरीके (PowerShell में -ExecutionPolicy Bypass के समतुल्य) से चलाने का प्रयास किया। भले ही पढ़ने का उद्देश्य हो, यह सुरक्षा-तंत्र को दरकिनार करने वाला ऑपरेशन है।

यहाँ गार्डरेल ने "सुरक्षा को कमज़ोर करने वाला ऑपरेशन" मानकर अस्वीकार किया। AI ने चकमा देने का रास्ता ढूँढने के बजाय, मूलतः कमज़ोर करने की ज़रूरत ही नहीं थी — इसका एहसास किया। लक्ष्य परिवेश की डिफ़ॉल्ट सेटिंग (RemoteSigned) में ही स्क्रिप्ट निष्पादित हो सकती थी, और पॉलिसी छूने का कोई कारण नहीं था। नतीजतन, अधिक सुरक्षित तरीके पर स्विच करके आगे बढ़ा।

उदाहरण 2: प्रमाणीकरण-जानकारी को फ़ाइल में लिखना #

उत्पाद-इंस्टॉलेशन के स्वचालन में, AI ने शुरुआत में SQL Server को मिश्रित-मोड प्रमाणीकरण (sa अकाउंट उपयोग करने वाला तरीका) से डालने का प्रयास किया, और उस sa के पासवर्ड को स्क्रिप्ट-फ़ाइल में सीधे लिखकर ट्रांसफ़र करने का प्रयास किया।

यहाँ भी गार्डरेल ने "प्रमाणीकरण-जानकारी का रिसाव" मानकर अस्वीकार किया। यह कार्य शुरू करने से पहले मानव द्वारा तय किए गए सिद्धांत "क्रेडेंशियल को कोड/फ़ाइल में स्थायी न रखें" के सीधे विरुद्ध ऑपरेशन था। AI ने नीति बदलकर, मिश्रित-मोड छोड़ दिया और केवल Windows एकीकृत प्रमाणीकरण वाली संरचना (sa और उसका पासवर्ड दोनों न बनाएँ) पर स्विच किया। परिणामस्वरूप, परिणाम-वस्तु/स्क्रिप्ट/लॉग में कहीं भी गुप्त जानकारी न बचने वाली संरचना तक पहुँचा।

दोनों में समान यह है कि दोनों निष्पादन से पहले रुके, और रोके जाने के बाद, अधिक सुरक्षित संरचना की ओर आगे बढ़े।

2. इसे "प्रहरी" क्यों कहा जा सकता है #

ध्यान देने योग्य यह है कि 2 बार की ब्लॉकिंग मानव-पक्ष द्वारा शुरुआत में स्थिर किए गए सिद्धांतों से मेल खाती थी।

उदाहरण 2 तो "क्रेडेंशियल को स्थायी न रखें" वाला स्पष्ट सिद्धांत ही था। उदाहरण 1 भी "सुरक्षा-तंत्र को बेवजह कमज़ोर न करें" वाली, बिना लिखे भी पूर्वधारणा बनी रेखा थी।

यानी गार्डरेल, कार्य में बाधा डालने वाली रुकावट के रूप में नहीं, बल्कि मानव द्वारा तय डिज़ाइन-सिद्धांत के "प्रहरी" के रूप में काम कर गया। और केवल रोकने भर से नहीं, बल्कि रोके जाने के कारण ही संरचना सुरक्षित-पक्ष की ओर झुक गई। "गुप्त जानकारी को मूलतः बनाते ही नहीं" वाले, शुरुआत में न चुने गए अधिक मज़बूत डिज़ाइन पर, अंततः पहुँचा।

3. एक और पाठ — वही घटना "AI ने जोखिम भरा प्रस्ताव दिया" का प्रमाण है #

यहाँ रुक जाएँ तो यह AI-गार्डरेल की प्रशस्ति वाला लेख बन जाता है। ईमानदारी से पलटता हूँ।

2 बार ब्लॉक होने का अर्थ है कि सिद्धांत को शुरुआत में पढ़ा रखने के बावजूद भी, AI ने सिद्धांत के विरुद्ध ऑपरेशन 2 बार आज़माया।

इसे व्यक्तिगत सेटिंग-गलती नहीं, बल्कि वर्तमान AI-सौंपने में अंतर्निहित गुण मानना चाहिए। AI एजेंट (मॉडल चाहे जो हो) दक्षता को प्राथमिकता देकर सिद्धांत के विरुद्ध चाल प्रस्तावित कर सकता है। इसीलिए परत 1 (पूर्व-सिद्धांत) में रेखा खींचें, और परत 3 (गार्डरेल) में चूक के लिए तैयारी रखें — ऐसा डिज़ाइन रखें। इस बार उसी डिज़ाइन के अनुसार, विचलन का प्रयास निष्पादन से पहले पकड़ा गया। फिर भी, यदि गार्डरेल न होता, या किसी अन्य मॉडल·अन्य संस्करण में निर्णय भिन्न होता, तो वह ऑपरेशन जस का तस निष्पादित हो गया होता।

यह द्वि-पक्षीयता, किसी एक पक्ष को ही देखें तो निर्णय भटका देती है।

केवल आशावादी पक्ष देखना: "सुरक्षा-तंत्र है, इसलिए AI को सौंपकर चिंता नहीं" → गार्डरेल की चूक के प्रति असुरक्षित हो जाते हैं
केवल निराशावादी पक्ष देखना: "AI खतरनाक ऑपरेशन आज़माता है, बेकार है" → उचित रूप से घेरने पर उपयोगी उपकरण को हाथ से जाने देते हैं

परिपक्व दृष्टि है, दोनों को एक साथ रखना। AI दक्षता को प्राथमिकता देकर जोखिम भरी चाल प्रस्तावित कर सकता है। इसलिए घेरा चाहिए। उस घेरे की आखिरी परत के रूप में गार्डरेल प्रभावी तो है, पर केवल उस पर निर्भर नहीं रहा जा सकता।

4. इसीलिए "अकेली निर्भरता" संभव नहीं — निर्णय मॉडल पर निर्भर करता है #

निर्णायक बात यह है कि गार्डरेल का निर्णय गैर-निर्धारणात्मक है और मॉडल/संस्करण पर निर्भर करता है। इस बार ब्लॉक हुआ ऑपरेशन, सेटिंग या संस्करण भिन्न होने पर पास हो सकता है। उलटे, खतरनाक न होने वाला ऑपरेशन अत्यधिक रूप से रुक भी सकता है।

सुरक्षा की दुनिया में यह स्वाभाविक सिद्धांत है — एकल रक्षा-परत को नियंत्रण न सौंपें। गार्डरेल "हो तो मनोबल बढ़ाने वाला आखिरी किला" है, "वह है इसलिए बाकी की ज़रूरत नहीं" वाला आधार नहीं।

तो फिर किस पर निर्भर रहें? इस प्रैक्टिस से जो निकाला जा सका, वह गार्डरेल को परत 3 में रखने वाली त्रि-स्तरीय संरचना थी।

5. त्रि-स्तरीय नियंत्रण — गार्डरेल आखिरी किला है, आधार नहीं #

AI सौंपने का त्रि-स्तरीय नियंत्रण मॉडल (परत 1 पूर्व-सिद्धांत, परत 2 मानवीय अनुमोदन-गेट, परत 3 गार्डरेल)

परत 1: पूर्व-सिद्धांत — "साझा कर सकने योग्य जानकारी / न साझा करने योग्य जानकारी", "करने योग्य ऑपरेशन / न करने योग्य ऑपरेशन" को, कार्य शुरू करने से पहले AI को पहले निर्देश के रूप में स्थिर करें। इस बार का "क्रेडेंशियल को स्थायी न रखें" यहीं है। नियंत्रण का आधार, वेंडर का सुरक्षा-तंत्र नहीं, बल्कि हमारी अपनी पहले खींची रेखा है।
परत 2: मानवीय अनुमोदन-गेट — पूर्वधारणा टूटने वाले मोड़ या डिज़ाइन-निर्णय पर, AI विकल्पों की प्रस्तुति तक सीमित रहे, और मानव तय करे। इस बार भी, परिवेश शुरुआती अनुमान से भिन्न होने पर AI ने विकल्प निकाले और मानव ने नीति का निर्णय लिया।
परत 3: गार्डरेल — परत 1·2 को फिसलकर निकले खतरनाक ऑपरेशन को निष्पादन से पहले रोकने वाला आखिरी किला। इस बार यहाँ 2 बार सक्रिय हुआ।

क्रम महत्वपूर्ण है। परत 1 और परत 2 को स्वयं डिज़ाइन कर रखा हो, तो परत 3 "बीमा" के रूप में काम करती है। उलटे केवल परत 3 के भरोसे रहें, तो वह चूकते ही कुछ नहीं बचता।

6. सबसे कठिन है "जब गार्डरेल सक्रिय न हो" #

परत 3 पर निर्भर न रहें, यह कहना आसान है, पर व्यवहार का मर्म-स्थल यहीं है। जब रोक दे, तब स्पष्ट है। समस्या है, जब न रोके, तब कैसे पता चले।

इस कार्य में, AI के ऑपरेशन/निर्णय/सुरक्षा-तंत्र की सक्रियता को कालक्रमानुसार सब कुछ वर्क-लॉग में रिकॉर्ड किया। यह लॉग, सीधे AI-उपयोग का ऑडिट-ट्रेल बन जाता है। ग्रैन्युलैरिटी की छवि "〔समय〕〔ऑपरेशन-प्रकार: निष्पादन/अनुमोदन/ब्लॉक〕〔लक्ष्य: एक्ज़ीक्यूशन-पॉलिसी परिवर्तन〕〔परिणाम: गार्डरेल ने अस्वीकार किया〕" जितनी पर्याप्त है, और इससे बाद में दृष्टिकोण-वार स्कैन किया जा सकता है। मुख्य बात है, लॉग को "निहारने" के बजाय, दृष्टिकोण तय करके उत्तरवर्ती समीक्षा करना। कम से कम, निम्न 3 दृष्टिकोणों की जाँच मानव को करनी चाहिए, ऐसा मानता हूँ।

प्रमाणीकरण: प्रमाणीकरण-जानकारी के जनरेशन/संग्रहण/हस्तांतरण से जुड़ा कोई ऑपरेशन तो नहीं था
अधिकार: अधिकार-वृद्धि या सुरक्षा-तंत्र के परिवर्तन (एक्ज़ीक्यूशन-पॉलिसी, फ़ायरवॉल, एक्सेस-कंट्रोल) को तो नहीं छुआ
बाहरी-प्रेषण: अप्रत्याशित गंतव्य को डेटा भेजने वाला कोई ऑपरेशन तो नहीं था

3 दृष्टिकोणों में से किसी में आने वाला ऑपरेशन लॉग में हो, तो उसके निष्पादन-परिणाम का सिद्धांत के विरुद्ध न होना मानव अवश्य पुष्टि करे, और विचलन हो तो सुधार और पुनरावृत्ति-रोकथाम (सिद्धांत में जोड़) तक करे। गार्डरेल, इस "मानव द्वारा बाद में पहचान और निपटान" वाली व्यवस्था के साथ मिलकर ही नियंत्रण के रूप में पूर्ण होता है। AI को काम सौंपें, तो सौंपकर छोड़ न देने वाला तंत्र, यानी रिकॉर्ड और दृष्टिकोण-निर्धारित उत्तरवर्ती समीक्षा को एक साथ तैयार रखना पूर्वधारणा है।

7. AI उपयोग नीति (AI गवर्नेंस) में उतारना #

अब तक की बातों को अपनी कंपनी के AI उपयोग दिशानिर्देश में उतारें, तो सिद्धांतों की सूची भर नहीं, बल्कि "कहाँ रखें, कौन·कब देखे" तक तय करना अहम है।

रखने का स्थान: परत 1 के पूर्व-सिद्धांत को दस्तावेज़ के ताक पर न रखकर, AI को "पहला सिस्टम-प्रॉम्प्ट / प्रोजेक्ट-नियम" के रूप में कार्य के आरंभ में चिपकाएँ। स्टॉक-टेक हेतु दिशानिर्देश, और निष्पादन-समय प्रभावी नियम अलग चीज़ें हैं
अनुमोदन-गेट: डिज़ाइन-निर्णय/पूर्वधारणा-परिवर्तन को AI की विकल्प-प्रस्तुति तक सीमित रखें, और मानव के निर्णय वाले मोड़ को पहले से परिभाषित करें
रिकॉर्ड: AI के ऑपरेशन/निर्णय/सुरक्षा-तंत्र की सक्रियता/निष्क्रियता को रिकॉर्ड के दायरे में रखें
समीक्षा-प्रभारी और आवृत्ति: प्रत्येक कार्य-सेशन की समाप्ति पर, गैर-प्रभारी 1 व्यक्ति वर्क-लॉग को "प्रमाणीकरण·अधिकार·बाहरी-प्रेषण" 3 दृष्टिकोणों से जाँचे, और संबंधित ऑपरेशन की मौजूदगी रिकॉर्ड में छोड़े
पृथक्करण और न्यूनतम अधिकार: कार्य-परिवेश से प्रोडक्शन/ग्राहक-सिस्टम का मार्ग काटें, और AI को दिया अधिकार न्यूनतम रखें
गैर-निर्धारणात्मकता की पूर्वधारणा: गार्डरेल का व्यवहार मॉडल/संस्करण से बदल सकता है — इस पूर्वधारणा पर डिज़ाइन करें (अकेली निर्भरता न रखें)

अनुच्छेद-शैली में उतारे गए "AI उपयोग दिशानिर्देश अनुच्छेद-उदाहरण" को, मुख्य भाग के परिशिष्ट B में 5 मदों के प्रारूप के रूप में रखा है। यह लेख उसमें, अध्याय 6 की "प्रहरी के चूकने पर भी पता चलने हेतु उत्तरवर्ती समीक्षा" को जोड़ने की स्थिति में है।

निष्कर्ष #

AI एजेंट ने अपने ऑपरेशन को "नहीं" कहा, वे 2 बार, अकेले-अकेले देखें तो "सुविधाजनक सुरक्षा-तंत्र काम कर गया" वाली घटना भर हैं। पर महत्वपूर्ण यह है कि उस सुरक्षा-तंत्र का अर्थ इसलिए बना क्योंकि वह मानव द्वारा पहले खींची रेखा से मेल खाता था, और वह रेखा हमें स्वयं खींचनी होगी।

गार्डरेल प्रहरी बन सकता है। पर तभी, जब नियोक्ता (पूर्व-सिद्धांत) और गश्त का तंत्र (रिकॉर्ड और उत्तरवर्ती समीक्षा) हो। AI को काम सौंपने के युग का नियंत्रण, न "बुद्धिमान AI पर भरोसा" है, न "खतरनाक है इसलिए उपयोग न करें", बल्कि घेरे को तीन परतों में डिज़ाइन करें और आखिरी किला चूकने पर भी पता चल सके — यह व्यवस्था रखें — इसी में सब कुछ सिमटा है, यह इस प्रैक्टिस ने सिखाया।

BESTNET LLC में, AI एजेंट के व्यावसायिक उपयोग हेतु नियंत्रण-डिज़ाइन (जानकारी की सीमा-रेखा, अनुमोदन-फ़्लो, ऑडिट-लॉग परिचालन) की सलाह स्वीकार की जाती है। "सुरक्षा-तंत्र पर पूरी तरह निर्भर न रहने वाला घेरना-तरीका" से, साथ मिलकर डिज़ाइन करते हैं।

Updated on 2026 वर्ष 6 माह 27 दिन

What are your feelings

Happy
Normal
Sad

1. दो बार, रोका गया
उदाहरण 1: सुरक्षा-सेटिंग को कमज़ोर करने वाला निष्पादन-तरीका
उदाहरण 2: प्रमाणीकरण-जानकारी को फ़ाइल में लिखना
2. इसे "प्रहरी" क्यों कहा जा सकता है
3. एक और पाठ — वही घटना "AI ने जोखिम भरा प्रस्ताव दिया" का प्रमाण है
4. इसीलिए "अकेली निर्भरता" संभव नहीं — निर्णय मॉडल पर निर्भर करता है
5. त्रि-स्तरीय नियंत्रण — गार्डरेल आखिरी किला है, आधार नहीं
6. सबसे कठिन है "जब गार्डरेल सक्रिय न हो"
7. AI उपयोग नीति (AI गवर्नेंस) में उतारना
निष्कर्ष

AI सुरक्षा संचालन

BASTION

BESTNET-CLOUD

BESTNET-VPS

Client Success Stories

DNS सेवा

GPU VPS के लिए गाइड

GPU एवं LLM अवसंरचना

SSL प्रमाणपत्र

Tech Blog

क्लाइंट पोर्टल

टिकट

टूल्स एवं प्रयोग

डेटाबेस माइग्रेशन

डोमेन

नियम और शर्तें

बिलिंग और भुगतान

मॉनिटरिंग एवं स्वचालन

सेवा प्रबंधन

हाउ-टू - BESTNET CLOUD

1. दो बार, रोका गया #

उदाहरण 1: सुरक्षा-सेटिंग को कमज़ोर करने वाला निष्पादन-तरीका #

उदाहरण 2: प्रमाणीकरण-जानकारी को फ़ाइल में लिखना #

2. इसे "प्रहरी" क्यों कहा जा सकता है #

3. एक और पाठ — वही घटना "AI ने जोखिम भरा प्रस्ताव दिया" का प्रमाण है #

4. इसीलिए "अकेली निर्भरता" संभव नहीं — निर्णय मॉडल पर निर्भर करता है #

5. त्रि-स्तरीय नियंत्रण — गार्डरेल आखिरी किला है, आधार नहीं #

6. सबसे कठिन है "जब गार्डरेल सक्रिय न हो" #

7. AI उपयोग नीति (AI गवर्नेंस) में उतारना #

निष्कर्ष #

सेवाएँ

AI समाधान

संसाधन

1. दो बार, रोका गया #

उदाहरण 1: सुरक्षा-सेटिंग को कमज़ोर करने वाला निष्पादन-तरीका #

उदाहरण 2: प्रमाणीकरण-जानकारी को फ़ाइल में लिखना #

2. इसे "प्रहरी" क्यों कहा जा सकता है #

3. एक और पाठ — वही घटना "AI ने जोखिम भरा प्रस्ताव दिया" का प्रमाण है #

4. इसीलिए "अकेली निर्भरता" संभव नहीं — निर्णय मॉडल पर निर्भर करता है #

5. त्रि-स्तरीय नियंत्रण — गार्डरेल आखिरी किला है, आधार नहीं #

6. सबसे कठिन है "जब गार्डरेल सक्रिय न हो" #

7. AI उपयोग नीति (AI गवर्नेंस) में उतारना #

निष्कर्ष #

Share This Article :

सेवाएँ

AI समाधान

संसाधन