ब्लुस्की र तपाईँको डेटा: एआई प्रशिक्षणको लागि तपाईँको पोस्टहरू प्रयोग होला ?
आजकल सामाजिक सञ्जालहरू एकदमै लोकप्रिय छन्। हरेक जना कुनै न कुनै प्लेटफर्ममा जोडिएका छौँ, आफ्ना भनाइ, विचार र अनुभवहरू शेयर गरिरहेका छौँ। तर, तपाईँलाई थाहा छ, तपाईँले शेयर गरेका त्यस्ता डेटाको भविष्य के होला ? हालै ब्लुस्की नामक सामाजिक सञ्जालले एउटा नयाँ प्रस्ताव ल्याएको छ, जसले धेरैको ध्यान खिचेको छ। यस प्रस्तावले तपाईँको डेटा कसरी प्रयोग हुन्छ भन्ने कुरामा केही नयाँ विकल्पहरू ल्याउन सक्छ।
ब्लुस्कीले के प्रस्ताव राख्यो ?
ब्लुस्कीले आफ्नो प्लेटफर्ममा पोस्ट गरिएका सामग्रीहरूलाई कसरी प्रयोग गर्ने भन्ने विषयमा प्रयोगकर्ताहरूलाई केही विकल्प दिने प्रस्ताव गरेको हो। यो प्रस्ताव अनुसार, तपाईँका पोस्टहरू र डेटा एआई (कृत्रिम बुद्धिमत्ता) प्रशिक्षण वा सार्वजनिक अभिलेखका लागि प्रयोग हुनसक्छन्। तर, तपाईँले चाहेमा यो अनुमति दिन वा नदिन सक्नुहुन्छ। यो प्रस्तावको बारेमा ब्लुस्कीका प्रमुख कार्यकारी अधिकृत (सीईओ) जे ग्रबरले पनि कुरा गरेका छन्। उहाँले भन्नुभयो, “हामी प्रयोगकर्ताहरूलाई यो कुराको जानकारी दिन र उनीहरूलाई नियन्त्रण दिन खोजिरहेका छौँ।” (TechCrunch) मा यस बारेमा समाचार प्रकाशित भएको छ।
किन यो विषय यति महत्वपूर्ण छ ?
अहिले धेरै कम्पनीहरू एआई बनाउनको लागि डेटा सङ्कलन गरिरहेका छन्। यसका लागि उनीहरूले इन्टरनेटबाट सार्वजनिक रूपमा उपलब्ध डेटा स्क्र्याप (scrape) गर्छन्। स्क्र्याप गर्नुको मतलब हो, वेबसाइटहरूबाट जानकारी निकाल्नु। ब्लुस्कीको नयाँ प्रस्ताव यस्तै स्क्र्यापिङलाई व्यवस्थित गर्न खोज्छ। उहाँले भन्नुभयो, “हामी एउटा नयाँ मापदण्ड ल्याउन खोजिरहेका छौँ, जसले डेटा कसरी प्रयोग हुनुपर्छ भन्ने कुरा स्पष्ट पार्छ।” यो कुरा वेबसाइटहरूले वेब क्रलरहरूलाई अनुमति दिनका लागि प्रयोग गर्ने robots.txt जस्तै हो। (Wikipedia मा robots.txt बारे जानकारी छ)
प्रयोगकर्ताहरूलाई कस्ता विकल्पहरू पाउँछन् ?
ब्लुस्कीको प्रस्ताव अनुसार, प्रयोगकर्ताहरूले आफ्नो सेटिङ्समा गएर निम्न कुराहरूका लागि अनुमति दिन वा नदिन सक्छन्:
- एआई प्रशिक्षण: तपाईँको डेटा एआई बनाउन प्रयोग हुन्छ की हुँदैन।
- प्रोटोकल ब्रिजिंग: तपाईँको डेटा अन्य सामाजिक सञ्जालहरूसँग जोड्न प्रयोग हुन्छ की हुँदैन।
- बल्क डेटासेट: तपाईँको डेटा ठूलो समूहमा सङ्कलन गरेर प्रयोग हुन्छ की हुँदैन।
- वेब अभिलेख: तपाईँको डेटा वेबमा जगेडा गर्न (archive) प्रयोग हुन्छ की हुँदैन। (जस्तै, इन्टरनेट आर्काइभको Wayback Machine)।
यदि तपाईँले एआई प्रशिक्षणको लागि अनुमति दिनुभएन भने, कम्पनीहरूले तपाईँको डेटा प्रयोग गर्न पाउँदैनन्।
सबैलाई यो प्रस्ताव मन पर्यो ?
यो प्रस्ताव आएपछि ब्लुस्कीका प्रयोगकर्ताहरूमा विभिन्न प्रकारका प्रतिक्रियाहरू आएका छन्। कसैले यसलाई स्वागत गरेका छन्, तर कसैले यसको विरोध पनि गरेका छन्। केही प्रयोगकर्ताहरूले चिन्ता व्यक्त गर्दै भने, “ब्लुस्कीले पहिले त भन्थे उनीहरू प्रयोगकर्ताको डेटा विज्ञापनकर्ताहरूलाई बेचैनन् र एआई बनाउन प्रयोग पनि गर्दैनन्। तर, अहिले यो प्रस्ताव ल्याउनुको मतलब उनीहरू आफ्नो कुराबाट पछि हटिरहेका छन्।” (Bluesky मा यो प्रतिक्रिया पोस्ट गरिएको छ)।
तर, ब्लुस्कीका सीईओ जे ग्रबरले यस कुरालाई स्पष्ट पारेर भन्नुभयो, “जनरेटिभ एआई (generative AI) कम्पनीहरूले पहिले नै इन्टरनेटमा भएका सार्वजनिक डेटा स्क्र्याप गरिरहेका छन्, र ब्लुस्की पनि त्यसमा समावेश छ। त्यसैले हामी यो स्क्र्यापिङलाई व्यवस्थित गर्न खोजिरहेका छौँ।”
विशेषज्ञहरूले के भन्छन् ?
मोली व्हाइट, जो ‘Quotation Wanted’ नामक न्यूजलेटर लेख्छन्, ले यो प्रस्तावलाई “राम्रो” भनेर संज्ञा दिएकी छिन्। उहाँ भन्नुहुन्छ, “यो प्रस्तावले प्रयोगकर्ताहरूलाई आफ्नो डेटाको नियन्त्रण दिन प्रयास गर्छ। तर, यो पूर्ण रूपमा प्रभावकारी हुन्छ भन्ने छैन, किनकि धेरै कम्पनीहरूले robots.txt को नियमहरू पनि मान्दैनन्।” (Bluesky मा उहाँको प्रतिक्रिया हेर्न सक्नुहुन्छ)।
यो प्रस्तावको भविष्य के होला ?
ब्लुस्कीको यो प्रस्ताव अहिले छलफलमा छ। यदि यो प्रस्ताव लागू हुन्छ भने, सामाजिक सञ्जालमा डेटाको गोपनीयता र प्रयोगको बारेमा एउटा नयाँ मापदण्ड स्थापित हुन सक्छ। तर, यो कुरामा ध्यान दिनु जरुरी छ कि यो प्रस्तावले डेटा स्क्र्यापिङलाई पूर्ण रूपमा रोक्न सक्दैन। यसले केवल प्रयोगकर्ताहरूलाई आफ्नो डेटा कसरी प्रयोग हुन्छ भन्ने कुरामा जानकारी दिन र छनोट गर्न सक्ने अवसर दिन्छ।
तपाईँको लागि के हो ?
तपाईँले ब्लुस्की प्रयोग गर्नुहुन्छ भने, यो प्रस्ताव तपाईँको लागि धेरै महत्त्वपूर्ण छ। यो प्रस्ताव लागू भएपछि, तपाईँले आफ्नो डेटाको प्रयोग बारे निर्णय लिन सक्नुहुन्छ। यदि तपाईँलाई आफ्नो डेटा एआई प्रशिक्षणका लागि प्रयोग गर्न मन छैन भने, तपाईँले त्यसलाई अस्वीकार गर्न सक्नुहुन्छ।
निष्कर्ष
ब्लुस्कीले ल्याएको यो प्रस्ताव सामाजिक सञ्जालमा डेटाको गोपनीयता र प्रयोगको बारेमा एउटा महत्वपूर्ण बहस सुरु गरेको छ। यो प्रस्तावले प्रयोगकर्ताहरूलाई अधिक नियन्त्रण दिन सक्ने सम्भावना बोकेको छ, तर यसको प्रभावकारिता कति हुन्छ भन्ने कुरा भविष्यमै थाहा हुन्छ।
स्रोतहरू:
- TechCrunch
- Wikipedia
- Bluesky
- Bluesky
- Bluesky GitHub प्रस्ताव को बारेमा जानकारी।
यो लेखमा ब्लुस्कीको प्रस्तावको बारेमा जानकारी दिइएको छ। तपाईंको डेटाको गोपनीयतालाई ध्यानमा राख्दै यो प्रस्तावले केही नयाँ विकल्पहरू ल्याउन सक्छ।