By दिव्यांशी भदौरिया | Jan 24, 2025
हाल ही में ओपनएआई ने अपना एआई एजेंट Operator लॉन्च किया है, जो कि यूजर्स के लिए वेब पर विभिन्न काम करता है। कंपनी के अनुसार, यह अपने ब्राउजर का प्रयोग कर सकते हैं। सबसे बड़ी खासियत यह है कि ओपनएआई का पहला ऐसा एआई एजेंट है जो स्वतंत्र रुप से कार्य कर सकता है यानी इसे किसी कमांड की जरुरत नहीं है। हालांकि, यह अभी रिसर्च प्रीव्यू के लिए लॉन्च किया गया है, इसका मतलब है कि इसमें अभी कुछ सीमाएं हैं और यह यूजर्स के फीडबैक के लिए खुला है।
Operator को विभिन्न प्रकार के रूटीन ब्राउजर कार्यों के लिए उपयोग किया जा सकता है। जैसे कि- फॉर्म फिल करना, ग्रॉसरी ऑर्डर करना और मीम्स बनाना। ओपनएआई का प्लान है कि इसे जल्द ही Plus, Team और Enterprise यूजर्स के लिए उपलब्ध कराया जाए और इसे भविष्य में ChatGPT में एकीकृत किया जाए। इतना ही नहीं, कंपनी ने ब्लॉग में बताया है कि यह GPT-4o की विजन क्षमताओं और एडवांस्ड रीजनिंग को रिइन्फोर्समेंट लर्निंग के माध्यम से जोड़ता है। यह ग्राफिकल यूजर इंटरफेस (GUI) जैसे बटन, मेन्यू और टेक्स्ट फील्ड, के साथ इंटरैक्ट करना सीखता है।
इसकी खासियत यह Operator स्क्रीनशॉट के जरिए ब्राइजर को 'देख' सकता है और माउस और कीबोर्ड एक्शन के जरिए इंटरैक्ट कर सकता है। इसके लिए कस्टम API इंटीग्रेशन की जरुरत नहीं होती। अगर Operator किसी समस्या या गलती का सामना करता है, तो यह अपने रीजनिंह एबिलिटीज का उपयोग करके खुद को सही कर सकता है।