in

ओपनएआई पूर्व-सीटीओ मीरा मुराती की थिंकिंग मशीन लैब ने एआई संवाद जैसे अधिक मानवीय के लिए इंटरेक्शन मॉडल पेश किए |

पिछले दो वर्षों से, एआई क्रांति ने ज्यादातर वॉकी-टॉकी की तरह काम किया है। आप कुछ पूछें. एआई रुकता है, सुनता है, सोचता है और अंततः उत्तर देता है। फिर यह फिर इंतजार करता है. चाहे आप ChatGPT, जेमिनी, क्लाउड, या ग्रोक का उपयोग कर रहे हों, आज लगभग हर मुख्यधारा का टूल इस “टर्न-आधारित” मॉडल का अनुसरण करता है। मनुष्य पहले बोलते हैं, मशीनें बाद में प्रतिक्रिया देती हैं।
लेकिन सिलिकॉन वैली के कुछ सबसे बड़े एआई खिलाड़ियों का मानना ​​है कि दृष्टिकोण पहले से ही पुराना लगने लगा है।

थिंकिंग मशीन्स लैब, पूर्व ओपनएआई सीटीओ मीरा मुराती द्वारा स्थापित एआई स्टार्टअप ने एक झलक पेश की है कि आगे क्या हो सकता है: सिस्टम को न केवल संकेतों का जवाब देने के लिए डिज़ाइन किया गया है, बल्कि उपयोगकर्ताओं के साथ लगातार जुड़े रहने के लिए, निर्देशों की प्रतीक्षा कर रहे चैटबॉट की तुलना में चल रही बातचीत में एक सहयोगी की तरह।

सोमवार को, मुराती के स्टार्टअप ने “इंटरैक्शन मॉडल” के बारे में विवरण प्रकाशित किया। ये एआई सिस्टम हैं जो बातचीत जारी रहने के दौरान वास्तविक समय में जानकारी सुनने, देखने और संसाधित करने में सक्षम हैं।

व्यावहारिक रूप से, महत्वाकांक्षा एआई को कम मशीनी और अधिक मानवीय महसूस कराने की है।

टर्न-आधारित एआई से परे बदलाव

यह विचार वृद्धिशील लग सकता है, लेकिन शोधकर्ताओं का कहना है कि यह मानव-मशीन संपर्क की प्रकृति को बदल देता है।

आज के AI उपकरण क्रमिक रूप से काम करते हैं। एक उपयोगकर्ता बोलता है या टाइप करता है, मॉडल अनुरोध को संसाधित करता है, और उसके बाद ही प्रतिक्रिया देता है। थिंकिंग मशीनें उन प्रणालियों के साथ प्रयोग कर रही हैं जो 200-मिलीसेकंड के छोटे टुकड़ों में लगातार बातचीत की प्रक्रिया करती हैं, जिससे एआई को प्रतिक्रिया करने की अनुमति मिलती है जबकि कोई अभी भी बोल रहा है।

यह रुकावटों, प्रासंगिक प्रतिक्रियाओं और बातचीत के संकेतों सहित अधिक प्राकृतिक अंतःक्रियाओं का द्वार खोलता है जिनका मनुष्य सहज रूप से उपयोग करते हैं।

एआई शिक्षक और द कटिंग एज ग्रुप के संस्थापक अंश मेहरा का कहना है कि वास्तविक सफलता केवल कम विलंबता नहीं है। कम विलंबता एक कंप्यूटिंग सिस्टम या नेटवर्क की न्यूनतम देरी के साथ प्रतिक्रिया प्रदान करने की क्षमता है।

उन्होंने एनडीटीवी को बताया, “उनकी सबसे बड़ी उपलब्धि नई रीयल-टाइम इंटरेक्शन प्रणाली है, जो केवल एक साथ जुड़े व्यक्तिगत घटकों का एक समूह नहीं है; यह दो-तरफ़ा आदान-प्रदान के लिए बनाया गया एक मूलभूत मॉडल है।”

मेहरा का तर्क है कि वर्तमान एआई सिस्टम बातचीत के दौरान मूल रूप से मनुष्यों से अलग व्यवहार करते हैं। “बातचीत में अधिकांश लोग वास्तव में सुन नहीं रहे हैं, वे बस जवाब देने के लिए अपनी बारी का इंतजार कर रहे हैं। जब हम किसी इंसान से बात करते हैं, तो वे राय बनाने के लिए मेरे वाक्य के खत्म होने का इंतजार नहीं कर रहे हैं। वर्तमान एआई उपकरण जो हम उपयोग करते हैं वे बारी-बारी के आधार पर काम करते हैं। वे मेरे पूरे अनुरोध के समाप्त होने का इंतजार करते हैं, उस पर कार्रवाई करते हैं और फिर उसके बारे में सोचते हैं।”

उनका कहना है कि इंटरेक्शन मॉडल निर्णय की अधिक तरल शैली की नकल करने का प्रयास करते हैं। “जब आप बात कर रहे हों तो यह मॉडल सोच और देख सकता है, जो अगर आप इसके बारे में सोचते हैं तो अविश्वसनीय रूप से शक्तिशाली है। एक बार जब आप डेमो देखेंगे, तो आप खुद से पूछेंगे कि यह सुविधा पहले दिन से अनिवार्य क्यों नहीं थी।”

एआई जो बातचीत के बीच में आपकी बात स्वीकार कर लेता है

अधिक सूक्ष्म परिवर्तनों में से एक में कुछ ऐसा शामिल है जिसे शोधकर्ता “बैकचैनलिंग” कहते हैं, जो कि बातचीत के दौरान मनुष्य द्वारा लगातार की जाने वाली छोटी स्वीकृतियां हैं, जैसे सिर हिलाना, “मिमी-हम्म” कहना, या जब कोई दूसरा व्यक्ति बोल रहा हो तो संक्षेप में प्रतिक्रिया करना।

थिंकिंग मशीन पूर्वावलोकन इस व्यवहार के शुरुआती लक्षण प्रदर्शित करता प्रतीत होता है। मेहरा ने कहा, “मॉडल बैकचैनलिंग की झलक भी दिखाता है, जो मानवीय सिर हिलाने और सहमति देने की क्षमता है।” “ये वृद्धिशील परिवर्तन फ़ंक्शन में वृद्धि नहीं करते हैं बल्कि एआई के स्वरूप को महत्वपूर्ण रूप से आकार देते हैं।”

व्यापक निहितार्थ यह है कि एआई सिस्टम न केवल सटीकता के लिए, बल्कि उपस्थिति के लिए भी तेजी से अनुकूलित हो सकता है, जिससे बातचीत सहज, अधिक प्रतिक्रियाशील और भावनात्मक रूप से सहज महसूस हो सकती है।

‘दोहरी-मस्तिष्क’ वास्तुकला

इसे संभव बनाने के लिए, कंपनी दो-परत वास्तुकला का वर्णन करती है। एक परत – इंटरेक्शन मॉडल, वास्तविक समय के आदान-प्रदान, रुकावटों और तत्काल प्रतिक्रियाओं को संभालने वाले एक तेज़ संवादी इंजन के रूप में कार्य करता है। दूसरा पृष्ठभूमि तर्क मॉडल पर्दे के पीछे भारी विश्लेषणात्मक कार्य करता है।

संरचना सजगता और गहन तर्क के बीच एक विभाजन जैसा दिखता है जहां एक प्रणाली बातचीत को प्रवाहित रखती है जबकि दूसरी अधिक कम्प्यूटेशनल रूप से गहन सोच को संभालती है।

यह भारत में क्यों मायने रख सकता है?

निहितार्थ भारत जैसे देशों में विशेष रूप से महत्वपूर्ण हो सकते हैं, जहां वॉयस-फर्स्ट इंटरनेट का उपयोग व्यापक है और लाखों उपयोगकर्ता अभी भी पहली बार एआई पारिस्थितिकी तंत्र में प्रवेश कर रहे हैं।

वर्तमान एआई सिस्टम अभी भी प्रभावी संकेतन पर बहुत अधिक निर्भर हैं, जिसका अर्थ है कि यह जानना महत्वपूर्ण है कि अनुरोधों को स्पष्ट रूप से कैसे तैयार किया जाए। रीयल-टाइम वार्तालाप प्रणालियाँ उस बाधा को काफी हद तक कम कर सकती हैं, विशेष रूप से उपयोगकर्ताओं के लिए टाइपिंग की तुलना में बोलना अधिक आरामदायक है।

लगातार बातचीत में हिंदी, बंगाली, तमिल या अन्य भारतीय भाषाओं को स्वाभाविक रूप से संभालने में सक्षम एक एआई सहायक अंततः छात्रों, छोटे व्यवसाय मालिकों और पहली बार इंटरनेट उपयोगकर्ताओं के लिए डिजिटल सिस्टम को अधिक सुलभ बना सकता है।

बड़ा बदलाव जितना दार्शनिक है उतना ही तकनीकी भी। दशकों तक, इंसानों ने कमांड टाइप करना, कुशलतापूर्वक खोज करना और संकेतों को तैयार करना सीखकर खुद को मशीनों के अनुरूप ढाल लिया। इंटरेक्शन मॉडल से पता चलता है कि उद्योग अब मशीनों को मानव व्यवहार के लिए अधिक स्वाभाविक रूप से अनुकूलित करके उस समीकरण को उलटने की कोशिश कर रहा है।

चेतावनियाँ बनी हुई हैं

उत्साह के बावजूद, मेहरा ने चेतावनी दी है कि प्रौद्योगिकी के आसपास के कई दावों को स्वतंत्र रूप से सत्यापित करना मुश्किल है क्योंकि सिस्टम अभी भी केवल एक शोध पूर्वावलोकन है। उन्होंने कहा, “एपीआई एक्सेस के माध्यम से कोई भी वास्तव में इन आश्चर्यजनक दावों को मान्य नहीं कर सकता है।”

उन्होंने एआई की लगातार तकनीकी सीमाओं में से एक की ओर भी इशारा किया: लंबी बातचीत। “लंबे सत्र अभी भी अनसुलझे हैं क्योंकि जैसे-जैसे आप अधिक बोलते हैं, संदर्भ फूल जाता है और एआई भ्रमित होने लगता है।”

फिर भी, उनका मानना ​​है कि प्रक्षेप पथ स्पष्ट है। “जब एक बच्चे को दुनिया से परिचित कराया जाता है, तो उसे पहले बोलना और देखना सिखाया जाता है, और फिर कौशल विकसित करना सिखाया जाता है। एआई के निर्माण के लिए हमारा रास्ता ठीक उसी पैटर्न की नकल करने की कोशिश कर रहा है।”

और अनसुलझे चुनौतियों के बावजूद, मेहरा कहते हैं कि सुधार की गति आश्चर्यजनक बनी हुई है। “यह एआई का नवीनतम सबसे खराब संस्करण है जिसे हम कभी देखेंगे।” दूसरे शब्दों में, आज के एआई सिस्टम – पहले से ही जितने शक्तिशाली लगते हैं – जल्द ही आने वाले समय की तुलना में आदिम दिख सकते हैं।


Written by Chief Editor

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

Loading…

0

डीजेआई रोमो 2, रोमो ए2 रोबोट वैक्यूम क्लीनर 36,000Pa सक्शन पावर, सेल्फ-क्लीनिंग डॉकिंग स्टेशन के साथ लॉन्च किए गए |

उसकी याद रखना: कैसे ‘व्हाट वंस वाज़’ जो हो सकता था उसका स्मारक बन गया |