Anonim

बच्चों के लिए डिज्नी की भाषण मान्यता प्रणाली बकवास के माध्यम से कटौती

कंप्यूटर

माइकल इरविंग

7 सितंबर, 2016

2 तस्वीरें

डिज़नी रिसर्च ने विशेष रूप से बच्चों के भाषण पैटर्न के लिए एक भाषण मान्यता प्रणाली विकसित की है, और इसे एक ऐसे गेम के साथ परीक्षण किया है जो बच्चों को सरल आवाज आदेशों का उपयोग करके एक तिल को नियंत्रित करने की अनुमति देता है (क्रेडिट: डिज्नी रिसर्च)

एक फोन, कार, कंप्यूटर, या एलेक्सा जैसे समर्पित वॉयस सहायक पर बार्किंग वॉयस कमांड इन दिनों काफी आम है, लेकिन इन प्रणालियों को आम तौर पर दिमाग में बोलने के वयस्क तरीके से डिजाइन किया जाता है। बच्चों के पास बहुत अलग भाषण पैटर्न होते हैं, और डिज़नी रिसर्च ने एक ऐसी प्रणाली विकसित की है जो एक छोटी भीड़ को पूरा करती है, उत्तेजित चापलूसी से मुख्य शब्द चुनती है और बच्चों को उनकी आवाज के साथ वीडियो गेम खेलने देती है।

मोल पागलपन खेल का नाम है, और बच्चे चरित्र को केवल दो सरल आवाज आदेशों के साथ नियंत्रित करते हैं। जोड़ों में बजाना (या तो किसी अन्य बच्चे या सैमी नामक रोबोट के साथ), एक खिलाड़ी स्क्रीन पर चलने वाले तिल को पाने के लिए "जाना " कहता है, जबकि उनके साथी इसे "कूद " कहकर ऊपर की ओर चलाते हैं। जैसा कि एक भाषण मान्यता प्रणाली की पहचान करने के लिए सरल लगता है, बच्चों ने कामों में कुछ स्पैनरों को फेंक दिया और एक-दूसरे से बात करने की प्रवृत्ति के साथ फेंक दिया।

"बच्चे जरूरी नहीं कि वयस्कों की तरह शब्दों का उच्चारण करें और जब वे एक साथ खेल रहे हों, जैसा कि वे करना चाहते हैं, वे अक्सर पक्षपातपूर्ण, या उत्तेजना के विस्मयादिबोधक में संलग्न होते हैं, या बस एक-दूसरे से बात करते हैं, " जिल फैन कहते हैं लेहमैन, परियोजना पर अग्रणी शोधकर्ता। "इससे भाषण-आधारित प्रणाली के लिए यह कठिन हो जाता है, यहां तक ​​कि एक जिसे केवल शब्दों को 'जाना ' और 'कूद ' को मोल पागलपन में पहचानना पड़ता है। "

सबसे पहले, ध्वनि पहचान प्रणाली में कुछ मानव प्रशिक्षण पहियों थे, जो एक अन्य कमरे में "जादूगर " के रूप में होते थे जो नियंत्रक पर एक बटन दबाते थे जब उन्होंने या तो "कूद " या "जाना " सुना था आदेश। पांच और 10 साल की आयु के 62 बच्चों के खेल के बाद, शोधकर्ताओं के पास सिस्टम को प्रशिक्षित करने के लिए पर्याप्त डेटा था, दोनों महत्वपूर्ण शब्दों को पहचानने के लिए, व्यक्तिगत रूप से या एक साथ कहा गया था, और उन्हें पृष्ठभूमि शोर और बटर के अन्य बिट्स से अलग किया गया था।

एक बार सिस्टम स्वचालित हो जाने के बाद और विज़ार्ड समीकरण से हटा दिया गया, शोधकर्ताओं ने बताया कि यह समय के 85 प्रतिशत कीवर्ड चुन सकता है। बुरा नहीं, उन आदेशों में से 40 प्रतिशत पर विचार करते हुए दो बच्चे खेल रहे थे, और 32 प्रतिशत सामान्य से तेज कहा गया था।

तुलनात्मक रूप से, व्यावसायिक रूप से उपलब्ध भाषण मान्यता प्रणाली को पैसों के माध्यम से रखा गया था और केवल 50 प्रतिशत आदेशों को पहचान सकता था, और ओवरलैपिंग और तेज़ भाषण से जूझ रहा था।

जब एक शोधकर्ता मैन्युअल रूप से आदेशों में प्रवेश कर रहा था, तब से स्वचालित प्रणाली को खिलाड़ियों के लिए अधिक आकर्षक होने का भी निर्णय लिया गया था। बाद में वीडियो देखने वाले माता-पिता के अनुसार, बच्चों को महसूस करने के करीब थे कि वे खुद को आनंद लेने के बजाय "इसे ले सकते हैं या छोड़ सकते हैं "। एक बार गेम स्वचालित हो जाने के बाद, और 150 मिलीसेकंड के भीतर एक कमांड को संसाधित कर सकता है, बच्चों ने गेम के साथ जुड़ाव के अधिक संकेत दिखाए।

सिस्टम "कूद " कमांड के साथ कुछ मुद्दों में चला गया जब बच्चों के एक नए समूह, चार के रूप में युवा, ने गेम की कोशिश की, लेकिन शोधकर्ताओं ने पाया कि प्रतिभागियों ने जल्द ही सिस्टम के माध्यम से सिस्टम की मदद के लिए अपने भाषण पैटर्न को संशोधित किया, आदेश दोहराएं या उन्हें अधिक सावधानी से कहें।

"डिज्नी रिसर्च के उपाध्यक्ष जेसिका होडगिन्स कहते हैं, " तकनीक पहचान परिपक्व हो गई है क्योंकि तकनीक परिपक्व हो गई है, लेकिन जब वे खेलते हैं तो बच्चे क्या कहते हैं, यह समझना मुश्किल होता है। " "हमारे शोधकर्ताओं द्वारा यह नवीनतम काम रोबोट के साथ बातचीत सहित बच्चों के लिए भाषण-आधारित गेम या मनोरंजन अनुप्रयोगों की किसी भी संख्या को डिजाइन करना संभव बना सकता है। "

शोधकर्ता इस सप्ताह बाल कंप्यूटर इंटरैक्शन पर कार्यशाला में और इस महीने के अंत में इंटेलिजेंट वर्चुअल एजेंटों पर अंतर्राष्ट्रीय सम्मेलन में अध्ययन पेश कर रहे हैं।

स्रोत: यूरेक्लर्ट के माध्यम से डिज्नी रिसर्च

उनकी आवाज़ के साथ मोल पागलपन को नियंत्रित करने वाले दो बच्चे (क्रेडिट: डिज्नी रिसर्च)

डिज़नी रिसर्च ने विशेष रूप से बच्चों के भाषण पैटर्न के लिए एक भाषण मान्यता प्रणाली विकसित की है, और इसे एक ऐसे गेम के साथ परीक्षण किया है जो बच्चों को सरल आवाज आदेशों का उपयोग करके एक तिल को नियंत्रित करने की अनुमति देता है (क्रेडिट: डिज्नी रिसर्च)

अनुशंसित संपादक की पसंद