Latest News

Review http://scoop-technology.blogspot.com/ on alexa.com

برامج إلكترونية لتحويل الأصوات إلى نصوص

الأربعاء، 18 أغسطس 2010 , Posted by abdoun homes at 2:34 ص

طرحت شركة «نيوانس» الأميركية برنامجا مطورا للتعرف على الأصوات. وتحتل الشركة التي صممت برنامجها السابق «دراغون ناتشورالي سبيكينغ فور ويندوز» للتعرف على الأصوات، موقعا متميزا بعد أن احتكرت هذا الميدان تقريبا بسبب انسحاب الكثير من الشركات المنافسة في عالم التعرف على الأصوات. كما لم يعد برنامج «ماك سبيتش - ريغوغنيشن» من «ماك سبيتش ديكتايت» منافسا لها، لأنها اشترته في العام الحالي. وظل برنامج «سبيتش» من «مايكروسوفت ويندوز»، فقط، الذي لم يأخذ حقه الكافي من الاعتبار، موجودا ليجعل «نيوانس» تقف على أهبة الاستعداد.


ويتساءل الخبراء عن الحوافز التي سوف تدفع الشركة الآن إلى الابتكار، وهل ستقوم «نيوانس» بالحفاظ على أسعارها متدنية وجودة منتوجها عالية عندما تكون هي الوحيدة في هذا المجال؟


* برنامج جديد


* للدلالة على كل ذلك يمكن تجربة برنامج «ناتشورالي سبيكينغ 11» (NaturallySpeaking 11) الذي طرح للبيع مؤخرا. وهذا التحديث الأخير يتبع الفلسفة ذاتها، كتلك التي تخص التحديثات السنوية القليلة الأخيرة، فهو مليء بعمليات الترقيع هنا وهناك المرحب بها والمنفذة بشكل جيد، لكنها غير حاسمة بتاتا، وخاصة على صعيد التحسين السنوي في الدقة الإملائية.


وتقول «نيوانس» إن النسخة الجديدة هي أكثر دقة بنسبة 15 في المائة. وهو أمر جيد، وإن كان بالكاد ملاحظا. والأهم من ذلك كله كيف جرى الوصول إلى هذه النسبة.


وكانت «نيوانس» قد شرعت في ديسمبر (كانون الثاني) الماضي في تقديم تطبيق مجاني لـ«آي فون»، وهو «دراغون ديكتيشن» الذي يتيح لك الكلام لتقوم كومبيوترات الشركة في بوسطن بتحليله، وبالتالي تحويله خلال ثوان إلى نص مطبوع يظهر على شاشتك.


لكن هذا الأمر ليس حركة تغييرية، بل كان للشركة دافع خفي، إذ تقوم كومبيوتراتها بالاحتفاظ بنسخ عن مئات الآلاف من الرسائل المملاة، مؤسسة بذلك لأكبر أرشيف مركزي لأنماط الأصوات والخطابات الأميركية. وقام مهندسو الشركة لاحقا باستثمار منجم الذهب هذا، لاختبار وسائل وضع الرموز الكومبيوترية في البرامج الجديدة للتعرف على الكلام، لتحسين دقة «دراغون».


ويؤمن البرنامج دقة جيدة جدا، بحيث لا حاجة هناك للشروع في ابتداء قراءة نص تدريبي مدته أربع دقائق، كما كان الحال سابقا قبل سنوات. ويقول ديفيد بوغ في صحيفة «نيويورك تايمز» إنه قام بتركيب البرنامج في جهازه الكومبيوتري «بي سي»، متجاوزا عملية التدريب والتمرين هذه، وخصص واحدة من مقالاته القديمة بطول 1300 كلمة لتأتي النتيجة دقيقة مائة في المائة!


* تعرف صوتي دقيق


* التغييرات المرئية تستقبلك أيضا، وأكبرها هي صفحة خداعة من الأوامر التي تملأ لوحة في الجانب الأيمن من الشاشة التي تحتل الكثير من المساحة، لكنها تشكل مساعدة كبرى للأشخاص الذين لم يدركوا أنه بالمقدور عمل الكثير من مجرد الكلام لغرض تحويله إلى طباعة، إذ يمكن فتح البرامج، واختيار الأوامر من لائحة المهام، والنقر على روابط الشبكة، وتحريك المؤشر، وصياغة النص، وهكذا. وفي النسخة 11 يمكن تطبيق الصيغة ذاتها بالنسبة إلى تكرار كل كلمة، أو عبارة في الوثيقة.


وقد حصل كل ذلك بسهولة عندما تم إملاء قطعة تتعلق بـ«تويتر» بحيث رفض «دراغون» باستمرار أن يبدأ الجمل وأسماء العلم بالأحرف الكبيرة. لكن ذلك لم يشكل أي مشكلة فقد تمت تسوية هذا الأمر بعد ذلك عن طريق أمر واحد.


ولم يتمكن «ناتشورالي سبيكينغ» على الدوام من التعرف على أصوات الأطفال بشكل جيد، لكن هذا الأمر تغير أيضا. حتى الأطفال في الابتدائي بات بمقدورهم أن يكونوا من الخبراء في مجال الإملاء هذا.


وبرنامج الإملاء «نات سبيك» ليس معصوما عن البلاهة والعيوب أيضا، إذ يصعب عليه فهم واستيعاب كلام الأشخاص. ومن المفترض أن يتحسن هذا البرنامج على مدى السنوات، لأنه في كل مرة يرتكب خطأ من المفترض أن تصلح ذلك بصوتك ويقوم البرنامج بناء على ذلك بتصحيح النص، وبالتالي فإنه يتعلم من أخطائه، وهكذا دواليك. لكن لسوء حظ الشركة فإن نسبة كبيرة من مالكي «نات سبيك» لم يستخدموا قط الأمر المنطوق «صحح» لإصلاح الأخطاء، بل اعتمدوا، بدلا من ذلك، على النقر المزدوج على الخطأ والطباعة فوقه، حارمين البرنامج من فرصة التعلم. فبالنسبة لمثل هؤلاء الأشخاص لا ترتفع درجة الدقة لديهم.


وفي النسخة 11 قامت «نيوانس» بعمل تستري آخر، فإذا قمت يدويا بتنقيح وتصليح قطعة ما يقوم «نات سبيك» بنسخها نصيا، وبمقارنة العبارة الجديدة التي طبعتها بما قلته وأمليته بالأصل. ولكن إذا ما غيرت النص كلية يفترض البرنامج أنك تقوم بالتنقيح والتحرير فقط. ولكن إذا غيرت مثلا عبارة «عملية أساسية» إلى عبارة «انحراف أساسي» يفترض البرنامج عند ذلك أنك تصلح خطأ نصيا ويبدأ يتعلم من هذه الأمثلة.وبعبارة أخرى فإن عامل الدقة سيبدأ الآن في التحسن حتى بالنسبة إلى الأشخاص الذين يرفضون التعامل مع البرنامج.


* تطبيقات مساعدة


* وكانت النسخة 10 قد أنزلت أوامر تختصر الطريق مثل «ابحث في الشبكة عن الشارع 79 في نيويورك» ليهرع الكومبيوتر إلى بحث وخرائط «غوغل» لمساعدتك. وهناك الأكثر في هذه النسخة مثل «ابحث في البريد»، و«ابحث في ويكيبيديا»، و«ابحث في فيس بوك»، وهكذا على هذا التوالي، مما يقود إلى الإعجاب جدا بالنتيجة.


وهناك تحسينات أخرى أيضا، فإذا كان جهاز كومبيوترك «بي سي» مزودا بمعالج متعدد النواة (القلوب) يقوم «نات سبيك» بتقسيم أو تجزئة مهمات التعرف للحصول على نتائج نسخ أفضل. وإذا كنت تملك واحدا من 18 مسجلا صوتيا رقميا من تلك المرخص بها، يمكنك تهيئة «نات سبيك» لعملية نسخ صوتك بعد أربع دقائق فقط من التدريب بعدما كانت هذه المدة 15 دقيقة. ولا يمكن لهذا البرنامج، ولا غيره بعد، نسخ المقابلات، أو عندما يتحدث عدة أشخاص معا من دون فواصل، أو تنقيط. بعيدا عن الميكروفون، إذ لا تزال هذه المهمة صعبة.


وثمة تحسينات في الأسعار أيضا فنسخة «برو» (Pro) الخاصة بالمهنيين من ذوي الأعمال بمزايا لإدارة الحسابات الصوتية للأشخاص عبر الشبكة تكلف اليوم 600 دولار، بدلا من 900 دولار، في حين يصل سعر نسخة «ليغال» (Legal) للقانونيين إلى 800 دولار، بدلا من 1200 دولار. ولا تزال هذه الأسعار عالية، لكنها باتت في متناول شريحة واسعة من الناس.


بإيجاز تحسن برنامج «ناتشورالي سبيكينغ»، لكن لا تزال بعض أخطائه وعيوبه هي ذاتها، خاصة أن بعض عملياته مضيعة للوقت أكثر من توفيره، فالكتابة عن طريق الإملاء لا تزال تتطلب تعديلا ذهنيا للمستخدم، بحيث يتوجب معرفة العبارة المطلوبة قبل نطقها بعناية، لأن الدقة هنا تتوقف على اللهجة والعوامل الأخرى.


وربما قد لا يحتاج الأمر إلى 100 دولار لتحديث نسخة «دراغون 10»، إن كنت تملكها، إلى «دراغون 11». ولكن إن كنت تملك نسخة بدائية، أو كنت لم تجرب أبدا برمجيات الإملاء، فقد تتعجب بمقدار تطور هذه التقنية. صحيح أن «نيوانس» قد احتكرتها، لكن من الرائع أن نلاحظ التقدم الذي حصل مع التخفيض في الأسعار.

Currently have 0 التعليقات:

Leave a Reply

إرسال تعليق