ماهنامه ريزپردازنده  

شماره  245(فروردین و اردیبهشت 1394)

 

 

اینترنت آدم‌ها (8)

نرم‌افزارلب‌خوانی

□ نوشته علیرضامحمدی‌فر

همچنان که در مقاله اول از این سلسله از مقالات گفتیم با وجود دستاوردهای بسیار بزرگ و شگفت‌انگیز در عصر اطلاعات، به دلیل توانی که فناوری‌های اطلاعات و ارتباطات  در محدودکردن حریم خصوصی‌ انسان دارند  می‌توانند دورانی را  بیافرینند  که شاید آیندگان آن را دوران تاریک  یا  قرون وسطی در عصر اطلاعات نام بگذارند. از سوی دیگر، گفتیم که کنارگذاشتن و نادیده‌گرفتن فناوری‌های اطلاعات و ارتباطات برای انسان این روزگار به دلیل منافع بی‌شماری که دارد  ناممکن است و نمی‌تواند به عنوان یک راه حل  مطرح شود. در این مقاله به یکی دیگر از فناوری‌ها و نرم‌افزارهایی پرداخته‌ایم  که می‌توانند حریم خصوصی انسان را محدودتر کنند.

 

در نخستین بخش از این سلسله از مقالات یکی از روش‌های نامعمول گردآوری اطلاعات به دور از چشم کاربران را که در یک فیلم علمی-تخیلی به نمایش در آمده است ذکر کردیم:

در فیلم «۲۰۰۱: یک اودیسه فضایی» محصول سال 1968 وقتی یکی از فضانوردان به کامپیوتر سفینه فضایی خود _ به نام HAL _  مشکوک می‌شود، برای در میان گذاشتن این مسئله با همکارش به بهانه تعمیر سفینه از او می‌خواهد که برای خروجاز سفینه سوار یک کپسول ویژه تعمیرات  شوند. به این ترتیب، اطمینان می‌یافت که HALگفتگویآنها را نخواهد شنید. اما HAL با لب‌خوانی به گفتگوی این دو فضانورد پی می‌برد. امروزه نیز بسیاری ازگردآورندگان اطلاعات و سرویس‌های اینترنتی از انواعی از تکنیک‌ها برای گردآوری اطلاعات دور از چشم کاربران بهره می‌گیرند. این تکنیک‌ها ممکن است آن‌قدر متنوع و مبتکرانه باشند که حتی کاربران پیشرفته هم نتوانند آنها را شناسایی کنند.[1]

آیا کامپیوتر واقعاً می‌تواند لب‌خوانی یا گفتارخوانی کند؟ لب‌خوانی یا گفتارخوانی یک تکنیک درک و فهم گفتار (صدای انسان)  با نگاه‌کردن به حرکات لب، چهره، سر،  پوست گردن، و زبان است.

پژوهشگران سال‌هاست که روی لب‌خوانی کار می‌کنند. به عنوان مثال، شرکت اینتل در سال 2003 یک نرم‌افزار منبع بازِ  بازشناسی گفتار[2] با لب‌خوانی را به نام AVSR[3]  منتشر کرد. شرکت‌های پرآوازه دیگری مانند HP و IBM نیز در زمینه لب‌خوانی تحقیقاتی داشته‌اند و اختراعاتی دارند. هرچند، هنوز تا لب‌خوانی با دقت بالا راهی طولانی در پیش داریم. 

احمد حسنات[4] استاد دانشگاه موته اردن یکی از صاحب‌نظران در حوزه نرم‌افزارهای لب‌خوانی است. او در گفتگو با نشریه نیوساینتیست می‌گوید که «حتی بهترین هنرپیشه‌ها تقلید دقیق حرکات لب دیگران را غیرممکن می‌دانند.[5]» گفته می‌شود که نرخ موفقیت لب‌خوانی سیستمی که حسنات ساخته است 76 درصد است.

با آن که لب‌خوانیمی‌تواند مسائل فراوانی را برای حریم خصوصی به وجود بیاورد، اما فایده‌هایی نیز در حوزه‌های ارتباط انسان-کامپیوتر،  دوربین‌های نظارتی و امنیت، و کمک به معلولان دارد. سیستم‌های بازشناسی گفتار در محیط‌های پرسروصدا با بهره‌گیری از  لب‌خوانی می‌توانندموفق‌تر عمل کنند.  مجموعه حرکات زبانی هر فرد همچون اثر انگشت می‌تواند منحصر به فرد باشد و می‌تواند مشخص‌کننده یک فرد باشد، و در نتیجه می‌تواند به شکل  یک گذرواژه عمل کند.

چنانچه دوربین‌های نظارتی به سیستم‌های گفتارخوان مجهز شوند، می‌توانند دردسرآفرین شوند. به عنوان مثال، در دنیای تجارت برای پی‌بردن به سیاست‌های آتی رقبا ممکن است از این فناوری بهره گرفته شود.  با این همه، لب‌خوانیهنوز برای کامپیوتر آسان نیست. اما در سال‌های اخیر پیشرفت‌های قابل توجهی در این حوزه حاصل شده است.□

نکته: برای اطلاعات بیشتر درباره فناوری‌های لب‌خوانی می‌توانید به صفحه وب زیر مراجعه کنید:

http://www.technologyreview.com/view/530641/the-challenges-and-threats-of-automated-lip-reading

 

 

 



[1]http://rizpardazandeh.com/articles/riz238/internetofhumans.htm

[2]speech recognition

[3]Audio Visual Speech Recognition

[4]Ahmad Hassanat

[5]http://www.newscientist.com/article/mg22429892.700-lipreading-computers-unlock-with-a-word.html

 

 

بازگشت به خانه اول