ماهنامه ريزپردازنده
شماره 245(فروردین و اردیبهشت 1394)
اینترنت آدمها (8)
نرمافزارلبخوانی
□ نوشته علیرضامحمدیفر
همچنان که در مقاله اول از این سلسله از مقالات گفتیم با وجود دستاوردهای بسیار
بزرگ و شگفتانگیز در
عصر اطلاعات، به دلیل توانی که فناوریهای اطلاعات و ارتباطات
در محدودکردن حریم خصوصی انسان دارند
میتوانند دورانی را
بیافرینند که شاید آیندگان آن را
دوران تاریک یا
قرون وسطی در عصر اطلاعات نام بگذارند. از سوی دیگر، گفتیم که کنارگذاشتن و
نادیدهگرفتن فناوریهای اطلاعات و ارتباطات برای انسان این روزگار به دلیل منافع
بیشماری که دارد ناممکن است و
نمیتواند به عنوان یک
راه حل مطرح شود. در
این مقاله به یکی دیگر از فناوریها و نرمافزارهایی پرداختهایم
که میتوانند حریم خصوصی انسان
را محدودتر کنند.
در نخستین بخش از این سلسله از مقالات یکی از روشهای نامعمول گردآوری اطلاعات به
دور از چشم کاربران را که در یک فیلم علمی-تخیلی به نمایش در آمده است ذکر کردیم:
در فیلم «۲۰۰۱: یک اودیسه
فضایی» محصول سال 1968 وقتی یکی از فضانوردان به
کامپیوتر سفینه فضایی خود _ به نام
HAL
_
مشکوک میشود، برای در میان گذاشتن این مسئله با همکارش به
بهانه تعمیر سفینه از او میخواهد که
برای خروجاز
سفینه سوار یک کپسول ویژه تعمیرات
شوند. به این ترتیب، اطمینان مییافت که
HALگفتگویآنها
را نخواهد شنید. اما
HAL
با لبخوانی به گفتگوی
این دو فضانورد پی میبرد. امروزه نیز بسیاری ازگردآورندگان اطلاعات و سرویسهای
اینترنتی از انواعی از تکنیکها برای گردآوری اطلاعات دور از چشم کاربران بهره
میگیرند. این تکنیکها ممکن است آنقدر متنوع و مبتکرانه باشند که حتی کاربران
پیشرفته هم نتوانند آنها را شناسایی کنند.[1]
آیا کامپیوتر واقعاً میتواند
لبخوانی یا گفتارخوانی
کند؟ لبخوانی یا
گفتارخوانی یک تکنیک
درک و فهم گفتار (صدای انسان)
با نگاهکردن به حرکات لب، چهره، سر،
پوست گردن، و زبان است.
پژوهشگران سالهاست که روی لبخوانی کار میکنند. به عنوان
مثال، شرکت اینتل در سال 2003 یک نرمافزار منبع بازِ
بازشناسی گفتار[2]
با لبخوانی را به نام
AVSR[3]
منتشر کرد. شرکتهای پرآوازه دیگری مانند
HP
و IBM
نیز در زمینه لبخوانی تحقیقاتی داشتهاند و اختراعاتی دارند. هرچند، هنوز تا
لبخوانی با دقت بالا راهی طولانی در پیش داریم.
احمد حسنات[4]
استاد دانشگاه موته
اردن یکی از صاحبنظران در حوزه نرمافزارهای لبخوانی است. او در گفتگو با نشریه
نیوساینتیست میگوید که
«حتی بهترین هنرپیشهها تقلید دقیق حرکات لب دیگران را غیرممکن میدانند.[5]»
گفته میشود که نرخ موفقیت لبخوانی سیستمی که حسنات
ساخته است 76 درصد است.
با آن که لبخوانیمیتواند مسائل فراوانی را برای حریم خصوصی
به وجود بیاورد، اما فایدههایی نیز در حوزههای ارتباط انسان-کامپیوتر،
دوربینهای نظارتی و امنیت، و کمک به معلولان دارد.
سیستمهای بازشناسی گفتار
در محیطهای پرسروصدا با بهرهگیری از
لبخوانی میتوانندموفقتر عمل کنند.
مجموعه حرکات زبانی هر فرد همچون اثر انگشت میتواند
منحصر به فرد باشد و میتواند مشخصکننده یک فرد باشد، و در نتیجه میتواند به شکل
یک گذرواژه عمل کند.
چنانچه دوربینهای نظارتی به سیستمهای گفتارخوان مجهز شوند،
میتوانند دردسرآفرین شوند. به عنوان مثال، در دنیای تجارت برای پیبردن به
سیاستهای آتی رقبا ممکن است از این فناوری بهره گرفته شود.
با این همه، لبخوانیهنوز برای کامپیوتر آسان نیست.
اما در سالهای اخیر پیشرفتهای قابل توجهی در این حوزه حاصل شده است.□
نکته: برای اطلاعات بیشتر درباره
فناوریهای لبخوانی میتوانید به صفحه وب زیر مراجعه کنید:
http://www.technologyreview.com/view/530641/the-challenges-and-threats-of-automated-lip-reading
[1]http://rizpardazandeh.com/articles/riz238/internetofhumans.htm
[2]speech
recognition
[3]Audio
Visual Speech Recognition
[4]Ahmad
Hassanat
[5]http://www.newscientist.com/article/mg22429892.700-lipreading-computers-unlock-with-a-word.html