ماهنامه ريزپردازنده  

شماره  255 (فروردین1395)

 

 

اینترنت آدم‌ها (18)

دانش داده‌ها و داده‌دان‌ها

□ نوشته علیرضا محمدی‌فر

 

انسان از دیرباز به پیش‌بینی آینده علاقه و نیاز داشته است و با روش‌هایی مانند رمالی و یا بررسی اوضاع کواکب سعی کرده است به این  آرزوی خودش پاسخ بدهد. دانش داده‌ها[1] با بهره‌گیری از کلان‌داده‌ها[2]، آمار، داده‌کاوی[3]، هوش مصنوعی، یادگیری ماشین، الگوریتم‌های بازشناسی الگو[4]، و مانند آن پیش‌گویی را به روشی کاملاً علمی انجام می‌دهد.

داده‌دان[5] یا  دانشمند داده‌ها کسی است که از دانش داده‌ها برای کسب بینش[6] و یافته‌های قابل استفاده برای حال  و آینده بهره می‌گیرد. داده‌دان‌ها با استفاده از روش‌های علمی رابطه‌های معنی‌دار بین داده‌ها را می‌یابند و برای استفاده ارائه می‌دهند. تفسیر  داده‌دان‌ها  بیشتر آینده‌نگر است تا توصیفی (تفسیر تحلیل‌گرهای مرسوم). امروزه نیاز و اهمیت  داده‌دان چنان شده است که هرگاه از صاحب‌نظران بهترین زمان استخدام یک داده‌دان را بپرسید، پاسخ آنها تقریباً یکسان است: دیروز.

 

چرا داده‌های خصوصی‌مان را ارزان می‌فروشیم؟

داده‌ها با سرعتی بسیار زیاد  از طریق دولت‌ها، شبکه‌های اجتماعی، برنامک‌های موبایل، سایت‌های تجارت الکترونیک، حس‌گرهای اینترنت چیزها[7] (IoT) و اینترنت آدم‌ها[8] (IoH)، و مانند آن تولید می‌شود و کلان‌داده‌ها را به وجود می‌آورد. کلان‌داده‌ها در صورتی سودمند است که افراد ماهری وجود داشته باشند که بتوانند آن را تحلیل کنند.

بخش بزرگی از این داده‌ها را ما انسان‌ها تولید می‌کنیم. گاهی اطلاعات خصوصی‌مان را نیز به آسانی در اختیار شرکت‌های گردآورنده داده‌ها قرار می‌دهیم. به عنوان مثال، برنامه‌های رایگان دست‌کم نام، نشانی ایمیل، شماره تلفن، و حتی امکان ردیابی GPS را از شما می‌خواهند. درآمد  سرویس‌های رایگان از طریق گردآوری اطلاعات شخصی مردم و ارائه تبلیغات هدفمند حاصل می‌شود. جذابیت برنامک‌ها و سرویس‌های رایگان برای مردم چنان است که حاضرند اطلاعات شخصی خود را به راحتی در اختیار ارائه‌کنندگان این برنامک‌ها و سرویس‌ها قرار دهند.  به هر سایت وب، جستجوگر اینترنتی مانند گوگل، یا سرویس الکترونیک که سر می‌زنیم داده‌هایی را تولید می‌کنیم که ارائه‌کننده‌های آن سایت‌ها یا سرویس‌ها آنها را گردآوری می‌کنند و در اختیار داده‌دان‌های خود قرار می‌دهند. آنها با داده‌های ما و با داده‌دان‌ها به تصمیمات ما پی می‌برند. این نوع داده‌ها که فعالیت‌های انسان‌ها را توصیف می‌کنند بیشتر از فناوری‌های مختلف  «اینترنت آدم‌ها» به دست می‌آیند. هنگامی که اطلاعات شخصی آدم‌ها انتشار یابد یا مورد تحلیل قرار بگیرد ممکن است حق حریم خصوصی انسان نقض شود. داده‌های حس‌گرهای اینترنت آدم‌ها می‌تواند بخش بزرگی از زندگی خصوصی افراد را افشا کند.

 

مرام‌نامه اخلاقی

نظر به این که بخش بزرگی از داده‌ها در مورد اطلاعات شخصی افراد است و به حریم خصوصی آنها مربوط می‌شود داده‌دان‌ها باید مراقب باشند که این اطلاعات فاش نشود و مورد سوءاستفاده قرار نگیرد. از همین روی، در بسیاری از دانشگاه‌های دنیا برای دوره دانش داده‌ها یک درس «اخلاق و دانش داده‌ها» نیز ارائه می‌شود و از فارغ‌التحصیل‌ها خواسته می‌شود که به یک مرام‌نامه اخلاقی پای‌بند باشند. این مرام‌نامه به داده‌دان‌ها امکان می‌دهد که در برابر خواسته‌های نادرست شرکت‌ها و حتی دولت‌ها ایستادگی کنند.

اما آیا پای‌بندی به یک مرام‌نامه اخلاقی می‌تواند جلوی سوءاستفاده‌ها را بگیرد؟ در کوتاه‌مدت ممکن است جلوی بسیاری از مسائل را بگیرد، اما نظر به این که توسعه دانش داده‌ها _ که امروزه دوران طفولیت خود را می‌گذراند _ به دلیل تولید پرشتاب داده‌ها یک نیاز بسیار ضروری برای مدیریت و بهره‌برداری از داده‌ها است ابزارهای پیشرفته‌تر و کاربرپسندتر[9] تولید خواهد شد. پیشرفت‌ها در کاربرپسندیِ این ابزارها می‌تواند آنها را به ابزاری تبدیل کند که به طور خودکار داده‌ها را تحلیل می‌کنند و نتایج را برای استفاده‌کننده، حتی داده‌دزدان و داده‌ستیزان ارائه می‌دهند.

دانش داده‌ها و فرصت‌های شغلی آینده

روبات‌ها و سیستم‌های خودکار بسیاری از فرصت‌های شغلی را در آینده از آن خود خواهند کرد. به عنوان مثال، خودران‌ها شغل رانندگی  را و روبات‌ها شغل کارگری، گارسونی، و بسیاری از مشاغل کارمندی را ناپدید خواهند کرد. اما یکی از معدود شغل‌هایی که برای انسان باقی خواهد ماند و بخش بزرگی  از مردم به آن اشتغال خواهند داشت شغل داده‌دانی است، زیرا از هوش انسان بهره می‌گیرد که همچنان که در مقاله‌های پیشین گفتیم  در تلفیق با هوش ماشین فراهوش[10]  یا هوش افزوده را به وجود می‌آورد، که اساس بسیاری از پیشرفت‌های آینده خواهد بود. بازهم همچنان که در مقاله‌های پیشین گفتیم هوش انسان زمانی شکوفا و خلاق می‌شود که یک عامل خلاقیت از بین نرود: حریم خود انسان. در بخش 13 این سلسله از مقالات گفتیم که اگر حریم خصوصی کوچک وکوچک‌تر شود و در نهایت به خود انسان برسد خلاقیت  در هوش انسان به پایین‌ترین حد خودش خواهد رسید. تصور کنید روزی را که یک داده‌دان بیاید و گذشته شما را که از کلان‌داده‌ها استخراج کرده است جزء به جزء به شما بگوید و تصمیمات شما را برای آینده با احتمال بسیار بالا پیش‌بینی کند. گوگل هم‌اکنون یک داده‌دان بزرگ است و تصمیم‌گیری را برای شما راحت کرده است.  پیشرفت‌های گوگل در هوش مصنوعی و دانش داده‌ها می‌تواند کاری کند که شما دیگر فکر نکنید، و دستیارهای شخصی مجازی (Google Now) به جای شما تصمیم بگیرد.

برای این که خلاقیت در انسان‌ها پایدار بماند و تقویت شود راه حل آن است که از هم‌اکنون تدریس مبانی دانش داده‌ها و تحلیل داده‌ها را از دوره دبستان‌ آغاز کنیم تا دست‌کم در 15 سال بعد که بسیاری از فرصت‌های شغلی از دست انسان خارج خواهد شد با کمترین بیکاری روبه‌رو شویم. یک حُسن دیگر این آموزش آن است که نیروی کارِ آینده از هم‌اکنون با اهمیت حریم شخصی و نحوه حفاظت از آن آشنا می‌شود، و در نتیجه به دلیل حفظ حریم خود انسان، این نیروی کار خلاقیت خود را از دست نخواهد داد. هرچه تعداد بیشتری از مردم با دانش داده‌ها آشنا باشند _ که بی‌گمان در آینده یکی از درس‌های عمومی اکثر رشته‌های دانشگاهی خواهد بود _ داده‌دان‌هایِ خلاف‌کارِ کمتری می‌توانند از داده‌های خصوصی مردم سوءاستفاده کنند.□


[1] data science

[2] big data

[3] data mining

[4] pattern recognition

[5] data scientist

[6] insight

[7] Internet of Things

[8] Internet of Humans

[9] userfriendly

[10] ultra-intelligence

بازگشت به خانه اول