آیا اعداد دروغ میگویند؟
پرهام پهلوان - دادهسازی (Datafication)، تبدیل اتفاقات مختلف، از جمله رفتارهای انسان، فعالیتها و پدیدههای طبیعی به اعداد (داده) است. دادهسازی، شامل جمعآوری، تجزیه و تحلیل و تفسیر دادهها از منابع مختلف مانند حسگرها، رسانههای اجتماعی، تراکنشها و تعاملات است. دادهسازی با پیشرفتهای فناوری، بهویژه در زمینههایی مانند هوش مصنوعی، یادگیری ماشینی و تجزیه و تحلیل دادههای بزرگ به طور فزایندهای رایج شده است. دادهسازی به سازمانها و کسبوکارها اجازه میدهد با تبدیل وقایع مختلف به اعداد، توان پیشبینی و تصمیمگیری بهرهورتری داشته باشند. با توجه به افزایش روزافزون اهمیت علوم داده (Data Scince) در زندگی بشر و کمکهای مطالعه کلاندادهها و یادگیری ماشین، تبدیل رویدادها به اعداد و افزایش توان محاسبات اهمیت غیرقابل چشمپوشی دارد.
به طور کلی، دادهسازی سازمانها، محققان، سیاستگذاران و افراد را با اطلاعات و بینشهای ارزشمندی توانمند میسازد که میتواند نوآوری، کارآیی و تصمیمگیری آگاهانه را در حوزههای مختلف هدایت کند. با این حال، پرداختن به نگرانیهای مربوط به حریم خصوصی، امنیت، تعصب و ملاحظات اخلاقی برای اطمینان از استفاده مسوولانه و اخلاقی از دادهها ضروری است.
دادهسازی به چند دلیل مهم است:
با تبدیل جنبههای مختلف جهان به داده، سازمانها میتوانند به ارزشمندترین بینشها درباره روندها، الگوها و همبستگیها دست یابند که ممکن است اثر آن بهطور فوری مشخص نشود. این بینشها میتوانند در تصمیمگیریها، توسعه استراتژی و بهینهسازی فعالیتها در بخشهای مختلف کمک شایانی کنند. دادهپردازی با ارائه اطلاعات دقیق، بهموقع و مرتبط، سهامداران را قادر میسازد تا تصمیمگیریهای آگاهانهتری انجام دهند. این امر میتواند به انتخابهای بهتر، نتایج بهتر و تخصیص منابع بهتر منجر شود. رویکردهای دادهمحور با شناسایی زمینههای بهبود، بهینهسازی فرآیندها و توسعه محصولات یا خدمات جدید براساس بینشهای مبتنی بر داده، نوآوری و کارآیی را تقویت میکنند که میتواند به کاهش هزینه، افزایش درآمد و داشتن مزیتهای رقابتی برای سازمانها منجر شود.
Datafication امکان تجربیات شخصیسازیشده در زمینههایی مانند مراقبتهای بهداشتی، خردهفروشی، آموزش و سرگرمی را فراهم میکند. با تجزیه و تحلیل ترجیحات، رفتارها و نیازهای فردی، سازمانها میتوانند پیشنهادهای خود را به گونهای تنظیم کنند که نیازهای منحصربهفرد مشتریان، بیماران یا کاربران خود را برآورده سازند. Datafication تحلیل پیشگویانه را فعال میکند که شامل استفاده از دادههای تاریخی برای پیشبینی رویدادها، روندها یا رفتارهای آینده است. این امر میتواند برای مدیریت ریسک، پیشبینی تقاضا، کشف تقلب و سایر وظایف مدلسازی پیشبینی ارزشمند باشد.
دادهسازی در زمینههایی مانند پزشکی، علوم محیطی، نجوم و علوم اجتماعی نقش مهمی در پیشبرد تحقیقات و درک پدیدههای پیچیده ایفا میکند. با جمعآوری و تجزیهوتحلیل دادههای بزرگ، محققان میتوانند بینشهای جدیدی کشف کنند، فرضیهها را آزمایش کنند و به پیشرفت دانش علمی کمک کنند. دادهسازی میتواند با ارائه شواهد تجربی، بینش در مورد روندهای اجتماعی و معیارهای ارزیابی برای مداخلات سیاستی فراهم کند. این میتواند به سیاستهای عمومی موثرتر و مبتنی بر شواهد منجر شود.
دادهسازی به خودی خود، تشریح و تغییر شکل و نه تبدیل (Digitization) رویدادهای بیرونی به داده است و نمیتواند دروغ بگوید. هرچند ممکن است به صورت عمدی یا غیرعمدی، اشتباهاتی در دادهسازی اتفاق بیفتد که سایرین را گمراه یا از مسیر آنها دور کند. فرانچسکا جینو، «محقق عدمصداقت» معروفی بود که پس از فاش شدن دستکاری در دادههای چهارمقاله او در یکدهه، از دانشگاه هاروارد تعلیق شد. در یکی از این چهار مقاله، دکتر جینو اثرگذاری این پرسش را که «آیا افراد صادقانه به سوالات پاسخ میدهند یا خیر؟» در ابتدای اظهارنامه مالیاتی، نسبت به انتهای آن، بر میزان صداقت مردم بررسی کرده بود. این مقاله که در پژوهشهای دیگر بیش از ۵۰۰بار استفاده شده بود، ادعا میکرد که با اثرگذاری بر میزان اخلاقمداری افراد، ایجاد این پرسش در ابتدای فرم، بهتر از انتهای آن است. هرچند جینو اطلاع نداشت، سهدانشمند رفتاری دیگر که یک وبلاگ داشتند، در مورد عدمصحت در دادهها به هاروارد تذکر داده بودند.
وبلاگنویسان گفتند که به نظر میرسد دکتر جینو دادهها را دستکاری کرده است تا مطالعات خود را چشمگیرتر از آنچه بودند نشان دهد. آنها گفتند که در برخی موارد، شخصی اعداد را در یک صفحهگسترده جابهجا کرده است تا بهتر با فرضیه او هماهنگ شوند. در مقالهای دیگر، به نظر میرسد که نقاط داده برای اغراق در یافته تغییر داده شده است. نتایج مطالعات هاروارد در مورد احتمال تقلب نشان داد که هرچند احتمال تقلب در دادههای مقالات مختلف وجود دارد، اما نقطه اشتراک این مقالات اسم فرانچسکا جینو است که این موضوع به اخراج آکادمیک او منتهی شد. بنابراین دادهها دروغ نمیگویند، اما ممکن است با استفاده اشتباه از روشهای تبدیل و اندازهگیری یا حضور و همکاری افرادی که با نیتهای مختلف ممکن است در دادهها دستکاری کنند، به دادهسازی خیانت شود. با توجه به حساسیت علوم اجتماعی و رفتاری به داده، این خیلی مهم است که در تبدیل رویدادها به داده، حسن نیت ثابت شده باشد و روشها با آزمونهای مختلف مورد آزمایش قرار گیرند تا بتوان به صحت دادهها اعتماد کرد.