چرا شرکت ها باید شکاف سواد داده را پر کنند (قسمت 2)


همانطور که بسیاری از کمبود استعدادهای علم داده ابراز تاسف می کنند، باید بیشتر نگران کننده باشد که اکثریت قریب به اتفاق کارگران ایالات متحده به طور فزاینده ای برای مقابله با سونامی داده های امروزی آمادگی ندارند. در سال 2012، برنامه ارزیابی بین‌المللی شایستگی‌های بزرگسالان (PIAAC) مهارت‌های سواد، حساب و حل مسئله بزرگسالان 16 تا 65 ساله را در 23 کشور بررسی کرد. در حالی که کشورهایی مانند ژاپن و فنلاند در مهارت های ریاضی پیشتاز بودند، ایالات متحده رتبه ناامید کننده 21 را از 23 کشور شرکت کننده کسب کرد. به جای اینکه منتظر فناوری یا سیستم آموزشی ما باشیم تا این مشکل را حل کند، هر شرکتی باید به این نگاه کند که چه کاری می تواند انجام دهد تا شکاف سواد داده را برای مدیران و کارمندان خود کاهش دهد.

در آکواریوم Loveland Living Planet در یوتا، کریس اومرا، معاون ارشد عملیات، متوجه شد که مردم می‌دانند چه سوالات تجاری را باید بپرسند، اما مطمئن نبودند که چگونه داده‌ها می‌توانند پاسخ‌های مورد نیاز را ارائه دهند. برای پرداختن به این موضوع، او یک راه‌حل BI با کاربری ساده‌تر (Domo) و همچنین یک برنامه آموزشی مهارت‌های داده را معرفی کرد که شامل جلسات ناهار و یادگیری معمولی اما آموزنده بود.

اگرچه بیشتر افراد در دانشگاه به درجات مختلفی در معرض آمار قرار گرفته اند، از زمانی که فارغ التحصیل شده اند، از چند سال تا دهه ها می گذرد. از طریق جلسات ناهار و یادگیری، O'Meara توانست دانش آماری خود را تقویت کند، اصطلاحات جدید داده را استاندارد کند، و رفتار مبتنی بر داده را القا کند. به عنوان مثال، چند سال پیش بخش بازاریابی آن تقریباً به هیچ داده ای برای هدایت تلاش های بازاریابی خود متکی نبود. اکنون به یکی از بخش‌های داده محور غیرانتفاعی تبدیل شده است که بر استراتژی‌های داده قوی برای اندازه‌گیری و بهینه‌سازی تلاش‌های بازاریابی خود تکیه می‌کند.

4 کلید برای حداقل سواد داده ای قابل اجرا

سواد داده می تواند طیف وسیعی از مهارت ها را در بر گیرد، بنابراین ایجاد یک پایه کاربردی برای این نوع مهارت مهم است. همانطور که افراد برای داشتن سواد به مدرک زبان انگلیسی پیشرفته نیاز ندارند، کارمندان شما نیز برای داشتن سواد داده نیازی به دانش آماری و مهارت های برنامه نویسی پیشرفته در پایتون یا R ندارند. سطح سواد اغلب بر اساس آنچه افراد می توانند یا نمی توانند در زندگی روزمره خود به دست آورند تعیین می شود – ما باید همین کار را برای سواد داده انجام دهیم. برای مثال، اگر فردی در خواندن برچسب مواد غذایی یا پر کردن درخواست شغلی مشکل داشته باشد، ممکن است بی سواد در نظر گرفته شود.

هنگامی که صحبت از سواد داده پایه می شود، باید بتوان به اندازه کافی جدول یا نمودار داده استاندارد را تجزیه و تحلیل و تفسیر کرد. آنها باید با هر یک از نمودارهای رایج مانند نمودارهای خطی، میله ای، ناحیه ای، دایره ای و نقطه ای که امروزه در اکثر برنامه های کاربردی تجاری، داشبوردها و گزارش های خبری یافت می شوند، راحت باشند. در حالت ایده آل، اگر همه بدانند چگونه نمودارهای خود را ایجاد کنند و تجزیه و تحلیل خود را انجام دهند، عالی خواهد بود، اما من فکر نمی کنم این حداقل استانداردی باشد که ما به دنبال آن هستیم. حداقل ما به افرادی نیاز داریم که بتوانند داده ها را به طور موثر مصرف و تفسیر کنند. برای انجام این کار، آنها به مهارت هایی در چهار زمینه زیر نیاز دارند:

1. دانستن داده ها.

هر شرکت، رشته (بازاریابی، امور مالی) و صنعت (خرده فروشی، مراقبت های بهداشتی) مجموعه ای از اصطلاحات و مجموعه داده های منحصر به فرد خود را خواهند داشت. هرچه کارکنان شما اطلاعات شرکت شما را از منظر تجاری بیشتر درک کنند، موقعیت بهتری برای اعمال آن خواهند داشت. به عنوان مثال، اگر شما یک بازاریاب آنلاین هستید، باید با معیارهای کلیدی مانند بازدید از صفحه، جلسات، بازدیدکنندگان منحصر به فرد و نرخ پرش آشنا باشید. علاوه بر دانستن داده ها، به توانایی کار با اعداد یا حساب دیفرانسیل هم نیاز دارید. ممکن است برخی افراد را شگفت زده کند که بسیاری از آنچه دانشمندان داده روی آن تمرکز می کنند فقط محاسبات است و اکثر تجزیه و تحلیل ها (80٪) حول مبالغ و میانگین ها متمرکز هستند. علاوه بر این، درک پایه ای از مفاهیم و اصطلاحات آماری مفید خواهد بود، مانند دانستن اینکه همبستگی چیست و تفاوت بین داده های کمی و کیفی.

2. یکسان سازی داده ها.

وقتی داده‌های جدیدی برای تفسیر به شما ارائه می‌شود، باید در پیمایش داده‌های ناآشنا قبل از مصرف آن‌ها ماهر باشید. در این مرحله شما داده ها را تجزیه و تحلیل یا قضاوت نمی کنید – شما به سادگی چیزی را که در مقابل شما قرار دارد جذب می کنید. شما باید عادت داشته باشید که عناصر زیر جداول یا نمودارها را بررسی کنید و در صورت مبهم بودن یا گم شدن برخی از عناصر به دنبال توضیح بیشتر باشید:

  • عنوان و برچسب ها: آیا جدول یا نمودار دارای عنوان و برچسب توصیفی و واضح است؟
  • چارچوب زمانی: دوره زمانی (های) برای داده های ارائه شده چقدر است؟
  • منبع داده: آیا می دانید داده ها از کجا می آیند؟
  • واحد(های) اندازه گیری: آیا به وضوح درک می کنید که معیارهای موجود در جداول یا نمودارها چه چیزی را نشان می دهند؟
  • ترازو: آیا مقیاس های محور نمودار واضح و موثر هستند؟
  • شاخص(های) محاسبه شده: برای نسبت ها، درصدها و سایر فرمول ها، آیا درک روشنی از نحوه محاسبه آنها دارید؟
  • ابعاد: آیا ابعاد یا مقوله‌هایی که برای سازماندهی یا بخش‌بندی داده‌ها استفاده می‌شوند واضح و معنادار هستند؟
  • فیلترها: آیا مشخص است که فیلترهای خاصی برای مجموعه داده اعمال شده است (مثلاً همه مشتریان در مقابل مشتریان جدید)؟
  • مرتب سازی: اگر مقادیر مختلف مرتب شده یا رتبه بندی شوند، مشخص است که از چه معیارهایی استفاده شده است؟
  • اهداف: اگر اهداف یا وظایفی به نمودارها اضافه شوند، مشخص است که چه هستند؟

3. تفسیر داده ها.

هنگامی که با داده ها آشنا شدید، باید بتوانید آن ها را تجزیه و تحلیل و تفسیر کنید. بسته به نوع داده و فرمت ارائه آن، می توان آن را به روش های مختلفی بررسی کرد. به طور کلی، شما باید به انجام انواع مشاهدات زیر در نمودارها عادت داشته باشید:

  • گرایش ها: نشانگر در چه جهتی در حال حرکت است (بالا، پایین، صاف)؟
  • مدل ها: چه الگوها یا چرخه های تکرار شونده ای را در داده ها می بینید (مثلاً فصلی)؟
  • حذفیات: آیا شکاف یا حذف آشکاری در مجموعه داده وجود دارد؟
  • خوشه ها: آیا برخی از مقادیر در مناطق خاصی به طور فشرده جمع شده اند؟
  • تحریف: آیا مقادیر به طور قابل توجهی در یک طرف بیشتر از طرف دیگر متمرکز هستند یا کج می شوند؟
  • موارد پرت: آیا نقطه داده ای جدا شده یا دور از سایر نقاط داده وجود دارد؟
  • تمرکز: آیا چیزی در نمودار یا جدول برای جلب توجه به آن خط کشیده شده است؟ آیا واضح است که چرا برخی از داده ها پرچم گذاری شده اند؟
  • نویز: آیا داده های اضافی وجود دارد که حواس را از پیام اصلی نمودار منحرف می کند؟
  • منطقی: آیا داده ها به پاسخگویی به یک سوال تجاری خاص کمک می کند؟ آیا داده ها از یک نتیجه گیری یا استدلال پیشنهادی پشتیبانی می کنند؟

4. بدبینی و کنجکاوی در مورد داده ها.

علاوه بر تجزیه و تحلیل و تفسیر داده ها، باید به طور انتقادی نیز در مورد آن فکر کنید. خیلی اوقات داده ها بدیهی تلقی می شوند. با این حال، مهم است که بتوانیم به عقب برگردیم و سایر عوامل کمتر آشکار را که ممکن است بر نتایج و تفسیر آنها تأثیر بگذارند، بسنجیم:

  • روش جمع آوری: آیا روش یا روش جمع آوری داده ها می تواند بر نتایج تأثیر بگذارد؟
  • اعتبار: منبع داده ها چقدر معتبر یا قابل اعتماد است؟
  • اعتیادها: آیا سوگیری احتمالی از سوی تولید کننده داده یا شما به عنوان کاربر وجود دارد؟
  • انصافا: آیا داده‌ها به گونه‌ای دستکاری می‌شوند – عمدی یا سهوا – که معنای واقعی آن را نادرست نشان دهد؟
  • مفروضات: آیا مفروضات ضمنی وجود دارد که می تواند بر نحوه تفسیر اعداد تأثیر بگذارد؟
  • زمینه: آیا زمینه یا اطلاعات زمینه اضافی وجود دارد که برای درک صحیح داده ها وجود ندارد؟
  • مقایسه ها: اگر داده های اضافی برای مقاصد مقایسه گنجانده شود (مثلاً داده های دوره به دوره)، آیا این یک مقایسه منصفانه و مرتبط ارائه می دهد؟ از طرف دیگر، آیا مقایسه آشکاری وجود ندارد؟
  • علت: آیا ممکن است شما همبستگی را با علیت که مدل مستقیم علت و معلول است اشتباه بگیرید؟
  • معنی: اگر داده ها از نظر آماری معنی دار هستند، آیا از نظر عملی معنی دار هستند؟
  • موارد پرت: آیا انحراف مهم است یا به طور غیر ضروری نتایج کلی را منحرف می کند؟
  • کیفیت: آیا می توانید تفاوت بین داده های غیرقابل استفاده و داده هایی که هنوز مفید هستند را تشخیص دهید؟

سناریو: سواد اطلاعاتی در عمل

برای نشان دادن این اصول سواد داده در عمل، من از سناریوی زیر از یک بازاریاب دیجیتال استفاده می کنم که به تازگی نموداری را از یک تحلیلگر در تیم خود دریافت کرده است (به زیر مراجعه کنید). اولین وظیفه آن این است که بفهمد به چه چیزی نگاه می کند (همسان سازی داده ها). او متوجه می شود که نمودار دارای دو معیار است: بازدید از صفحه و نرخ پرش. آنها در 28 روز گذشته روی محورهای y جداگانه روند داشته اند. Ann با هر دو معیار وب نشان داده شده در نمودار (دانش داده ها!) آشنا است. با این حال، آن مطمئن نیست که داده ها برای کل وب سایت آنها (بعید است به دلیل حجم کم بازدید از صفحه) یا برای یک صفحه وب خاص باشد. او برای توضیح بیشتر به تحلیلگر مراجعه می کند.

پس از تأیید اینکه داده‌ها برای صفحه فرود بازاریابی اولیه شرکت هستند، Ann آماده تفسیر داده‌ها است. اولین مشاهده او این است که به نظر می رسد بازدیدهای صفحه در طول زمان افزایش می یابد. دوم، او متوجه می شود که حجم بازدید از صفحه بر اساس روزهای هفته چرخه ای است و در آخر هفته ها حجم کمتری دارد. سوم، او خاطرنشان می کند که نرخ ترک تحصیل تقریباً ثابت در حدود 45٪ است. چهارم، او متوجه افزایش زیادی در نرخ پرش در 12 فوریه شد، که هشدار دهنده است زیرا به این معنی است که بازدیدکنندگان بلافاصله پس از دیدن صفحه فرود سایت را ترک می کنند.
همانطور که آنا به آنچه در حال رخ دادن است فکر می کند، مشکوک است که صفحه فرود احتمالاً بهینه نشده است و ممکن است نیاز به طراحی مجدد داشته باشد. با این حال، او همچنین می‌داند که تیمش تغییرات قابل‌توجهی در صفحه ایجاد نکرده است و چیز دیگری باید باعث افزایش نرخ پرش شده باشد (شک و کنجکاوی داده‌ها). با کمی تحقیق و زمینه اضافه، او متوجه شد که تیمش در حال آزمایش یک پیکربندی محصول جدید است که توسط یک شریک شخص ثالث در دامنه وب خودش میزبانی شده است. از آنجایی که صفحات شریک به درستی برای ابزار تجزیه و تحلیل وب آنها علامت گذاری نشده است، به نظر می رسد بازدیدکنندگان وب سایت را ترک می کنند. از آنجایی که بازدیدهای اضافی از صفحه ثبت نشد، این امر باعث افزایش جعلی در نرخ پرش شد، حتی اگر بسیاری از بازدیدکنندگان در واقع پیکربندی محصول جدید را امتحان کردند. با استفاده از مهارت‌های سواد داده‌ای، آن می‌تواند یک مشکل را شناسایی کند و برای رفع آن اقدام اصلاحی انجام دهد (تگ‌های تجزیه و تحلیل وب شریک زندگی خود را رفع می‌کند).

امروزه مهارت های سواد داده ای بیش از هر زمان دیگری مورد نیاز است

همانطور که سواد، تمدن ها را از جهل و فقر بیرون می آورد، سواد داده ای بیشتر نیز می تواند سازمان شما را روشن و غنی کند. متأسفانه، بسیاری از کاربران تجاری هنوز این تصور اشتباه را دارند که داده ها در درجه اول کسب و کار شخص دیگری است. در محیط‌های تجاری غنی از داده‌های امروزی، درک، استفاده و برقراری ارتباط موثر داده‌ها – نه فقط متخصصان داده – به سرعت بر عهده همه است. پر کردن شکاف سواد داده در شرکت شما، توانایی کارمندان شما را برای پذیرش حجم فزاینده داده ای که در مقابل آنها قرار می گیرد تسریع می کند.

نقل قول سواد داده

توییتراین را توییت کنید

جالب است که پیامدهای ادامه بی سوادی داده‌ای جدی‌تر از تأثیر آن بر تجارت است. در میان فریادهای بدبینانه اخبار جعلی و ارائه حقایق جایگزین، بسیار مهم است که جامعه – نه فقط شرکت‌ها – سواد داده‌ای بیشتری را تشویق کنند تا مردم بتوانند واقعیت را از تخیلی بهتر تشخیص دهند. ما فقط به دانشمندان داده شهروندی نیاز نداریم – ما به شهروندان داده بیشتری نیاز داریم. بهترین دفاعی که در برابر داده های تقلبی داریم، عمومی است که از طریق سواد داده ای بیشتر از تأثیر منفی آن مصون است.

** این مقاله در ابتدا در Forbes.com در 9 مارس 2017 منتشر شد.






دیدگاهتان را بنویسید