تجسم داده (data visualization) چیست؟
تجسم داده، عمل ترجمه اطلاعات به یک زمینه بصری، مانند نقشه یا نمودار، برای آسانتر کردن اطلاعات برای مغز انسان برای درک و استخراج بینش است. هدف اصلی تجسم داده ها آسان تر کردن شناسایی الگوها، روندها و نقاط پرت در مجموعه داده های بزرگ است. این اصطلاح اغلب به جای سایرین استفاده می شود، از جمله گرافیک اطلاعاتی، تجسم اطلاعات و گرافیک های آماری.
بصری سازی داده ها یکی از مراحل فرآیند علم داده است که بیان می کند پس از جمع آوری، پردازش و مدل سازی داده ها، برای نتیجه گیری باید تجسم شوند. بصری سازی داده ها همچنین یک عنصر از رشته معماری ارائه داده گسترده تر (DPA) است که هدف آن شناسایی، مکان یابی، دستکاری، قالب بندی و ارائه داده ها به کارآمدترین روش ممکن است.
تجسم داده ها تقریباً برای هر شغلی مهم است. این می تواند توسط معلمان برای نمایش نتایج آزمون دانش آموزان، توسط دانشمندان کامپیوتری که پیشرفت های هوش مصنوعی (AI) را بررسی می کنند یا توسط مدیرانی که به دنبال به اشتراک گذاری اطلاعات با سهامداران هستند، استفاده شود. همچنین نقش مهمی در پروژه های کلان داده ایفا می کند. از آنجایی که کسبوکارها در سالهای اولیه روند کلان داده، مجموعههای عظیمی از دادهها را جمعآوری میکردند، به راهی برای دریافت سریع و آسان یک دید کلی از دادههای خود نیاز داشتند. ابزارهای تجسم یک تناسب طبیعی بودند.
تجسم به دلایل مشابه در تجزیه و تحلیل پیشرفته نقش اساسی دارد. هنگامی که یک دانشمند داده در حال نوشتن الگوریتمهای تجزیه و تحلیل پیشبینیکننده پیشرفته یا یادگیری ماشینی (ML) است، تجسم خروجیها برای نظارت بر نتایج و اطمینان از عملکرد مدلها بهعنوان مورد نظر مهم میشود. این به این دلیل است که تجسم الگوریتمهای پیچیده معمولاً آسانتر از خروجیهای عددی تفسیر میشوند.
چرا تجسم داده ها مهم است؟
تجسم داده ها روشی سریع و موثر برای برقراری ارتباط بین اطلاعات به شیوه ای جهانی با استفاده از اطلاعات بصری فراهم می کند. این عمل همچنین می تواند به کسب و کارها کمک کند تا تشخیص دهند کدام عوامل بر رفتار مشتری تأثیر می گذارد. نقاطی را مشخص کنید که نیاز به بهبود دارند یا نیاز به توجه بیشتری دارند. داده ها را برای ذینفعان به یاد ماندنی تر کنید. درک زمان و مکان قرار دادن محصولات خاص؛ و حجم فروش را پیش بینی کنید.
از دیگر مزایای تجسم داده ها می توان به موارد زیر اشاره کرد:
- توانایی جذب سریع اطلاعات، بهبود بینش و تصمیم گیری سریعتر؛
- درک بیشتر از گام های بعدی که باید برای بهبود سازمان برداشته شود.
- توانایی بهبود یافته برای حفظ علاقه مخاطب با اطلاعاتی که آنها می توانند درک کنند.
- توزیع آسان اطلاعات که فرصت به اشتراک گذاشتن بینش با همه افراد درگیر را افزایش می دهد.
- از بین بردن نیاز به دانشمندان داده، زیرا داده ها در دسترس تر و قابل درک تر هستند. و
- افزایش توانایی برای عمل سریع بر روی یافته ها و در نتیجه رسیدن به موفقیت با سرعت بیشتر و اشتباهات کمتر.
تجسم داده ها و کلان داده ها
محبوبیت فزاینده پروژه های کلان داده و تجزیه و تحلیل داده ها، تجسم را بیش از همیشه مهم کرده است. شرکتها به طور فزایندهای از یادگیری ماشینی برای جمعآوری حجم عظیمی از دادهها استفاده میکنند که مرتبسازی، درک و توضیح آنها دشوار و کند است. تجسم ابزاری برای سرعت بخشیدن به این امر و ارائه اطلاعات به صاحبان کسب و کار و ذینفعان به روشی که می توانند درک کنند ارائه می دهد.
تجسم کلان داده اغلب فراتر از تکنیک های معمولی مورد استفاده در تجسم معمولی است، مانند نمودار دایره ای، هیستوگرام و نمودارهای شرکتی. در عوض از نمایش های پیچیده تری مانند نقشه های حرارتی و نمودارهای تب استفاده می کند. تجسم کلان دادهها به سیستمهای کامپیوتری قدرتمندی نیاز دارد تا دادههای خام را جمعآوری کند، آنها را پردازش کند و آنها را به نمایشهای گرافیکی تبدیل کند که انسانها میتوانند از آنها برای ترسیم سریع بینش استفاده کنند.
در حالی که تجسم داده های بزرگ می تواند مفید باشد، می تواند چندین مضرات را برای سازمان ها ایجاد کند. آنها به شرح زیر است:
- برای استفاده حداکثری از ابزارهای تصویرسازی کلان داده، باید یک متخصص تجسم استخدام شود. این متخصص باید بتواند بهترین مجموعه داده ها و سبک های تجسم را شناسایی کند تا تضمین کند که سازمان ها استفاده از داده های خود را بهینه می کنند.
- پروژههای تجسم دادههای بزرگ اغلب به مشارکت فناوری اطلاعات و همچنین مدیریت نیاز دارند، زیرا تجسم دادههای بزرگ به سختافزار رایانهای قدرتمند، سیستمهای ذخیرهسازی کارآمد و حتی انتقال به فضای ابری نیاز دارد.
- بینش های ارائه شده توسط تجسم داده های بزرگ فقط به اندازه اطلاعاتی که تجسم می شوند دقیق خواهند بود. بنابراین، وجود افراد و فرآیندهایی برای مدیریت و کنترل کیفیت دادههای شرکتی، ابردادهها و منابع داده ضروری است.
نمونه هایی از تجسم داده ها
در روزهای اولیه تجسم، رایج ترین تکنیک تجسم استفاده از صفحه گسترده مایکروسافت اکسل برای تبدیل اطلاعات به جدول، نمودار میله ای یا نمودار دایره ای بود. در حالی که این روشهای تجسم هنوز معمولاً استفاده میشوند، تکنیکهای پیچیدهتری در حال حاضر در دسترس هستند، از جمله موارد زیر:
- اینفوگرافیک
- ابرهای حبابی
- نمودارهای گلوله ای
- نقشه های حرارتی
- نمودارهای تب
- نمودارهای سری زمانی
- برخی دیگر از تکنیک های محبوب به شرح زیر است:
نمودارهای خطی این یکی از اساسی ترین و رایج ترین تکنیک های مورد استفاده است. نمودارهای خطی نشان می دهد که چگونه متغیرها می توانند در طول زمان تغییر کنند.
نمودارهای مساحتی این روش تجسم، تغییری از نمودار خطی است. چندین مقدار را در یک سری زمانی نمایش می دهد — یا دنباله ای از داده های جمع آوری شده در نقاط متوالی و به همان اندازه در زمان.
توطئه های پراکنده. این تکنیک رابطه بین دو متغیر را نشان می دهد. نمودار پراکندگی به شکل یک محور x و y با نقاط برای نشان دادن نقاط داده است.
نقشه های درختی این روش داده های سلسله مراتبی را در قالب تودرتو نشان می دهد. اندازه مستطیل های استفاده شده برای هر دسته متناسب با درصد آن از کل است. نقشههای درختی زمانی بهتر مورد استفاده قرار میگیرند که چندین دسته وجود داشته باشند و هدف مقایسه بخشهای مختلف یک کل است.
اهرام جمعیتی این تکنیک از یک نمودار میله ای انباشته برای نمایش روایت اجتماعی پیچیده یک جمعیت استفاده می کند. بهتر است هنگام تلاش برای نمایش توزیع یک جمعیت استفاده شود.
موارد استفاده متداول از تجسم داده ها
موارد استفاده رایج برای تجسم داده ها شامل موارد زیر است:
فروش و بازاریابی. تحقیقات ارائهدهنده دادههای بازار و مصرفکننده Statista تخمین زده است که در سال 2022، 566 میلیارد دلار برای تبلیغات دیجیتال هزینه شده است و این رقم تا سال 2025 از مرز 700 میلیارد دلار عبور خواهد کرد. تیمهای بازاریابی باید به منابع ترافیک وب خود و نحوه درآمدزایی داراییهای وب آنها توجه زیادی داشته باشند. تجسم داده ها به راحتی می توانید ببینید که چگونه تلاش های بازاریابی بر روند ترافیک در طول زمان تأثیر می گذارد.
سیاست. استفاده رایج از تجسم داده ها در سیاست، یک نقشه جغرافیایی است که حزبی را که هر ایالت یا ناحیه به آن رای داده است را نشان می دهد.
مراقبت های بهداشتی. متخصصان مراقبت های بهداشتی اغلب از نقشه های choropleth برای تجسم داده های مهم سلامت استفاده می کنند. نقشه choropleth مناطق یا مناطق جغرافیایی تقسیم شده را نشان می دهد که رنگ خاصی در رابطه با یک متغیر عددی به آنها اختصاص داده شده است. نقشه های Choropleth به متخصصان این امکان را می دهد که ببینند چگونه یک متغیر، مانند میزان مرگ و میر بیماری قلبی، در مناطق خاص تغییر می کند.
دانشمندان. تجسم علمی، که گاهی به اختصار SciVis نامیده میشود، به دانشمندان و محققان این امکان را میدهد تا بینش بیشتری از دادههای تجربی خود به دست آورند.
دارایی، مالیه، سرمایه گذاری. متخصصان امور مالی باید عملکرد تصمیمات سرمایه گذاری خود را هنگام انتخاب خرید یا فروش دارایی پیگیری کنند. نمودارهای کندل استیک به عنوان ابزار معاملاتی مورد استفاده قرار می گیرند و به متخصصان مالی کمک می کنند تا حرکات قیمت را در طول زمان تجزیه و تحلیل کنند و اطلاعات مهمی مانند اوراق بهادار، مشتقات، ارزها، سهام، اوراق قرضه و کالاها را نمایش دهند. با تجزیه و تحلیل چگونگی تغییر قیمت در طول زمان، تحلیلگران داده و متخصصان مالی می توانند روندها را تشخیص دهند.
لجستیک. شرکت های حمل و نقل می توانند از ابزارهای تجسم برای تعیین بهترین مسیرهای حمل و نقل جهانی استفاده کنند.
دانشمندان و محققین داده. تجسم های ساخته شده توسط دانشمندان داده معمولاً برای استفاده خود دانشمند یا برای ارائه اطلاعات به مخاطبان منتخب است. نمایشهای بصری با استفاده از کتابخانههای تجسم زبانها و ابزارهای برنامهنویسی انتخاب شده ساخته میشوند. دانشمندان و محققان داده اغلب از زبان های برنامه نویسی منبع باز – مانند پایتون – یا ابزارهای اختصاصی طراحی شده برای تجزیه و تحلیل داده های پیچیده استفاده می کنند. تجسم دادهها که توسط این دانشمندان و محققان داده انجام میشود به آنها کمک میکند تا مجموعههای داده را درک کنند و الگوها و روندهایی را شناسایی کنند که در غیر این صورت مورد توجه قرار نمیگرفتند.
علم تجسم داده ها
علم تجسم داده ها از درک چگونگی جمع آوری و پردازش اطلاعات توسط انسان ها ناشی می شود. دانیل کان و آموس تورسکی در تحقیقاتی که دو روش متفاوت برای جمعآوری و پردازش اطلاعات تعریف میکرد، همکاری کردند.
سیستم 1 بر روی پردازش فکر که سریع، خودکار و ناخودآگاه است تمرکز دارد. این روش اغلب در زندگی روزمره استفاده می شود و به انجام موارد زیر کمک می کند:
- خواندن متن روی علامت؛
- حل مسائل ریاضی ساده، مانند 1+1.
- تشخیص اینکه صدا از کجا می آید؛
- دوچرخه سواری؛ و
- تعیین تفاوت بین رنگ ها
سیستم 2 بر پردازش افکار آهسته، منطقی، محاسباتی و نادر تمرکز دارد. این روش در یکی از شرایط زیر استفاده می شود:
- تلاوت شماره تلفن؛
- حل مسائل پیچیده ریاضی، مانند 132 x 154.
- تعیین تفاوت در معنا بین چند نشانه که در کنار هم ایستاده اند. و
- درک نشانه های اجتماعی پیچیده
ابزارهای تجسم داده ها و فروشندگان
ابزار تجسم داده ها را می توان به روش های مختلفی مورد استفاده قرار داد. امروزه رایج ترین استفاده به عنوان ابزار گزارش هوش تجاری (BI) است. کاربران می توانند ابزارهای تجسم را برای تولید داشبوردهای خودکار تنظیم کنند که عملکرد شرکت را در شاخص های کلیدی عملکرد (KPI) ردیابی می کند و نتایج را به صورت بصری تفسیر می کند.
تصاویر تولید شده همچنین ممکن است دارای قابلیت های تعاملی باشند که به کاربران امکان می دهد آنها را دستکاری کنند یا برای پرسش و تجزیه و تحلیل دقیق تر به داده ها نگاه کنند. همچنین میتوان شاخصهایی را که برای هشدار دادن به کاربران هنگام بهروزرسانی دادهها یا وقوع شرایط از پیش تعریفشده طراحی شدهاند، ادغام کرد.
بسیاری از بخشهای تجاری نرمافزار تجسم دادهها را برای پیگیری ابتکارات خود پیادهسازی میکنند. برای مثال، یک تیم بازاریابی ممکن است این نرمافزار را برای نظارت بر عملکرد یک کمپین ایمیل، ردیابی معیارهایی مانند نرخ باز، نرخ کلیک و نرخ تبدیل، پیادهسازی کند.
همانطور که فروشندگان تجسم داده ها عملکرد این ابزارها را گسترش می دهند، آنها به طور فزاینده ای به عنوان قسمت های جلویی برای محیط های داده های بزرگ پیچیده تر استفاده می شوند. در این تنظیمات، نرمافزار تجسم دادهها به مهندسان و دانشمندان داده کمک میکند تا منابع داده را پیگیری کنند و تجزیه و تحلیل اکتشافی اولیه مجموعه دادهها را قبل یا بعد از تجزیه و تحلیلهای پیشرفتهتر دقیقتر انجام دهند.
بزرگترین نام ها در بازار ابزارهای کلان داده شامل مایکروسافت، IBM، SAP و SAS هستند. برخی دیگر از فروشندگان نرم افزار تخصصی تجسم کلان داده را ارائه می دهند. از نام های پرطرفدار این بازار می توان به Tableau، Qlik و Tibco اشاره کرد.
در حالی که مایکروسافت اکسل همچنان یک ابزار محبوب برای تجسم داده ها است، ابزارهای دیگری ساخته شده اند که توانایی های پیچیده تری را ارائه می دهند:
- IBM Cognos Analytics
- Qlik Sense و QlikView
- Microsoft Power BI
- آنالایزر بصری اوراکل
- SAP Lumira
- SAS Visual Analytics
- Tibco Spotfire
- Zoho Analytics
- D3.js
- ژوپیتر
- میکرواستراتژی
- نمودارهای گوگل