نحوه انتخاب نوع نمودار که داده های شما را به بهترین وجه توصیف کند
هنگامی که کار بر روی هر پروژه علم داده, یکی از مراحل ضروری برای کشف و تفسیر نتایج خود را به تجسم داده های خود را. در ابتدای پروژه, تجسم داده های شما به شما کمک می کند تا بهتر درک کنید, الگوها و روندها را پیدا کنید.
در پایان پروژه, پس از تجزیه و تحلیل خود را انجام داده ام و اعمال مدل های مختلف یادگیری ماشین, تجسم داده ها کمک خواهد کرد که شما در برقراری ارتباط نتایج خود را موثر تر.
انسانها ذاتا موجوداتی بصری هستند و چیزهایی برای ما منطقی هستند که در تجسم قابل فهم نشان داده شوند. تفسیر نمودار میله ای ساده تر از نگاه کردن به تعداد زیادی از اعداد در صفحه گسترده است.
تجسم داده های موثر می تواند پروژه شما را خراب یا خراب کند. اگر شما تن از تلاش را به تجزیه و تحلیل و مدل سازی داده های خود را, اما شما به پایان رسید تا با استفاده از نوع نمودار اشتباه به نتایج خود را, مخاطبان خود را نمی خواهد درک تلاش شما را در قرار داده و یا چگونه به استفاده از این نتایج.
بسیاری از انواع نمودار وجود دارد, بنابراین بسیاری از, روند انتخاب یک درست می تواند طاقت فرسا و گیج کننده. این مقاله-امیدوارم-به شما یک روش ساده و ساده برای انتخاب بهترین نوع نمودار که داده های شما را به طور کامل نشان می دهد و به طور موثر ارتباط برقرار می کند.
چگونه برای شروع?
قبل از اینکه شما شروع به دنبال در انواع نمودار, شما نیاز به خودتان بپرسید 5 سوال مهم در مورد داده های خود را. این سوالات به شما کمک می کند تا داده های خود را بهتر درک کنید و از این رو نوع نمودار مناسب را برای نمایش انتخاب کنید.
№1. چه داستان داده های خود را در تلاش است تا تحویل?
داده ها فقط داستانی است که به تعداد گفته می شود.
بنابراین, اولین چیزی که باید در مورد داده های خود بدانید این است, چه داستانی سعی در تحویل دارد? چرا این داده ها جمع شد, و چگونه?
داده های خود را برای پیدا کردن روند? برای مقایسه گزینه های مختلف? این نشان دادن برخی از توزیع? یا استفاده می شود برای مشاهده رابطه بین مجموعه ارزش های مختلف?
درک داستان اصلی داده های شما و دانستن اینکه چه چیزی سعی در تحویل دارد انتخاب نوع نمودار را برای شما بسیار ساده تر می کند.
№2. چه کسی شما را در حال حاضر نتایج خود را به?
هنگامی که شما نمیفهمد داستان پشت داده های خود را, بعد, شما نیاز به دانستن که شما خواهد شد نتایج خود را برای معرفی. اگر شما در حال تجزیه و تحلیل روند بازار سهام و شما یافته های خود را به برخی از بازرگانان در حال حاضر, شما ممکن است یک نوع نمودار های مختلف از اگر شما به نمایندگی از یافته های خود را برای مردم شروع به کار با بازار سهام استفاده.
تمام هدف استفاده از تجسم داده ها کارایی بیشتر ارتباطات داده است.
به همین دلیل شما باید مخاطبان خود را بشناسید تا بتوانید بهترین نوع نمودار را برای استفاده در هنگام نمایش داده های خود انتخاب کنید.
№3. داده های شما چقدر است?
اندازه داده های شما به طور قابل توجهی بر نوع نمودار مورد استفاده شما تاثیر می گذارد. برخی از انواع نمودارها قرار نیست با مجموعه داده های عظیم مورد استفاده قرار گیرند در حالی که برخی دیگر برای داده های بزرگ مناسب هستند.
مثلا, پیچارت بهترین کار با تعداد کمی از مجموعه داده; با این حال, اگر شما با استفاده از مقدار قابل توجهی از مجموعه داده, با استفاده از یک طرح پراکنده حس بیشتری خواهد داشت.
شما باید یک نوع نمودار را انتخاب کنید که متناسب با اندازه داده های شما باشد و بدون بهم ریختگی به وضوح نشان داده شود.
№4. نوع داده شما چیست?
انواع مختلفی از داده ها وجود دارد, توصیف, مداوم, کیفی, یا طبقه بندی. شما می توانید از نوع داده ها برای از بین بردن برخی از انواع نمودار استفاده کنید. مثلا, اگر شما داده های مداوم, یک نمودار میله ای ممکن است بهترین انتخاب; شما ممکن است نیاز به رفتن با یک نمودار خط به جای.
به طور مشابه, اگر شما داده های قطعی, سپس با استفاده از یک نمودار میله ای و یا یک نمودار دایره ای ممکن است یک ایده خوب. شما احتمالا نمی خواهید از یک نمودار خطی با داده های طبقه بندی شده استفاده کنید زیرا طبق تعریف نمی توانید دسته های مداوم داشته باشید. این باید یک مقدار محدود گسسته از دسته ها باشد.
№5. چگونه عناصر مختلف داده های خود را مربوط به یکدیگر?
در نهایت باید از خود بپرسید که عناصر مختلف داده های شما چگونه با هم ارتباط دارند. است سفارش داده های خود را بر اساس برخی از عامل زمان, اندازه,نوع — رتبه بندی بر اساس برخی از متغیر را نشان نمی دهد? یا یک ارتباط بین متغیرهای مختلف?
است داده های خود را یک سری زمانی-داده هایی که در طول زمان تغییر? یا بیشتر از یک توزیع?
رابطه بین مقادیر موجود در مجموعه داده شما ممکن است تصمیم بگیرد که از چه نوع نمودار کمی ساده تر استفاده کند.
7 نوع نمودار استفاده شده برتر
بیش از 40 نوع نمودار وجود دارد که برخی بیشتر از سایرین استفاده می شوند زیرا ساخت و تفسیر راحت تر هستند. بیایید در مورد 7 نوع نمودار برتر استفاده شده و زمان استفاده از هر کدام صحبت کنیم.
نمودار میله ای
زمان استفاده:
- مقایسه بخش هایی از یک مجموعه بزرگتر از داده ها, برجسته دسته های مختلف, و یا نشان دادن تغییر در طول زمان.
- برچسب دسته های طولانی داشته باشید-فضای بیشتری را فراهم می کند.
- اگر می خواهید مقادیر مثبت و منفی را در مجموعه داده نشان دهید.
هنگامی که برای جلوگیری از:
- اگر از چندین نقطه داده استفاده می کنید.
- اگر دسته های زیادی دارید از بارگذاری بیش از حد نمودار خود خودداری کنید. نمودار شما نباید بیش از 10 میله داشته باشد.
نمودار پای
زمان استفاده:
- وقتی نسبت ها و درصدهای نسبی یک مجموعه داده کامل را نشان می دهید.
- بهترین استفاده با مجموعه داده های کوچک-در مورد نمودارهای دونات نیز صدق می کند.
- هنگام مقایسه اثر یک عامل در دسته های مختلف.
- اگر حداکثر 6 دسته دارید.
- وقتی داده های شما اسمی است و ترتیبی نیست.
هنگامی که برای جلوگیری از:
- اگر شما یک مجموعه داده بزرگ.
- اگر می خواهید یک مقایسه دقیق یا مطلق بین مقادیر انجام دهید.
نمودار خطی
زمان استفاده:
- اگر یک مجموعه داده پیوسته دارید که با گذشت زمان تغییر می کند.
- اگر مجموعه داده شما برای نمودار میله ای خیلی بزرگ است.
- اگر می خواهید چندین سری را برای یک جدول زمانی نمایش دهید.
- اگر می خواهید روندها را به جای مقادیر دقیق تجسم کنید.
هنگامی که برای جلوگیری از:
- نمودار خط کار بهتر با مجموعه داده های بزرگتر, بنابراین, اگر شما یک کوچک, استفاده از یک نمودار میله ای به جای.
طرح پراکنده
زمان استفاده:
- برای نشان دادن همبستگی و خوشه بندی در مجموعه داده های بزرگ.
- اگر مجموعه داده شما حاوی نقاطی است که دارای یک جفت ارزش هستند.
- اگر ترتیب نقاط در مجموعه داده ضروری نباشد.
هنگامی که برای جلوگیری از:
- اگر داده های کوچک دارید.
- اگر مقادیر موجود در مجموعه داده شما با هم ارتباط ندارند.
نمودار منطقه
زمان استفاده:
- اگر می خواهید روابط بخشی به کل را نشان دهید.
- اگر می خواهید حجم داده های خود را به تصویر بکشید و نه فقط رابطه با زمان.
هنگامی که برای جلوگیری از:
- این را نمی توان با داده های گسسته استفاده کرد.
نمودار حباب
زمان استفاده:
- اگر می خواهید مقادیر مستقل را مقایسه کنید.
- اگر می خواهید توزیع یا رابطه را نشان دهید.
هنگامی که برای جلوگیری از:
- اگر داده های کوچک دارید.
نمودار ترکیبی
زمان استفاده:
- اگر می خواهید مقادیر را با اندازه گیری های مختلف مقایسه کنید.
- اگر مقادیر در محدوده متفاوت باشد.
هنگامی که برای جلوگیری از:
- اگر می خواهید بیش از 2 نمایش داده شود~3 نوع نمودار. در این صورت بهتر است نمودارهای جداگانه داشته باشید تا خواندن و درک راحت تر شود.
نکات انتخاب نمودار
هر زمان که شما تصمیم به ایجاد برخی از تجسم داده ها, استفاده از این بهترین شیوه را ساده تر و موثر.
- اگر شما داده های قطعی, استفاده از یک نمودار میله ای اگر شما بیش از 5 دسته ها و یا یک نمودار دایره ای در غیر این صورت.
- اگر شما داده های اسمی, استفاده از نمودار نوار یا هیستوگرام اگر اطلاعات شما گسسته است, و یا خط/ نمودار منطقه اگر مداوم است.
- اگر شما می خواهید برای نشان دادن رابطه بین ارزش ها در مجموعه داده خود را, استفاده از یک طرح پراکنده, نمودار حباب, و یا نمودار خط.
- اگر شما می خواهید برای مقایسه ارزش, استفاده از یک نمودار دایره ای — برای مقایسه نسبی — و یا نمودار نوار — برای مقایسه دقیق.
- اگر می خواهید مقایسه حجم نمودار منطقه یا نمودار حباب استفاده کنید.
- اگر شما می خواهید برای نشان دادن روند و الگوهای در داده های خود را, استفاده از یک نمودار خط, نمودار میله ای, و یا طرح پراکنده.
نتیجه گیری
قبل از اینکه شما انتخاب می کنید چه نوع نمودار به استفاده از, شما نیاز به دریافت به دانستن اطلاعات خود را بهتر, داستان پشت سر, و مخاطبان خود را/رسانه ها. هر زمان که شما سعی می کنید برای ایجاد یک تجسم, انتخاب رنگ های ساده و فونت.
همیشه تجسم ساده را نسبت به تجسم پیچیده هدف قرار دهید. هدف از تجسم داده ها سهولت در درک و خواندن است. بنابراین از اضافه بار و بهم ریختگی نمودارهای خود خودداری کنید. داشتن چندین نمودار ساده همیشه بهتر از یک نمودار مفصل است.
این مقاله برای اولین بار از سری سه قسمتی در تجسم است 101. مقالات بعدی نکاتی را برای تجسم موثر داده ها و کتابخانه های مختلف تجسم در پایتون و نحوه انتخاب بهترین مقاله بر اساس داده ها و نوع نمودار شما بیان می کنند.