KnowledgeCity

التمثيل المرئي للبيانات والتعبير/السرد

في هذه الدروس، سنركّز على العلاقة بين الرسوم ومجموعات البيانات الأساسية المستخدمة في إنشائها.

في هذه الدروس، سنركّز على العلاقة بين الرسوم ومجموعات البيانات الأساسية المستخدمة في إنشائها. فليست كل البيانات متساوية، وبعض الرسوم تعمل بشكل أفضل من غيرها في مواقف معيّنة. سنستكشف عدّة مجموعات بيانات مناسبة للمدرّجات التكرارية، ومخططات الانتشار، والخرائط الحرارية. بالنسبة إلى المدرّجات التكرارية، نستخدم مجموعات بيانات يمكن اعتبارها توزيعًا — مثل ألف رمية نرد والنتائج المقابلة لها — مما يتيح لنا رؤية ذلك التوزيع.

سنوضّح لك كيفية الجمع بين الأرقام العشوائية، وNumpy، وmatplotlib.pyplot لإنشاء مجموعات بيانات ذات توزيع من خلال استخلاص بيانات من مهمة NASA إلى المرّيخ لرسم مخطط انتشار. تمتلك NASA قمرًا صناعيًّا يدور حول المرّيخ ويلتقط صورًا لسطحه؛ وفي هذه الدروس، سنستكشف تلك المجموعة من البيانات لرسم مناطق من سطح المرّيخ. كما ستستكشف كيفية عمل الخرائط الحرارية، بما في ذلك العلاقة بين المتغيّرات المختلفة للخريطة الحرارية، ومتى تكون منطقية ومتى لا تكون كذلك.

أهداف التعلّم:

  • فهم العلاقة بين البيانات الأساسية والرسم المناسب لها
  • تقييم الممارسات باستخدام Numpy وPandas ومجموعات البيانات الكبيرة
  • وصف العلاقة بين مجموعات البيانات والطرق المعتادة للتعبير عن مجموعات البيانات

المدرّب: Bill Hood

المدّة: 19m · 3 دروس
المستوى: Intermediate
اللغة: العربية

المهارات التي ستكتسبها

Data VisualizationInformation VisualizationScatter PlotsStatistical GraphicsVisual SimulationsVisualization

ما ستتعلمه

  • فهم العلاقة بين مجموعة البيانات الأساسية ونوع المخطط الأنسب للتعبير عنها
  • إنشاء مجموعات بيانات التوزيع عن طريق دمج الأرقام العشوائية و Numpy و matplotlib.pyplot
  • رسم المخططات التكرارية لمجموعات البيانات التي تمثل توزيعاً، مثل نتائج ألف رمية نرد
  • بناء مخططات التشتت من مجموعة بيانات مهمة المريخ التابعة لـ NASA لرسم مناطق من سطح المريخ
  • إنشاء مخططات الخرائط الحرارية وتقييم العلاقات بين متغيراتها
  • تطبيق ممارسات باستخدام Numpy و Pandas ومجموعات البيانات الضخمة

النقاط الرئيسية

  • ليست كل البيانات متساوية، وتعمل بعض المخططات بشكل أفضل من غيرها في حالات معينة.
  • تناسب المخططات التكرارية مجموعات البيانات التي يمكن اعتبارها توزيعاً، مثل نتائج ألف رمية نرد.
  • يمكن رسم مخططات التشتت من بيانات حقيقية، مثل الصور التي يلتقطها قمر صناعي تابع لـ NASA لسطح المريخ.
  • تعتمد الخرائط الحرارية على العلاقة بين متغيراتها، وهو ما يحدد متى تكون منطقية ومتى لا تكون كذلك.
  • يمكن دمج الأرقام العشوائية و Numpy و matplotlib.pyplot لإنشاء مجموعات بيانات ذات توزيع معين.

الأسئلة الشائعة

ماذا يغطي هذا المسار التعليمي؟

يركز المسار على العلاقة بين المخططات ومجموعات البيانات الأساسية المستخدمة لإنشائها، مع استكشاف المخططات التكرارية، ومخططات التشتت، والخرائط الحرارية، ومعرفة الوقت المناسب لاستخدام كل منها.

ما أنواع المخططات التي سأتعلم إنشاءها؟

ستتعلم كيفية الرسم باستخدام المخططات التكرارية، ومخططات التشتت، ومخططات الخرائط الحرارية.

ما الأدوات والمكتبات المستخدمة في هذا المسار؟

تستخدم الدروس الأرقام العشوائية، و Numpy، و Pandas، و matplotlib.pyplot للتعامل مع مجموعات البيانات وإنشاء المخططات.

ما مجموعات البيانات المستخدمة كأمثلة؟

تشمل الأمثلة توزيعاً مثل نتائج ألف رمية نرد، ومجموعة بيانات مهمة المريخ التابعة لـ NASA من قمر صناعي يقوم بتصوير سطح المريخ.

ما المهارات التي سأكتسبها؟

ستبني مهارات في تصور البيانات، وتصور المعلومات، ومخططات التشتت، والرسومات الإحصائية، والمحاكاة البصرية، والتصور.

النص

النص

في هذا الدرس سوف نتحدث عن الرسوم البيانية الخاصة بالتردد Histograms، ماهيتها ومتى تستخدمها. يوضح الرسم البياني المتردد توزيع التردد وما أعنيه بذلك هو عدد مرات حدوث شيء ما المتعلق بأحداث أخرى. على سبيل المثال، دعنا نستخدم لفة النرد. هناك ستة إجابات فقط. من واحد إلى ستة، نرمي النرد. سنحصل على واحد إلى ستة. نرمي النرد 1000 مرة. ماذا نتوقع من حيث تلك لفات النرد. ودعنا نمضي قدمًا ونحاكى ذلك. دعنا نسأل هذا السؤال. دعنا نضع ذلك في إطار الرسم البياني هي الإجابة الصحيحة في الواقع، عندما تحاول معرفة شكل البيانات. وفي هذه الحالة نريد أن نرى كيف تبدو لفة النرد. لذلك سنستخدم المدرج التكراري Histogram. سنقوم بالانطلاق مباشرة. أعتقد أننا جميعًا على دراية بهذه الواردات الثلاثة في هذه المرحلة، لذا لن نقضي الكثير من الوقت في الحديث عن ذلك. سنقوم بإنشاء قائمة تسمى rand مع حالة الرقم r قم بتعيينها على فارغة. وبعد ذلك سنقوم بإنشاء ستة خانات، وسنطلق عليها اسم خانات Bins لعدم وجود اسم أفضل. وثم في نطاق من 0 إلى 100 سننشئ X والذي سيكون رقمًا عشوائيًا بين 1 و 6 وهذا هو دحرجة نرد عبر المحاكاة، هذا هو بالضبط هذا هنا وبعد ذلك سنلحق أيًا كانت هذه النتائج بقائمتنا. وبعد ذلك سأرسم ذلك ونرى كيف يبدو. لنبدأ بـ 100 سجل فقط ودعنا نشغل ذلك. وما سنلاحظه، في هذه الحالة، هنا ها هي لفات النرد 1 و 2 و 3 و 4 و 5 و 6. ثم هذا هو التردد. ودحرجنا 1 20 مرة. دحرجنا 2 15 مرة. دحرجنا 3، يبدو أكثر بقليل من ربما 17 مرة. دحرجنا 4 15 مرة. أعدنا تشغيله مرة أخرى، وسنحصل على إجابة مختلفة. لكن ما سنبدأ في ملاحظته هو أن هناك اتجاهًا بالتأكيد وهذا الاتجاه هو أن هذا توزيع موحد. وما أعنيه بذلك هو أنه عندما تقوم برمي نرد، فإن فرص حصولك على 1 هي نفسها تمامًا مثل حصولك على 6، والتي تتطابق تمامًا مع حصولك على 4، وهكذا. لذا فإن ما نتوقعه من هذه البيانات عندما نرفع العد هو أنها أصبحت توزيعًا موحدًا بشكل واضح ويمكنك أن تبدأ في رؤيته الآن بـ 175 أو ربما يكون الحد الأقصى 180 هو الحد الأقصى ولكن يمكنك أن ترى هنا مكان النرد بالتأكيد يظهر وهو بالتأكيد يبدو موحدًا، أي احتمالية متساوية لأي إجابة. سنشغل الآن 10 آلاف ألق نظرة أخيرة، ويمكنك أن ترى حقًا أننا نقودها حقًا إلى هذا المظهر الموحد. حسنًا، يمكننا أن نرى أن هذا توزيع موحد، هذا هو السبب في أنك ستستخدم المدرج التكراري، وهذا هو نوع المعلومات التي تحاول اكتشافها عند استخدام الرسم البياني التكراري Histogram. دعنا الآن نزيد هذا بمقدار درجة واحدة وإلقاء نظرة على ماذا يحدث عندما يكون لديك رمي نرد. لذا سنستمر الآن بنفس النهج إلا أننا سنقوم برمي النرد مرة واحدة ثم مرة ثانية سنجمع أحجار النرد معًا وسنذهب لإلحاق ذلك برقمنا العشوائي. الآن لماذا نفعل ذلك؟ لأن هذا يشبه إلى حد كبير لفة النرد. الآن هل لفة النرد مع اثنين من النرد توزيع موحد؟ لا، لا ينبغي أن يكون. والسبب هو أنه باستخدام حجري نرد، هناك عدد من الطرق التي يمكنك من خلالها رمي أربعة وخمسة وستة وسبعة وثمانية، ومن هنا تأتي بعض الألعاب التي يتم لعبها حول ذلك. ولكن مع اثنين من النرد، فإن الخيارات تتراوح من 1 إلى 12. وما سنجده هو أن الغالبية العظمى من هؤلاء سيظهرون في منتصف ذلك، في منطقة التوزيع 6 و 7 و 8 وما إلى ذلك. يمكننا بالفعل أن نبدأ في رؤية هذا الشكل ويمكننا بالتأكيد أن نقول أن هذا ليس توزيعًا موحدًا. لذلك دعنا نشغّله الآن مرة أخرى ويمكننا أن نرى أنه تم تشكيله بالتأكيد. ما أعنيه بالشكل هو أن هذا هو 2، حسنًا ،هذا هو أدنى احتمال ،لقد حدث مائة مرة. ها هو الرقم 8، وهو احتمال أعلى بكثير. يحدث 300 مرة. لذا فإن الـ 8 بوضوح من المرجح أن يحدث أكثر من 2. والسبب هو أنه توجد طريقة واحدة فقط للحصول على 2 و 1 و 1. هناك طرق عديدة للحصول على الرقم 8. الدرس التالي هو المخططات المبعثرة.

التعلّم أثناء التنقّل

تعلّم أينما كنت — يتيح لك تطبيق KnowledgeCity للجوّال مشاهدة الدروس أثناء التنقّل.