KnowledgeCity

خوارزميات ونماذج التصنيف

ستتعلم في هذه الدروس خوارزميات التصنيف الأكثر استخدامًا والمشكلات التي تنطبق عليها عادةً.

ستتعلم في هذه الدروس خوارزميات التصنيف الأكثر استخدامًا والمشكلات التي تنطبق عليها عادةً. سنغطي العديد من أنماط النمذجة بما في ذلك: الانحدار، وNaive Bayes، وآلات المتجهات الداعمة، وأشجار القرار، ونماذج الغابات العشوائية، وخوارزمية K-Nearest Neighbours والنماذج متعددة الفئات.

لكل من أنماط النمذجة هذه، ستتعلم نقاط القوة والضعف النسبية والمفاضلات بينها. سيغطي هذا الفصل أيضًا مقدمة حول الشبكات العصبية واستخدامها في مشاكل التصنيف الشائعة، مثل تصنيف الصور والشبكات العصبية التلافيفية.

أهداف الدورة التدريبية:

  • التعرف على خوارزميات التصنيف الأكثر استخدامًا
  • التعرف على نقاط القوة والضعف في الخوارزميات
  • إدخال الشبكات العصبية واستخدامها في مشاكل التصنيف

المهارات التي ستتعلمها:

  • التمايز بين نماذج التصنيف
  • الشبكات العصبية في نمذجة التصنيف

المدرّب: Briana Brownell

المدّة: 34m · 8 دروس
المستوى: Intermediate
اللغة: العربية

المهارات التي ستكتسبها

تصنيف البياناتشجرة اتخاذ القرارتعلم الآلةخوارزميات تعلم الآلةأساليب تعلم الآلةتدريب نموذج تعلم الآلة

ما ستتعلمه

  • تحديد خوارزميات التصنيف الأكثر استخدامًا والمشكلات التي تُطبَّق عليها عادةً
  • مقارنة نقاط القوة والضعف والمقايضات في الانحدار وNaive Bayes وآلات المتجهات الداعمة وأشجار القرار ونماذج الغابة العشوائية وk أقرب جار
  • تطبيق النماذج متعددة الفئات على مشكلات التصنيف
  • شرح المحولات والشبكات العصبية واستخدامها في مشكلات التصنيف
  • استخدام الشبكات العصبية التلافيفية لتصنيف الصور

النقاط الرئيسية

  • تغطي الدورة أساليب نمذجة متعددة، منها الانحدار وNaive Bayes وآلات المتجهات الداعمة وأشجار القرار ونماذج الغابة العشوائية والتعزيز التدريجي وk أقرب جار والنماذج متعددة الفئات.
  • تفحص الدورة لكل أسلوب نمذجة نقاط قوته وضعفه النسبية والمقايضات بينها.
  • تُقدّم الدورة الشبكات العصبية واستخدامها في مشكلات التصنيف الشائعة كتصنيف الصور.
  • تُعرَض الشبكات العصبية التلافيفية في سياق تصنيف الصور.

الأسئلة الشائعة

ما خوارزميات التصنيف التي تغطيها هذه الدورة؟

تغطي الدورة الانحدار وNaive Bayes وآلات المتجهات الداعمة وأشجار القرار ونماذج الغابة العشوائية والتعزيز التدريجي وk أقرب جار والنماذج متعددة الفئات والمحولات والشبكات العصبية والشبكات العصبية التلافيفية لتصنيف الصور.

هل سأتعلم الفروق بين هذه الخوارزميات؟

نعم. ستتعلم لكل أسلوب نمذجة نقاط قوته وضعفه النسبية والمقايضات بينها.

هل تغطي الدورة الشبكات العصبية؟

نعم. تُقدّم الدورة الشبكات العصبية واستخدامها في مشكلات التصنيف الشائعة، بما فيها تصنيف الصور والشبكات العصبية التلافيفية.

ما المهارات التي تساعد هذه الدورة على بنائها؟

تبني الدورة مهارات في تصنيف البيانات، وتعلم أشجار القرار، وتعلم الآلة، وخوارزميات تعلم الآلة، وأساليب تعلم الآلة، وتدريب نماذج تعلم الآلة.

النص

النص

في هذا الفصل، سنطبق عمليا بعض الخوارزميات المحددة التي قد تستخدمها لنمذجة التصنيف. واحدة من أكثر الطرق شيوعًا لعمل نمذجة التصنيف هي مع الانحدار اللوجستي. الآن، يعد الانحدار أحد أكثر الأساليب شيوعًا من التعلم الآلي المستخدمة في الممارسة وله تاريخ طويل حقًا. يعتمد الانحدار اللوجستي على نفس النظرية على أنها انحدار خطي ولكن بدلاً من التنبؤ بقيمة محددة، تتنبأ باحتمال الانتماء إلى فئة معينة. للقيام بذلك، تستخدم الدالة اللوجيستية أو السينية. تبدأ هذه الدالة من احتمال الصفر إلى احتمال 100٪. ميزة استخدام الانحدار اللوجستي هو أن لديك هذا الاحتمال الذي يمكن تفسيره بشكل مباشر إلى حد ما. هذا يسمح لك بالنظر إلى متغير إدخال محدد ونرى كيف أن التغييرات داخل قيم متغير الإدخال هذا تؤثر على الاحتمال الكلي لنقطة البيانات في أن تنتمي إلى فئة معينة. لذا، دعنا نرى كيف يمكن أن يعمل. لدي هنا مثال على البرنامج من شأنه تشغيل نموذج معين على ثلاث مجموعات بيانات تركيبية مختلفة. تم إعداد مجموعات البيانات التركيبية بحيث يكون لديهم خصائص محددة بحيث عندما نقارن نتائج النماذج المختلفة، يمكننا تحديد المكان الذي تعمل فيه بعض النماذج بشكل جيد حقًا وأين تكون النماذج الأخرى ضعيفة نسبيًا. لذلك في حالة الانحدار اللوجستي، أحتاج أولاً إلى استيراد الوحدة من SK learn. ثم أحتاج إلى عنوان للرسم البياني الخاص بي، وأخيرًا، أحتاج إلى إدخال المصنف الفعلي نفسه الذي أريد أن أقوم بتشغيله، في هذه الحالة، إنه الانحدار اللوجستي. لذا عندما نقوم بتشغيل ذلك، فإنه يعرض أولاً مجموعات البيانات التركيبية ثم يظهر لنا أداء الانحدار اللوجستي. مجموعة البيانات الأولى تشبه قمرين متشابكين، الثانية على شكل دائرتين، واحدة حول الأخرى. والأخيرة هي في الأساس نقطة التي يمكن فصلها خطيًا تقريبًا. حسنًا، كيف حدث ذلك؟ لذا يخبرنا التظليل في الرسوم البيانية للنتائج أين يتوقع النموذج قيمة مقابل أخرى. لذا يتوقع ما إذا كانت نقطة البيانات تنتمي إلى الفئة الحمراء أو الزرقاء وتوضح لنا الشبكة المكان الذي يعتقد النموذج أنه منطقة التي تكون أكثر ارتباطًا بالفئة الحمراء أو الفئة الزرقاء. لذا يمكنك أن ترى هنا في أول واحد تذكر أن لدينا هذا النوع من العلاقة الخطية بين المتغيرين في النموذج. إذن ما يعنيه ذلك هو أنها ستتراكب نوعًا ما دالة السيني القائمة على الاحتمال على الشبكة بطريقة خطية. لذلك بالنسبة لأمثلتنا، هذا لا يعمل بشكل جيد حقًا إنه لا يمسك بالبنية داخل الأقمار ولا سيما داخل الدوائر. الآن المجموعة الأخيرة، مجموعة البيانات القابلة للفصل خطيًا يمكنك أن ترى أنه في الواقع أفضل بكثير، لكن الشيء المثير للاهتمام هو الاحتمال 100٪ أن المناطق التي يكون فيها النموذج مؤكدًا تمامًا أن نقطة البيانات تنتمي إلى تلك الفئة هي في الواقع بعيدة جدًا. لذا يمكنك أن ترى أن معظم نقاط البيانات إنها في الواقع تصنفهم قريبًا جدًا إلى علامة 50٪، إما أعلى بقليل أو أقل بقليل. هذا يعطينا بعض الحدس في أنواع مجموعات البيانات التي قد لا يتم تصميمها بشكل جيد من خلال الانحدار اللوجستي. لذلك يجب أن يمنحك هذا القليل من الحدس حول كيفية عمل الانحدار اللوجستي في بيانات الحياة الواقعية. هناك تحديات لهذا النموذج بالرغم من إنها طريقة شائعة للغاية للنمذجة يمكنك بالتأكيد أن تقول أنه لا يعمل بشكل جيد لأنواع معينة من العلاقات بين متغيرات الإدخال الخاصة بك. في الواقع، لا يستنتج أي نوع من العلاقات المعقدة ضمن متغيرات الإدخال الخاصة بك. ستحتاج إلى إنشاء متغيرات الإدخال هذه كميزات جديدة من أجل استخدامها. الشيء الجميل هو أنه من السهل تفسير ما الذي يحدث في النموذج. وهكذا إذا كان لديك نمط من مجموعة البيانات الذي يتمتع بدقة جيدة إلى حد ما،فسيكون تفسيرها أمر سهل للغاية لأن لديك معاملات قليلة فقط التي تحتاج إلى تفسيرها لفهم مدى أهمية كل من هذه العناصر. ويمكنك وضعها مباشرة في شكل احتمالات ويمكنك التفكير فيها في الاحتمالات وهي طريقة بديهية حقًا للتفكير في نمذجة التصنيف. المشكلة الأخيرة في الانحدار اللوجستي هي أن إنها حساسة جدًا للقيم المتطرفة. هذا يعني أن مجموعة التدريب الخاصة بك يمكنها حقًا أن تؤثر على النتيجة النموذجية. لذا كن على دراية بالقيم المتطرفة في بياناتك، إنه شيء يجب عليك دائمًا التحقق منه على أي حال ولكن من المهم حقًا عند استخدام الانحدار اللوجستي. التحدي الآخر مع الانحدار اللوجستي هو إنه مبني على مجموعة من الافتراضات التي قد لا تتحقق مع العديد من مصادر البيانات المختلفة التي تستخدمها. على سبيل المثال، وجود متغيرات غير متكافئ ضمن متغيرات الإدخال المختلفة هو شيء يمكن أن يؤثر بشكل كبير على النموذج الذي تبنيه. لذا تذكر بياناتنا من بطاقة ديكو لقد رأينا الكثير من التباين غير المتكافئ في متغيرات الإدخال. وفي هذه الحالة، نريد أن نتأكد بعد ذلك أن لدينا متغير إدخال يعمل في نموذجنا. الآن يجب أن يكون لديك فكرة جيدة عن، كيف يمكن تنفيذ الانحدار اللوجستي باستخدام مكتبة تعلم SK والطرق التي يمكنك من خلالها ستخدام بعض التصورات من أجل تفسير ما الذي يخبرك به النموذج وما الذي يحدث مع التنبؤ. يمكنك بناء حدسك على بعض من مجموعات البيانات التركيبية تلك حتى تحصل على فكرة حول كيفية مقارنة النماذج المختلفة عندما ستستخدم هذا في تحدياتك الحقيقية.

التعلّم أثناء التنقّل

تعلّم أينما كنت — يتيح لك تطبيق KnowledgeCity للجوّال مشاهدة الدروس أثناء التنقّل.