مايكل تشن | خبير إستراتيجيات المحتوى | 25 نوفمبر 2024
أصبح التعلم الآلي مصطلحًا شائعًا في السنوات الأخيرة، إذ انتقل المفهوم من الخيال العلمي إلى محرك رئيسي لكيفية معالجة الشركات والمؤسسات للمعلومات. مع استمرار وتيرة إنشاء البيانات في النمو بشكل كبير، تُعد أدوات التعلم الآلي محورية للمؤسسات التي تتطلع إلى اكتشاف الأنماط، واستخلاص الاتجاهات، ورسم المسار الأكثر ربحية للمضي قدمًا.
ما مدى شيوع التعلم الآلي؟ إذا نقرت على توصية من موقع للتجارة الإلكترونية أو منصة بث، أو تم إعلامك بسوء استخدام محتمل لبطاقة ائتمان، أو استخدمت برنامج نسخ، فقد استفدت من التعلم الآلي. يُستخدم في التمويل والرعاية الصحية والتسويق والبيع بالتجزئة والعديد من الصناعات الأخرى لاستخراج رؤى قيّمة من البيانات وأتمتة العمليات.
التعلم الآلي (ML) هو مجموعة فرعية من الذكاء الاصطناعي التي تركز على بناء أنظمة تتعلم - وتتحسن - مع استهلاك المزيد من البيانات. يُعد الذكاء الاصطناعي مصطلحًا أوسع يشير إلى الأنظمة أو الآلات التي تحاكي الذكاء البشري. وغالبًا ما تتم مناقشة التعلم الآلي والذكاء الاصطناعي معًا، ويتم استخدام المصطلحات في بعض الأحيان بالتبادل، ولكنهما لا يمثلان الشيء نفسه.
باختصار، كل ما هو تعلم آلي هو ذكاء اصطناعي، وليس العكس، فليس كل ذكاء اصطناعي هو تعلم آلي.
النقاط الرئيسة
التعلم الآلي هو تقنية تكتشف العلاقات غير المعروفة سابقًا في البيانات عن طريق البحث في مجموعات بيانات كبيرة جدًا لاكتشاف الأنماط والاتجاهات التي تتجاوز التحليل الإحصائي البسيط. يستخدم التعلم الآلي خوارزميات متطورة يتم تدريبها على تحديد الأنماط في البيانات، وإنشاء نماذج. يمكن استخدام هذه النماذج لتقديم تنبؤات وتصنيف البيانات.
لاحظ أن الخوارزمية ليست هي نفسها النموذج. الخوارزمية هي مجموعة من القواعد والإجراءات المستخدمة لحل مشكلة معينة أو أداء مهمة معينة، بينما النموذج هو الناتج أو نتيجة تطبيق خوارزمية على مجموعة بيانات.
قبل التدريب، لديك خوارزمية. بعد التدريب، لديك نموذج.
على سبيل المثال، يُستخدم التعلم الآلي على نطاق واسع في مجال الرعاية الصحية لتنفيذ مهام تشمل تحليل الصور الطبية، والتحليلات التنبؤية، وتشخيص الأمراض. تُعد نماذج التعلم الآلي مناسبة تمامًا لتحليل الصور الطبية، مثل فحوصات التصوير بالرنين المغناطيسي والأشعة السينية والتصوير المقطعي المحوسب، لتحديد الأنماط واكتشاف التشوهات التي قد لا تكون مرئية للعين البشرية أو التي قد يغفل عنها طبيب تشخيصي مرهق. يمكن لأنظمة التعلم الآلي أيضًا تحليل الأعراض والمعلومات الجينية وبيانات المرضى الأخرى لاقتراح اختبارات لحالات مثل السرطان والسكري وأمراض القلب.
تتمثل السمات الرئيسية للتعلم الآلي في
هناك أربعة أنواع رئيسية للتعلم الآلي. لكل منها نقاط قوته وقيوده، ما يجعل اختيار النهج الصحيح للمهمة المحددة أمرًا بالغ الأهمية.
التعلم الآلي المعزز، مثل التعلم الآلي غير الخاضع للإشراف، يستخدم مجموعات بيانات غير مصنفة ويسمح للخوارزميات بتقييم البيانات. ومع ذلك، يختلف التعلم المعزز في أنه يعمل لتحقيق هدف محدد بدلاً من استكشاف البيانات لاكتشاف أي أنماط قد تكون موجودة. مع وضع هدف في الاعتبار، تتقدم الخوارزمية في عملية التجربة والخطأ. تتلقى كل خطوة تعليقات إيجابية أو سلبية أو محايدة، والتي تستخدمها الخوارزمية لصقل عملية صنع القرار الشاملة الخاصة بها. يمكن لخوارزميات التعلم المعزز أن تعمل على مستوى كلي نحو هدف المشروع، حتى لو كان ذلك يعني التعامل مع عواقب سلبية قصيرة الأجل. بهذه الطريقة، يتعامل التعلم المعزز مع مواقف أكثر تعقيدًا وديناميكية من الطرق الأخرى لأنه يسمح لسياق هدف المشروع بالتأثير على المخاطر في الخيارات. يُعد تعليم الكمبيوتر لعب الشطرنج مثالاً جيدًا. الهدف العام هو الفوز باللعبة، ولكن ذلك قد يتطلب التضحية بقطَع مع تقدم اللعبة.
ما النهج الأفضل الذي يناسب احتياجاتك؟ يعتمد اختيار النهج الخاضع للإشراف أو إحدى الطرق الثلاث الأخرى عادةً على بنية وحجم بياناتك، والميزانية والساعات التي يمكن تخصيصها للتدريب، وحالة الاستخدام التي تريد تطبيق النموذج النهائي عليها. قد يكون التغاضي عن اقتراح بلوزة لتتناسب مع تنورة غير ذي أهمية. أما تفويت ورم فله عواقب وخيمة.
كما يشير اسمه، يعمل التعلم الآلي عن طريق إنشاء نماذج إحصائية قائمة على الكمبيوتر يتم تحسينها لغرض معين عن طريق تقييم بيانات التدريب، بدلاً من النهج الكلاسيكي حيث يطور المبرمجون خوارزمية ثابتة تحاول حل مشكلة. مع تمرير مجموعات البيانات عبر نموذج التعلم الآلي، يتم الحكم على الناتج من حيث الدقة، ما يسمح لعلماء البيانات بتعديل النموذج من خلال سلسلة من المتغيرات الثابتة، تسمى المَعلمَات الفائقة، والمتغيرات المعدلة خوارزميًا، تسمى مَعلمَات التعلم.
نظرًا لأن الخوارزمية تتكيف في أثناء تقييم بيانات التدريب، فإن عملية التعرض والحساب حول البيانات الجديدة تدرب الخوارزمية على أن تصبح أفضل فيما تفعله. الخوارزمية هي الجزء الحسابي من المشروع، بينما مصطلح "النموذج" هو خوارزمية مدربة يمكن استخدامها لحالات استخدام العالم الحقيقي.
سيحدد نطاق مشاريع التعلم الآلي ومواردها وأهدافها المسار الأنسب، ولكن معظمها يتضمن سلسلة من الخطوات.
1. جمع البيانات وتجميعها
يتطلب تدريب نماذج التعلم الآلي الكثير من البيانات عالية الجودة. غالبًا ما يكون العثور عليها صعبًا، وقد يكون تصنيفها، إذا لزم الأمر، كثيفًا جدًا للموارد. بعد تحديد مصادر البيانات المحتملة، قم بتقييمها لتحديد الجودة الشاملة والتوافق مع موارد تكامل/مستودع البيانات الحالية للمشروع. تشكّل هذه المصادر الأساس التدريبي لمشروع تعلم آلي.
2. اختيار خوارزمية مناسبة لإنتاج النموذج المطلوب
اعتمادًا على ما إذا كان المشروع يخطط لاستخدام التعلم الخاضع للإشراف أو غير الخاضع للإشراف أو شبه الخاضع للإشراف، يمكن لعلماء البيانات اختيار الخوارزميات الأكثر ملاءمة. على سبيل المثال، يمكن لمشروع أبسط مع مجموعة بيانات مصنفة استخدام شجرة قرار، بينما يتطلب التجميع - تقسيم عينات البيانات إلى مجموعات من الكائنات المتشابهة - المزيد من موارد الحوسبة إذ تعمل الخوارزمية دون إشراف لتحديد أفضل مسار لهدف معين.
3. تحسين البيانات وإعدادها للتحليل
من المحتمل أن البيانات الواردة لن تكون جاهزة للاستخدام. ينظّف إعداد البيانات مجموعات البيانات لضمان إمكانية استيعاب جميع السجلات بسهولة في أثناء التدريب. يتضمن الإعداد مجموعة من مهام التحويل، مثل إنشاء تنسيقات التاريخ والوقت، وضم أو فصل الأعمدة حسب الحاجة، وتعيين مَعلمَات التنسيق الأخرى، مثل الأرقام المعنوية المقبولة في بيانات الأرقام الحقيقية. تشمل المهام الرئيسية الأخرى تنظيف السجلات المكررة، والتي تسمى أيضًا إزالة تكرار البيانات، وتحديد وربما إزالة القيم المتطرفة.
4. تعليم النموذج من خلال التدريب
بمجرد تحديد النموذج النهائي المطلوب، تبدأ عملية التدريب. في التدريب، تتم تغذية مجموعة بيانات مُنسقة، إما مصنفة أو غير مصنفة، إلى الخوارزمية. في عمليات التشغيل الأوليّة، قد لا تكون النتائج رائعة، ولكن علماء البيانات سيقومون بالتعديل حسب الحاجة لتحسين الأداء وزيادة الدقة. ثم يتم عرض البيانات على الخوارزمية مرة أخرى، عادةً بكميات أكبر لضبطها بدقة أكبر. كلما زادت البيانات التي تراها الخوارزمية، كان النموذج النهائي أفضل في تقديم النتائج المرجوة.
5. تقييم أداء النموذج ودقته
بعد تدريب النموذج بدقة كافية، يكون قد حان الوقت لمنحه بيانات غير مرئية سابقًا لاختبار أدائه. غالبًا ما تكون البيانات المستخدمة للاختبار مجموعة فرعية من بيانات التدريب مخصصة للاستخدام بعد التدريب الأوّلي.
6. ضبط مَعلمَات النموذج وتحسينها
من المرجح الآن أن يكون النموذج قريبًا من النشر. يجب أن تنتج عمليات التشغيل مع مجموعات بيانات الاختبار نتائج دقيقة للغاية. تحدث التحسينات من خلال تدريب إضافي ببيانات محددة - غالبًا ما تكون فريدة لعمليات الشركة - لتكملة البيانات المعممة المستخدمة في التدريب الأصلي.
7. إطلاق النموذج
مع تحسين النتائج، أصبح النموذج الآن جاهزًا للتعامل مع البيانات غير المرئية سابقًا في الاستخدام الإنتاجي العادي. عندما يكون النموذج مباشرًا، ستجمع فرق المشروع بيانات حول كيفية أداء النموذج في سيناريوهات العالم الحقيقي. يمكن القيام بذلك عن طريق مراقبة مقاييس الأداء الرئيسية، مثل الدقة، والصحة الإجمالية لتنبؤات النموذج، والاستدعاء، ونسبة الملاحظات الإيجابية المتوقعة بشكل صحيح. ضع في اعتبارك أيضًا كيف تؤثر تنبؤات النموذج على نتائج الأعمال على أرض الواقع - هل تولّد قيمة، سواءً في زيادة مبيعات البلوزات أو تحسين التشخيص؟
يمكن أن يساعد إجراء عمليات تدقيق ومراجعات منتظمة لأداء النموذج في تحديد المشكلات أو التشوهات التي ربما نشأت بعد النشر وهي ضرورية لضمان أداء النموذج بفعالية وتحقيق الأهداف المرجوة.
الخوارزميات هي الجزء الحسابي من مشروع التعلم الآلي. بمجرد تدريبها، تنتج الخوارزميات نماذج ذات احتمالية إحصائية للإجابة عن سؤال أو تحقيق هدف. قد يكون هذا الهدف هو العثور على ميزات معينة في الصور، مثل "تحديد جميع القطط"، أو قد يكون اكتشاف الحالات الشاذة في البيانات التي يمكن أن تشير إلى احتيال أو بريد عشوائي أو مشكلة صيانة في آلة. قد تحاول خوارزميات أخرى تقديم تنبؤات، مثل عناصر الملابس التي قد يحبها المشتري أيضًا بناءً على ما هو موجود حاليًا في عربة التسوق.
فيما يلي بعض الخوارزميات الأكثر شيوعًا المستخدمة في التعلم الآلي:
ما وراء الشبكات العصبية
يستخدم التعلم الآلي مجموعة واسعة من الخوارزميات. بينما تتربع الخوارزميات المذكورة أعلاه على عرش الشعبية، إليك خمس خوارزميات أقل شيوعًا ولكنها لا تزال مفيدة.
تعزيز التدرج (Gradient boosting) | خوارزمية تبني نماذج بالتتابع من خلال التركيز على الأخطاء السابقة في التسلسل. مفيدة لاكتشاف الاحتيال والبريد العشوائي. |
خوارزمية الجيران الأقرب (K-nearest neighbors - KNN) | نموذج بسيط ولكنه فعال يصنف نقاط البيانات بناءً على تصنيفات أقرب جيران لها في بيانات التدريب. |
تحليل المكونات الرئيسية (Principal component analysis - PCA) | خوارزمية تقلل من أبعاد البيانات عن طريق تحديد أهم الميزات. مفيدة للتصور وضغط البيانات، على سبيل المثال، لاكتشاف الحالات الشاذة. |
التعلم كيو (Q-learning) | خوارزمية تستخدم وكيلاً يتعلم من خلال التجربة والخطأ، ويتلقى مكافآت للإجراءات المرغوبة وعقوبات لاتخاذ الخطوة الخاطئة. |
آلات المتجهات الداعمة (Support vector machines - SVM) | خوارزمية تنشئ مستوى فائقًا لفصل نقاط البيانات التي تنتمي إلى فئات مختلفة بشكل فعال، مثل تصنيف الصور. |
يتيح التعلم الآلي للمؤسسات استخلاص رؤى من بياناتها قد لا تتمكن من العثور عليها بأي طريقة أخرى. تشمل بعض الفوائد الأكثر شيوعًا من دمج التعلم الآلي في العمليات ما يلي:
تعتمد فعالية مشاريع التعلم الآلي على جودة النظام والموارد التي يتم بناؤها بها. وهذا يسلط الضوء على الحاجة إلى الاستثمار في التخطيط والإعداد المناسبين.
فيما يلي بعض التحديات الأكثر شيوعًا التي تواجه مشاريع التعلم الآلي:
يمكن أن يوفر التعلم الآلي فوائد كبيرة لكل صناعة وكل قسم داخل المؤسسة. إذا تم إجراء العمليات الحسابية وكانت البيانات موجودة، فإن التعلم الآلي يوفر طريقة لزيادة الكفاءة واستخلاص أنواع جديدة من المشاركة. تشمل حالات استخدام التعلم الآلي الشائعة عبر الصناعات ما يلي:
يقدم التعلم الآلي في Oracle Database مجموعة من الإمكانات والميزات لتسريع عملية التعلم الآلي. مع القدرة على الاحتفاظ بالبيانات داخل قاعدة البيانات، يمكن لعلماء البيانات تبسيط سير عملهم وزيادة الأمان مع الاستفادة من أكثر من 30 خوارزمية مدمجة وعالية الأداء؛ ودعم اللغات الشائعة، بما في ذلك R وSQL وPython؛ وإمكانات التعلم الآلي الآلية؛ وواجهات دون تعليمات برمجية.
بالنسبة إلى المؤسسات التي لديها مجموعات بيانات كبيرة، فإن التعلم الآلي داخل قاعدة البيانات مع HeatWave MySQL يلغي الحاجة إلى نقل البيانات إلى نظام منفصل للتعلم الآلي، ما يمكن أن يساعد في زيادة الأمان وخفض التكاليف وتوفير الوقت. يعمل HeatWave AutoML على أتمتة دورة حياة التعلم الآلي، بما في ذلك اختيار الخوارزمية وأخذ عينات البيانات الذكية للتدريب واختيار الميزات والضبط، ما يوفر غالبًا المزيد من الوقت والجهد.
العائد من التعلم الآلي هو القدرة على تحليل وتفسير كميات كبيرة من البيانات بسرعة ودقة. بمجرد التدريب، يمكن لنماذج التعلم الآلي تحديد الأنماط والاتجاهات والرؤى في ثوانٍ أو دقائق والتي يمكن أن تستغرق أسابيع من البشر للكشف عنها - أو التي قد لا ترى النور أبدًا. والنتيجة هي اتخاذ قرارات أكثر استنارة، وتحسين حل المشكلات، والقدرة على تقديم تنبؤات قائمة على البيانات. بالإضافة إلى ذلك، يمكن لنماذج التعلم الآلي أتمتة العمليات الروتينية، ما يوفر الوقت والموارد. يحقق التعلم الآلي إمكاناته لإحداث ثورة في مكان العمل ودفع الابتكار.
التعلم الآلي هو المفتاح لإطلاق القيمة في بياناتك - والخطوة الأولى في برنامج ذكاء اصطناعي ناجح.
ما الفرق بين الذكاء الاصطناعي والتعلم الآلي؟
الذكاء الاصطناعي هو الاسم الذي يُطلق على مجال الحوسبة الواسع الذي يركز على بناء وتطوير أنظمة تفكر مثل البشر. التعلم الآلي هو مجموعة فرعية من مجال الذكاء الاصطناعي تركز تحديدًا على الجانب الحسابي لعملية التعلم. غالبًا ما يُستخدم المصطلحان بالتبادل ويواجهان تحديات مماثلة، ولكنهما موجودان بشكل منفصل على الرغم من هذه الصلة.
ما الأنواع الأربعة الرئيسية للتعلم الآلي؟
الأنواع الأربعة للتعلم الآلي هي كما يلي:
هل تعلم التعلم الآلي صعب؟
مثل أي حرفة تقنية، فإن تعلم تفاصيل التعلم الآلي هو عملية تكرارية تتطلب الوقت والتفاني. نقطة انطلاق جيدة للتعلم الآلي هي امتلاك أساس في لغات البرمجة، مثل Python أو R، إلى جانب فهم الإحصاء. يتطلب العديد من العناصر المتعلقة بتقييم مخرجات التعلم الآلي فهم المفاهيم الإحصائية، مثل الانحدار والتصنيف والتوافق والمعلمات.
هل من أمثلة على التعلم الآلي؟
أحد الأمثلة الأكثر شيوعًا للتعلم الآلي هو محرك اقتراحات. في التجارة الإلكترونية، يظهر ذلك كاقتراح منتج "قد يعجبك أيضًا...". في وسائط بث الفيديو، يظهر ذلك كأفكار لما يجب مشاهدته بعد ذلك. في هذه الحالات، تأخذ الخوارزمية تاريخ المستخدم وتنشئ تنبؤات لما قد يجده المستخدم مثيرًا للاهتمام - وكلما أضاف المستخدم نقاط بيانات، تمكنت الخوارزمية من تحسين التنبؤات.