في هذا الصيف، بدأنا نلتمس بداية إحدى الثورات الأكثر أهمية في مجال الذكاء الصناعي.
نحن نتكلم عن أكثر إنجاز حلمنا بتحقيقه في مجال علوم الحاسوب، إنه الذكاء الصنعي العام (AGI).
مع تقديمها لمعمارية إمبالا (Impala architecture)، يبدو أن شركة (DeepMind)، التي كانت وراء (AlphaGo) و (AlphaZero)، قد بدأت تقترب من الـ (AGI) حقًا.
دعونا نعرف الـ (AGI)، كون هذا المصطلح يستعمل من قبل أناس مختلفين بمعانٍ مختلفة، إنه عبارة عن خوارزمية واحدة يمكنها أن تؤدي مهام متعددة مبديةً نقلًا إيجابيًا للمهارات المتعلمة خلال قيامها بذلك، وتدعى أحيانًا التعلم الأعلى (meta-learning).
إن اكتساب مهارة واحدة، خلال التعلم الأعلى، يمكّن المتعلم من تعلم مهارة جديدة بشكل أسرع لأنه يطبق بعض “معرفته” السابقة للمهمة الجديدة. بعبارة أخرى، يتعلم البرنامج كيف يتعلم – ويمكن أن يعمم ذلك لاكتساب مهارات جديدة، كما يفعل البشر.
بشكله الحالي، يظهر الذكاء الصنعي قدرة ضئيلة على تطبيق ما تعلمه في مهام جديدة، وعادة ما يجب تدريبها من جديد من الصفر.
على سبيل المثال، لا يمكن للشبكة العصبية نفسها التي تقدم لك توصيات في موقع Netflix أن تستخدم لتقدم توصيات بقالة مفيدة.
حتى هذه الذكاءات الاصطناعية “الضيقة” ذات الوظيفة الواحدة يمكن أن تكون مثيرة للإعجاب، مثل تقنية Watson لشركة IBM أو تقنية السيارة ذاتية القيادة لشركة Google. ومع ذلك، فإن هذه لا تعد من الذكاء العام الاصطناعي (AGI)، الذي يمكن أن يطلق العنان لسلسلة متكررة من عمليات التحسين الذاتي، والتي يشار إليها باسم “انفجار الذكاء” أو “التفرد (singularity)”.
بالنسبة للذين يعتقدون أن هذا اليوم لن يأتي قبل زمن طويل فعليهم التفكير مرة أخرى.
من المؤكد أن شركة DeepMind قد حققت تقدمًا نحو هذا الهدف من قبل، وتحديدًا في عملها على Psychlab و Differentiable Neural Computers .
ولكن، تعد إمبالا أكبر الجهود وأكثرها نجاحًا حتى الآن، إذ تقدم خوارزمية واحدة يمكن أن تتعلم 30 مهمة صعبة مختلفة تتطلب جوانب مختلفة من التعلم والذاكرة.
والآن يكفي تمهيدًا، دعونا ننظر عميقًا لنعرف ما يجعل Impala مميزةً.
أولًا، تعتمد إمبالا على التعلم المعزز (Reinforcement learning)، وهي تقنية ذكاء اصطناعي يعود منشؤها إلى دراسة السلوكيات.
هذه الآلية تشابه الطريقة التي يبني بها الإنسان مهارة تستند إلى الحدس البديهي، مثل تعلم المشي أو ركوب الدراجة.
وقد تم بالفعل استخدام التعلم التعزيزي في بعض الإنجازات الرائعة، مثل منح الذكاء الاصطناعي المشاعر وتعليمه ألعاب معقدة مثل غو والبوكر.
ومع ذلك، فحتى خوارزميات التعلم المعزز هذه لم تتمكن من نقل ما تعلمته حول مهمة واحدة لاكتساب مهمة جديدة. من أجل تحقيق هذا الإنجاز، قامت DeepMind ببناء خوارزمية تعلم معزز تسمى A3C.
في ما يسمى التعلم المعزز باستخدام الناقد والفاعل (actor-critic reinforcement learning)، والذي تعد A3C إحدى أشكاله، يتم فصل العمل والتعلم بحيث تقوم شبكة عصبية واحدة، الناقد، بتقييم الأخرى المنفذة، ومعًا تقودان عملية التعلم. هذه الطريقة كانت أساس التصميم، ولكن DeepMind أضافت خوارزمية تصحيح جديدة تسمى (V-trace) إلى المزيج، ما جعل التعلم أكثر كفاءة، وأكثر قدرة على تحقيق نقل إيجابي بين المهام.
بالطبع، هذا لا ينبئ بزمن “الروبوتات الواعية” أو حتى الروبوتات التي لديها خيال. في حين أننا نفكر في هذه الصفات كسمات مميزة للذكاء لأنها تنطبق على البشر، فهذا أمر خاطئ نوعًا ما. إذ يقول الباحث في الذكاء الصنعي شين ليج (Shane Legg): «إن الأمور مثل الوعي والخيال قد تكون سمات مفيدة لحل أنواع معينة من المشاكل، مثل التنسيق بين أعداد كبيرة من الأشخاص أو تبادل المعلومات».
ومع ذلك، يمكن أن توجد خوارزمية خارقة الذكاء (superintelligent) بدون هذه السمات.
في الواقع، من المرجح أن نكون حكيمين لضمان عدم امتلاك الذكاء الاصطناعي للوعي كما نعرفه.