Home
سيدتي
أخبار اقتصادية
أشد اختبار للذكاء الاصطناعي في الرياضيات.. والنتيجة صادمة!

أشد اختبار للذكاء الاصطناعي في الرياضيات.. والنتيجة صادمة!

لم يتمكن الذكاء الاصطناعي، رغم تقدمه الهائل، من انتزاع لقب “عالم رياضيات”، بعد أن أخضعه 11 من كبار الرياضيين في العالم لأصعب امتحان من نوعه حتى الآن. وعلى مدى أسبوع، مُنحت النماذج اللغوية الكبرى (LLMs) فرصة لحل 10 مسائل رياضية بحثية أُعلن عن نتائجها في الساعات الأولى من يوم “فالنتاين”، لتكشف عن حقيقة واضحة: لا نموذج ذكاء اصطناعي واحد اقترب من حل جميع المسائل، ولا حتى معظمها.

المسابقة التي حملت اسم “First Proof” صممت لاختبار قدرة الذكاء الاصطناعي على التعامل مع “اللمات” – وهي نتائج رياضية جزئية تمهد لإثباتات أكبر – وهي نوعية مسائل تعطى عادة لطالب دراسات عليا موهوب. ووفق محمد أبوزيد، أستاذ الرياضيات في جامعة ستانفورد وعضو الفريق المنظم، فقد اختيرت مسائل تتطلب لمسة ابتكار، وليس مجرد تطبيق آلي لتقنيات معروفة.

ورغم أن التحدي كشف جانباً من حدود الذكاء الاصطناعي، فإنه أظهر أيضاً مجتمعاً ناشئاً من المتحمسين داخل عالم الرياضيات، من أكاديميين ومبرمجين وطلاب جامعات، الذين انخرطوا في نقاشات ومحاولات مكثفة عبر المنتديات ومواقع التواصل.

نتائج ضعيفة وثقة زائفة

نشر فريق “First Proof” السبت الماضي حلول المسائل العشر، وكشف تجربته الشخصية في محاولة دفع النماذج لحلها. ورغم أن الذكاء الاصطناعي قدّم إثباتات كاملة وواثقة لكل مسألة، فإن اثنين فقط منها كانا صحيحين: الحل الخاص بالمسألة التاسعة والعاشرة. الأسوأ أن أحدهما كان مطابقاً تقريباً لحل موجود سابقاً، ما يضعف ادعاء أصالته.

حتى المسألة الأولى، التي تسرب جزء من برهانها عبر موقع صاحبها مارتن هايرر – الفائز بميدالية فيلدز عام 2014 – لم تنجح النماذج في استكمالها رغم تلميحات الحل المتاحة.

وعلى نحو لافت، لاحظ أبوزيد أن الأسلوب الذي أنتجته النماذج في الحلول الصحيحة أقرب إلى رياضيات القرن التاسع عشر، بينما يسعى العلماء لبناء رياضيات القرن الحادي والعشرين.

محاولات خارجية

لم تكن المشاركات الخارجية أفضل حالاً. بعضها بدا متأثراً بتدخل بشري بدرجات متفاوتة، رغم أن قواعد المسابقة تشدد على منع أي “مساعدة رياضية بشرية”.

قالت أستاذة الرياضيات بجامعة هارفارد وعضو الفريق المنظم، لورين ويليامز: “بمجرد دخول البشر إلى العملية، يصبح من الصعب تحديد ما هو إنجاز الآلة وما هو إنجاز الإنسان”.

وخلال عطلة نهاية الأسبوع، نشرت “OpenAI” نتائج محاولاتها، بعد “سباق أسبوعي” استخدمت فيه أحدث نماذجها إلى جانب تغذية راجعة من خبراء رياضيات. وقال جاكوب باتشوكي، كبير العلماء في الشركة، إن ستة من الحلول لديها فرصة عالية لتكون صحيحة، إلا أن رياضيين كشفوا بالفعل ثغرات في أحدها على الأقل.

ومع فتح الحلول، بدأ المتخصصون يفككون بسرعة عدداً كبيراً من البراهين التي بدت مقنعة للوهلة الأولى، ليتبين أنها غير دقيقة أو خاطئة.

الأصالة أصعب من الصحة

سيستغرق خبراء الرياضيات أياماً لمراجعة جميع المشاركات بعناية. لكن الحكم على “الأصالة” أصعب حتى من تقييم الصحة.

قال أستاذ الرياضيات بجامعة تورونتو، دانيال ليت: “لا شيء في الرياضيات بلا سوابق بشكل كامل”. فريق First Proof أكد أن ما جرى هو “تجربة أولى”، وأنه يستعد لجولة ثانية بقواعد أكثر صرامة وتفاصيل إضافية في 14 مارس.

بالنسبة للبعض، جاءت النتائج ضمن المتوقع. قال ليت: “كنت أتوقع حل مسألتين أو ثلاث مسائل بشكل لا لبس فيه من النماذج المتاحة للجمهور. أما حل عشر مسائل كاملة فكان سيكون مفاجئاً للغاية”.

لكن آخرين أشاروا إلى أن الحصول على حتى بضع حلول صحيحة لمسائل بحثية كان أمراً مستحيلاً قبل أشهر قليلة فقط.

وقال سكوت أرمسترونغ من جامعة السوربون: “هناك زملاء مصدومون. هذه الأدوات ستغير الرياضيات، والتغيير يحدث الآن”.

أما الطالب الجامعي كيفن باريتو من جامعة كامبريدج، الذي استخدم سابقاً الذكاء الاصطناعي لحل أحد مسائل الرياضي الشهير بول إردوش، فعبر عن خيبة أمل: “النماذج واجهت صعوبة واضحة، وأنا بصراحة محبط بعض الشيء”.

أشد اختبار للذكاء الاصطناعي في الرياضيات.. والنتيجة صادمة!

نتائج ضعيفة وثقة زائفة

محاولات خارجية

الأصالة أصعب من الصحة

Related Posts

ترامب: أسعار النفط ستنخفض سريعاً فور انتهاء الحرب.. ومستعدون لتعطيل الكهرباء في إيران

جمعية تجار بيروت تهنّئ سلام بالتكليف

الذهب يرتفع بعد أسبوعين من الخسائر وسط ترقب قرار الفيدرالي الأميركي

السعودية وهولندا توقعان 27 اتفاقية في القطاع الزراعي

سعر أونصة الذهب يرتفع الى 5168.69 دولاراً

دبوسي يهنئ بعيد الفطر: معالجة الكثير من الأزمات تبدأ من طرابلس الكبرى..

Recommended

قطاع الطيران العالمي في مهب حرب إيران: 50 ألف رحلة ملغاة وخسائر بالمليارات خلال شهر

4 مليارديرات يقودون مستقبل الرعاية الصحية في الشرق الأوسط

قائمة فوربس 250 تكشف عن خريطة جديدة للنجاح في الولايات المتحدة

سعر الغاز الأميركي عند أدنى مستوياته في 17 شهراً لوفرة المخزونات واعتدال الطقس

Popular

إتفاق بين “الطاقة” و”الصناعيين” لتخزين المحروقات مقابل صفر رسوم

توما : حركة مبيع النبيذ في الاعياد جيدة وافضل من السنة الماضية وتشكل بين ٣٥ و٤٠ في المئة من النسبة العامة

Recommended

قطاع الطيران العالمي في مهب حرب إيران: 50 ألف رحلة ملغاة وخسائر بالمليارات خلال شهر

4 مليارديرات يقودون مستقبل الرعاية الصحية في الشرق الأوسط

قائمة فوربس 250 تكشف عن خريطة جديدة للنجاح في الولايات المتحدة

سعر الغاز الأميركي عند أدنى مستوياته في 17 شهراً لوفرة المخزونات واعتدال الطقس

نتائج ضعيفة وثقة زائفة

محاولات خارجية

الأصالة أصعب من الصحة

Related Posts

Popular

للمراجعة او الاعلان او الإشتراك

Recommended