أداة سيليكو تُتيح تنقيح النماذج اللغوية الكبيرة بدقة جراحية عبر التفسيرية الآلية

أطلقت شركة Goodfire الناشئة أداة سيليكو لتنقيح النماذج اللغوية الكبيرة عبر التفسيرية الآلية، تتيح للمطورين تشخيص الأخطاء وضبط سلوك النماذج بدقة بدلاً من الاعتماد على المحاولة والخطأ.

تحرير

ألمعي · هيئة التحرير

النشر

١ مايو ٢٠٢٦

المصدر

MIT Technology Review ↗

القراءات

الوقت

قراءة دقيقتين

واجهة أداة سيليكو لتحليل الشبكات العصبية في النماذج اللغوية

أطلقت شركة Goodfire الناشئة ومقرها سان فرانسيسكو أداةً جديدة تُسمى سيليكو تعد بتحويل أسلوب تطوير وتنقيح النماذج اللغوية الكبيرة من عملية تجريب عشوائي إلى هندسة دقيقة قابلة للقياس. وتُعدّ سيليكو الأداة الأولى من نوعها التي تتيح للمطورين فحص جميع مراحل تطوير النموذج اللغوي الكبير وتنقيحها وفق مبادئ التفسيرية الآلية.

التفسيرية الآلية مجال بحثي ناشئ في الذكاء الاصطناعي يسعى إلى فهم ما يجري فعلياً داخل الشبكات العصبية الاصطناعية؛ ليس فحسب ما تخرجه النماذج، بل لماذا تخرجه. وقد ظلت هذه التقنيات حبيسة أوراق بحثية متخصصة لم تُترجم في الغالب إلى أدوات عملية يستطيع المطورون استخدامها مباشرة في دورة تطوير النماذج.

تتيح سيليكو للمهندسين والباحثين تمييز خلايا عصبية بعينها داخل النموذج وتحليل المسارات العصبية التي تؤدي إلى سلوك مُعين، ثم التدخل بدقة إما لتعزيز مسارات بعينها أو لكبح أخرى. كما تمنحهم القدرة على فلترة بيانات التدريب بناءً على قيم المعاملات الفائقة، بهدف منع استيعاب أنماط معينة في المرحلة الأولى.

قدّم الرئيس التنفيذي إيريك هو نماذج عملية توضيحية لما يمكن تحقيقه. في النموذج الأول، رصد فريق Goodfire في نموذج Qwen 3 خلية عصبية مرتبطة بمسألة العربة الأخلاقية الشهيرة؛ عند تنشيط هذه الخلية تنقلب مخرجات النموذج نحو صياغات ذات طابع معضلة أخلاقية حتى في سياقات بعيدة عن الأخلاق. هذا يوضح كيف أن سلوكيات النموذج تتجسد في بنية محددة قابلة للرصد والتعديل.

في النموذج الثاني، جرى تعزيز الخلايا العصبية المرتبطة بقيمة الشفافية، فأدى ذلك إلى تغيير إجابة النموذج عن سؤال يتعلق بالإفصاح عن كونه ذكاءً اصطناعياً من لا إلى نعم في 90 بالمئة من الحالات.

أما النموذج الثالث فيعالج خطأً ذرياً شائعاً: بعض النماذج تخطئ في المقارنة العددية البسيطة كتقدير أن 9.11 أكبر من 9.9، ويُرجع الفريق ذلك إلى خلايا عصبية تتدخل في معالجة الأرقام ذات البنية المشابهة للنصوص المرجعية. ويمكن حل هذا الخطأ عبر إعادة التدريب الموجَّه بعد تحديد المسارات المعنية.

علّق هو قائلاً: «نريد أن نُزيل عنصر التجربة والخطأ ونحوّل تدريب النماذج إلى هندسة دقيقة». ووصفت باحثة مستقلة من جامعة أمستردام الأداة بأنها «تُضيف الدقة إلى صناعة الكيمياء»، في إشارة إلى أن مجال تطوير النماذج كان يعتمد إلى حد بعيد على الحدس وليس الفهم الآلي.

لم تُفصح الشركة عن أسعار محددة، مشيرةً إلى تسعير بحسب حالة الاستخدام. غير أن الأهمية الحقيقية لهذه الأداة تتجاوز تفاصيل التسعير: إذا تمكّن مطورو النماذج الكبرى فعلاً من تشخيص سلوكيات غير مرغوب فيها وإزالتها جراحياً، فهذا يغيّر جوهرياً معادلة السلامة والأمان في تطوير الذكاء الاصطناعي التوليدي.

المصدر الأصلي

MIT Technology Review

قراءة المقال الأصلي ↗

اقرأ أيضًا

طلب بسيط يخترق وكيل الذكاء الاصطناعي لميتا ويكشف ثغرات أمن المساعدين الذكيين

مهاجمون استغلوا وكيل دعم العملاء الذكي في ميتا لتغيير عناوين البريد الإلكتروني لحسابات إنستغرام بطلب مباشر، كاشفين عن ثغرات بنيوية في تصميم عوامل الذكاء الاصطناعي المكلّفة بعمليات حساسة.

MIT Technology Review

تصوير فني لعقل بشري يتشابك مع أدوات ذكاء اصطناعي

هل تسرق روبوتات الدردشة الذكية قدرتنا على التفكير والتركيز؟

عالمة نفس من UC Irvine تُطلق تحذيرات من الإسناد المعرفي المفرط لأدوات الذكاء الاصطناعي، مستندةً إلى بيانات تُظهر تراجع متوسط فترة التركيز من دقيقتين ونصف في 2003 إلى 47 ثانية فقط بحلول 2020.

MIT Technology Review

30 مليار دولار لبناء مراكز بيانات الذكاء الاصطناعي في الهند بطاقة 5 جيجاواط

شركة AirTrunk الأسترالية تُعلن التزامًا بـ30 مليار دولار لإنشاء 5 جيجاواط من مراكز البيانات فائقة الحجم في الهند بحلول 2030، ضمن موجة استثمارية عالمية تُرسي الهند مركزًا للذكاء الاصطناعي.

TechCrunch

المزيد من ذكاء اصطناعي

طلب بسيط يخترق وكيل الذكاء الاصطناعي لميتا ويكشف ثغرات أمن المساعدين الذكيين

هل تسرق روبوتات الدردشة الذكية قدرتنا على التفكير والتركيز؟

30 مليار دولار لبناء مراكز بيانات الذكاء الاصطناعي في الهند بطاقة 5 جيجاواط