روبوتات المحادثة الذكية تُفصح عن أرقام هواتف حقيقية وخبراء يحذرون من فجوة الخصوصية
تحقيق يرصد كيف تُكشف نماذج الذكاء الاصطناعي التوليدي كجيميني عن معلومات شخصية تعريفية لأشخاص حقيقيين، في ظل غياب حلول فعّالة لمنع هذا التسريب من بيانات التدريب.

لم تعد روبوتات المحادثة المدعومة بالذكاء الاصطناعي مجرد مساعدين افتراضيين؛ إذ باتت بعضها تُفصح عن أرقام هواتف حقيقية ومعلومات شخصية تعريفية لمستخدمين من لحم ودم. تحقيق نشرته مجلة MIT Technology Review يرصد حالات موثّقة لمستخدمين تعرّضوا لتبعات مباشرة جراء كشف نماذج الذكاء الاصطناعي التوليدي لمعلوماتهم الخاصة.
في إحدى الحالات الموثّقة، تعرّض مستخدم لوابل من المكالمات المجهولة لشهر كامل بعد أن أحال روبوت المحادثة جيميني اتصالين يبحثون عن محامٍ وقفّال إلى رقمه الشخصي. وفي إسرائيل، تفاجأ مطوّر برمجيات برسالة على واتساب من غريب يطلب مساعدة في تطبيق دفع، بعد أن زوّده جيميني برقمه باعتباره خط خدمة عملاء للتطبيق. واللافت أن الرقم نُشر مرة واحدة فقط على الإنترنت منذ أكثر من عقد.
تعزو الخبيرة جنيفر كينغ من معهد ستانفورد لذكاء الاصطناعي المتمحور حول الإنسان هذه الحوادث إلى ظاهرة حفظ البيانات في النموذج: حين يُدرَّب النموذج اللغوي الكبير على كميات ضخمة من بيانات الإنترنت، يتشرّب الأرقام والعناوين والمعلومات الشخصية المبثوثة، ثم يُنتجها في ردوده بصورة لا يمكن التنبؤ بها.
ارتفع الطلب على خدمات حذف البيانات الشخصية من الإنترنت بنحو 400% في سبعة أشهر وفق شركة DeleteMe، إذ تتعلق آلاف الاستفسارات تحديداً بنماذج الذكاء الاصطناعي التوليدي. اختبرت باحثتان في جامعة واشنطن نموذج ChatGPT بسؤاله عن معلومات لأستاذة فرفض في البداية، ثم تبنّى نهجاً تحقيقياً أكثر عمقاً وأدلى بعنوان السكن وثمن المنزل واسم الزوج اعتماداً على سجلات الملكية العقارية العامة.
تكمن جذور المشكلة في طريقة عمل النماذج: تُشير الأبحاث الحديثة إلى أن النماذج اللغوية الكبيرة لا تحفظ البيانات الأكثر تكراراً فحسب، بل قد تختزن سجلات ظهرت مرة أو مرتين فقط. وتُفاقم مسألةَ التشريعات القائمة أن قوانين الخصوصية الكبرى تُركّز على البيانات التي يمنحها المستخدم مباشرةً للشركة، لا على ما جُمع من الفضاء العام.
تطرح هذه الفجوة تحدياً قانونياً وتنظيمياً عاجلاً للمنطقة العربية التي تشهد تبنّياً متسارعاً لروبوتات المحادثة الذكية في البنوك والاتصالات والقطاع الحكومي. فقد سنّت السعودية نظام حماية البيانات الشخصية والإمارات قانون البيانات الاتحادي رقم 45 لعام 2021، غير أنّ كليهما يفتقران إلى أحكام صريحة تُعالج تسريب البيانات من بيانات تدريب نماذج الذكاء الاصطناعي. وتُسلّط الحوادث الضوء على مخاطر تتعدّى الأرقام إلى تسريب أسماء وعناوين منشورة في صفحات الزفاف والنعي والقوائم الانتخابية العربية، ما يستدعي تطوير «الهيئة السعودية للبيانات والذكاء الاصطناعي سدايا» ومكتب الذكاء الاصطناعي الإماراتي معايير محلية لتدقيق نماذج الذكاء الاصطناعي قبل نشرها.
في غياب حلول جذرية، يُوصي الخبراء بالسعي لحذف المعلومات الشخصية من الإنترنت قبل وقوعها في يد روبوتات الزحف التلقائي.
المزيد من ذكاء اصطناعي

طلب بسيط يخترق وكيل الذكاء الاصطناعي لميتا ويكشف ثغرات أمن المساعدين الذكيين
مهاجمون استغلوا وكيل دعم العملاء الذكي في ميتا لتغيير عناوين البريد الإلكتروني لحسابات إنستغرام بطلب مباشر، كاشفين عن ثغرات بنيوية في تصميم عوامل الذكاء الاصطناعي المكلّفة بعمليات حساسة.

تحذير من مجموعة قراصنة ترسل موظفين مزيّفين لاختراق الشركات جسديًا وسرقة بياناتها
مجموعة Silent Ransom Group تصعّد هجماتها بإرسال أفراد متنكّرين كدعم تقني إلى مقار الشركات لسرقة البيانات عبر أقراص USB أو تثبيت وصول عن بُعد، وفق تحذير مشترك من غوغل ومكتب التحقيقات الفيدرالي.

هل تسرق روبوتات الدردشة الذكية قدرتنا على التفكير والتركيز؟
عالمة نفس من UC Irvine تُطلق تحذيرات من الإسناد المعرفي المفرط لأدوات الذكاء الاصطناعي، مستندةً إلى بيانات تُظهر تراجع متوسط فترة التركيز من دقيقتين ونصف في 2003 إلى 47 ثانية فقط بحلول 2020.