كشف بحث جديد مشترك بين شركة "أنثروبيك" و"ETH Zurich" أن أنظمة الذكاء الاصطناعي الحديثة قد تكون قادرة على كشف الهوية الحقيقية وراء الحسابات المجهولة أو المستعارة على الإنترنت.
ونُشرت الدراسة على شكل مسودة أولية على منصة "arXiv" تحت عنوان "Large-scale online deanonymization with LLMs"، وأظهرت أن نماذج اللغة الكبيرة (LLMs) تستطيع تحليل النشاط الرقمي وربط الحسابات المستعارة بأشخاص حقيقيين بشكل آلي وعلى نطاق واسع.
كيف يعمل الذكاء الاصطناعي على فك التعمية؟
تقليدياً، كان ربط الحسابات المجهولة بهويات المستخدمين يتطلب ساعات من التحقيق اليدوي، مع تحليل المشاركات، أساليب الكتابة، والمؤشرات المبعثرة على الإنترنت، بحسب تقرير نشره موقع "digitaltrends" واطلعت عليه "العربية Business".
لكن الدراسة أوضحت أن الذكاء الاصطناعي يمكنه تنفيذ هذه المهام تلقائياً، من خلال:
- استخراج مؤشرات الهوية من النصوص المنشورة، مثل الاهتمامات الشخصية، والدلائل الديموغرافية، وأسلوب الكتابة، والتفاصيل الطارئة في المشاركات.
- البحث عن ملفات تعريف مطابقة عبر الشبكة وتقييم مدى توافق المؤشرات مع الأفراد المعروفين.
تجارب عملية
اختبرت الدراسة الفكرة بعدة مجموعات بيانات، منها:
- ربط مستخدمي "Hacker News" بحساباتهم على "لينكدإن" بعد إزالة أي معرفات واضحة مثل الأسماء واسم المستخدم.
- ربط حسابات مستعارة على "ريديت" عبر مجتمعات مختلفة.
- تقسيم سجل منشورات مستخدم واحد إلى حسابين منفصلين لمعرفة ما إذا كان الذكاء الاصطناعي يستطيع التعرف أنهما لنفس الشخص.
وأظهرت النتائج تفوق أنظمة الذكاء الاصطناعي على الطرق التقليدية، حيث وصلت الدقة إلى حوالي 90% مع نسبة استرجاع تصل إلى 68%، في حين كانت الطرق التقليدية شبه عديمة الفاعلية.
تداعيات على الخصوصية
يمثل هذا التطور تهديداً كبيراً لمفهوم الهوية المجهولة الذي يعتمد عليه الصحفيون والمبلغون عن المخالفات والنشطاء والأفراد الذين يريدون مناقشة مواضيع حساسة دون كشف هويتهم.
وتشير الدراسة إلى أن هذا الحاجز، المعروف أحياناً باسم "التمويه العملي"، قد يضعف مع قدرة الذكاء الاصطناعي على ربط الأدلة الرقمية بين المنصات بسرعة وكلفة منخفضة، حيث يُقدّر تكلفة كشف هوية حساب واحد بين 1 و4 دولارات فقط.
الحاجة إلى حلول جديدة
ورغم أن البحث أُجري في بيئات محكومة باستخدام بيانات عامة ولم يُراجع بعد من قبل الخبراء، فقد أثار جدلاً واسعاً بين خبراء الخصوصية والتكنولوجيا.
ويحث الباحثون المستخدمين على إعادة التفكير في كمية المعلومات الشخصية التي يشاركونها على الإنترنت، حتى في المساحات التي تبدو مجهولة، مع الدعوة إلى تطوير أدوات خصوصية أفضل، وتعزيز سياسات المنصات، أو إنشاء أنظمة ذكاء اصطناعي مخصصة لتعمية البيانات الحساسة قبل نشرها.
مع تطور قدرات الذكاء الاصطناعي على تحليل محتوى الإنترنت الضخم، تصبح مسألة موازنة قوة الاكتشاف وحماية الخصوصية أحد أكبر التحديات في العصر الرقمي.








