إنقاذ الصحافة الرقمية.. كيف نروض الذكاء الاصطناعي؟

بقلم: شريف عبدالمنعم *

تواجه الصحف الرقمية أزمة كبرى في جميع أنحاء العالم، تتمثل في انخفاض أعداد الزيارات الواردة إلى المواقع الإلكترونية من محركات البحث في ظل الانتشار الواسع لتطبيقات الذكاء الاصطناعي التي بات الجمهور يلجأ إليها للحصول على المعلومات، وخاصة بعد تدشين محرك بحث “جوجل” خاصية (AI Overviews) التي تقدم ملخصات سريعة في أعلى صفحة النتائج، وتلغي حاجة الزائرين للنقر على روابط المواقع الإلكترونية الأصلية مالكة المعلومة.

ورغم خطورة الأزمة وما تمثله من تداعيات على مستقبل الصحف الرقمية في ظل التحديات الكثيرة التي تواجهها، تباينت ردود الفعل بشكل كبير بين المواقع الإخبارية العالمية ونظيرتها العربية، ففي حين لجأت الأولى إلى إجراءات تقنية وقانونية لحماية محتواها الرقمي، لكن الثانية تأخرت بشكل كبير في الانتباه إلى الخطوات الواجب عليها اتخاذها للحفاظ على حقوقها ومستقبلها.

في هذا التحقيق الاستقصائي التحليلي، أجرينا دراسة تحليلية رصدنا خلالها إجراءات بعض المواقع الإخبارية العالمية والعربية (عينة عشوائية) لحماية محتواها الرقمي، كما رصدنا نماذج متنوعة لحجم خسائر المواقع الإلكترونية جراء الانتشار المتسارع للذكاء الاصطناعي، واستشرفنا الخطوات المقترحة لترويض بوتات الذكاء الاصطناعي.. فالغرض الأساسي من هذا التحقيق ليس رصد الأزمة فقط، وإنما إطلاق مبادرة متكاملة لإنقاذ الصحافة الرقمية في الوطن العربي، نستكشف من خلالها مواضع الخلل، ونطلق حملة للتوعية بالإجراءات الواجب اتخاذها في ظل اكتشافنا التأخر الشديد في التعامل مع الأزمة وفقاً لما سيرد بشكل عملي لاحقاً.

منبع الأزمة وحجم الخسائر

تعتمد تطبيقات الذكاء الاصطناعي في عملها على الدخول إلى المواقع الإلكترونية، بواسطة برامج آلية (بوتات) تقوم بجمع المحتوى وتصنيفه، وهي آلية لا تختلف كثيرًا عن تلك التي يستخدمها محرك بحث “جوجل” في فهرسة الصفحات عبر بوتاته المعروفة مثل Googlebot أو Googlebot-News. ويمتلك الناشرون السلطة المطلقة في السماح لبوتات محركات البحث العادية بالدخول إلى المواقع، عبر وضع أكواد جوجل في ملف robots.txt وربط الموقع بـ”google search console” ووضع خارطة الموقع بداخله لضمان فهرسة المحتوى بالشكل الصحيح.

الإشكالية الحقيقية بدأت عندما دخلت بوتات الذكاء الاصطناعي إلى المواقع لنسخ المحتوى دون إذن من أصحاب الحقوق، مستخدمة النصوص والصور والفيديوهات في تقديم إجابات توليدية للمستخدمين، أو في تدريب النماذج اللغوية، وهنا برز الخياران الأساسيان:

إما حظر بوتات الذكاء الاصطناعي تقنياً وقانونياً لحماية المحتوى.
وإما التوصل إلى اتفاقات عادلة مع شركات الذكاء الاصطناعي قبل السماح لها بالدخول إلى المواقع الإلكترونية واستخدام محتواها في تدريب النماذج اللغوية وتوليد ملخصات للمستخدمين.

ولمعرفة حجم الضرر الواقع على المواقع الإلكترونية، استندت صحيفة “برس جازيت” البريطانية، إلى دراسة أجرتها شركة “Authoritas” تشير إلى أنه عندما تتوافر خاصية (AI Overviews) في أعلى صفحة نتائج البحث تشهد المواقع انخفاضًا بنسبة 47.5% في معدل النقر على أجهزة سطح المكتب و37.7% على الأجهزة المحمولة، بينما ذكرت صحيفة “نيويورك بوست” استناداً إلى تقرير لشركة “SimilarWeb” أن موقع “فوربس” وموقع “هافينغتون بوست” كانا الأكثر تضرراً بسبب تلك الخاصية، حيث خسر كل منهما 40% من حركة المرور، في حين انخفضت زيارات موقع “ديلي ميل” بنسبة 32%، وانخفض موقع شبكة “CNN” بنسبة 28%.

الصحافة الأجنبية.. مجزرة البوتات

للتأكد من الخطوات التي اتخذتها المواقع الإخبارية الأجنبية مع بوتات الذكاء الاصطناعي، لجأنا في “برس بوست” إلى فحص ملفات الزحف (robots.txt) في ثلاث عينات عشوائية من تلك المواقع، وكانت البداية مع النسخة الإنجليزية الدولية لشبكة CNN الإخبارية الأمريكية، حيث يشير ملف الزحف الخاص بها إلى أنها قامت بما يمكن وصفه مجازاً بـ”مجزرة البوتات”، حيث حظرت بالاسم العشرات من بوتات الذكاء الاصطناعي المعروفة وغير المعروفة ومنعتها من الزحف إلى موقع الشبكة ونسخ محتواه.

وشمل الحظر بوتات الذكاء الاصطناعي الخاصة بالشركات الكبرى مثل “Google” و”OPEN AI” و”META”.. إلخ، باستخدام أمر (/ :Disallow) أي ممنوعين من الزحف نهائياً، وسمح الملف بالزحف فقط لبوتات “Google” الأساسية المسؤولة عن البحث التقليدي: وهي Googlebot (للبحث العادي) وGooglebot-News (بحث الأخبار)، أما بوت Google-Extended الذي يُستخدم في تدريب نماذج الذكاء الاصطناعي فقد حظرته الشبكة.

أما صحيفة “نيويورك تايمز” نجد هناك اختلافاً بعض الشيء، حيث وضعت الصحيفة إعلاناً قانونياً في بداية الملف شددت فيه على ما يلي:

المحتوى متاح للاستخدام الشخصي وغير التجاري فقط.
يمنع منعاً باتاً استخدام أي أدوات أو برمجيات أو تقنيات للتنقيب في البيانات و نسخ المحتوى (Scraping) بشكل آلي، إلا بموافقة مكتوبة مسبقة من الشركة المالكة للصحيفة، وذلك لحماية المحتوى من أن يُستخدم في تدريب الذكاء الاصطناعي أو في قواعد بيانات شركات أخرى.
وبالطبع شمل الملف حظر بوتات GPTBot و CCBot و Google-Extended.

بدورها، وضعت صحيفة الجارديان البريطانية إعلاناً قانونياً، يماثل الإعلان الذي وضعته “نيويورك تايمز” في بداية ملف الزحف، لكن “الجارديان” أضافت عشرات الأسماء من بوتات الذكاء الاصطناعي المحظورة مثلما فعلت “سي إن إن”.

الصحافة العربية.. مواقف متباينة

المثير للانتباه، أنه بفحص ملفات الزحف الخاصة ببعض المواقع الإخبارية العربية، كانت هناك مواقف متباينة، وكشفت دراسة أجريناها في موقع “برس بوست”، من أجل إكمال هذا التحقيق الاستقصضائي المدعوم بالبيانات، أن نحو 88% من المواقع الإخبارية العربية لم تتخذ إجراءات مع أو ضد بوتات الذكاء الاصطناعي حتى اللحظة، في الوقت الذي تشهد فيه الكثير من المواقع انخفاض في الزيارات بسبب عدة عوامل من بينها لجوء الجمهور إلى تطبيقات الذكاء الاصطناعي للحصول على المعلومات، وخاصية (AI Overviews) التي دشنها محرك بحث “جوجل” وتقلل من حاجة الزائرين إلى النقر على روابط المواقع الإلكترونية صاحبة المعلومات.

وأُجريت هذه الدراسة التحليلية على عينة عشوائية من 50 موقعاً إلكترونياً من أشهر المنصات الإخبارية في 13 دولة عربية هي: (مصر، السعودية، الإمارات، الأردن، الكويت، العراق، البحرين، السودان، سلطنة عمان، المغرب، الجزائر، تونس، سوريا)، ورصدنا خلالها سياسات الحماية التقنية تجاه بوتات الزحف الخاصة بتطبيقات الذكاء الاصطناعي، من خلال تحليل ملفات الزحف (robots.txt) الخاصة بالمواقع المرصودة في العينة.

وأوضحت النتائج أن نحو 88% من المواقع الإخبارية محل الدراسة (عدد 44 موقعاً) لا تطبّق أي إجراءات تقنية لحظر الزحف الآلي لبوتات الذكاء الاصطناعي عبر ملفات الزحف، وتبيّن أن ملفاتها مفتوحة بالكامل وتفتقر إلى أوامر مخصّصة لمنع تلك البوتات من الدخول إلى محتواها.

وفي المقابل، أظهرت النتائج أن 10% من المواقع الإخبارية محل الدراسة (5 مواقع) أجرت حظراً صريحاً لبوتات الذكاء الاصطناعي عبر ملفات الزحف، سواء من خلال الإعلانات القانونية، أو ذكر أسماء البوتات المحظورة، بينما سمحت 2% (موقع واحد) بالزحف الكامل بشكل معلن وواضح.

إجراءات الحظر الواقعية

ووفقاً للدراسة التي أجريناها في “برس بوست”، شملت قائمة المواقع الإخبارية العربية الخمسة التي حظرت بوتات الذكاء الاصطناعي، والإجراءات التي اتخذتها ما يلي:

الموقع الإلكتروني لصحيفة “الوطن” المصرية وضع في ملف الزحف الخاص به إعلاناً قانونياً يوضح سياسة استخدام المحتوى، حيث يسمح باستخدام مواده لأغراض الفهرسة وعرض نتائج البحث فقط، مع استثناء الملخصات المولَّدة بواسطة الذكاء الاصطناعي، كما يحظر استخدام المحتوى كمدخل لنماذج الذكاء الاصطناعي أو في الإجابات التوليدية، ويمنع كذلك استخدامه في تدريب أو تحسين نماذج الذكاء الاصطناعي.
الموقع الإلكتروني لصحيفة أخبار اليوم المصرية، تضمَّن ملفّ الزحف الخاص به إعلاناً قانونياً يوضح أنه يسمح بفهرسة محتواه من قِبل محركات البحث التقليدية واستخدامه في الأغراض الأكاديمية، لكنه يشير بوضوح إلى أن أي استخدام لمحتواه في تدريب أنظمة الذكاء الاصطناعي أو استخراجه بطرق آلية يتطلّب الحصول على إذن مسبق من إدارة الموقع، كما أعلن أنه يعتمد معايير Content Signals / AI Preferences الحديثة، والتي تهدف إلى حماية حقوق المحتوى ومنع استغلاله من قِبل روبوتات الذكاء الاصطناعي دون تصريح.
الموقع الإلكتروني لصحيفة الرأي الأردنية حظر بالاسم 8 بوتات ذكاء اصطناعي، مع وضع إعلان قانوني ملخصه أن الموقع يسمح لمحركات البحث العادية فقط بجمع محتواه لأغراض الفهرسة، لكنه يمنع تماماً استخدام محتواه في تدريب نماذج الذكاء الاصطناعي، ونشرت الصحيفة تقريراً أوضحت فيه أسباب الحظر واستشهدت بالدراسة التي أجراها موقع “برس بوست” في هذا الشأن.
موقع “إرم نيوز”، قام بحظر استخدام محتواه في تدريب أو تغذية أنظمة الذكاء الاصطناعي، وسمح فقط بفهرسته كموقع إخباري ضمن محركات البحث التقليدية، كما أضاف في مقدمة ملف الزحف إعلاناً قانونياً يوضح أن محتواه محمي بموجب قوانين الملكية الفكرية والتشريعات الأوروبية الخاصة بحماية البيانات والمحتوى الرقمي.
الموقع الإلكتروني لصحيفة الصباح المغربية لم يدرج في ملف ‎robots.txt‎ أسماء محددة للبوتات المحظورة، لكنه أدرج إعلاناً قانونياً عاماً يوضح سياسته تجاه استخدام محتواه، حيث يسمح فقط لمحركات البحث التقليدية بفهرسة محتواه لأغراض البحث، بينما يحظر استخدام المحتوى في تدريب أو تغذية نماذج الذكاء الاصطناعي، كما يمنع الاعتماد على محتواه في توليد ملخصات بالذكاء الاصطناعي.

الخطوات المقترحة لترويض بوتات الذكاء الاصطناعي

بالتأكيد ليس الهدف من هذه المبادرة هو دعوة المواقع الإلكترونية إلى تطبيق حظر فوري لبوتات الذكاء الاصطناعي، فهذا الطرح غير واقعي وقد يكون له عواقب كارثية إذا تم تنفيذه بشكل فردي دون دراسة، ولكن الحظر الذي نقترحه هو أحد الحلول التي سيرد ذكرها لاحقاً لحل الأزمة، وإذا تم استنفاد جميع الطرق ولم يبق سوى الحظر، يجب أن يتم تنفيذه بشكل جماعي وأن تشرف عليه الجهات المسؤولة عن الصحافة في كل دولة أو نطاق جغرافي محدد كما سيرد لاحقاً.

وتشمل المبادرة التي نطرحها عدة خطوات بالترتيب، حتى ينجح الترويض المنشود لتلك البوتات وإرضاخ عمالقة التكنولوجيا لطلبات الصحف الرقمية صاحبة الحق الحصري في المعلومات المنشورة على الإنترنت، والتي أنفقت على مدار السنوات الماضية مئات المليارات من الدولارات على بنيتها الأساسية وموظفيها حول العالم، وتشمل تلك الخطوات ما يلي:

أن تتبنى الجهات المحلية والإقليمية والدولية المسؤولة عن الصحافة تحديد أسماء بوتات الذكاء الاصطناعي بالاستعانة بالمتخصصين التقنيين، وإعداد قائمة بها وتوزيعها على الصحف في النطاق الجغرافي الخاص بها، تمهيداً لحظر تلك البوتات بشكل جماعي من دخول المواقع الإلكترونية الكبرى إذا لم يتم الاتفاق مع شركات التكنولوجيا العملاقة المالكة لتلك البوتات (طرق الحظر المقترحة سيرد ذكرها لاحقاً).
قبل اتخاذ القرار الجماعي بحظر البوتات في كل نطاق جغرافي يتبع جهة أو هيئة صحفية تنتمي إليها المؤسسات الكبرى، ستخاطب تلك الجهة شركات الذكاء الاصطناعي الكبرى، وخاصة “جوجل” للتفاوض حول مخصصات مالية لكل صحيفة حسب معدلات زياراتها، في مقابل استفادتها من المحتوى الذي تملكه كل صحيفة.
يمكن أن يشمل التفاوض السماح لبوتات الشركات التي تثبت حسن نيتها بتقديم أفضل عروض للصحف الرقمية، في مقابل حظر الشركات المنافسة، ولا اعتقد أن هذا الأمر يشكل تلاعباً أو خداعاً ولكنه أمر لا مفر منه، وذلك لصعوبة الحصول على اتفاقات مع جميع الشركات المالكة للبوتات من ناحية، وأيضاً لضمان أن الشركات التي سيتم الاتفاق معها ستفعل كل ما بوسعها لضمان حماية المحتوى وعدم السماح لبوتات الشركات المنافسة بالحصول على المحتوى مجاناً دون استئذان.
في الأغلب أن الأمر سيكون محسوماً لشركة جوجل، فهي بشكل أساسي تقوم على فهرسة وتصنيف محتوى الصحف الرقمية في جميع أنحاء العالم، وتشمل مبادرتنا نداء عاجلاً لشركة جوجل بأن تقدم عبر أذرعها المهنية مثل “مبادرة أخبار جوجل” أو مكاتبها ومشروعاتها الإقليمية، مبادرات للتواصل مع الجهات الصحفية والإعلامية لتقنين حركة بوتات الذكاء الاصطناعي في الصحف الرقمية، بما يحافظ على حقوق النشر ويحمي المحتوى من السرقة، وفي ذات الوقت يحافظ على دقة المعلومات المنشورة على الإنترنت، وهي غاية محمودة ومطلوبة تدعمها جوجل.
عقد مؤتمرات محلية أو إقليمية أو دولية تناقش الأزمة بشكل موسع (تحريري – تقني – مالي – قانوني) والخروج بتوصيات وقواعد يتم نشرها في صفحتي سياسة الخصوصية وشروط الخدمة، داخل كل موقع.
وضع تشريعات تجرم إنشاء بوتات الذكاء الاصطناعي التي تدخل المواقع الإلكترونية دون استئذان، وفرض عقوبات مالية باهظة على أي موقع إلكتروني يسرق المحتوى عبر الاسكريبتات الآلية أو حتى النسخ اليدوي للمحتوى (نصوص – صور – فيديوهات) دون استئذان المصدر الأصلي، وتفعيل قوانين حماية الملكية الفكرية للمحتوى الرقمي، مع وضع توصيف دقيق لسياسة الاستخدام العادل، ليس للفيديوهات فقط ، وإنما أيضاً للصور والنصوص.

الطرق المقترحة لحظر بوتات الذكاء الاصطناعي

في حالة لم يتم التوصل إلى اتفاقات مرضية مع عمالقة التكنولوجيا، لن يكون هناك مفر سوى حظر بوتات الذكاء الاصطناعي، وتشمل خطوات الحظر التي نقترحها بعد دراستنا التحليلية لملفات الزحف في المواقع الإخبارية الأجنبية ، وأيضاً إرشادات منصة cloudflare الرائدة في التخزين السحابي وحماية البيانات، ما يلي:

حظر البوتات عبر ملف robots.txt الخاص بكل موقع، بخصوص صعوبة حصر أسماء تلك البوتات، فعلى الأقل علينا حظر البوتات المعروفة ومنها على سبيل المثال: ( – PerplexityBot – Perplexity-User – anthropic-ai – meta-externalagent – GPTBot – OAI Search Bot – Bing Preview – msai – Meta AI – Amazon Bot)، مع تحديث القائمة باستمرار عن طريق خبراء البرمجة.
بالنسبة لبوتات جوجل الخاصة بالذكاء الاصطناعي، يوجد بوت يسمى (Google Extended) يستخدم في نماذج الذكاء الاصطناعي التوليدية الخاصة بـ Google مثل Gemini والذي يدخل في نطاقه ميزة (AI Overviews)، وأيضاً يوجد بوت يسمى (Google Other) المتعلق بالتجارب والأبحاث الجديدة.
يمكن حظر بوتات الذكاء الاصطناعي مباشرة عبر جدار الحماية (Firewall)، بحيث يتم إيقاف طلباتها ومنعها من الوصول إلى الموقع من الأساس.
حظر البوتات عبر خاصية (block ai bots) التي دشنتها منصة Cloudflare الرائدة في التخزين السحابي وحماية البيانات. (توجد أمثلة مصورة في نهاية الموضوع).
وضع الإعلان القانوني الاسترشادي الذي أطلقته منصة cloudflare في بداية ملف الزحف، والذي يطلق عليه ملف إشارات استخدام المحتوى (Content-Signals Declaration).

نحو تعاون لا مواجهة

بالتأكيد لا يتمنى أحد أن تصل الأمور بين المواقع الإخبارية إلى المواجهة مع شركة جوجل وحظر بوتات التدريب والذكاء الاصطناعي الخاصة بها، مثل Google Extended وGoogle Other، بالعكس كل المواقع تقريبًا ستقف إلى جوار “جوجل” في صراعها مع الشركات المنافسة إذا ما توصلت الشركة إلى اتفاقات معها، فالمواقع الإخبارية حول العالم أنفقت مليارات الدولارات على البنية التحتية والتدريب للتوافق مع خوارزميات جوجل، وكانت “جوجل” شريكاً أساسياً في تطوير الصحافة الرقمية، ومصدراً رئيسياً لحركة الزوار في أغلب المواقع.

لكن من المهم في المقابل أن تدرك شركة “جوجل” أن بقاء المواقع الإخبارية في وضع قوي، مصلحة مشتركة للطرفين؛ لأن المحتوى المهني هو ما يمنح نتائج البحث قيمتها وموثوقيتها، علماً بأننا في موقع “برس بوست” أرسلنا بريداً إلكترونياً إلى قسم التواصل الصحفي في شركة جوجل بشأن الأزمة وتداعياتها لكننا لم نتلق أي رد حتى اللحظة.

وهنا، لا بد من التأكيد على أن الفترة القادمة يجب أن تكون فترة تعاون لا مواجهة، فمستقبل العلاقة بين الصحافة وتطبيقات الذكاء الاصطناعي يجب أن يقوم على التفاهم والتنسيق المشترك وحفظ الحقوق، لا على الصراع، أو الإقصاء، فلكل طرف دوره في دعم النظام الإعلامي العالمي وضمان استمراريته.

ولكي تواكب المؤسسات الصحفية هذه التحولات، يجب أن تتجه كليات الإعلام، ومراكز التدريب إلى تحديث مناهجها ومقرراتها، لتشمل دراسة آلية عمل الخوارزميات، والبوتات، وطرق فهرسة المحتوى، وتصنيفه، فالصحفي في العصر الرقمي لم يعد كاتباً فقط، بل جزءًا من منظومة تقنية تحتاج إلى فهم عميق لآليات النشر الذكي، ومهارات إدارة المحتوى على المنصات.

وأخيرًا.. نجدد التأكيد على أن بقاء الصحافة الرقمية، والمواقع الإخبارية في عصر الذكاء الاصطناعي لن يتحقق بالمواجهة، ولا بالاستسلام، بل بالفهم والترويض.