خضر سلامةلا شك أننا نعرف ضخامة شبكة الـ web، مؤشر غوغل عام 1998لفت إلى وجود 26 مليون صفحة على امتداد الإنترنت، تزايد العدد إلى مليار موقع عام 2000، إلّا أن الأعوام الأخيرة حملت نقلة نوعية على مستوى أداء المؤشر وإمكان البحث وتعريف الصفحات، ليتجاوز عدد مواقع الشبكة تريليون موقع إلكتروني! (اثنا عشر صفراً)، منها 40 مليار موقع مُفهرس في ذاكرة محرك البحث الأشهر في العالم «غوغل».
وجاء في المدونة الرسمية للمحرك الشهير أن بعض المواقع تستعمل عدة عناوين توصل جميعها إلى صفحة واحدة، ويمكن أن يطال الاختلاف تسمية العنوان أو نطاقه (net, org, com....) .
أما في ما يتعلق بعدد الصفحات الداخلية في مواقع الإنترنت، فيؤكد التقرير استحالة إحصائها، وتقديرها بأنها تساوي «لا نهائي» أو الصيغة «infinity»، ويُشير التقرير إلى أن صفحات الروزنامات الإلكترونية مثلاً تسمح للمتصفح بزيارة عدد لا نهاية له من «الصفحات التالية»، لذا فإن إجراء أي تقدير للصفحات المتفرعة هو إجراء نسبي يعتمد على تعريف الباحث لمعنى «صفحة إلكترونية» وللمطلوب منها.
الإحصاء يقوم على تتبّع كل العناوين المسجلة في ذاكرة محرك البحث، وذلك بهدف فصل المكرّر منها عن المتمايز أو المؤدي إلى زاوية جديدة، ويشبّه المهندسان العاملان في طاقم «بنية البحث» في شركة غوغل، جسي ألبرت ونيسان حجاج، هذه العملية بأنها تشبه إحصاء كل تقاطع بين طريقين في خريطة الولايات المتحدة، مع فارق أن عدد الاحتمالات في الإحصاء كان مضاعفاً خمسين ألف مرة عن أعداد الطرقات الأميركية!.
ويمضي معدا التقرير في شرح كيفية عمل محرك «غوغل» الذي كان يعتمد على ذاكرة ثابتة من 25 مليون وخمسمئة ألف موقع، تعدّ «من الأفضل تقويماً وزيارةً في الإنترنت»، وصار المحرك مكوناً من ذاكرةٍ مطاطة تقوم بتحديث نفسها عدة مرات في اليوم، ويقوم المحرك بفهرسة صفحات كل موقع في الشبكة، ويربط بمادة البحث حتى وصل إلى تسجيل 25 مليار موقع.