Interessante Zahlen zu Google

by Jojo on 11.09.06 · 1 comment

in Google

Dieses pdf-File liefert eine Reihe von interessante Zahlen zu den Datenbergen die Google so speichert:

Google Crawl 850 TB (800 TB + 50 TB)
Google Analytics 220 TB (200 TB für die unverarbeiteten Daten und 20 TB für die Zusammenfassungen)
Google Earth 70,5 TB (70 TB für Bilder und 0,5 TB für Indexdaten.)
Personalized Search 4 TB
Google Base 2 TB
Orkut 9 TB

Diese Daten sind aber größtenteils sehr sehr stark komprimiert. So werden aus den 800 TB Crawl-Daten dann letztlich komprimiert nur noch 88 TB.

Wenn man mal davon ausgeht, dass die Google Crawl-Daten korrekt sind, kann man folgende kleine Rechnung machen. Mit der Annahme das Google 24 Mrd. Seiten indexiert hat:
934,584,883,609,600 / 24,000,000,000 = 38,941 (38 K)

Dann wäre also jede Seite etwa 38 K groß. Wohl schon relativ viel? Hat Google also bedeutend mehr Seiten indexiert? Mag sein. Allerdings ist die Frage wozu die 850 TB so verwendet werden. Es gibt ja scheinbar schon eine Aufsplittung in 800 und 50 TB. Insgesamt wird Google für all seine Daten wohl noch einige TBs mehr brauchen. Große Frage ist für mich zum Beispiel was man so an historischen Daten gespeichert hat? Hinzu kommt noch, das man diese Daten natürlich nicht nur einmal gespeichert hat, sondern das es viele Kopien gibt. Nicht nur durch die vielen Rechenzentren, sondern auch innerhalb eines Rechenzentrums. Andererseits geht es hier wohl nur um die “Crawl”-Daten. Interessant sind die Zahlen aber auf jeden Fall.

P.S. TB = Terabyte; 1 TB = 1024 GB

via Google Operating System

{ 1 trackback }

SEO-Shortcuts Top 10 - SEO Marketing Blog
13.09.06 um 16:46

{ 0 comments… add one now }

Leave a Comment

You can use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Previous post:

Next post: