Aus Zeitgruenden bin ich eine Erklaerung fuer diese Dateien in den Uebungen heute leider schuldig geblieben. Deshalb nun auf diesem Wege: Es handelt sich bei diesen Datei um REALE Weblogs, d.h. um Protokoll-Dateien, welche Benutzer (IP-Adressen) auf eine bestimmte Seite zugegriffen haben. Jeder Webserver fuehrt in der Regel derartige Log-Dateien, und im Zusammenhang mit der Diskussion um Internetsperren und Vorratsdatenspeicherung sind sie ja auch immer wieder in den Medien. Bei haeufig frequentierten Seiten (wie der hier vorliegenden; es handelt sich um einen der Top-50-Blogs in Deutschland) entstehen zwangslaeufig sehr grosse Dateien (so auch hier), und damit die einzelnen Dateien nicht zu gross werden, erfolgt eine sogenannte "Rotierung": wenn eine Datei eine bestimmte Groesse erreicht hat, wird sie umbenannt, und die Logs kommen in eine neue, leere (frische) Datei. Wir haben hier also 4 echte Logdateien und - in der Aufgabenstellung - vier Fragen zu Informationen, die wir aus diesen Logdateien herausholen wollen. Arbeitet dazu unbedingt mit dem grep bzw. egrep und NICHT mit OpenOffice Writer bzw. Microsoft Word. Denn erstens waere es ein untypischen Vorgehen, derartige Aufgaben mit einem Textverarbeitung-Programm zu erledigen und zweitens koennt Ihr ja mal spasseshalber eine solche Datei in OpenOffice Writer oder Microsoft Word oeffnen. (Mein Rechner hatte es auch nach 3 Minuten noch nicht geschafft, die Datei in OpenOffice zu oeffen, danach habe ich ihn abgebrochen.) Damit ist auch gleich der Sinn dieser Aufgabe klar: mit den elementaren Unix-Tools hat man sehr effektive Werkzeuge in der Hand, um auch sehr grosse Dateien schnell zu durchkaemmen. ACHTUNG ======= Die Dateien sind sehr sehr gross und verbrauchen viel Speicherplatz auf unseren Festplatten. Bitte loescht sie deshalb wieder aus Eurem Heimat- verzeichnis, wenn Ihr sie nicht mehr braucht. Danke! nh - 21.10.2009