Start!
– Die Schöpfungsgeschichte von Google (das damals noch BackRub hieß), ist die, dass Larry Page seinem Crawler zum Stapellauf im März '96 nur einen einzigen Startpunkt gab: seine eigene Homepage in Stanford. Das ergibt eine nette Überleitung, um zu erzählen, dass Rivva ursprünglich mit sieben Feeds gestartet ist (ich wollte hier schreiben 'nur sieben Feeds', aber Larry Pages Geschichte nimmt mir den Wind aus den Segeln). Das Seeding begann mit meiner eigenen Seite, Basic Thinking, Blogbar, Spreeblick, Wirres, Lummaland und Werbeblogger. Über die von diesen Sites ausgehenden Links konnte Rivva dann weitere Blogs finden … ad infinitum.
Heute beobachtet Rivva ungefähr 2200 unterschiedliche Quellen. Ich möchte diesen Pool auch weiterhin vorrangig organisch wachsen lassen und mich damit rühmen können, nicht mehr, sondern weniger Weblogs zu tracken als andere Dienste. Hauptsächlich, weil ein größerer Crawl-Radius aus meiner Erfahrung auch sehr schnell das 'Gesetz vom abnehmenden Ertrag' in Aktion bringt. Schwarmverhalten als Basis zu nehmen, hat für Rivva viele Vorzüge. Allerdings auch einen ganz entscheidenden Nachteil: Dieser Weg führt auch zu statistischen Plateaus und memetischem Inzest. 'Mehr vom gleichen Heu' könnte man dazu auch sagen.
Daher will ich, wie letzten Frühling schon einmal geschehen, für kurze Zeit das Vorschlagsformular öffnen. Und wäre euch sehr dankbar dafür, wenn ihr eure lieb gewonnenen Blogs dort eintragt: URL, Feed, Name, ganz egal … Wenn sich dadurch Rivvas Qualität und Vielfalt erhöht, mal sehen, vielleicht bekommt diese Funktion dann sogar ihren festen Platz.
Digitaler Alzheimer
Angespornt durch die re:publica-Keynote zum nützlichen Vergessen und Gerrit van Aakens digitalem Frühjahrsputz habe ich Rivva jetzt so programmiert, dass ältere Artikel nach und nach in Vergessenheit geraten und irgendwann auch komplett gelöscht werden. Wo genau dieses "irgendwann" liegt, wird sich noch zeigen. Momentan lösche ich Artikel, die kein Echo geschlagen haben und älter als 100 Tage sind. Von dieser Regel ausgenommen sind Blogs, die Rivvas Digest-Funktion verwenden: wirres.net, peterkroener.de, blog.metaroll.de, domanske.de, schulte-web.com, bueltge.de, wissenswerkstatt.net. (Danke dafür!) metaroll.de und blogoscoop.net verlinken ebenfalls den Story-Verlauf, doch nur für neuere Beiträge.
Wer schreibt häufiger zu einem Thema?
Eine Funktion, die ich bisher in allen Blogsuchmaschinen vermisse, hab ich vor ein paar Tagen in einer ersten Version zum Feedbacksammeln live gestellt: Wenn ich nach einem bestimmten Begriff suche, möchte ich auch wissen, welche Blogs relativ häufig zu diesem Thema schreiben. Jetzt in der Sidebar der Suchergebnisseite: sieben Sites, die Rivva empfehlen kann. Wie gesagt: in der Do-the-simplest-Thing-that-could-possibly-work-Variante. Aber eigentlich erstaunlich, dass sowas noch keine andere Blogsuche anbietet. Oder hab ich Tomaten auf den Augen?
Wo wir gerade bei der Suche sind: Ich weiß, Rivva ist schon wieder viiiel zu lahm geworden. Crawler, Datenbank, Index, Clusterer, Data-Crunching und alle Frontends (die Hauptseite, der Rails-Rivva, das Blog, die iPhone- und mobile Site) laufen immer noch auf einer einzigen Maschine. Ich rangiere eigentlich permanent am oberen Ende von dem, was der Server gerade noch so hergibt. Weil ich mal für mich selbst ausloten wollte, wie lange man wohl mit einem einzigen durchschnittlich ausgestatteten Server hinkommt. Doch langsam bin ich am Ende meines Lateins, was ich aus der Kiste noch rausholen kann, und muss mir bald anders behelfen. Bitte noch um Geduld!
Video Mixtape
Und schließlich bin ich endlich mal dazu gekommen, was mir schon von Anfang an als Idee durch den Kopf spukte: Das Blog hat eine weitere Dimension bekommen, so dass meine Einträge vielleicht auch endlich Sinn machen ;)