[OSM-Devserver] Killed process 1767 (postgres)

Jochen Topf jochen at remote.org
So Apr 25 08:43:25 CEST 2010


On Sat, Apr 24, 2010 at 09:08:01PM +0100, Kai Krueger wrote:
>> Nicht wirklich, denn letztlich geht es um Mangelverwaltung. Schon
>> alleine der AIO buildprozess braucht so lange er läuft etwa die
>> Hälfte der verfügbaren Resourcen.  Wenn jetzt noch zwei Prozesse mit
>> etwa diesen Anforderungen laufen dann krachts halt.  Ich fürchte um
>> alle Projekte vernünftig mit Resourcen auszustatten bräuchte ich
>> nochmal 3 Maschinen und am besten den doppelten RAM.
>
> Naja, es gibt ja dann noch etliche Server in Frankreich, den OSMF  
> devserver, die osm-toolserver von Wikimedia und vieleicht sogar noch ein  
> paar andere die verwendet werden koennten wie die in Holland oder den  
> USA. Wieweit alle Server fuer alle Projekte verwendbar waeren kann ich  
> nicht sagen, vermutlich nicht alle, aber vielleicht koennte man sich da  
> trotzdem mal absprechen und eine den Ressourcen entsprechende sinnvolle  
> Arbeitsteilung eingehen.

Wir können ja nichtmal die Ressourcen auf diesem einen Server richtig planen,
wie sollen wir das dann über x verschiedene Server, die von verschiedenen
Leuten verwaltet werden?

Und was weitere Server angeht, die wir vielleicht gespendet bekommen können:
Auch die werden sofort voll sein, wenn wir uns nicht koordiniert bekommen.
Andersrum wird ein Schuh draus: Wenn wir gut organisiert sind und eine Maschine
haben, die den ganzen Tag 100% läuft und dann nur einmal die Woche z.B.
Garmin-Images erzeugt, dann kann man zu einem Sponsor hingehen und sagen:
Schautmal, wir haben hier was tolles, aber wir brauchen einen neuen Server,
damit das jeden Tag läuft nicht nur einmal die Woche. Wenn ihr uns einen
Server gebt, dann steht da nachher drauf: Aktuelle Garmin-Images jeden Tag
dank Firma X. Das ist viel leichter zu argumentieren als: Wir wissen selbst
nicht so genau, was alles auf unserem Server läuft und dauernd schießen wir
uns die Prozesse gegenseitig ab und wir brauchen mehr Spielzeug.

> Ein eigenes
>> RAID0 für die Datenbank wäre auch nicht schlecht...
>
> Ja, das waere nicht schlecht, SSDs waeren noch besser... ;-)

SSDs sind auch nicht so toll wie man vielleicht denken würde. :-( Siehe
diverse Artikel in der c't.

> ulimits pro user einzurichten waere vielleicht auch nicht verkehrt damit  
> man nicht ausversehen alleine die ganze Kiste abschiessen kann.

Sehe ich nicht. Dann läuft der Prozess nach drei Tagen gegen ein Limit und
schwupps war alles umsonst. Und Datenbankzeit bekommt man damit auch nicht
reguliert.

Irgendwie drehen wir uns hier im Kreis. Ich schlage jetzt mal als ersten
Schritt vor, dass wir eine Wiki-Seite anlegen, wo alle Dauerläufer und
Cronjobs mit den Ressourcen, die sie brauchen, dokumentiert sind. Also ne
Tabelle mit Projekt, Job, RAM, etc. drin. Ohne zu wissen, was läuft, kommen
wir nicht weiter. Wer kümmert sich drum, so eine Seite anzulegen?

Jochen
-- 
Jochen Topf  jochen at remote.org  http://www.remote.org/jochen/  +49-721-388298