Serialisierung und Netzwerkprotokolle in verteilten Systemen

Einführung in verteilte Systeme und Serialisierung

Verteilte Systeme sind heute allgegenwärtig – von Multiplayer-Spielen über Cloud-Dienste bis hin zu KI-Anwendungen wie ChatGPT. Eine zentrale Herausforderung ist die effiziente Kommunikation zwischen Komponenten. In diesem Tutorial lernst du, wie du Serialisierung und Netzwerkprotokolle optimierst, basierend auf der Aufgabenstellung '15.094 problem set 1 p0'. Wir betrachten typische Probleme wie Marshalling, Latenz und Bandbreite.

Grundlagen der Serialisierung

Serialisierung wandelt Datenstrukturen in ein übertragbares Format um. Im gegebenen Code wird ein Spielbrett (100x100) mit int8_t Werten serialisiert. Wichtig sind die Speichergrößen: Auf einem 64-Bit-System ist int8_t 1 Byte, int32_t 4 Bytes. Die Gesamtgröße des Spielbretts beträgt 100 * 100 * 1 Byte = 10.000 Bytes.

Fehlende Code-Fragmente (Teil A)

Hier die Lösung für die Lücken im Serialisierungscode:

_(1)_: sizeof(int32_t) + 100 * 100 * sizeof(int8_t) – Gesamtgröße für round (4 Bytes) und board (10.000 Bytes).
_(2)_: &(currentstate->round) – Adresse des round-Feldes.
_(3)_: sizeof(int32_t) – Offset nach dem round-Feld.
_(4)_: 100 * sizeof(int8_t) – Größe einer Zeile (100 Bytes).
_(5)_: currentstate->squareval + i * 100 – Zeiger auf die i-te Zeile.

Berechnung der Verzögerung (Teil B)

Die Gesamtverzögerung setzt sich zusammen aus:

Marshalling Client: 5 ms
Übertragung: 10.000 Bytes * 8 Bits/Byte / 240.000 bps = 333,33 ms
Netzwerk-Latenz (Hin- und Rückweg): 2 * 10 ms = 20 ms
Unmarshalling Server: 5 ms

Gesamt: 5 + 333,33 + 20 + 5 = 363,33 ms.

Effizientere Übertragung von Spielzügen (Teil C)

Statt das gesamte Brett zu senden, genügt es, nur die geänderten Felder zu übertragen. Ein Spielzug ändert maximal 10 Felder. Das spart enorm Bandbreite. Eine mögliche Datenstruktur:

typedef struct {
    int32_t num_changes; // Anzahl geänderter Felder (max 10)
    struct {
        int16_t index; // Position im 1D-Array (0..9999)
        int8_t new_value;
    } changes[10];
} move_t;

Größe: 4 + 10 * (2 + 1) = 34 Bytes.

Durchschnittliche Verzögerung (Teil D)

Bei durchschnittlich 5 Änderungen pro Zug:

a) Original: 10.000 Bytes → 333,33 ms Übertragung + 10 ms Marshalling/Unmarshalling + 20 ms Latenz = 363,33 ms.
b) Optimiert: 34 Bytes → 34*8/240.000 = 1,13 ms Übertragung + 10 ms + 20 ms = 31,13 ms.

Auswirkungen vieler Änderungen (Teil E)

Wenn 5000 Felder geändert werden:

Original: unverändert 363,33 ms (da immer das ganze Brett gesendet wird).
Optimiert: 5000 * (2+1) + 4 = 15004 Bytes → 15004*8/240.000 = 500,13 ms Übertragung + 10 ms + 20 ms = 530,13 ms. Nun ist das Original besser.

Erkenntnisse zur Zustandsverwaltung (Teil F)

Die Wahl des Protokolls hängt von der Änderungsrate ab. Bei wenigen Änderungen lohnt sich differenzielle Übertragung, bei vielen das Senden des gesamten Zustands. Ein adaptives System könnte je nach Situation umschalten – ähnlich wie bei Videocodecs.

Endianness-Probleme (Teil G)

Der Hardwarewechsel von Intel (Little Endian) zu einem Big-Endian-System führt zu unterschiedlicher Byte-Reihenfolge. Dadurch werden mehrbyteige Werte wie int32_t falsch interpretiert. Lösung: Verwende eine einheitliche Byte-Reihenfolge (Network Byte Order, Big Endian) mittels htonl/ntohl.

Protokollvergleich: Stop-and-Go vs. Blast (Teil A & B)

Helen möchte Rezepte an einen Server senden. Bei niedriger Latenz (Cafe) ist Stop-and-Go effizienter, da bei Paketverlust nur ein Rezept erneut gesendet wird. Bei hoher Latenz (Mars) ist Blast besser, da die Wartezeit auf ACKs vermieden wird.

Berechnung für Cafe (Teil A)

Annahme: 100 Rezepte à 1 KB. Stop-and-Go: 100 * (Übertragungszeit + 2*Latenz). Blast: 100 KB Übertragung + 2*Latenz. Stop-and-Go ist besser bei geringer Latenz.

Berechnung für Mars (Teil B)

Hohe Latenz L dominiert. Stop-and-Go: 100 * (Übertragungszeit + 2L). Blast: Übertragungszeit + 2L. Blast ist überlegen.

Unzuverlässige Netze (Teil D)

Bei hoher Paketverlustwahrscheinlichkeit ist Stop-and-Go robuster, da nur ein Rezept neu gesendet wird. Blast müsste alle Rezepte erneut senden, was ineffizient ist.

End-to-End-Pipeline für ChatGPT (Teil A)

Eine Anfrage durchläuft mehrere Stationen mit unterschiedlichen Latenzen und Bandbreiten. Die Gesamtverzögerung berechnet sich aus Übertragungszeiten und Verarbeitungszeiten. Für 10 KB Query und 5 KB Response:

WiFi: 10 KB * 8 / 10 Mbps = 8 ms Übertragung + 10 ms Latenz = 18 ms
Ethernet: 8 ms + 1 ms = 9 ms
Weitverkehr: 8 ms + 500 ms = 508 ms
Server: 200 ms
Rückweg analog: 508 ms + 9 ms + 18 ms = 535 ms
Gesamt: 18+9+508+200+535 = 1270 ms

Fazit

Effiziente Kommunikation in verteilten Systemen erfordert durchdachte Serialisierung und Protokollwahl. Die Aufgaben aus 15.094 zeigen, wie man durch Optimierung Latenz und Bandbreite spart – relevant für aktuelle Trends wie Cloud-Gaming, KI und Echtzeit-Anwendungen.