HAProxy-Tutorial: Installation unter Debian/Linux

HAProxy Tutorial – Installation und Konfiguration

In diesem HAProxy Tutorial führe ich dich durch die Installation und Konfiguration von HAProxy unter Debian/Linux und binde zwei Webserver als Backend-Systeme ein.

Wenn du noch nicht so viele Erfahrungen mit Loadbalancern hast und dich für ein paar Grundlagen interessierst, scroll doch mal kurz durch meinen Artikel Loadbalancing mit HAProxy.

In diesem Setup gehe ich dann Stück für Stück durch unterschiedliche Konfigurationen und Loadbalancer Modes durch.

Table Of Contents

HAProxy Tutorial – Installation und Konfiguration
Vorbereitung
Installation HAProxy
Installation deiner Webserver
Übersicht deiner aktuellen Installation
PHP zum Auslesen der Webserverinfos
HAProxy und X-Forwarded-For Header
Beispiel Layer-7 Loadbalancer und URIs
Zusammenfassung

Vorbereitung

Als erstes installiere dir drei neue Server bei deinem Cloud Hosting Provider. In diesem Artikel nutze ich natürlich Cloud Server auf unserer Plattform 🙂 aber du kannst die Installation und Konfiguration auch auf jeden anderen Hosting Provider anwenden.

Bei gridscale kannst du dir interne Layer-2 Netzwerke konfigurieren und deine Cloud Server intern vernetzen. Diese Funktion nutze ich in dieser Anleitung. Sollte dein Cloud Hosting Provider dir keine internen Netzwerke zur Verfügung stellen, arbeite einfach mit den öffentlichen IP-Adressen deiner neuen Server.

Auf meinen Servern habe ich ein frisches Debian 8 installiert. Du kannst aber natürlich auch eine beliebige andere Distribution, zum Beispiel CentOS, verwenden.

Installation HAProxy

Als erstes bereite deinen Cloud Server mit HAProxy vor. Unter Debian nutzt du dafür einfach apt-get um die benötigten Pakete zu installieren. Ich installiere noch ein paar zusätzliche Sachen wie ‚vim‘ oder ‚wget‘, du kannst darauf natürlich auch verzichten.

root@haproxy:~# apt-get -y install wget vim haproxy

Konfiguriere nun noch das interne Netzwerk auf dem HAProxy Server. Dazu einfach die Datei /etc/network/interfaces editieren und folgendes einfügen:

auto eth1
     iface eth1 inet static
     address 10.0.0.1
     netmask 255.255.255.0
     broadcast 10.0.0.255

Anschließend das Netzwerk neustarten und kontrollieren, ob das Interface eth1 konfiguriert ist.

root@haproxy:~# /etc/init.d/networking restart
[ ok ] Restarting networking (via systemctl): networking.service.
root@haproxy:~# ifconfig 
eth0      Link encap:Ethernet  HWaddr 1e:db:db:8b:c1:01  
...

eth1      Link encap:Ethernet  HWaddr 1e:db:db:8b:c1:02  
          inet addr:10.0.0.1  Bcast:10.0.0.255  Mask:255.255.255.0
...

root@haproxy:~#

Jetzt konfiguriere ein paar Bindings auf deinem HAProxy, damit wir pro Binding nachher einen Service mit unterschiedlichen Konfigurationsoptionen versehen können.

Du findest alle Konfigurationsdateien in ‚/etc/haproxy‘. Öffne als erstes die Datei ‚haproxy.cfg‘ und verschaffe dir einen kurzen Überblick.

Du kannst sowohl die global als auch die defaults Sektion erst einmal überspringen. Leg dir am Ende der Datei ein paar Listener an und erstelle die zugehörigen Backend Services.

frontend port_80
 bind *:80
 mode http
 default_backend port_80

frontend port_81
 bind *:81
 mode tcp
 default_backend port_81

backend port_80
 mode http
 balance roundrobin
 option httpchk HEAD / HTTP/1.0
 server web1 10.0.0.2:80 check
 server web2 10.0.0.3:80 check

backend port_81
 mode tcp
 balance roundrobin
 option httpchk HEAD / HTTP/1.0
 server web1 10.0.0.2:80 check
 server web2 10.0.0.3:80 check

Mit der Konfiguration hast du erst einmal einen funktionierenden HAProxy. Jetzt schnell die Webserver noch konfigurieren.

Installation deiner Webserver

Alle nachfolgenden Befehle führe einfach auf beiden Webservern aus, damit die Installationen gleich sind. Zunächst installiere dir ein paar Pakete. Es dürften alle möglichen Abhängigkeiten aufgelöst werden, am Ende steht dir dann ein Webserver mit PHP5 zur Verfügung. PHP5 möchte ich später dafür nutzen, um auf dem Webserver ein paar Daten auszugeben.

$ apt-get -y install vim wget libapache2-mod-php5

Nun editiere noch die Datei ‚/etc/network/interfaces‘ auf deinen Servern und fahre das Netzwerk Interface eth1 mit einer internen IP hoch. Für web1 habe ich 10.0.0.2 und für web2 habe ich 10.0.0.3 genommen. Die Konfigurationsdatei und das Kommando zum Neustarten der Netzwerkinterfaces kannst du von deinem HAProxy Server abgucken.

Bist du bereit zu starten?

Oder hast du noch Fragen? Lasse dir jetzt dein Konto erstellen oder dich in einem persönlichen Gespräch beraten.

Beraten lassen

Übersicht deiner aktuellen Installation

Wenn alles funktioniert hat, dann sollte deine Installation nun wie folgt aussehen.

Ob dein HAProxy funktioniert kannst du ganz einfach testen. Rufe in deinem Webbrowser einfach die IP-Adresse deines HAProxy Servers auf. Du solltest eine Standard-Webseite vom Apache2 erhalten.

Wenn das klappt, versuche das selbe mit Port 81. Auch hier sollte jetzt der Webserver seine Standardseite präsentieren.

Lass uns einen kurzen Blick auf die Konfiguration werfen, warum das so ist. Zunächst haben wir auf Port 80 einen Listener erstellt. Alle Anfragen die HAProxy auf Port 80 entgegen nimmt, werden auf die Backend-Server weitergeleitet, die unter der Gruppe „port_80“ zusammengefasst sind. Port 80 verfügt über ein sogenanntes Layer-7 Loadbalancing (zu erkennen an dem mode http). Für Port 80 ist noch keine Sticky Session konfiguriert, sprich deine Anfragen werden zwischen den Webservern verteilt.

Für Port 81 (Layer-4 Loadbalancing) verhält sich es ähnlich. Der Port 81 ist ohne eine Sticky Session konfiguriert. Das heißt, deine Anfragen werden auch über Port 81 zwischen web1 und web2 verteilt.

Gut, dann teste mal noch ein wenig mehr. Lege auf deinen Webservern im Verzeichnis ‚/var/www/html‘ eine Text-Datei an. Nenne sie einfach test.txt und schreibe jeweils den Hostnamen hinein. Also auf web1 „web1“ und auf web2 „web2“.

Nun rufe über deine öffentliche IP-Adresse und Port 80 die Datei test.txt mehrmals in kurzen Abständen hintereinander auf. Du solltest dabei immer zwischen web1 und web2 wechseln.

Ändere den Port auf 81 und frage erneut in kurzen Abständigen die test.txt an. Was siehst Du?

Verlängere den Intervall der Anfragen solange, bis du wieder zwischen den einzelnen Webservern wechselst. Obwohl als Balancing Mode roundrobin konfiguriert ist, bleibst du für ca. fünf Sekunden auf einem der Webserver kleben. Erst, wenn mehr als fünf Sekunden zwischen zwei Anfragen liegen, wird deine TCP-Session neu verteilt und landet evtl. auf einem anderen Webserver. Das liegt daran, dass die TCP-Session nicht sofort geschlossen wird und du so Gelegenheit hast, noch einen weiteren Request in die bereits geöffnete TCP-Session zu senden.

PHP zum Auslesen der Webserverinfos

Damit ich an ein paar der Header auf dem Webserver komme, habe ich PHP direkt mitinstalliert. Leg doch mal eine neue Datei nach ‚/var/www/html/‘ mit Namen „info.php“. Schreib in die Datei rein:

<?php print_r($_SERVER); ?>

Wenn du jetzt die info.php über Port 80 oder 81 aufrufst, siehst du ein paar mehr Informationen über deinen Webserver und über den Verbindungsaufbau.
Wenn du dir die Ausgabe genau ansiehst, dann wirst du feststellen, dass an keiner Stelle deine IP-Adresse auftaucht. Stattdessen ist in beiden Fällen die interne IP-Adresse des HAProxy zu erkennen.

HAProxy und X-Forwarded-For Header

Lass uns als erstes den Header so verändern, dass du auf dem Webserver auch die IP-Adresse des anfragenden Clienten erkennen kannst. Hier hat sich ein Standard etabliert, der sogenannte X-Forwarded-For Header. Dieser sollte immer dann gesetzt werden, wenn aus irgendeinem Grund die Client-IP versteckt wird. Andernfalls hast du auf dem Webserver keine Möglichkeit festzustellen, welche Client-IP eine bestimmte Anfrage veranlasst hat.

Füge in dein port_80 Backend unterhalb von ‚mode http‘ folgendes hinzu:

http-request set-header X-Forwarded-For %[src]

Jetzt rufe erneut deine info.php über den Port 80 auf. Du solltest nun den Header ‚HTTP_X_FORWARDED_FOR‘ mit deiner öffentlichen IP erkennen können. Das Ganze hat einen kleinen Haken: Sollte sich zwischen dir und deinem HAProxy ein weiterer Proxy befinden, der bereits den X-Forwarded-For Header gesetzt hat (du terminierst also gar nicht mit deiner öffentlichen IP auf dem HAProxy), dann überschreibst du jetzt den bestehenden Header mit der falschen, nämlich der des Proxy-Servers, IP-Adresse. Aber später mehr dazu.

Du solltest jetzt einen wesentlichen Unterschied zwischen Layer-4 und Layer-7 Loadbalancing erkennen können. Es ist nicht möglich, in einem Layer-4 Loadbalancer eine Manipulation in dem höheren Protokoll vorzunehmen. Vielleicht jetzt noch kein großer Nachteil. Sobald du jedoch umfangreichere Manipulationen oder logische Entscheidungen treffen willst, kann Layer-4 dir die Arbeit nicht mehr abnehmen.

Beispiel Layer-7 Loadbalancer und URIs

Lass uns kurz einen neuen Frontend- und einen neuen Backend-Service definieren, um noch weitere Tests machen zu können. Füge einfach an das Ende der haproxy.cfg folgendes ein und starte den Dienst neu:

frontend port_82
 bind *:82
 mode http
 acl my_rule path_beg /i_exist
 use_backend alternative_82 if my_rule
 default_backend port_82

backend port_82
 mode http
 balance leastconn
 http-request set-header X-Forwarded-For %[src]
 option httpchk HEAD / HTTP/1.0
 server web1 10.0.0.2:80 check
 server web2 10.0.0.3:80 check

backend alternative_82
 mode http
 balance leastconn
 http-request set-header X-Forwarded-For %[src]
 option httpchk HEAD / HTTP/1.0
 server web1 10.0.0.2:80 check

Leg nun auf deinem web1 das Verzeichnis ‚/var/www/html/i_exist‘ an und lege dort eine Text-Datei „test.txt“ mit irgendeinem Inhalt ab. Lege dieses Verzeichnis nicht auf web2 an, denn durch die HAProxy-Konfiguration ist ja gewährleistet, dass immer nur web1 die Anfragen für dieses Verzeichnis bekommt.

Zusammenfassung

Also was hast du jetzt konfiguriert:

Drei neue Cloud Server (vermutlich mit Debian 8) die intern untereinander vernetzt sind.
Auf einen Cloud Server hast du einen HAProxy installiert, auf den anderen einen Apache2 mit PHP5
Du hast im HAProxy erfolgreich einen Layer-4 Loadbalancer erstellt (Port 81)
Du hast im HAProxy erfolgreich einen Layer-7 Loadbalancer erstellt (Port 80) und zugleich Header manipuliert
Und du hast im HAProxy eine bestimmte URI abgefangen und auf einen separaten Backend-Server umgeleitet

Das ist schon ganz gut. Was jetzt fehlt sind die Sticky Sessions (dazu später mehr), ein paar advanced Konfigurationen und natürlich noch SSL.

Cookie	Dauer	Beschreibung
_ga	2 years	Das _ga-Cookie, das von Google Analytics installiert wird, berechnet Besucher-, Sitzungs- und Kampagnendaten und verfolgt auch die Nutzung der Website für den Analysebericht der Website. Das Cookie speichert Informationen anonym und weist eine zufällig generierte Nummer zu, um eindeutige Besucher zu erkennen.
_ga_YXMZ98M2VB	2 years	Dieses Cookie wird von uns zu Analysezwecken installiert.
_gid	1 day	Das von uns installierte _gid-Cookie speichert Informationen darüber, wie Besucher eine Website nutzen, und erstellt einen Analysebericht über die Leistung der Website. Zu den gesammelten Daten gehören die Anzahl der Besucher, ihre Quelle und die Seiten, die sie anonym besuchen.
cookielawinfo-checkbox-advertisement	1 year	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und dient dazu, die Zustimmung des Nutzers für die Cookies der Kategorie "Werbung" zu erfassen.
cookielawinfo-checkbox-analytics	11 months	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Analytics" zu speichern.
cookielawinfo-checkbox-functional	11 months	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Functional" zu speichern.
cookielawinfo-checkbox-necessary	11 months	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Notwendig" zu speichern.
cookielawinfo-checkbox-others	11 months	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Andere" zu speichern.
CookieLawInfoConsent	1 year	Speichert den Standard-Schaltflächenstatus der entsprechenden Kategorie & den Status von CCPA/DSGVO. Es funktioniert nur in Koordination mit dem primären Cookie.
mautic_device_id	1 year	Dieser Cookie wird von dem Anbieter Mautic gesetzt und dient der Identifizierung von Besuchern über Besuche und Geräte hinweg. Mautic-Cookies werden zur Unterstützung von Marketingaktivitäten verwendet.
mautic_referer_id	30 minutes	Dieses Cookie wird von dem Anbieter Mautic gesetzt. Dieses Cookie wird für Marketingzwecke verwendet. Es hilft bei der Verfolgung von Personen, die Formulare einreichen.
mtc_id	session	Dieses Cookie wird von dem Anbieter Mautic gesetzt und dient dazu, eine eindeutige ID für den Besucher zu setzen, um ihn über mehrere Websites hinweg zu verfolgen und ihm relevante Werbung zu zeigen. Mautic-Cookies werden zur Unterstützung von Marketingaktivitäten verwendet.
mtc_sid	session	Dieses Cookie wird von dem Anbieter Mautic gesetzt und dient dazu, eine eindeutige ID für den Besucher zu setzen, um ihn über mehrere Websites hinweg zu verfolgen und ihm relevante Werbung zu zeigen. Mautic-Cookies werden zur Unterstützung von Marketingaktivitäten verwendet.
viewed_cookie_policy	11 months	Das Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um zu speichern, ob der Nutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine persönlichen Daten.

Cookie	Dauer	Beschreibung
_gat_UA-64546682-1	1 minute	Eine Variante des _gat-Cookies, das von Google Analytics und Google Tag Manager gesetzt wird, um Website-Besitzern zu ermöglichen, das Besucherverhalten zu verfolgen und die Leistung der Website zu messen. Das Musterelement im Namen enthält die eindeutige Identitätsnummer des Kontos oder der Website, auf die es sich bezieht.
_gcl_au	3 months	Wird von Google Tag Manager zur Verfügung gestellt, um die Werbeeffizienz von Websites zu testen, die deren Dienste nutzen.
AnalyticsSyncHistory	1 month	Mit diesem Cookie speichert LinkedIn, wann eine Synchronisierung mit dem Cookie „lms_analytics cookie“ stattgefunden hat.

Cookie	Dauer	Beschreibung
_fbp	3 months	Dieses Cookie wird von Facebook gesetzt, um nach dem Besuch der Website entweder auf Facebook oder auf einer digitalen Plattform, die von Facebook-Werbung unterstützt wird, Werbung anzuzeigen.
_uetsid	1 day	Bing Ads setzt dieses Cookie, um mit einem Nutzer in Kontakt zu treten, der zuvor die Website besucht hat.
_uetvid	1 year 24 days	Bing Ads setzt dieses Cookie, um mit einem Nutzer in Kontakt zu treten, der zuvor die Website besucht hat.
bcookie	1 year	LinkedIn setzt dieses Cookie aufgrund LinkedIn-Share-Buttons und Anzeigen-Tags, um die Browser-ID zu erkennen.
bscookie	1 year	LinkedIn setzt dieses Cookie, um auf der Website durchgeführte Aktionen zu speichern.
fr	3 months	Facebook setzt dieses Cookie, um Nutzern relevante Werbung zu zeigen, indem es das Nutzerverhalten im gesamten Web auf Websites verfolgt, die mit dem Facebook-Pixel oder dem Facebook Social Plugin ausgestattet sind.
lang	session	LinkedIn setzt dieses Cookie, um sich die Spracheinstellung eines Nutzers zu merken.
li_gc	5 months 27 days	Mit diesem Cookie wird von LinkedIn die Einwilligung von Gästen zur Verwendung von nicht zwingend erforderlichen Cookies gespeichert.
lidc	1 day	LinkedIn setzt das lidc-Cookie, um die Auswahl des Rechenzentrums zu erleichtern.
MUID	1 year 24 days	Bing setzt dieses Cookie, um einzelne Webbrowser zu erkennen, die Microsoft-Seiten besuchen. Dieses Cookie wird für Werbung, Website-Analysen und andere Vorgänge verwendet.
test_cookie	15 minutes	Der test_cookie wird von doubleclick.net gesetzt und dient dazu, festzustellen, ob der Browser des Benutzers Cookies unterstützt.
UserMatchHistory	1 month	LinkedIn setzt dieses Cookie für die Synchronisierung der LinkedIn Ads ID.

Cookie	Dauer	Beschreibung
_chatwoot_session	session	Wird von Chatwoot verwendet, um die Benutzersitzung zu erhalten.
cw_conversation	1 year	Dieses Cookie ermöglicht es Chatwoot, die Konversation aufrechtzuerhalten, wenn der Kontakt durch die Webseiten navigiert / die Website später erneut besucht.

Cookie	Dauer	Beschreibung
csrf_token	10 years	No description available.
new_session	session	Keine Beschreibung verfügbar.
session_data	10 years	Keine Beschreibung verfügbar.
show_cookie_banner	session	Zeigt das Cookie als Banner.

Hybrid Core Concierge

Management Features

Cloud Portfolio

Company

Resources

Community