GPU-Infrastruktur as a Service!?
Warum sich mittelständische Unternehmen für KI aus der Cloud interessieren sollten
Bei der Diskussion neuer Konzepte für den IT-Infrastrukturbetrieb stehen gewöhnlich Arbeitsspeicher, Prozessorleistung (CPU), Datenbanken oder Netzwerke im Fokus. Die Performance der Graphics Processing Units, kurz: GPU – schien dagegen eher ein Thema für Designer, Gamer und Krypto Miner. Dieses Bild hat sich jedoch während der letzten Jahre angesichts der zunehmenden Bedeutung von künstlicher Intelligenz, Machine Learning und Deep Learning deutlich gewandelt. Unternehmen, die ihre Datenverarbeitung zukunftssicher gestalten wollen, sollten eine cloud-basierte Bereitstellung von GPUs ernsthaft prüfen.
Matrixrechnung und parallele Verarbeitung großer Datenmengen: GPUs für KI unerlässlich
Aber von vorn: Was ist eine GPU und wie unterscheidet sich diese von der CPU? Die CPUs, also Central Processing Units oder einfach Hauptprozessoren, sind für die Steuerung von PCs oder Servern zuständig und können mehrere hunderttausend Maschinenbefehle pro Sekunde ausführen. Klingt viel und ist es auch. Dennoch würden ressourcen-intensive Berechnungen – wie u. a. für die Grafikerstellung notwendig – über eine CPU immens viel Zeit benötigen und währenddessen den gesamten PC- oder Server-Betrieb ins Stocken bringen.
An dieser Stelle kommen die GPUs ins Spiel, die, anders als die Hauptprozessoren, auf die Durchführung von Vektor- oder Matrix-Rechnungen optimiert sind und damit aufwändige Berechnungen wesentlich effizienter durchführen können. Zudem sind GPUs in der Lage, große Datenmengen parallel zu verarbeiten. Genau wegen dieser Fähigkeiten – Vektorrechnung und parallelisierte Verarbeitung – schenken Online Gamer und Krypto Miner der GPU-Performance so große Beachtung.
Während der letzten Jahre kam allerdings noch ein weiterer GPU-Anwendungsfall hinzu: Künstliche Intelligenz, Machine Learning oder Deep Learning setzen eine effiziente Verarbeitung riesiger Datenmengen voraus. Das Lernen der Algorithmen basiert schließlich auf Mustererkennung (in neuronalen Netzen) – ein immens ressourcenaufwändiger Prozess und somit ein perfekter GPU Use Case.
Bedeutung von KI nimmt stetig zu – Investitionsstau im Mittelstand
Tatsächlich gewinnt die Umsetzung von KI-Anwendungen in der Praxis immer mehr an Fahrt. Laut einer im Jahr 2021 vom Digital-Branchenverband Bitkom durchgeführten Befragung halten mehr als zwei Drittel der deutschen Unternehmen KI für die wichtigste Zukunftstechnologie. Etwa jedes vierte Unternehmen wollte 2021 in diesen Bereich investieren und bei 8 % sind KI-Anwendungen bereits im Einsatz – Tendenz steigend.
Verbreitete KI-Einsatzfelder heute sind laut Bitkom personalisierte Werbung (71 %), die Verbesserung interner Abläufe in der Produktion und Instandhaltung (64 %) oder der Kundendienst (63 %). Zu weiteren verbreiteten KI-Anwendungsbereichen zählen u. a. die Analyse des Kundenverhaltens, Textarbeit, Übersetzungen, Buchhaltung, Entscheidungshilfen für Management und Strategieentwicklung, Werkzeuge für das IT-Management, Logistik und noch vieles mehr.
Kurzum: Verantwortliche in den Unternehmen können sich diesem Thema nicht verschließen – ganz egal, ob sie neue Konzepte für Marketing, Logistik oder Produktion in Angriff nehmen. Sie sollten besser heute als morgen die Grundlagen für die Sammlung und intelligente Auswertung von Massendaten schaffen – einschließlich des Aufbaus und der Integration von GPU-Rechenkapazitäten.
Dies gilt auch und insbesondere bei kleinen und mittleren Unternehmen, die sich bislang bei diesem Thema noch zurückhaltend zeigen. Mit fortschreitender Cloud-Migration und der Etablierung von mittelstandskonformen Cloud-Angeboten dürfte sich der Investitionsstau in diesem Feld nach und nach aufheben.
Bezug von GPU-Ressourcen als Infrastruktur-Cloud-Service birgt vielfältige Vorteile
So sollten gerade auch mittelständische Unternehmen bei einem anvisierten Ausbau der Infrastruktur im Zuge des KI-Trends ernsthaft prüfen, ob der Erwerb von GPU-Ressourcen in Form von KI-Grafikkarten oder als Erweiterungsboxen im eigenen Rechenzentrum sinnvoll ist.
Die immensen Schwankungen des Ressourcenbedarfs bei KI-Vorhaben ebenso wie die rasante technische Entwicklung und die unsichere Preisentwicklung im GPU-Umfeld sprechen eher für den Bezug von GPUs-as-a-Service von einem Cloud-Anbieter.
Auch sollte der Bezug der GPUs nicht isoliert betrachtet werden. Die schiere Menge der in Echtzeit zu verarbeitenden Daten fordert die gesamte IT und macht ein optimales Zusammenspiel der verschiedenen Infrastruktur-Elemente notwendig. Zu hinterfragen ist u. a., inwieweit sich die vorhandenen Datenbanken für eine performante Verarbeitung großer Datenmengen eignen und wie diese mit den neuen GPU-Ressourcen zusammenspielen.
Unter Umständen ist ein technischer Umbau der gesamten Infrastruktur notwendig. Ein weiterer Grund für den Bezug der Infrastruktur als Cloud Service: Der Betrieb von State-of-the-Art-Technologien – ob bei GPUs, Datenbanken oder weiteren Infrastrukturelementen – und deren reibungsloses Zusammenspiel gehört schließlich zu den zentralen Wertversprechen der Cloud-Anbieter.
Handlungsempfehlungen: von der Strategie zur GPU-Anbieterwahl
Was also tun? Für GPU-Bedarf und -Bereitstellung gibt es keinen Königsweg, die Unternehmen müssen und können nur selbst darüber entscheiden. Die Grundlage hierfür ist eine Strategie: Welche KI-Vorhaben sind aktuell und zukünftig angedacht? Welche Ziele werden damit verfolgt? Welche Daten sollten hierfür woher herangezogen und ausgewertet werden? Die Verantwortlichen benötigen schließlich eine Vorstellung über den Umfang der zu verarbeitenden Daten und den damit verbundenen Anforderungen an die Infrastruktur.
Im zweiten Schritt gilt es, ein geeignetes Konzept für Design und Betrieb der Infrastruktur zu finden. Grundsätzlich ist zu klären, ob der Aufbau eigener Ressourcen hierfür, einschließlich der damit einhergehenden Investitionsrisiken, tatsächlich lohnt. Die meisten Unternehmen – insbesondere kleine und mittelständische Akteure – dürften sich im Ergebnis dafür entscheiden, mindestens einen Teil der benötigten GPUs und weiterer Ressourcen als Cloud Service zu beziehen.
Fällt die Entscheidung pro Cloud, muss schließlich ein geeigneter Provider gefunden werden. Klar ist: Die Kandidaten sollten über ein umfassendes Portfolio an Infrastrukturdiensten, einschließlich GPU Services, verfügen und ein gutes Zusammenspiel der verschiedenen Komponenten gewährleisten.
Aber mehr noch: Mittelständische Unternehmen, die i. d. R. nur über begrenzte IT-Ressourcen verfügen, benötigen einen Kundenservice auf Augenhöhe. Mit dem Aufbau einer KI-geeigneten Infrastruktur wird schließlich Neuland beschritten. Umso wichtiger ist im Bedarfsfall ein einfach zugänglicher Support durch den Cloud-Anbieter.
Alternative Cloud-Angebote mit GPU-Portfolio etablieren sich – Neusondierung des Marktes lohnt
Solche Angebote aber sind immer noch rar – ein zentraler Grund für die bisherige Zurückhaltung vieler Mittelständler beim KI-Ausbau. So bieten die meisten großen Cloud-Plattformen heute zwar technisch ausgereifte Services – auch für den GPU-Betrieb. Eine individuelle Betreuung oder gar einen Support durch persönliche Ansprechpartner oder Service Manager können Mittelstandskunden bei Amazon, Google & Co. jedoch nicht erwarten. Sie müssen sich stattdessen mit standardisierten Online-Hilfen, User-Foren oder Chat-Bots begnügen.
Allerdings sind die Hyperscaler Services nicht (mehr) alternativlos. So haben sich in Deutschland und Europa während der letzten Jahre alternative Cloud-Ansätze etabliert, die sowohl moderne Dienste, einschließlich GPU-Services bereitstellen als auch einen ausgeprägten Kundenservice versprechen. Mittelständische Unternehmen, die ihre Infrastruktur im Zuge des KI-Trends modernisieren wollen, sollten deshalb den Cloud-Provider-Markt – jenseits der üblichen Verdächtigen – neu sondieren und lokale Angebote ernsthaft zu prüfen. Es lohnt sich.
Dr. Andreas Stiehler
Dr. Andreas Stiehler begleitet als IT-Analyst, Autor und Berater
seit mehr 20 Jahren Forschungs- und Beratungsprojekte zum
digitalen Wandel. Seine Kernthemen sind hierbei Digital Work &
Digital Workplace, Kundenservice im digitalen Wandel sowie das
Management von Wissensarbeit(ern). Der promovierte Volkswirt
mit Schwerpunkt auf Verhaltensökonomie setzt sich dafür ein,
den digitalen Wandel ganzheitlich zu betrachten und dabei die
Menschen stärker in den Fokus zu rücken.
Profil bei LinkedIn