arocom setzt KI im eigenen Agenturalltag in drei Bereichen produktiv ein: Softwareentwicklung (KI-Agenten für Implementierung, Tests und Reviews mit menschlicher Abnahme), Content-Arbeit (Recherche und Entwürfe, finale Redaktion beim Autor) und SEO/GEO-Analysen (automatisierte Audits über eigene Tool-Pipelines). Der größte messbare Effekt liegt in der Entwicklung; der Engpass wandert vom Umsetzen zum präzisen Beschreiben und zum Review. Wieder abgeschafft: vollautomatische Übersetzungen ohne Review, KI-generierte Stock-Bilder für Fachinhalte und ein interner Wissens-Chatbot.
Hinweis: Dieser Beitrag beschreibt einen Stand, der sich inzwischen weiterentwickelt haben kann. Für eine aktuelle Einschätzung sprecht uns an.

Inside arocom: Wie wir selbst mit KI arbeiten

Wer Unternehmen zu KI berät, sollte die eigene Werkstatt zeigen können. Dieser Beitrag ist bewusst konkret: welche Werkzeuge wir wofür nutzen, was sie messbar bringen, was schiefging. Stand: Januar 2026. Die Halbwertszeit solcher Berichte ist kurz; genau deshalb schreiben wir ihn. Ein Update folgt, wenn sich Wesentliches ändert.

Drei Bereiche tragen bei uns den Alltag: Entwicklung, Content-Arbeit und SEO-Analysen. Für jeden zeigen wir ein konkretes Beispiel aus den letzten Wochen, dazu die Liste der Dinge, die wir nach ehrlicher Bilanz wieder beerdigt haben.

Entwicklung: Agenten implementieren, Menschen entscheiden

Der größte Hebel liegt bei uns in der Entwicklung. KI-Agenten übernehmen abgegrenzte Implementierungsaufgaben: Komponenten bauen, Tests schreiben, Refactorings durchziehen, Code-Reviews vorbereiten. Unsere eigene Website (440+ statische Seiten, Astro plus Drupal-Erbe) wird überwiegend so weiterentwickelt. Wir beschreiben die Aufgabe, der Agent implementiert auf einem Feature-Branch, Qualitäts-Gates laufen automatisch (Tests, Linting, visuelle Regression), ein Mensch reviewt den Pull Request.

Wie das an einem normalen Vormittag aussieht, am Beispiel eines echten Features (die Zeiten sind grobe Werte aus unserer eigenen Beobachtung, keine Benchmark):

  • 9:00 Uhr, Aufgabe beschreiben, etwa 20 Minuten. Eine kurze Spezifikation: was die neue Filterfunktion können soll, welche Seiten betroffen sind, dass DE und EN gleichziehen müssen.
  • 9:20 Uhr, der Agent implementiert, etwa 45 Minuten. Feature-Branch, Komponente, Tests, Übersetzungen. Wir arbeiten währenddessen an anderen Themen.
  • 10:15 Uhr, Qualitäts-Gates, etwa 10 Minuten. Tests, Linting, Accessibility-Check und visuelle Regression laufen automatisch.
  • 10:30 Uhr, Review, etwa 30 Minuten. Ein Entwickler liest den Pull Request, findet einen unbehandelten Randfall, der Agent korrigiert ihn.
  • Gegen 11:30 Uhr: Merge. Vor den Agenten hätten wir für dasselbe Feature ein bis zwei Personentage angesetzt. Am Nachmittag läuft das nächste Ticket nach demselben Muster.

Die ehrliche Bilanz: Bei klar umrissenen Aufgaben sind die Agenten schneller und gründlicher als wir. Sie vergessen keine Testfälle und keine Übersetzung. Bei unscharfen Aufgaben produzieren sie selbstbewussten Unsinn. Der Engpass wandert vom Schreiben des Codes zum präzisen Beschreiben des Problems und zum Review.

Über das Jahr gerechnet schätzen wir den Effekt auf etwa die doppelte Zahl umgesetzter Aufgaben pro Woche. Das ist eine Größenordnung aus unserer eigenen Aufzeichnung, keine Benchmark, und sie verteilt sich ungleich: Routinearbeit beschleunigt stark, Konzeptarbeit kaum. Bewusst nicht an Agenten geben wir Architekturentscheidungen, sicherheitskritische Änderungen und alles, was wir selbst noch nicht klar beschreiben können. Eine unscharfe Aufgabe wird durch einen Agenten nicht schärfer, nur schneller falsch umgesetzt.

Content und SEO: Entwurf ist KI, Absender ist Mensch

In der Content-Arbeit gilt unser Leitprinzip wörtlich: Recherche, Strukturvorschläge und Erstfassungen kommen aus der KI. Die finale Fassung verantwortet der Autor oder die Autorin, bei diesem Text: ich. Metadaten, Alt-Texte und Übersetzungs-Rohfassungen laufen über dieselben Workflows, die wir Kunden in Drupal einrichten.

Das konkreteste Beispiel ist dieser Blog selbst. Der Workflow für jeden Beitrag: Recherche-Agenten sammeln Quellen und Gegenpositionen, ein Agent baut daraus einen Strukturvorschlag und eine Erstfassung nach unserem Redaktionsleitfaden. Dann übernimmt der Mensch: kürzen, Zahlen prüfen, eigene Projekterfahrung ergänzen, den Ton geraderücken. Von der Erstfassung bleibt selten mehr als die Struktur unverändert. Auch dieser Text ist so entstanden, und freigegeben habe ihn ich.

Die Recherche-Agenten liefern dabei keine fertige Wahrheit, sondern Material: eine Quellenliste mit Gegenpositionen, offene Fragen, eine erste Gliederung. Unsere Regel dazu ist streng: Kein Beitrag geht raus, dessen Zahlen und Behauptungen der benannte Autor nicht selbst geprüft hat. Das kostet pro Text ein bis zwei Stunden und ist der Teil, den wir nicht automatisieren werden.

Für SEO- und GEO-Analysen haben wir eigene Pipelines gebaut: automatisierte Site-Audits, Search-Console-Trends, Wettbewerbs-Monitoring in KI-Antworten. Was früher ein Beratertag war, ist heute ein Report auf Knopfdruck. Der Beratertag steckt jetzt in der Interpretation und den Maßnahmen. Ein Beispiel: Der wöchentliche Sichtbarkeits-Report über unsere Kundenprojekte brauchte früher einen halben Tag Handarbeit. Heute läuft er automatisch und endet in einer halben Stunde menschlicher Einordnung. Die Bausteine dafür sind dieselben Agenten wie in der Entwicklung, nur mit anderen Datenquellen: Search Console, Webanalyse und die KI-Suchen selbst.

Was wir wieder abgeschafft haben

Transparenz heißt auch, die Fehlschläge zu nennen. Die Liste ist kurz, aber jeder Punkt hat uns Zeit oder Geld gekostet, bevor wir ihn gestrichen haben:

  • Vollautomatische Übersetzungen ohne Review. Die Rohqualität ist beeindruckend, aber Fachterminologie und Tonalität kippen ohne menschliche Redaktion zuverlässig ins Generische. Heute: Rohfassung automatisch, Freigabe menschlich. Gelernt haben wir, Qualität dort zu prüfen, wo sie kippt: an Fachbegriffen und Tonlage, nicht an der Grammatik.
  • KI-generierte Bilder für Fachinhalte. Sie sahen nach KI aus und zahlten auf nichts ein. Wir sind zu kuratierten Stock-Fotos und eigenen Grafiken zurückgekehrt. Das Learning daraus: Ein Bild zahlt nur ein, wenn es etwas Echtes zeigt, also kuratieren wir Fotos heute so sorgfältig wie Texte.
  • Der "alles automatisieren"-Reflex. Ein interner Chatbot für Projektwissen brachte weniger als die simple Disziplin, Wissen strukturiert in Markdown-Dokumenten zu halten, die Menschen und unsere KI-Werkzeuge gleichermaßen lesen. Der Engpass war nie das Abfragen von Wissen, sondern seine Pflege. Manchmal ist die beste KI-Maßnahme ein aufgeräumtes Dateisystem.

Was ihr aus unserer Werkstatt mitnehmen könnt

Hinter allen drei Bereichen steckt dasselbe Muster: KI verschiebt den Engpass vom Ausführen zum Entscheiden. Implementieren, Übersetzen und Auswerten sind schnell geworden; präzise beschreiben, prüfen und verantworten bleiben Menschenarbeit, und genau dort investieren wir. Diese Verschiebung ist auch der Grund, warum dieser Bericht ein Verfallsdatum trägt: Die Werkzeuge ändern sich schneller als die Spielregeln, also dokumentieren wir vor allem die Spielregeln.

Wenn ihr prüfen wollt, wo KI in eurem eigenen Alltag trägt: Beginnt mit einem abgegrenzten, gut beschreibbaren Prozess, messt vorher und nachher, und behaltet die Freigabe beim Menschen. Wie daraus eine Strategie statt einer Bastelei wird, beschreiben wir im Beitrag zur KI-Strategie im Mittelstand.

Ihr wollt wissen, was diese Themen für euer Unternehmen bedeuten? Der Zukunfts-Check zeigt in 2–4 Wochen, wo die größten Hebel liegen.

Zukunfts-Check anfragen Direkt Kontakt aufnehmen
100 %