Daten sind zum wichtigsten Unterscheidungsmerkmal für Unternehmen geworden. Hierfür werden Experten benötigt.

Quick wins

No more messy data!

Datenverschmutzung ist teuer! Die meisten Organisationen geben an, dass geschätzte 25% ihrer Daten ungenau sind, ein Faktor, der das Geschäftsergebnis stark beeinflusst. Dies lässt sich am besten mit der 1-10-100-Regel erklären: Wenn es dich 1 Euro kostet, einen Datenfehler zu vermeiden, kostet es dich 10 Euro, ihn anschließend zu beheben - und 100 Euro, wenn durch diesen Fehler ein Problem entsteht.

Unser Ansatz stellt sicher, dass Unternehmen Datenverschmutzung an der Quelle, der Datenpipeline, verhindern.

Wir bauen automatisierte Tests in deine Datenpipeline ein, um zu verhindern, dass verschmutzte Daten Auswirkungen auf dein Geschäft haben.

In ca. 2 Wochen werden wir, mit Unterstützung deiner Domainspezialisten:

  • Ein automatisiertes Datentest-Framework innerhalb deiner bestehenden Datenpipeline einbauen
  • Eine Datenpipeline komplett mit automatisierten Tests programmieren
  • Dich in Workshops unterstützen, um dir das nötige Wissen zu vermitteln, damit du den Rest deiner Datenpipelines selbst (test)automatisieren kannst

Clean code for data scientists

Data Scientists arbeiten mehr und mehr in einer Welt, die über ihre lokale “Insel” von RStudio oder Jupyter-Notebooks hinausgeht. Es besteht ein wachsender Bedarf, trainierte Modelle in eine Produktionsumgebung zu integrieren. Dies führt dazu, dass der Code ein längeres Leben außerhalb eines Notebooks beginnt, wo er von anderen Data Scientists gepflegt und verändert wird.

Bei dieser Transition erhält der Code neue Anforderungen. Mit dem ursprünglichen Ziel, das genaueste maschinelle Lernmodell zu erstellen, sehen wir nun, dass der Code in den meisten Fällen nicht einfach in eine Produktionsumgebung integriert oder von anderen gewartet werden kann. Data- oder DevOps-Ingenieurinnen unterstützen in diesen Fällen, aber diese Disziplinen sprechen nicht immer die gleiche Sprache und haben möglicherweise einen anderen Ansatz, wie Software entwickelt werden muss.

In diesem Hands-On-Workshop speziell für Data Scientists wirst du in die Welt des Clean Coding eingeführt und wir schauen uns Probleme an, die wir in unserer Erfahrung mit der Umsetzung von Machine Learning Modellen in die Produktion gesehen haben. Wir werden dies durch eine Reihe von kurzen Refactoring-Katas tun, denen jedes Mal ein bisschen Theorie vorausgeht. Als Ergebnis dieses Workshops wird der Übergang von lokalem Data Science Code zu einem produktionsreifen Produkt einfacher und liefert somit schneller einen Geschäftswert.

Spot on - Cloud Data Processing cost reduction

Komplexe Datenberechnungen in der Cloud sind teuer und benötigen meistens wiederkehrenden Rechenleistungen. Wir können dir zeigen, wie du preiswerte temporäre Ressourcen (sogenannte Spots) intelligent nutzen kannst, um Kosten zu sparen.

Die Kosten pro Maschinenstunde können um bis zu 90 % reduziert werden. Dies führt zu einer signifikanten Reduzierung des €/Outputs für schwere Daten-Workloads in der Cloud. Unsere Expertinnen helfen dir, deine Cloud-Datenverarbeitungskosten auszuarbeiten, diese zu reduzieren und überschaubar zu machen.

Continuous Delivery for Machine Learning (CD4ML)

Dein Modell und deine Daten in der Produktion von Tag 1 an - kontinuierlich und immer aktuell.

Continuous Delivery - das kurzzyklische und zuverlässige Ausrollen neuer Software in einer Produktionsumgebung - hat die Softwareentwicklung revolutioniert. Wir können dir helfen, dieses smarte Prinzip auf deine Daten und Modelle anzuwenden. So bekommst du sofortiges Feedback und den schnellsten ROI für deine smarten Anwendungen.

Data consulting

Consulting

Brauchst du kurzfristige Unterstützung bei deinen Datenprojekten? Suchst du nach neuem Wissen oder möchtest du jemanden temporär in deinem Team aufnehmen? Egal, ob es sich um kurz- oder langfristige Projekte handelt, mit jedem einzelnen Berater kannst du auf das Wissen aller Dataworkz-Ingenieurinnen zugreifen, um hochmoderne Datenplattformen oder Machine-Learning-Anwendungen zu entwickeln.

Audit & Second Opinion

Du bist dir nicht sicher, ob du die richtige Wahl getroffen hast? Unsere Expertinnen werden dir gerne eine zweite Meinung geben.

Data Workshops

Intro Data Science
  • Data

Intro Data Science

Von den ersten Schritten in Python bis zur Erstellung deiner ersten Deep Learning Projekte.

Jetzt anmelden
Solution Architecture Workshop
  • Data

Solution Architecture Workshop

Viele Datenströme führen nach Rom. Aber was passt zu dir? Gemeinsam ermitteln wir die richtige …

Jetzt anmelden
Werde ein Microsoft Certified Azure-Experte
  • Data

Werde ein Microsoft Certified Azure-Experte

Unsere Microsoft zertifizierten Trainer nehmen dich mit in die Microsoft Welt der KI und ML.

Jetzt anmelden