Vortragsfolien der BTW Fachtagung 2017
stehen zum Download zur Verfügung!

Bereits zum 17. Mal fand letzte Woche die Fachtagung „Datenbanksysteme für Business, Technologie und Web“ (BTW) der Gesellschaft für Informatik in Stuttgart statt. Unter den namhaften Referenten fanden sich auch unsere Mitarbeiter Andreas Tönne und Florian Pfleiderer, die ihre Vorträge nun kostenlos zum Download anbieten. 

Vom 06. bis 10. März trafen sich im Rahmen der Fachtagung BTW wieder Wissenschaftler, Praktiker und Anwender in Stuttgart, um sich über aktuelle Themen der Datenbank- und Informationssystemtechnologie auszutauschen. Auch unsere beiden Mitarbeiter Andreas Tönne und Florian Pfleiderer waren auf der Veranstaltung an der Universität Stuttgart mit Fachvorträgen präsent und stellen diese nun allen Interessierten kostenlos zur Verfügung.

Big Data is no longer equivalent to Hadoop in the industry 
Andreas Tönne

For a long time, industry projects solved big data problems with Hadoop. The massive scalability of MapReduce algorithms and the HBase database brought solutions to an unanticipated level of computing. But this obstructs the view for the need of change. Business goals that emerge from Industry 4.0 or IoT have long been addressed with a suboptimal architecture. New business goals require a rethinking of the big data architecture instead of being driven by the known Hadoop ecosphere.

In this prasentation we discuss the transformation of a Hadoop-centric middleware solution to a streaming architecture from a business value perspective. The new architecture also replaces a single NoSQL database by polyglot persistence that allows to focus on best performance and quality of each data processing step. We also discuss alternative architecture approaches like Lambda that were evaluated in the course of the transformation. We show that a single technology choice likely leads to a solution that is suboptimal.

Download
“Big Data is no longer equivalent to Hadoop in the industry”

 

Drying up the data swamp – Vernetzung von Daten mittels iQser GIN Server
Florian Pfleiderer

In vielen Unternehmen laufen heute heterogene Daten aus vielfältigen Quellen in Data Lakes zusammen, die immer mehr zu Data Swamps verkommen. Oft ist nicht bekannt, was sich in den zahlreichen Datentöpfen befindet und in welcher Qualität die Daten tatsächlich vorliegen. Typische Big Data Technologien wie zum Beispiel Hadoop alleine bieten kaum eine Möglichkeit, diesem Chaos Herr zu werden. Immer mehr Firmen zeigen daher Interesse an kompletten Lösungen, statt eigene Lösungen aufwändig aus einzelnen Technologien zusammen zu stellen. Die iQser GmbH entwickelt mit dem GIN Server eine solche Lösung, die unterschiedliche Ansätze des Data Engineering kombiniert, um verschiedenste Problemstellungen der semantischen Datenanalyse lösen zu können.

Um aus einem Mix von strukturierten und unstrukturierten Daten Informationen gewinnen zu können, werden Daten und Dokumente basierend auf ihren Inhalten mithilfe qualifizierter Relationen automatisch vernetzt. Der hierbei entstehende Graph ist die Basis für die Schöpfung von neuem Wissen aus vorher unbekannten Daten. Solche Daten können nicht immer im Vorfeld klassifiziert oder auf bestimmte Arten modelliert werden, da hierfür das notwendige a-priori Wissen über die Inhalte der Daten fehlt oder zu aufwändig zu erlangen ist. Dies betrifft insbesondere die Erstellung von Ontologien im Sinne des Semantic Web oder Open Linked Data. Hier geht die Lösung von iQser einen anderen Weg und erzeugt in einem Bottom-Up-Ansatz aus den Daten selbst ein Modell über eine automatische semantische Vernetzung.

In diesem Vortrag erklären wir, welche Ziele mit der Entwicklung des GIN Servers verfolgt wurden, um Ordnung in einem Data Swamp zu schaffen, in dem mehr Daten nicht immer mehr Nutzen bedeuten, weil es immer schwerer wird diese zu korrelieren und ordnen zu können. Es wird darauf eingegangen, welchen Herausforderungen man sich bei der Entwicklung einer solchen Lösung stellen muss, welche Erfahrungen gemacht und Erkenntnisse hierbei gewonnen wurden und warum ein Schritt weg von einer Batch-Verarbeitung und hin zu einem Streaming-basierten Ansatz es der Anwendungsarchitektur ermöglicht hat, Ziele besser zu erreichen.

Download:
“Drying up the data swamp – Vernetzung von Daten mittels iQser GIN Server”

Nicole Klein

Head of Marketing
Sollten Sie Fragen zu unseren Veröffentlichungen haben, so können Sie sich gerne jederzeit an mich wenden. Ich verantworte den Fachbereich der Marketingkommunikation und betreute unter anderem die Online-Plattformen der dibuco GmbH.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.