© areto consulting gmbh 2014 Seite 1 · PDF fileETL Lineage for OWB ermöglicht im...

15
© areto consulng gmbh 2014

Transcript of © areto consulting gmbh 2014 Seite 1 · PDF fileETL Lineage for OWB ermöglicht im...

© areto consulting gmbh 2014 Seite 1

© areto consulting gmbh 2014 Seite 2

Inhaltsverzeichnis

Impressum ..................................................................................................................................................... 3

Über areto consulting gmbh .......................................................................................................................... 4

Über diese Marktstudie ................................................................................................................................. 5

Marktbetrachtung ......................................................................................................................................... 6

Unterstützte Datenbanken und Dateiformate .............................................................................................. 8

Stärken der vorgestellten ETL-Lösungen ...................................................................................................... 13

Übersicht der kommerziellen Aspekte und Details ....................................................................................... 14

Übersicht der Anbieter .................................................................................................................................. 16

Cubeware GmbH .................................................................................................................................... 17

Information Builders (Deutschland) GmbH ............................................................................................ 23

Microsoft Deutschland GmbH ................................................................................................................ 31

n³ data & software science GmbH ......................................................................................................... 38

Oracle Deutschland BV & Co. KG ........................................................................................................... 45

Pentaho EMEA ....................................................................................................................................... 53

SAP SE ..................................................................................................................................................... 62

Syncsort GmbH....................................................................................................................................... 69

Talend Germany GmbH .......................................................................................................................... 76

Theobald Software GmbH ...................................................................................................................... 84

© areto consulting gmbh 2014 Seite 3

Impressum

Copyright © 2014 areto consulting gmbh

Alle Rechte vorbehalten, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung. Kein Teil des Werkes darf

in irgendeiner Form (Druck, Fotokopie, Mikrofilm oder andere Verfahren) ohne schriftliche Genehmigung von areto consulting gmbh

reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.

Haftungsausschluss

Die Autoren versuchen mit größtmöglicher Sorgfalt, in der vorliegenden Studie richtige, vollständige und aktualisierte Informationen zur

Verfügung zu stellen. Fehler können jedoch nicht völlig ausgeschlossen werden. Es wird daher keinerlei Haftung oder Garantie für die

Richtigkeit, Vollständigkeit, Qualität und/oder Aktualität der veröffentlichten Informationen übernommen, es sei denn, die Fehler wur-

den vorsätzlich oder grob fahrlässig aufgenommen. Dies betrifft sowohl materielle als auch immaterielle Schäden Dritter, die durch die

Nutzung des Informationsangebots verursacht werden.

areto consulting gmbh

Schanzenstr. 6-20

51063 Köln

Phone +49 221 66 95 75-0

Fax +49 221 66 95 75-99

Geschäftsführer: Reinhard Mense, Jan Strackbein

HRB-Nr.: 73109 Amtsgericht Köln

http://www.areto-consulting.de

[email protected]

Autoren:

Reinhard Mense, Geschäftsführender Gesellschafter und CTO

Ulrich Kramer, Leiter Marketing und Vertrieb

© areto consulting gmbh 2014 Seite 4

Über areto consulting gmbh

Die areto consulting gmbh mit Sitz in Köln ist als IT-Beratungshaus spezialisiert auf die Themen Business Intelligence und Data Warehou-

sing.

areto ist ein langjähriger Partner führender Hersteller im BI-Sektor wie Oracle, EXASOL oder Informatica und bietet ihren zahlreichen

Kunden im gesamten deutschsprachigen Raum Standard- und Individuallösungen sowie eigenentwickelte Applikationen und Tools.

areto unterstützt mittelständische und Großunternehmen mit umfangreichen Professional Services bei der Konzeption und Einführung,

beim Betrieb und bei der Weiterentwicklung von BI-Systemen. Zu den Leistungen gehören u.a. die Analyse der Geschäftsprozesse und

Daten, die Datenmodellierung sowie die Entwicklung von ETL-Prozessen und Reports. Weiterhin bietet areto individuelle Schulungs- und

Coachingmaßnahmen vor allem für SAP BO-Lösungen und die Entwicklung sowie die Übernahme von BI-Anwendungen von Oracle und

SAP als Managed Service.

Das Lösungsangebot von areto umfasst insbesondere Tools und Methoden, die maßgeblich zur Steigerung der Effektivität und Effizienz

bei der Nutzung von BI-Systemen beitragen:

BI CONNECT for ODI

BI CONVERT for Informatica

BI SELECT

ETL Lineage for OWB

Für einen schnellen und sicheren Wechsel vom OWB auf Informatica PowerCenter oder eine andere ETL-/ELT-Lösung steht mit

BI CONVERT ein leistungsstarkes Werkzeug zur Verfügung.

BI CONNECT verbindet den Oracle Data Integrator direkt mit dem führenden In-Memory-Datenbanksystem EXASolution von EXASOL und

schafft so die Grundlage, selbst komplexeste Datenbestände in Echtzeit zu analysieren.

Mit dem Dienstleistungspaket BI SELECT unterstützt areto Sie bei der systematischen Auswahl einer geeigneten und für Sie passen-

den BI-Lösung.

ETL Lineage for OWB ermöglicht im Oracle Warehouse Builder eine Lineage-Analyse bis hinunter auf Attribut-Ebene. ETL Lineage ist ein

unverzichtbares Tool bei der Durchführung von Migrationen vom Oracle Warehouse Builder auf eine neue Lösung und klärt zweifelsfrei

die Herkunft von Kennzahlen, Attributen und Daten.

areto veröffentlicht regelmäßig Studien, White Paper und Präsentationen und betreibt ab 15. Dezember 2014 unter der Adresse

www.bi-labor.de einen Blog zu allen relevanten Themen rund um Business Intelligence.

Im Frühjahr 2015 sind weitere Studien im Umfeld von In-Memory-Datenbanken sowie Predictive Analytics mit vielen Informationen über

relevante Technologien und Methoden inklusive einer umfassenden Marktübersicht geplant.

© areto consulting gmbh 2014 Seite 5

Über diese Marktstudie

Es gibt zahllose Marktstudien zu Business-Intelligence-Tools ‒ warum also eine weitere? Ganz einfach: In Projekten stellen Kunden im-

mer wieder die Frage nach der für sie passenden ETL-Lösung. Eine Frage, die aus unserer Sicht gar nicht so einfach zu beantworten ist.

Wir sind der Meinung, dass eine sinnvolle Auswahl eines geeigneten Tools auf mehr beruhen muss als der bloßen Gegenüberstellung von

Features und Kosten. Vielmehr ist es wichtig, Kriterien und Fragen zu definieren, die wirklich relevante Aufgaben in BI-/DWH-Projekten

beschreiben und die am Ende einen echten und dauerhaften Nutzen bringen.

Dieser nachvollziehbare Anspruch wird in unserer Marktstudie zum Beispiel durch Fragen nach Standards und Möglichkeiten zur Auto-

matisierung sowie nach Verfügbarkeit fertiger Komponenten für typische Aufgaben in ETL-Prozessen abgebildet. Dabei haben wir uns

keineswegs auf das Auflisten von Features beschränkt, sondern die Teilnehmer an dieser Studie aufgefordert, beispielhafte ETL-Prozesse

für konkrete Fragestellungen zu skizzieren.

Die gestellten Fragen und zu behandelnden Kriterien erforderten von den Teilnehmern eine intensive Auseinandersetzung, so dass teil-

weise mehrere Personen für die Beantwortung herangezogen wurden. Ich möchte mich deshalb bei allen Teilnehmern der Studie herz-

lich für ihre Unterstützung und die aufgebrachte Zeit bedanken!

Wir wollen uns stets verbessern und weiterentwickeln. Deshalb möchten wir sowohl Sie, liebe Leserinnen und Leser, als auch die Teil-

nehmer der Studie aufrufen: Teilen Sie uns mit, was Ihnen gefallen hat, was Ihnen fehlt oder was Sie sich anders gewünscht hätten! Wir

werden dies bei den nächsten Updates dieser Studie und bei weiteren Studien berücksichtigen.

Abschließend möchte ich Sie auch auf zwei neue Studien hinweisen, die im Frühjahr 2015 erscheinen werden: Mit In-Memory-

Datenbanken und Predictive Analytics werden wir zwei derzeit besonders stark im Fokus stehende Themen behandeln. Wenn Sie recht-

zeitig über das Erscheinen der Studien informiert werden möchten, teilen Sie uns das einfach per eMail mit.

Ich wünsche Ihnen viel Vergnügen beim Lesen!

Reinhard Mense

Geschäftsführender Gesellschafter und CTO

areto consulting gmbh

© areto consulting gmbh 2014 Seite 6

Marktbetrachtung

Der Markt in Deutschland für Business Intelligence-Lösungen und -Werkzeuge wächst weiter kräftig: Auf rund 1,5 Milliarden Euro sum-

mierten sich laut einer Studie des Nürnberger BARC-Instituts1 die Umsätze für Lizenzen und Wartung von BI-Systemen in 2013 ‒ ein An-

stieg von satten 11 Prozent. Darin eingeschlossen sind sowohl die Verkaufszahlen bei Backend- als auch bei Frontend-Lösungen wie bei-

spielsweise Dashboard- oder Reporting-Anwendungen. Vor allem im Bereich der Datenmanagement-Software waren vergleichsweise

hohe Zuwachsraten zu verzeichnen. Um etwa 20 Prozent stiegen laut BARC die Erlöse bei Backend-Programmen, getrieben durch neue

Anforderungen (zum Beispiel die Integration von Social Media Daten oder zunehmende Big-Data-Initiativen), durch neue Technologien

und Methoden (In-Memory-Datenbanken, Predictive Analytics) oder neue fachliche und gesetzliche Vorgaben. Auch die zunehmende

Durchdringung von SAP HANA trug kräftig zum Umsatz bei. Der Markt für ETL- oder Datenintegrationssysteme präsentiert sich uneinheit-

lich: Einerseits haben die Anbieter von klassischen ERP- und CRM-Anwendungen immer mehr Funktionalität für die Integration der Daten

und deren Aufbereitung in ihre Suiten eingebaut, andererseits umfasst das Marktangebot auch viele Teilgebiete, die durch spezialisierte

Hersteller abgedeckt werden. Das Marktforschungsunternehmen Gartner2 kommt in diesem Bereich zu folgender Einteilung:

Datenerfassung für Business Intelligence (BI), Analytik und Data Warehousing

Konsolidierung und Bereitstellung von Stammdaten zur Unterstützung des Stammdatenmanagements

(Master Data Management ‒ MDM)

Datenmigration / Datenkonvertierung

Die Synchronisation von Daten zwischen operativen Anwendungen

Datenaustausch und Datennutzung in verbundenen Unternehmen

Bereitstellung von Datendiensten in Verbindung mit Service-orientierten Architekturen (SOA)

Integration Cloud-basierter Daten

Big Data Initiativen

Gartner2 schätzt das Marktvolumen nur für Integrationslösung auf etwa 2,2 Milliarden Dollar ‒ umgerechnet rund 1,8 Milliarden Euro.

Damit wurden im Vorjahr etwa 9,4% mehr erzielt als in 2012. Bis zum Jahre 2018 sollen die Erlöse gar auf 2,9 Milliarden Euro steigen.

Diese Einschätzung ist leicht nachvollziehbar, denn der Anspruch an Datenmanagementsysteme wird weiter steigen: Viele neue Techno-

logien wie In-Memory-Datenbanken, Frameworks wie Hadoop und ähnliche Verfahren werden innovative Anwendungen ermöglichen

und weitere Initiativen zur Nutzung der internen und externen Datenbestände in den Unternehmen begründen. Laut einer Studie des

Dienstleistungsunternehmens Lünendonk GmbH3 sehen Manager und Anwender in naher Zukunft folgende Anwendungsschwerpunkte:

Datenkonsolidierung, Datenintegration, Verbesserung der Datenqualität

Management Reporting und Dashboards

Finanzreporting

Planung/Budgetierung

Big Data

Risikomanagement/Unternehmenssteuerung

Die meisten dieser Themen berühren Aspekte der Datenintegration und des Datenmanagements. Insbesondere Big Data und darauf auf-

setzende Verfahren wie Predictive Analytics verlangen neben der Einbeziehung neuer Datenbestände (zum Beispiel aus NoSQL- und

NewSQL-Systemen) auch eine sehr hohe Datenqualität ‒ durchaus ein Bereich, wo viele Unternehmen erheblichen Nachholbedarf haben

und sich so manche Schwäche einer unzureichenden Datenmodellierung und einer verkümmerten Data Governance offenbart. Insbeson-

dere Banken und Finanzdienstleistungen werden mit der Umsetzung der gesetzlichen Vorgaben Datenstrukturen aufbauen müssen, die

eine flexible, zuverlässige und schnelle Bereitstellung relevanter Daten und Berichte ermöglicht. Aber auch für alle übrigen Unternehmen

gilt es, das Optimum aus der Datenflut und den im Unternehmen verborgenen Datenschätzen zu holen. Und dies hat stets mit der inten-

siven Nutzung von Lösungen zur Integration und Aufbereitung von Informationen zu tun.

1 Der Markt für Business Intelligence in Deutschland 2013; Business Application Research Center ‒ BARC GmbH; Juli 2014 2 Magic Quadrant for Data Integration Tools; Gartner Inc.; Juli 2014 3 Lünendonk®-Marktstichprobe 2014 ‒ Business Intelligence als Kernkompetenz; Lünendonk GmbH, 2014

© areto consulting gmbh 2014 Seite 7

Unterstützte Relationale Datenbanken I

Cubeware Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): EXASolution

Information Builders Unterstützung IBM DB/2: 9.5, 9.7, 10 cli, 10 Leightweight Client Unterstützung Microsoft SQL Server 2005, 2008 2012 Unterstützung Oracle Database 9.2, 10g, 11g, 12c Andere relationale Datenbanken per ODBC/JDBC (Quelle): Cache, Excel (via ODBC), Greenplum DB, Hive, JBoss, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per ODBC/JDBC (Ziel): Greenplum DB, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle): Hyperstage, Nucleus/SAND,IBM i Access, IDMS/SQL,Informix, Ingres,Interplex/Unisys DMS 1100, Oracle Times Ten, parAccel, Progress, PSQL, Redbrick, Sybase, UniData, UniVerse Andere relationale Datenbanken per nativer Anbindung (Ziel): Hyperstage, Nucleus/SAND, Informix, Ingres, Progress, PSQL, Redbrick, Sybase

Microsoft Andere relationale Datenbanken per ODBC/JDBC (Quelle): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per ODBC/JDBC (Ziel): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per nativer Anbindung (Quelle): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich Andere relationale Datenbanken per nativer Anbindung (Ziel): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich

Datenbanken

IBM

DB

/2

Micro

soft

SQL Server

MySQ

L

Oracle

SAP

HA

NA

OD

BC

/JDB

C

and

ere Daten

ban

ken p

er OD

BC

/JDB

C

and

ere Daten

ban

ken p

er nati

ver An

bin

du

ng

IBM

DB

/2

Micro

soft

SQL Server

MySQ

L

Oracle

SAP

HA

NA

OD

BC

/JDB

C

and

ere Daten

ban

ken p

er OD

BC

/JDB

C

and

ere Daten

ban

ken p

er nati

ver An

bin

du

ng

Anbieter als Quelle als Ziel

Cubeware J / O J / O J / O J / O J / O ● ● --- J / O J / O J / O J / O J / O ● ● ---

Information Builders ● ● J ● ● ● ● ● ● ● J ● ● ● ● ●

Microsoft ● ● J / O ● J / O ● ● ● ● ● J / O ● J / O ● ● ●

n3 data & software science J / O J / O J / O J / O J / O ● ● --- J / O J / O J / O J / O J / O ● ● ---

Oracle ● ● ● ● --- ● ● ● ● ● ● ● --- ● ● ●

Pentaho J / O J / O J / O J / O J / O ● ● ● J / O J / O J / O J / O J / O ● ● ●

SAP ● J / O J / O ● J / O ● ● ● ● J / O J / O ● J / O ● ● ●

Syncsort ● ● J / O ● --- ● ● ● ● ● J / O ● --- ● ● ●

Talend ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

Theobald Software --- --- --- --- --- --- --- ● ● ● --- ● J / O ● --- ●

● : (native) Unterstützung J : JDBC-Anbindung O : ODBC-Anbindung J / O : JDBC/ODBC-Anbindung -- keine/keine Angaben

© areto consulting gmbh 2014 Seite 8

n3 data & software science Andere relationale Datenbanken per ODBC/JDBC (Quelle) und Ziel: Alle mit JDBC-Treiber

Oracle Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Interbase 2007, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, MS Access/Excel/Word 2000, 2007, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Quelle): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory

Pentaho Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Apache Derby, AS/400, InfiniDB, Exasol 4, Firebird SQL, Greenplum, H2, Hive, Hive 2, Hypersonic, Informix, Ingres, LucidDB, MaxDB (SAP DB), PostgreSQL, SQLite, Teradata, UniVerse database; Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Microsoft, Oracle und Mondrian

SAP Unterstützung IBM DB/2: iSeries 6.4, 6.1, 7.1, LUW 9.1, 9.5, 9.7, 10.1, 10.5, zOS 8.1, 9.1, 10.5 via iSeries Access/ DB2 Connect/DataDirect ODBC Unterstützung Microsoft SQL Server Data Direct ODBC: 2000 SP4, 2005 SP3/SP4, 2008 SP2/R2, 2012 Unterstützung MySQL 5.0, 5.1, 5.5 Unterstützung Oracle Database 9i, 10g, 10gR2, 11g, 11gR1, 11gR2, 12c, 12cR1 Unterstützung SAP HANA ab 1.0 SP6, SP7, SP8 via HANA ODBC Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : SAP IQ, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Netezza, Informix, SAP ASE, SAP SQL Anywhere, HADOOP

Syncsort Unterstützung IBM DB/2: 9.1; 9.7 and higher Unterstützung Microsoft SQL Server 2005 and higher Unterstützung MySQL Level 3 compliant Unterstützung Oracle Database 10g; 11g Unterstützung ODBC/JDBC Level 3 compliant Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : JDBC level 3 compliant und ODBC Level 3 compliant Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Teradata; Vertica; Sybase; Netezza; Hive; Greenplum; Greenplum: 4.2 and higher; Hive: Hive Server 2; Netezza: 6.0 and higher Sybase: ASE und IQ 15.0 and higher; Teradata: TD13 und TD14; Vertica: 5.1 und 6.0 und 7.0

Talend Talend verwendet grundsätzlich JDBC für den Datenbankzugriff, wobei datenbankspezifische Komponenten Spezifika der jeweiligen Datenbank berücksichtigen. Zusätzlich werden die jeweiligen Batch/Bulk-Load Komponenten des Herstellers für das Laden großer Datenmengen unterstützt. Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel): generelle JDBC/ODBC Anbindung unterschiedlichster Datenbanken möglich; Für eine vollständige Übersicht https://help.talend.com/ display/TalendPlatformforDataManagementInstallationandUpgradeGuide55EN/Home Appendix B

Theobald Software Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): SAP ERP

Unterstützte Relationale Datenbanken II

© areto consulting gmbh 2014 Seite 9

Unterstützte Nicht-Relationale Datenbanken

Information Builders Andere unterstützte Datenbanken (Quelle): Adabas, Datacom/DB, IDMS/DB, IMS, Lotus Notes, Millennium, Model 204,

Axiom EPM, JD Edwards EnterpriseOne, JD Edwards World, Lawson, Oracle Applications, PeopleSoft, Salesforce.com, SAP,

Siebel,Adabas/NAT, Address Doctor, CICS Transaction, CICS Transaction for Natural, IMS Transaction, IWAF, Natural Batch,

Query/400, REST, Web Services, FOCUS/FDS

Microsoft Unterstützte Datenbanken benötigen 3rd Party connection data flow component;

diverse 3rd Party data flow components sind am Markt erhältlich, eigene Entwicklung ist einfach möglich,

da die Schnittstelle offen und dokumentiert ist

Pentaho Andere unterstützte Datenbanken: Impala, InfoBright, Ingres VectorWise, MonetDB, Neoview, Netezza, Vertica

Syncsort mittels HDFS bei allen Datenbanken, die diesen Standard unterstützen

Datenbanken

Ap

ache C

assand

ra

Go

ogle B

ig Table

HB

ase

Mo

ngo

DB

and

ere Nich

t-Relati

on

ale Daten

ban

ken

Ap

ache C

assand

ra

Go

ogle B

ig Table

HB

ase

Mo

ngo

DB

and

ere Nich

t-Relati

on

ale Daten

ban

ken

Anbieter als Quelle als Ziel

Cubeware ● --- --- ● --- --- --- --- --- ---

Information Builders --- --- ● ● ● --- --- ● ● ●

Microsoft ● ● ● ● ● ● ● ● ● ●

n³ data & software science --- --- --- --- --- --- --- --- --- ---

Oracle ● --- ● ● --- ● --- ● ● ---

Pentaho ● ● ● ● ● ● ● ●

SAP --- --- --- ● --- --- --- --- ● ---

Syncsort ● ● ● ● ● ● ● ● ● ●

Talend ● ● ● ● ● ● ● ● ● ●

Theobald Software --- --- --- --- --- --- --- --- --- ●

● : (native) Unterstützung -- keine/keine Angaben

© areto consulting gmbh 2014 Seite 10

Unterstützte Multidimensionale Datenbanken

Microsoft Unterstützte Datenbanken anderer Hersteller benötigen jeweils OLEDB/ODBC Treiber; SAP NetWeaver BW ergänzt durch

Theobald Software

Pentaho Unterstützte andere multidimensionale Datenbanken (Quelle): Palo MOLAP Server (Plug-In specific access method),

Mondrian (native)

SAP Unterstütze Versionen 3.5, 7.0, 7.3, 7.4, 7.4SP6

Syncsort DMX ist ein typisches ETL Tool. Als solches bereiten DMX die Daten auf lädt sie an die benötigten Stellen.

Multidimensionale Datenbanken laden dann von dort typischerweise die Daten selbst in die Cubes

Talend Unterstützte andere multidimensionale Datenbanken (Quelle und Ziel): Mondrian Palo

Theobald Software Unterstützte andere multidimensionale Datenbanken (Ziel): Goddata

Datenbanken

IBM

Co

gno

s TM1

Info

r BI O

LAP

Server

Jedo

x OLA

P Server

Micro

soft

An

alysis Services

Oracle Essb

ase

Oracle D

atabase O

LAP

Op

tio

n

SAP

Netw

eaver BW

SAS O

LAP

Server

and

ere mu

ltid

imen

sion

ale Daten

ban

ken

IBM

Co

gno

s TM1

Info

r BI O

LAP

Server

Jedo

x OLA

P Server

Micro

soft

An

alysis Services

Oracle Essb

ase

Oracle D

atabase O

LAP

Op

tio

n

SAP

Netw

eaver BW

SAS O

LAP

Server

and

ere mu

ltid

imen

sion

ale Daten

ban

ken

Anbieter als Quelle als Ziel

Cubeware ● ● --- ● ● --- ● --- --- ● ● --- ● ● --- ● --- ---

Information Builders --- --- --- ● ● --- ● --- --- --- --- --- --- --- --- --- --- ---

Microsoft ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

n³ data & software science --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---

Oracle --- --- --- --- ● ● --- --- --- --- --- --- --- ● ● --- --- ---

Pentaho --- --- --- ● --- --- --- --- ● --- --- --- --- --- --- --- --- ---

SAP --- --- --- --- --- --- ● --- --- --- --- --- --- --- --- ● --- ---

Syncsort --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---

Talend --- --- --- --- --- --- ● --- ● --- --- --- --- --- --- --- --- ●

Theobald Software --- --- --- --- --- --- ● --- --- --- --- --- ● ● --- ● --- ●

● : (native) Unterstützung -- keine/keine Angaben

© areto consulting gmbh 2014 Seite 11

Unterstützte Dateien/Datenformate

Cubeware Andere Datenformate: xls/xlsx

Information Builders Andere Datenformate: Acucobol CISAM, DB Heritage Files, Delimited Flat File, Excel (via direct retrieval), Flat File, Informix, CISAM, MicroFocus CISAM, RMS,VSAM

Microsoft Andere Datenformate: custom code oder 3rd Party Komponente notwendig (JSON); Excel, Access

n³ data & software science Anderes Datenformat: Excel

Pentaho Andere Datenformate: Email, ESRI, Google Analytics, Google Docs, GZIP, HL7, IBM Websphere MQ, JMS, LDAP, LDIF, MS Access, MS Excel, RSS, S3 CSV, Salesforce, SAS, Yaml

SAP Andere Datenformate: DTD, als Quelle: Excel Worksheet, Cobol Copybook, VCF Dateien (Genomsequenzen), ESRI Shapefiles (Geodaten), beliebige weitere via Adapter SDK

Syncsort Andere Datenformate: Informix C-ISAM; Microfocus; Unikox VSAM; ACUCOBOL GT Version; Fixed length; Mainframe; Fortran

Talend Andere Datenformate: HDFS, Apache Log, ARFF, EBCDIC, Excel, LDIF, Mail

Theobald Software Anderes Datenformat: Tableau-Datenfiles

Datenbanken

Fixed Len

gth Flat File

CSV

XM

L

JSON

and

ere Daten

form

ate

Fixed Len

gth Flat File

CSV

XM

L

JSON

and

ere Daten

form

ate

Anbieter als Quelle als Ziel

Cubeware ● ● --- --- ● --- ● --- --- ●

Information Builders ● ● ● ● ● ● ● ● ● ---

Microsoft ● ● ● ● ● ● ● ● ● ●

n³ data & software science ● ● ● ● ● ● ● ● ● ●

Oracle ● ● ● ● --- ● ● ● ● ---

Pentaho ● ● ● ● ● ● ● ● ● ●

SAP ● ● ● ● ● ● ● ● ● ●

Syncsort ● ● ● ● ● ● ● ● --- ●

Talend ● ● ● ● ● ● ● ● ● ●

Theobald Software --- --- --- --- --- ● ● ● ● ●

● : (native) Unterstützung -- keine/keine Angaben

© areto consulting gmbh 2014 Seite 12

Stärken des ETL-Tools aus Sicht des Herstellers

Cubeware Einfachheit in der Bedienung, selbst für die Definition komplexer ETL Prozesse; ETL und OLAP Modellierung über

ein Tool unter Verwendung eines Repositories; Definition von ETL Prozessen durch Drag & Drop-

Information Builders Funktional umfangreiches, leicht erlernbares ETL Tool. Der gesamte ETL Entwicklungsprozess erfolgt über eine

graphische Benutzeroberfläche und zwar schrittweise als Daten- und Prozess Flows. Die mit dem Data Migrator

erstellten Flows sind als lesbare Textfiles gespeichert, bestehend aus SQL Commandos und interner Scriptsprache.

So ist der gesamte Ablauf Line by Line nachvollziehbar (vollständiges Audit). Mehr als 250 Datenadapter stehen als

Quell- oder Zieladapter bereit. Der DataMigrator nutzt dieselben Metadaten wie das BI Reporting Werkzeug Web-

FOCUS, daraus ergeben sich Synergien für kürzere Entwicklungszeiten und Wiederverwendbarkeit von Modulen.

Microsoft Geschwindigkeit, Remote Debugging, kurze Designzeit, vollständige API zur Programmierung.

n³ data & software science leicht verständliche grafische Oberfläche; bedienbar mit grundlegenden Datenbank-Kenntnissen; einfach in beste-

hende Infrastruktur integrierbar.

Oracle 1. dynamische Codegenerierung durch Template (Knowledge Module): Der Anwender kann den genierten Code

an seine Anforderungen anpassen.

Einsatzszenarios:

- individuelle Performanceanpassungen

- neue Funktionalitäten, die Oracle nicht in das Tool eingebaut hat

- Standardisierung des Codes: wiederkehrende Schritte werden automatisch generiert und die Codestruktur ist

immer die gleiche (führt zu sehr viel kürzeren Entwicklungszeiten und geringeren Entwicklungskosten)

2. heterogene Umgebungen

3. Integration in den Oracle Product Stack von der Hardware bis zum BI Werkzeug

4. Java basierte Entwicklungsumgebung

Pentaho Intuitiv, skalierbar, offen, Baukastenprinzip (eigene Schritte können definiert und ausgeführt werden), alle markt-

gängigen Speichersysteme können integriert werden.

Big Data Adaptive Layer ‒ Änderungen in Hadoop-Distributionen sind transparent; Datenbank-Repository bietet

Möglichkeiten für Teamarbeit, zur Hinzufügung von Informationen, ist Metadaten-getrieben und kann in einer

Cloud-Umgebung eingesetzt werden.

SAP Benutzerfreundlichkeit, starke Datenqualitäts- und ETL-Transformationen in einem Tool, hohe Performance, Er-

weiterbarkeit via Adapter SDK, Real-Time und Batch-Szenarien in einem Tool.

Syncsort DMXExpress ist aus Sicht des Herstellers eines der leistungsfähigsten ETL Tools am Markt. Durch seine Mainframe-

Herkunft ist DMX gewohnt, mit wenig Ressourcen sehr effizient zu arbeiten. Typischer Weise benötigt DMX ca. 1/3

der Cores, die ein herkömmliches ETL Tool benötigt. Dazu verbraucht DMX ca. 65% weniger Memory. Durch den

Einsatz der verschiedenen DMX Features wie Compression kann der Bedarf an Plattenplatz drastisch reduziert

werden. DMX kann komplette Workflows komprimiert verarbeiten ‒ also sowohl komprimierte Files lesen, verar-

beiten und wieder wegschreiben. Ein Extrahieren ist nicht nötig.

Talend Durch native Unterstützung moderner Big-Data-Plattformen wie Hadoop und NoSQL nehmen die „Zero Footprint“

Lösungen von Talend die Komplexität und statten IT-Abteilungen so aus, dass sie schneller auf Geschäftsanforde-

rungen reagieren können.

Talends einheitliches Lösungsportfolio basiert auf Open Source und wird vom breitesten Ökosystem in der Bran-

che unterstützt. Es wird über ein vorhersehbares Subskriptionsmodell angeboten und beinhaltet Big Data, Daten-

integration, Data Quality, Master Data Management (MDM), einen Enterprise Service Bus (ESB) und Geschäftspro-

zessmanagement (BPM).

Theobald Software Instant Datawarehousing für automatisiertes Anlegen der DWH-Objekte, minimaler bis kein Eingriff in das SAP,

robustes, standardisiertes Verfahren für inkrementelle Beladungen, zentrales Security-Konzept.

© areto consulting gmbh 2014 Seite 13

Übersicht der kommerziellen Aspekte und Details I

Welche Lizensierungsmodelle gibt es (z.B. pro CPU, pro Named User)?

Cubeware Keine Angaben

Information Builders pro CPU Core und pro Datenquelle

Microsoft pro Core, min. 4 Cores

n³ data & software science Named User

Oracle Oracle bietet CPU-basierte Lizensierung (anhand der Cores des jeweiligen Prozessor-Anbieters) und eine Named

User Plus Lizensierung an. Es sind die Staging-/Transformations-Area zu lizensieren, die Quell- und Zielsysteme sind

in der Regel enthalten (Ausnahme: Host-Systeme, Standards-Applikationen wie z. B. SAP oder Siebel)

Pentaho per Core für die Pentaho Plattform; zusätzlich per Node für den adaptiven Big Data Layer / Hadoop

SAP CPU -Kerne

Syncsort Kauf- und Mietlizenzen pro CPU

Talend Named User, Concurrent User, Core-based

Theobald Software pro Server

Welche kostenpflichtigen Optionen und Zusatzmodule bieten Sie an?

Cubeware Keine Angaben

Information Builders Keine Angaben

Microsoft Keine

n³ data & software science Keine Angaben

Oracle Der Datenintegrationsbereich besteht im wesentlichen aus 3 Produkten:

1. ODI

2. Oracle Golden Gate (OGG) für Realtime Integration

3. Oracle Enterprise Data Quality (EDQ) für Data Quality and Data Profiling, optional Address Verification Server

Die drei Produkte können unabhängig voneinander betrieben werden, sie lassen sich auch integrieren und werden

dann von ODI gesteuert.

Optionen:

1. ODI Management Pack für Oracle Enterprise Manager Grid Control (z. B. für einheitliche Administration aller

Oracle Produkte oder die Optimierung des von ODI generierten Codes durch die Datenbank)

2. Adaptoren für Standard Applikationen (z. B. SAP ECC/BW, Siebel oder EBus)

3. Adaptoren für Host Systeme

Pentaho Adaptive Big Data Layer, Data Science Pack

SAP Keine

Syncsort DMX-Hadoop

Talend Mission Critical Support

Theobald Software Keine Angaben

© areto consulting gmbh 2014 Seite 14

Übersicht der Anbieter

Vorgestellte Unternehmen und Lösungen in dieser Studie

Cubeware GmbH .............................................................................................................................................................. 17

Information Builders (Deutschland) GmbH ...................................................................................................................... 23

Microsoft Deutschland GmbH .......................................................................................................................................... 31

n³ data & software science GmbH .................................................................................................................................... 38

Oracle Deutschland BV & Co. KG ...................................................................................................................................... 45

Pentaho EMEA .................................................................................................................................................................. 53

SAP SE ............................................................................................................................................................................... 62

Syncsort GmbH ................................................................................................................................................................. 69

Talend Germany GmbH .................................................................................................................................................... 76

Theobald Software GmbH ................................................................................................................................................ 84

Weitere Anbieter

Actian Germany GmbH 63303 Dreieich www.actian.com

IBM Deutschland GmbH 71139 Ehningen www.ibm.de

Informatica GmbH 60528 Frankfurt am Main www.informatica.com

SAS Institute GmbH 69118 Heidelberg www.sas.com

Vermissen Sie ein Unternehmen oder eine Lösung? Soll Ihr Unternehmen oder Ihr ETL-System im geplanten Update der Marktstudie Anfang 2015 ebenfalls

aufgeführt werden? Setzen Sie sich bitte mit uns in Verbindung, wir werden Ihre Wünsche gerne berücksichtigen.

© areto consulting gmbh 2014 Seite 15

Cubeware GmbH I

Anbieter

Anbieter Cubeware GmbH, Mangfallstr. 37, 83026 Rosenheim

Webseite und eMail-Adresse www.cubeware.com, [email protected]

Anzahl Mitarbeiter weltweit und in Deutschland 200 (weltweit), 100 (deutschlandweit)

Architektur

Speicherung der entwickelten ETL-Prozesse (ETL-Repository)

Kann die Speicherung des ETL-Repository in einer relationalen Datenbank

erfolgen? Nein

Kann die Speicherung des ETL-Repository außerhalb einer relationalen

Datenbank erfolgen? Ja (die Speicherung erfolgt in einem binären XML Dateiformat)

Werden vom Client des ETL-Tools Auswertungen des ETL-Repository zur

Verfügung gestellt (z. B. in Form von vordefinierten Berichten)? Nein

Kann auf das ETL-Repository auch außerhalb des Clients lesend zugegriffen

werden (Existieren z. B. Views, auf die mit SQL zugegriffen werden kann)? Nein

Kann auf das ETL-Repository auch außerhalb des Clients schreibend zuge-

griffen werden (Existieren z. B. API-Funktionen, um Objekte im ETL-

Repository zu erzeugen oder zu verändern)?

Nein

Existiert ein Metadaten-Repository und ist es erweiterbar? Nein

Welche Sicherheitslösungen bestehen für den autorisierten Zugriff

auf Metadaten? Keine Angaben

Softwarelösung

Genaue Bezeichnung des ETL-Tools C8 Importer

Version des aktuell verfügbaren ETL-Tools, die als Grundlage für die Beant-

wortung dieser Fragen herangezogen wurde C8 Importer R8

Modul 1 C8 SAP Connect R8 (Zugriff auf SAP ERP)

Modul 2 C8 SAP OLE DB Connect R8 (Zugriff auf SAP BW)

Modul 3 C8 Infor Connect R8 (Zugriff auf ION BI)

Modul 4 C8 TM1 Connect R8 (Zugriff auf IBM Cognos TM1)

Modul 5 C8 MS AS Connect R8 (Zugriff auf Microsoft Analysis Services)

Modul 6 C8 Essbase Connect R8 (Zugriff auf Oracle Essbase)

Modul 7 C8 EXASOL Connect R8 (Zugriff auf EXASolution)

Handelt es sich um kommerzielle Software oder um eine Open Source oder

Freeware-/Shareware-Lösung? kommerzielle Software