Talend voor Dummies (in het Nederlands).

Talend is in de eerste plaats de naam voor een Franse “vendor” van “open source software”, gespecialiseerd in “integratie”. In ruime zin wordt de term Talend ook gebruikt om de software zelf aan te duiden. Talend heeft 5 producten in zijn portfolio.

De “integratie” moet je op drie gebieden zien:

I. Data integratie (batch geöriënteerd)

Hieronder verstaan we het opzetten van jobs voor het ophalen en samenvoegen van data uit één of meerdere bronnen of applicaties en het bewaken van de kwaliteit van die data. Voor bepaalde domeinen (klanten, adresgegevens, productgegevens, ) bepaal je zo een uniform en betrouwbaar beeld en bewaar je dit ‘golden record’ in een centrale data hub. Hier maken ze een onderscheid tussen 3 producten


(1) Data Integratie (DI)
(2) Data Quality (DQ)
(3) Master Data Management (MDM)

II. Applicatie integratie (real-time)

(4) Enterprise Service Bus (ESB)

III. Proces integratie (real-time)

(5) Business Process Modeling (BPM)

Toeval of niet, de drie producten onder data integratie, nl. Data Integratie (DI), Data Quality (DQ) en Master Data Management (MDM), zijn net die producten die overeenkomen met de diensten waar IntoData zijn focus op legt.

Elk van de Talend producten kan je gratis downloaden en daarme direct aan de slag gaan. (). Dit zijn de zgn. ”Open Studio” versies.

Zeker de Data Integratie oplossing is een zeer sterk product met +500 componenten om diverse “data-manipulaties” uit te voeren. Dit kan gaan van bestandsuitwisseling van diverse formaten (CSV, XLSX, XML, JSON, EDIFACT, …), data migraties (tussen alle mogelijke databases), data synchronisatie of, vooral, de typische ETL (Extract-Transform-Load) jobs (bijvoorbeeld voor het opvullen van een Datawarehouse).

Voor de DI-tool kan je een “Enterprise” Licentie aanschaffen. De basis functionaliteit blijft natuurlijk hetzelfde, maar je krijgt een aantal zaken erbij. Naast officiële support, komen er heel wat extra features bij in de tool zoals een centrale repository (SVN), logging, scheduling, monitoring, en vele nice-to-haves …

Zodra je meerdere producten onder licentie neemt, spreekt Talend van een “Platform”. Afhankelijk van de combinaties krijg je verschillende “benamingen” voor die platformen. Volgend schema toont de mogelijke combinaties.

Talend probeert, naast zijn unieke focus op integratie oplossingen, zich van andere vendors te onderscheiden door volgende unieke concepten:

  • Het licentie model:
    Het model is ‘subscription based’, per jaar, op basis van het aantal ontwikkelaars.
    Voor MDM en ESB komt daar nog een server-runtime bij.
  • Het unified platform:
    Een Talend ontwikkelaar werkt voor elk van de bovenvernoemde producten vanuit dezelfde Talend-studio gekoppeld aan een centrale repository. Vermits de Studio met Eclipse RCP is ontwikkeld, krijg je afhankelijk van je licentie meer of minder “perspectives” te zien, die grotendeels overeenkomen met een product dat je in de free, “Open Studio” versie als stand-alone programma moet draaien.
    Alle administratie wordt ook gecentraliseerd vanuit één console (het “Talend Administration Center” of kortweg “TAC”).