Vpeljava tabelaričnih tokov v podatkovno arhitekturo

Avtorji

Tjaša Heričko
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0002-0410-7724 (neavtoriziran)
Saša Brdnik
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0003-3730-2769 (neavtoriziran)
Muhamed Turkanović
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0002-5079-5468 (neavtoriziran)

Kratka vsebina

Sodobne podatkovne arhitekture se vse bolj usmerjajo k agilnemu modelu ELT, temelječemu na podatkovnih jezerih in koliščih. Ključna prednost takšnega pristopa je uporaba odprtih tabelaričnih formatov, kot so Apache Iceberg, Hudi in Delta Lake, ki temeljijo na odprtih datotečnih formatih, kot so Avro, ORC in Parquet. V prispevku predstavljamo Tableflow – novo rešitev iz ekosistema Confluent, ki omogoča neposredno predstavitev podatkov v Kafka temah kot odprte tabele v formatu Iceberg ali Delta. S tem se podatki, pridobljeni iz virov OLTP, že v fazi zajema in vnosa pretvorijo v format, primeren za poizvedovanje in učinkovitejše shranjevanje neobdelanih podatkov v podatkovno jezero/kolišče. Kafka v tem kontekstu ne služi le pretočni obdelavi, temveč tudi kot mehanizem za zajem in vnos podatkov, skladen s sodobno velepodatkovno arhitekturo. To bistveno zmanjša izgubo konteksta in sheme, ki se pogosto pojavlja pri klasičnih prenosih med operativnimi in analitičnimi sistemi. V prispevku bomo predstavili uporabnost tabelaričnega toka, prikazali praktično uporabo rešitve Tableflow znotraj platforme Confluent Cloud in integracijo s sodobnimi podatkovnimi arhitekturami ter izvedli primerjalno analizo z obstoječimi pristopi materializacije pretočnih podatkov v tabelarno obliko. 

Biografije avtorja

Tjaša Heričko, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: tjasa.hericko@um.si

Saša Brdnik, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: sasa.brdnik@um.si

Muhamed Turkanović, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: muhamed.turkanovic@um.si

Prenosi

Izdano

01.09.2025