Agentic ETL Stack

Visualisation des workflows KNIME — Pipeline ETL PostgreSQL

00 - Init Connection KNIME 5.8

Teste la connexion PostgreSQL et insère une ligne de log dans etl.agent_action_log

flowchart LR A["DB Connector
PostgreSQL"] B["DB Row Writer
INSERT agent_action_log"] C[(PostgreSQL
analytics)] A -->|JDBC Connection| B B --> C

01 - CSV to PostgreSQL KNIME 5.8

Charge le fichier CSV sample_sales.csv dans la table etl.sales_sample

flowchart LR A["📄 CSV Reader
sample_sales.csv"] B["DB Connector
PostgreSQL"] C["DB Row Writer
INSERT sales_sample"] D[(PostgreSQL
etl.sales_sample)] A -->|Data Table| C B -->|JDBC Connection| C C --> D

02 - Sales Summary KNIME 5.8

Génère un résumé des ventes par mois/année avec GroupBy

flowchart LR A["📄 CSV Reader
sample_sales.csv"] B["GroupBy
🏷️ category
📊 SUM(amount)
"] C["DB Connector
PostgreSQL"] D["DB Row Writer
INSERT summary"] E[(PostgreSQL
etl.sales_summary)] A -->|Raw Data| B B -->|Aggregated| D C -->|JDBC Connection| D D --> E

03 - Data Quality KNIME 5.8

Valide la qualité des données (produits inconnus, montants négatifs, régions invalides)

flowchart LR A["📄 CSV Reader
sample_sales.csv"] B["🔍 Row Filter
✅ Valid rows"] C["GroupBy
📊 Count by category"] D["DB Connector
PostgreSQL"] E["DB Row Writer
INSERT quality report"] F[(PostgreSQL
etl.quality_logs)] A -->|Raw Data| B B -->|Filtered| C C -->|Aggregated| E D -->|JDBC Connection| E E --> F