Architettura di Sap HANA: domande e risposte per avere idee più chiare
Cos’è l’architettura Sap Hana?
SAP HANA è un sistema di gestione di basi di dati colonnare e in memory sviluppato e commercializzato dalla società SAP. L’architettura è progettata per gestire sia alti tassi di transazioni che elaborazione di interrogazioni complesse nella stessa piattaforma. La sigla indica SAP High-Performance Analytic Appliance.
In pratica Sap Hana è un file in memoria, orientato alle colonne, RDBMS (relational Banca dati sistema di gestione). Principalmente, funge da server di database che archivia e recupera enormi volumi di dati in formato tempo reale. Inoltre, funge anche da application server ed è in grado di eseguire analisi avanzate ed operazioni ETL.
SAP produce\vende il software o l’hardware?
SAP è associata con i principali fornitori di hardware (HP, Fujitsu, IBM, Dell ecc.) per vendere l’hardware certificato Sap Hana e vende licenze e servizi collegati ai suoi prodotti.
Quale linguaggio viene utilizzato?
Il database Sap Hana è sviluppato in C++.
Qual’è il sistema operativo supportato?
Il sistema operativo supportato da Sap Hana è SUSE Linux Enterprise Server x86-64 (SLES) 11 SP1.
Si può aumentare la memoria del database tradizionale Oracle fino a 2TB e ottenere una simile prestazione?
No non è previsto. E’ possibile migliorare le prestazioni grazie ad una memoria più estesa per i database Oracle/Microsoft/Teradata. Dal momento che stiamo parlando di più tecnologie messe insieme di hardware e software risulta difficile. L’operazione di inserimento dei dati e come sono processati dal motore In-Memory (IMCE) fa la differenza.
Cosa sono l’approccio orientato a righe e a colonne?
Il sistema di gestione di basi di dati orientato alle è un sistema di gestione di basi di dati che memorizza i dati delle tabelle come sezioni di colonne di dati piuttosto che righe di dati. In confronto, la maggior parte delle basi di dati relazionali memorizzano i dati in righe. Ciò porta vantaggi nelle data warehouse, nei sistemi customer relationship management (CRM) nei cataloghi di schede bibliografiche e altri sistemi ad hoc, dove gli aggregati sono calcolati su un grande numero di dati simili tra loro.
Si possono raggiungere alcuni benefici di organizzazione orientata alla colonna o orientata alla riga con qualsiasi DBMS. Denotandolo come orientato alla colonna, ci si riferisce sia a una struttura orientata alla colonna che ha una focalizzazione sull’ottimizzazione per i carichi di lavoro orientati alla colonna. Questo approccio è in contrasto con le basi di dati orientati alle righe o le basi di dati memorizzate per righe e con le basi di dati correlate, che usano una struttura di memorizzazione basata sul valore. SAP HANA supporta sia l’orientamento a colonna che quello a righe.
In Sap Hana è preferibile la tabella a riga o a colonna?
Le query SQL con funzioni di aggregazione richiedono maggior tempo su grossi dati poiché ogni singola riga è coinvolta nella raccolta dei dati per la risposta query. Nelle tabelle a colonna, questa informazione è contenuta l’una all’altra, e di conseguenza aumenta la velocità di alcune data query. I dati vengono anche compressi, consentendo un intervallo di caricamento più breve.
Perché gli aggregati materializzati non sono richiesti in Sap Hana?
Dato che il database Sap Hana è sempre in-memory, addizionali calcoli complessi, funzioni e operazioni intensive di dati si possono svolgere direttamente sul database. Quindi le aggregazioni materializzate non sono richieste.
I vantaggi
- Modello di dati semplificato
- Logica di applicazione semplificata
- Maggior livello di concorrenza dei processi
Cos’è l’analisi ad hoc?
L’analisi ad hoc è la disciplina dell’analisi dei dati secondo necessità o richiesta. Questa analisi si basa su una serie di dati disponibili per la persona che esegue l’analisi. L’analisi risultante è valida solo come i dati su cui si basa. In genere, questo processo viene utilizzato per rispondere a una specifica domanda aziendale.
Nei data warehouses tradizionali, come ad esempio SAP BW, viene svolta molta pre-aggregazione per velocizzare i risultati. Ciò significa che lamministratore (il dipartimento IT) decide quali informazioni potrebbero servire per l’analisi e prepara i risultati per gli utenti finali. Si ottiene così una prestazione veloce ma l’utente non ha flessibilità.