Guida alle Basi di Dati — Dal dato grezzo al modello E-R

Concetti fondamentali

Dato vs Informazione

Due concetti spesso confusi, con una differenza fondamentale

Nel mondo aziendale, e in particolare negli indirizzi AFM e RIM, si sente spesso parlare di dati e informazioni come se fossero la stessa cosa. Non lo sono — e capire la differenza è il punto di partenza di qualunque ragionamento sui database.

Concetto	Definizione	Esempio
Dato	Una descrizione elementare, un valore grezzo privo di contesto.	Rossi · 01/01/2025 · 120.50
Informazione	L'incremento di conoscenza che si ottiene interpretando e contestualizzando i dati.	"Il cliente Rossi ha effettuato un ordine di 120,50 € il 01/01/2025"

L'insieme di valori {Rossi, 01/01/2025, 120.50} è una raccolta di dati grezzi: di per sé non ci dice nulla. Diventa informazione significativa solo quando gli associamo uno schema che ne definisce il significato, ad esempio {Cognome Cliente, Data Ordine, Importo Fattura}.

ℹ️

La formula chiave Dati + Struttura (schema) + Contesto = Informazione. Un database è esattamente questo: un sistema che conserva dati organizzati secondo uno schema, per produrre informazioni utili.

Perché questa distinzione conta nel lavoro

In un'azienda AFM o RIM, chi gestisce dati senza capirne il significato commette errori costosi. Un file Excel con 10.000 righe di numeri senza intestazioni è dati. Lo stesso file con intestazioni chiare, formule corrette e filtri appropriati diventa informazione su cui si prendono decisioni.

💡

Caso pratico Il magazzino registra: ART-042, 15, 2025-03-10. Sono dati. Quando il gestionale li interpreta come "Articolo ART-042: 15 unità vendute il 10 marzo 2025", diventano informazione utile al riordino.

Struttura del database

Schema e Istanza

Un database è definito da due livelli distinti: la sua struttura (schema) e i suoi contenuti (istanza). Confonderli è uno degli errori più comuni tra chi si avvicina ai database per la prima volta.

Concetto	Cos'è	Cambia nel tempo?	Esempio
Schema	La definizione della struttura: nomi delle tabelle, colonne, tipi di dato, vincoli.	Raramente (solo con modifiche strutturali)	Tabella CLIENTI con colonne: ID, Cognome, Nome, Email
Istanza	I dati effettivamente contenuti nel database in un dato momento.	Continuamente (ad ogni INSERT, UPDATE, DELETE)	La riga: 1, Rossi, Marco, marco@email.it

🏗️

Analogia utile Lo schema è come il modulo di un form cartaceo: definisce i campi, il loro tipo (numero, testo, data) e le regole da rispettare. L'istanza è il modulo compilato: i valori concreti inseriti in quei campi.

Perché la distinzione è importante

Quando si progetta un database, si lavora prima sullo schema — si decide quali tabelle creare e come collegarle. Solo dopo si inseriscono i dati (istanza). Modificare lo schema di un database già popolato è costoso e rischioso: richiede migrazioni, controlli di integrità, aggiornamenti ai programmi che usano il database.

⚠️

Errore comune Aggiungere colonne a una tabella esistente senza pianificazione può causare valori NULL non previsti in milioni di righe già presenti. Una buona progettazione dello schema sin dall'inizio evita questi problemi.

Motivazione

Limiti dei file

Prima dei database, le aziende conservavano i dati in file separati: un file per le fatture, uno per i clienti, uno per il magazzino. Questo approccio, ancora diffuso con Excel, presenta problemi strutturali gravi.

🔁

Ridondanza

Lo stesso dato (es. nome del cliente) è copiato in più file. Ogni copia può diventare inconsistente.

💥

Inconsistenza

Se il cliente cambia indirizzo e si aggiorna solo un file su tre, i dati diventano contraddittori.

🔒

Accesso difficile

Per rispondere a "tutti i clienti che hanno ordinato prodotto X nel 2024" bisogna aprire e incrociare più file manualmente.

👤

Accesso non controllato

Chiunque abbia accesso al file può leggere o modificare tutto. Non è possibile dare accesso parziale.

🚧

Accesso concorrente

Due persone che modificano lo stesso file Excel contemporaneamente causano sovrascritture e perdita di dati.

🔗

Dipendenza dai programmi

Il formato del file è legato al programma che lo ha creato. Cambiare software significa dover migrare tutti i dati.

💡

Il database risolve tutti questi problemi Un DBMS centralizza i dati, elimina la ridondanza tramite le relazioni, garantisce l'accesso controllato con permessi granulari, e gestisce la concorrenza in modo automatico.

Definizione

Cos'è un Database

Un database (base di dati) è una raccolta organizzata di dati correlati, strutturata in modo da consentire l'accesso, la gestione e l'aggiornamento efficiente delle informazioni.

📖

Definizione formale Un database è un insieme di dati persistenti, condivisi e organizzati secondo un modello logico, gestiti da un sistema software chiamato DBMS che garantisce correttezza, sicurezza e accesso efficiente.

Caratteristiche fondamentali

💾

Persistenza

I dati sopravvivono alla chiusura del programma e ai riavvii del sistema.

👥

Condivisione

Più utenti e applicazioni possono accedere agli stessi dati contemporaneamente in modo controllato.

✅

Integrità

Il DBMS verifica che i dati rispettino le regole definite nello schema (vincoli di integrità).

🔐

Sicurezza

L'accesso ai dati è controllato tramite permessi: ogni utente vede e modifica solo ciò che gli è consentito.

Il software

Il DBMS

Il DBMS (Database Management System, Sistema di Gestione di Basi di Dati) è il software che si interpone tra gli utenti/applicazioni e il database fisico. Non si "apre un database" direttamente — si usa sempre un DBMS come intermediario.

DBMS	Tipo	Uso tipico
MySQL / MariaDB	Relazionale, open source	Applicazioni web, siti WordPress
PostgreSQL	Relazionale avanzato, open source	Applicazioni enterprise, dati geografici
SQLite	Relazionale, embedded	App mobile, file locali
Microsoft SQL Server	Relazionale, commerciale	Aziende Microsoft-stack
LibreOffice Base	DBMS desktop con HSQLDB	Uso didattico, piccoli archivi
MongoDB	NoSQL documentale	Dati non strutturati, JSON

Funzioni principali del DBMS

1
DDL — Data Definition Language: permette di creare, modificare ed eliminare la struttura del database (tabelle, vincoli, indici).
2
DML — Data Manipulation Language: permette di inserire, aggiornare, eliminare e interrogare i dati (INSERT, UPDATE, DELETE, SELECT in SQL).
3
Controllo accessi: gestisce utenti e permessi, garantendo che ogni soggetto possa fare solo ciò che gli è autorizzato.
4
Gestione transazioni: raggruppa operazioni in unità atomiche (tutto o niente) per garantire la coerenza dei dati anche in caso di errori.
5
Recovery: ripristina il database a uno stato coerente in caso di guasto hardware o software.

Progettazione

Le tre fasi di progettazione

Progettare un database non significa aprire subito un programma e creare tabelle. Si seguono tre fasi distinte, ognuna con strumenti e obiettivi propri.

1
Progettazione concettuale — Cosa dobbiamo rappresentare?
Si analizzano i requisiti del sistema e si produce un diagramma E-R (Entità-Relazione). Non si pensa ancora a come il database sarà implementato: si modella la realtà. Strumenti: diagrammi E-R, dizionario dei dati.
2
Progettazione logica — Come organizziamo i dati?
Si traduce il diagramma E-R in un modello logico relazionale: tabelle, colonne, chiavi primarie e chiavi esterne. Si decide la struttura senza ancora preoccuparsi del DBMS specifico.
3
Progettazione fisica — Come implementiamo nel DBMS scelto?
Si crea effettivamente il database nel DBMS scelto, ottimizzando per le sue caratteristiche specifiche: indici, tipi di dato nativi, partizioni, procedure.

📌

In questo corso Ci concentriamo sulla fase 1 (E-R) e sulla fase 2 (modello logico relazionale). La fase 3 viene affrontata nelle guide su LibreOffice Base e SQL.

Diagramma E-R

Entità, Istanze, Attributi

Il diagramma Entità-Relazione (E-R) è il principale strumento della progettazione concettuale. Usa tre concetti fondamentali.

Concetto	Definizione	Simbolo E-R	Esempio
Entità	Una "cosa" del mondo reale su cui vogliamo conservare informazioni.	Rettangolo	CLIENTE, PRODOTTO, ORDINE
Istanza	Un singolo elemento concreto di un'entità.	—	Il cliente Mario Rossi; il prodotto "Tastiera USB"
Attributo	Una proprietà che descrive un'entità.	Ovale / ellisse	Cognome, Nome, Email (attributi di CLIENTE)

Tipi di attributo

Semplice

Valore atomico

Non scomponibile ulteriormente. Es: Cognome, Prezzo, DataNascita.

Composto

Più parti distinte

Scomponibile in attributi più semplici. Es: Indirizzo = Via + Città + CAP.

Monovalente

Un solo valore

Ogni istanza ha un solo valore per quell'attributo. Es: CodiceFiscale.

Multivalore

Più valori possibili

Un'istanza può avere più valori. Es: Telefono (fisso + mobile + lavoro).

Attributo chiave (identificatore)

Ogni entità deve avere almeno un attributo chiave (o identificatore): un attributo il cui valore identifica univocamente ogni istanza. Nel diagramma E-R è sottolineato. Nella tabella relazionale diventerà la chiave primaria (PK).

⚠️

Attenzione agli identificatori "naturali" Attributi come Cognome o Email sembrano buoni identificatori, ma possono cambiare o non essere unici. Il CodiceFiscale è un buon identificatore naturale per le persone. In molti casi conviene usare un ID numerico progressivo come identificatore artificiale.

Diagramma E-R

Simbologia E-R e Cardinalità

Oltre a entità e attributi, il diagramma E-R rappresenta le relazioni tra entità e la loro cardinalità — cioè quante istanze di un'entità possono essere associate a istanze dell'altra.

Simbolo	Significato
Rettangolo	Entità
Rombo	Relazione tra entità
Ovale / Ellisse	Attributo
Ovale doppio	Attributo multivalore
Ovale tratteggiato	Attributo derivato (calcolabile da altri)
Linea con 1	Partecipazione "uno" (al più una istanza)
Linea con N	Partecipazione "molti" (più istanze possibili)

I tre tipi di cardinalità

1:1
Uno a Uno — Un'istanza di A è associata ad al più un'istanza di B e viceversa.
Esempio: PERSONA — PASSAPORTO (una persona ha al più un passaporto; un passaporto appartiene a una sola persona).
1:N
Uno a Molti — Un'istanza di A è associata a più istanze di B; ogni istanza di B è associata a una sola istanza di A.
Esempio: CLIENTE — ORDINE (un cliente fa più ordini; ogni ordine appartiene a un solo cliente).
N:M
Molti a Molti — Un'istanza di A è associata a più istanze di B e viceversa.
Esempio: STUDENTE — CORSO (uno studente segue più corsi; ogni corso ha più studenti iscritti).

💡

Come leggere la cardinalità Per determinare il tipo di relazione, fai due domande: "Un A può essere associato a quanti B?" e "Un B può essere associato a quanti A?". Se la prima risposta è "uno" e la seconda è "molti", è una relazione 1:N.

Entità avanzate

Entità forti, deboli, ridondanze

Entità forte vs entità debole

Entità forte

Esiste autonomamente

Ha un proprio identificatore che non dipende da altre entità. Può esistere nel database indipendentemente. Es: CLIENTE, PRODOTTO.

Entità debole

Dipende da un'altra

Non ha un identificatore proprio sufficiente. La sua esistenza dipende da un'entità forte. Es: RIGA_ORDINE dipende da ORDINE.

Nel diagramma E-R, l'entità debole è rappresentata con un rettangolo doppio e la relazione con l'entità forte con un rombo doppio.

Ridondanze

Una ridondanza nel diagramma E-R è un'informazione che può essere derivata da altre informazioni già presenti nel modello. Va identificata ed eliminata (o giustificata) durante la progettazione.

⚠️

Esempio di ridondanza Se ho le entità ORDINE e RIGA_ORDINE, e ORDINE ha un attributo "TotaleOrdine", questo è ridondante: può essere calcolato sommando gli importi delle RIGA_ORDINE associate. Memorizzarlo porta a inconsistenze se le righe vengono modificate senza aggiornare il totale.

Fase 2 — Progettazione logica

Dal concettuale al logico

La progettazione logica traduce il diagramma E-R in un insieme di tabelle relazionali. Si seguono regole precise per ogni tipo di entità e relazione.

Regole di traduzione

1
Ogni entità diventa una tabella. Gli attributi dell'entità diventano le colonne. L'attributo chiave diventa la chiave primaria (PK).
2
Relazione 1:N → chiave esterna. La chiave primaria del lato "1" va inserita come colonna aggiuntiva (chiave esterna, FK) nella tabella del lato "N".
3
Relazione N:M → tabella associativa. Si crea una nuova tabella con le chiavi primarie di entrambe le entità. Queste due FK formano insieme la chiave primaria composta della tabella associativa.
4
Relazione 1:1 → fusione o FK. Si può unire le due entità in una sola tabella, oppure inserire la FK in una delle due (preferibilmente in quella con partecipazione obbligatoria).
5
Attributi multivalore → tabella separata. Un attributo multivalore (es. Telefono) diventa una tabella separata con FK verso l'entità originale.
6
Entità debole → FK obbligatoria. La tabella dell'entità debole include la PK dell'entità forte come FK (e spesso come parte della PK composta).

Esempio completo — Da E-R a tabelle relazionali

Partiamo da un semplice E-R: STUDENTE frequenta CORSO (relazione N:M).

STUDENTI

PK ID_Stud Intero

Cognome Testo

Nome Testo

DataNascita Data

N:M →
tabella
associativa

ISCRIZIONI

PK+FK FK_ID_Stud Intero

PK+FK FK_ID_Corso Intero

DataIscrizione Data

Voto Intero

← N:M

CORSI

PK ID_Corso Intero

Titolo Testo

CFU Intero

Docente Testo

🔗

Prossimi passi Una volta acquisito il modello logico, si passa alla fase fisica — la creazione reale delle tabelle in un DBMS come LibreOffice Base o MySQL — e all'interrogazione dei dati tramite SQL e le sue query. Consulta la Guida alle Query con LibreOffice Base per approfondire.