Algoritmo Microsoft Linear Regression

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

L'algoritmo Microsoft Linear Regression è una variante dell'algoritmo Microsoft Decision Trees che consente di calcolare una relazione lineare tra una variabile dipendente e indipendente e quindi usare tale relazione per la stima.

La relazione assume la forma di un'equazione relativa alla linea che rappresenta meglio una serie di dati. Ad esempio, la linea contenuta nel diagramma seguente è la migliore rappresentazione lineare possibile dei dati.

Linea che modella un set di dati

A ogni punto dati del diagramma corrisponde un errore associato alla relativa distanza dalla retta di regressione. I coefficienti a e b dell'equazione di regressione regolano l'angolo e la posizione della retta di regressione. È possibile ottenere l'equazione di regressione modificando i coefficienti a e b fino a quando la somma degli errori associati a tutti i punti raggiunge il minimo.

Sono disponibili altri tipi di regressione che utilizzano più variabili, nonché metodi di regressione non lineari, tuttavia la regressione lineare è un metodo utile e noto per la modellazione della risposta a una modifica in alcuni fattori sottostanti.

Esempio

Tale tipo di regressione consente di determinare una relazione tra due colonne continue. È possibile ad esempio utilizzare la regressione lineare per calcolare una linea di tendenza da dati di produzione o di vendita. La regressione lineare può inoltre essere utilizzata come precursore dello sviluppo di modelli di data mining più complessi, per valutare le relazioni tra colonne di dati.

Anche se esistono molti modi per calcolare la regressione lineare che non richiedono strumenti di data mining, il vantaggio dell'uso dell'algoritmo Microsoft Linear Regression per questa attività è che tutte le possibili relazioni tra le variabili vengono calcolate e testate automaticamente. Non è necessario selezionare un metodo di calcolo, ad esempio la risoluzione per i minimi quadrati. La regressione lineare potrebbe tuttavia semplificare eccessivamente le relazioni in scenari in cui sul risultato influiscono più fattori.

Funzionamento dell'algoritmo

L'algoritmo Microsoft Linear Regression è una variante dell'algoritmo Microsoft Decision Trees. Quando si seleziona l'algoritmo Microsoft Linear Regression, viene richiamato un caso speciale dell'algoritmo Microsoft Decision Trees, con parametri che vincolano il comportamento dell'algoritmo e richiedono determinati tipi di dati di input. In un modello di regressione lineare, inoltre, per calcolare le relazioni nella sessione iniziale viene utilizzato tutto il set di dati, mentre con un modello di albero delle decisioni standard i dati vengono suddivisi ripetutamente in subset o alberi minori.

Dati necessari per i modelli di regressione lineare

Per preparare i dati da utilizzare in un modello di regressione lineare è necessario comprendere i requisiti dell'algoritmo, tra cui la quantità di dati necessaria e la modalità di utilizzo dei dati. I requisiti di questo tipo di modello sono i seguenti:

  • Una colonna a chiave singola Ogni modello deve contenere una colonna numerica o di testo che identifichi in modo univoco ogni record. Le chiavi composte non sono consentite.

  • Una colonna stimabile Richiede almeno una colonna stimabile. È possibile includere più attributi stimabili in un modello, ma tali attributi devono essere tipi di dati numerici continui. Non è possibile utilizzare un tipo di dati datetime come attributo stimabile anche se l'archiviazione nativa dei dati è numerica.

  • Colonne di input Le colonne di input devono contenere dati numerici continui ed essere associate al tipo di dati appropriato.

Per altre informazioni, vedere la sezione Requisiti in Riferimento tecnico per l'algoritmo Microsoft Linear Regression.

Visualizzazione di un modello di regressione lineare

Per esplorare il modello, è possibile usare il Visualizzatore Microsoft Decision Trees. La struttura ad albero per un modello di regressione lineare è molto semplice, in quanto tutte le informazioni sull'equazione di regressione sono contenute in un solo nodo. Per altre informazioni, vedere Visualizzare un modello usando il Visualizzatore Microsoft Decision Trees.

Per ulteriori dettagli sull'equazione, è anche possibile visualizzare i coefficienti e altri dettagli tramite Microsoft Generic Content Tree Viewer.

Per un modello di regressione lineare, il contenuto del modello include metadati, la formula di regressione e statistiche sulla distribuzione dei valori di input. Per altre informazioni, vedere Contenuto del modello di data mining per modelli di regressione lineare (Analysis Services - Data mining) .

Creazione di stime

Dopo l'elaborazione del modello, i risultati vengono archiviati come set di statistiche con la formula di regressione lineare che è possibile utilizzare per calcolare tendenze future. Per esempi di query da usare con un modello di regressione lineare, vedere Esempi di query sul modello di regressione lineare.

Per informazioni generali sulla creazione di query in base ai modelli di data mining, vedere Query di data mining.

Oltre a creare un modello di regressione lineare selezionando l'algoritmo Microsoft Linear Regression, se l'attributo stimabile è un tipo di dati numerico continuo, è possibile creare un modello di albero delle decisioni contenente regressioni. In questo caso, l'algoritmo suddividerà i dati quando rileverà punti di separazione appropriati, ma per alcune aree di dati creerà una formula di regressione. Per altre informazioni sugli alberi di regressione all'interno di un modello di albero delle decisioni, vedere Contenuto del modello di data mining per i modelli di albero delle decisioni (Analysis Services - Data mining).For more information about regression trees within a decision trees model, see Mining Model Content for Decision Tree Models (Analysis Services - Data mining).

Commenti

  • Non supporta l'utilizzo del linguaggio PMML (Predictive Model Markup Language) per la creazione di modelli di data mining.

  • Non supporta la creazione di dimensioni di data mining.

  • Supporta il drill-through.

  • Supporta l'utilizzo di modelli di data mining OLAP.

Vedere anche

Algoritmi di data mining (Analysis Services - Data mining)
Riferimento tecnico per l'algoritmo Microsoft Linear Regression
Esempi di query sul modello di regressione lineare
Contenuto dei modelli di data mining per i modelli di regressione lineare (Analysis Services - Data mining)