Advertisement

Analisi statistica multivariata di dati

  • Matteo Stocchero

Riassunto

Le tecniche sperimentali in uso nei moderni laboratori di biologia o chimica e le complesse simulazioni al calcolatore di sistemi biologici producono insiemi di dati che non possono essere studiati con le tecniche della statistica classica, ma richiedono opportune strategie di analisi. L’analisi statistica multivariata di dati (in inglese MultiVariate Statistical data Analysis o semplicemente MVA) è in grado di fornire questi strumenti rendendo possibile la costruzione di modelli interpretativi capaci di estrarre l’informazione contenuta in complesse strutture di dati. Possono essere messe in evidenza le relazioni nascoste tra le variabili, riconosciuti particolari andamenti nelle serie di osservazioni, caratterizzate le proprietà di un sistema rispetto a un controllo, distinti fra loro il rumore e l’informazione strutturata, ridotte le dimensioni del problema al fine di renderlo adatto a uno studio con altre tecniche di analisi, ad esempio quelle classiche. Per questi motivi molte tecniche dell’analisi statistica multivariata, quali ad esempio quelle che saranno presentate in questo capitolo, fanno parte di quello che più in generale si dice processo di data mining che si propone come obiettivo l’estrazione dell’informazione nascosta in complesse strutture di dati. I modelli costruiti possono avere anche un forte carattere predittivo ed essere usati per studiare il comportamento di nuovi sistemi. L’analisi dei dati può inoltre essere usata per confermare ipotesi di lavoro oppure per generare nuove ipotesi da validare con nuovi esperimenti.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Letture consigliate

  1. Eriksson L, Johansson E, Kettaneh-Wold N, Trygg J, Wikström C, Wold S (2006) Multi-and Megavariate Data Analysis, Basic principles and applications. Umetrics AB, Umeå, SwedenGoogle Scholar
  2. Härdler W, Simar L (2007) Applied Multivariate Statistical Analysis. Springer, Berlin, Germany Höskuldsson A (1988) PLS regression methods. J Chemom 2:211–228.Google Scholar
  3. Jackson JE (1991) A User’s Guide to Principal Components. John Wiley, New YorkCrossRefGoogle Scholar
  4. Krzanowski WJ (1987) Cross-Validation in Principal Component Analysis. Biometrics 43:575–584CrossRefGoogle Scholar
  5. Lindon JC, Holmes E, Nicholson JK (2001) Pattern recognition methods and applications in biomedical magnetic resonance. Prog Nucl Mag Res Sp 39:1–40CrossRefGoogle Scholar
  6. Wiklund S, Johansson E, Sjöström L et al (2008) Visualization of GC/TOF-MS based metabolomics data for identification of biochemically interesting compounds using OPLS class models. Anal Chem 80:115–122PubMedCrossRefGoogle Scholar
  7. Wold S, Sjöström M, Eriksson L (2001) PLS-regression: a basic tool of chemometrics. Chem. Intell Lab Syst 58:109–130CrossRefGoogle Scholar
  8. Wold S, Trygg J, Berglund A, Antti H (2001) Some recent development in PLS modeling. Chem Intell Lab Syst 58:131–150CrossRefGoogle Scholar

Copyright information

© Springer-Verlag Italia 2012

Authors and Affiliations

  • Matteo Stocchero
    • 1
  1. 1.S-IN Soluzioni InformaticheVicenzaItalia

Personalised recommendations