Kolabtree statistico freelance Kingsley Ukwuoma writes about the top statistical tools used in medical ricerca e clinica analisi dei dati.
C'è stato un tempo in cui la convalida degli esperimenti attraverso i dati veniva fatta completamente utilizzando il calcolo manuale. Questo apriva dei varchi per l'errore umano e per un maggior costo di realizzazione della ricerca soprattutto quando i dati erano grandi, per esempio, più di 1000 osservazioni sul campo. Oggi, a causa del graduale avanzamento della tecnologia, gli strumenti statistici vengono utilizzati nella ricerca medica per una maggiore efficienza e precisione.
In the medical research field, stretching from systematic reviews, meta-analysis and studi clinici, exactness and precision is paramount. Validation parameters must be more stringent. In testing research hypothesis, the assumption is based on 100% correctness. However, since data in itself is never normally distributed or perfect, it becomes important to apportion a percentage of 0.01 (1%) as the level of significance or margin of error or probability that the result will produce an error, though slight but gets better as the benchmark approaches 100%, in other words, 0.001 (0.1%) or 0.0001 (0.01%).
I dati di per sé consistenti in una miscela di punti numerici, stringhe e alfa numerici possono sembrare intimidatori, ma l'analisi dei dati non deve essere sempre complessa. Il processo può essere suddiviso in 3 fasi chiare:
-Comprendere l'origine dei dati, attraverso gli obiettivi della ricerca
-Cosa fare con i dati (scelta del test di stima)
-Come dare un senso ai dati (interpretazione dei risultati)
Esiste un vasto universo di strumenti statistici utilizzati nella ricerca medica. Questi strumenti fanno il lavoro in modi simili, ma le differenze risiedono nella facilità d'uso e nella presentazione, come le differenze nella licenza (proprietaria o no), nell'interfaccia (punta e clicca o linea di comando) e nel costo (gratuito o a pagamento). Questi strumenti gestiscono i processi end-to-end di raccolta, organizzazione, analisi e interpretazione dei dati statistici. Diamo un'occhiata ai 10 principali strumenti statistici utilizzati nella ricerca medica da scienziati, medici e professionisti di R&S dell'industria.
1. Stata
Stata is a complete toolbox that provides a data management capability, data analysis and a colorful graphical interface. Stata can be termed as the policy statistical software common to institutions, including international organizations like the United Nations, governments and academicians for Salute pubblica, Economia, Social Work and Medicine. It remains the most powerful software available in the analytics space. The name Stata is a syllabic abbreviation of the words statistiche and data and was released in 1985 and then the graphical user interface option in 2003.
Le caratteristiche di Stata includono l'interfaccia grafica (GUI) o semplicemente l'interfaccia point-and-click, accompagnata da un'opzione per l'interfaccia a riga di comando (CLI) che è rapida, autentica e facile da usare. STATA è compatibile con Excel (.xls, .xlsx), file di testo (.txt, .csv, .dat), SAS (.XPT) e Altro (.XML).
Ci sono un sacco di funzioni statistiche, che vanno dall'analisi descrittiva, analisi di tabulazione incrociata a tecniche più avanzate come la modellazione di equazioni strutturali, modelli di probabilità, analisi di sopravvivenza, serie temporali e modelli multilivello. Stata permette agli utenti di avere il controllo sui dati, sulle variabili e anche sulla compilazione statistica dei gruppi. Stata funziona bene con i dati longitudinali ma può contenere solo un set di dati in memoria che deve essere riscritto per aggiungere o accedere a un nuovo set di dati. I grafici di Stata non sono molto flessibili se paragonati ad altri software e i diversi pacchetti limitano le dimensioni dei set di dati utilizzabili (Stata/IC, Stata/SE, e Stata/MP).
2. R
R è un strumento software statistico open source that is well equipped to handle, visualization, analysis and aspects of apprendimento automatico ‘heavy computing’ and it’s strictly a programming ‘command line interface (CLI) software tool though relatively new in the user space, R now commands a strong fan base, boasting over 6000 packages, contributed by data scientists, bioinformatics and medical researchers, covering an expanse of disciplines from cancer research, clinical analysis, biologia molecolare, phylogeny, to meta-analysis.
L'ambiente di sviluppo integrato (IDE) R-studio, che ospita gli strumenti R, funziona come l'Oracle Data Base Engine dove si usa SQL. La versione precedente è stata lanciata nel 1993 e l'IDE rilasciato nel 2011. R è compatibile con file Excel (.xls, .xlsx), file di testo (.txt, .dat, .csv), SPSS (.sav), Stata (.dta), SAS (. sas7bdat), Altro (. xml, json). R interagisce bene con altri software con una curva di apprendimento piuttosto ripida, dati i diversi tipi di dati.
In particolare, Metafor è uno dei molti pacchetti R disponibili per condurre meta-analisi e contiene gli strumenti di analisi più completi. Il loro sito web contiene alcune analisi molto utili ed esempi di trame con il codice corrispondente. Tuttavia, poiché il pacchetto richiede l'uso dell'ambiente R, può essere difficile per coloro che non hanno mai usato R prima abituarsi al pacchetto così rapidamente. Degni di menzione sono il JASP o Jamovi pacchetti.
3. GraphPad Prism
GraphPad Prism è popolare tra i biologi nel mondo accademico e industriale. Viene anche fornito con funzionalità che permettono ai ricercatori di eseguire ricerche di laboratorio e test clinici utilizzando il t-test, ANOVA a senso unico, tabella di contingenza, analisi di sopravvivenza e modelli di probabilità come il modello di regressione logistica.
Il software, a differenza di qualsiasi altro, viene fornito con una pagina di analisi dei risultati interpretata dopo che le stime sono state prodotte. Il linguaggio è facile da capire con meno tecnicismi. Il software ha anche una funzione automatica incorporata che combina l'analisi e l'output grafico in un'istantanea - che si aggiunge al comportamento divertente di ri-analisi automatica dei dati nei casi in cui uno qualsiasi dei punti di dati viene alterato, il tutto in runtime senza alcuna necessità di rifare l'analisi eseguita o il grafico disegnato.
Lo strumento software è compatibile con file Excel (.xls, .xlsx), file di testo (.txt, .dat, .csv), e altro (.xml, json). Le caratteristiche dei grafici sono eccezionali.
Leggi anche: Come gli statistici freelance possono migliorare la ricerca
4. SAS
SAS è il fondamento dell'analitica avanzata con funzionalità che tagliano attraverso una gamma diversificata di imprese e organizzazioni scientifiche e ingegneristiche. Lo sviluppo di SAS (Statistical Analysis System) è iniziato nel 1966 da Anthony Bar della North Carolina State University e successivamente affiancato da James Goodnight. Il National Institute of Health ha finanziato questo progetto con l'obiettivo di analizzare i dati agricoli per migliorare la resa dei raccolti.
SAS è compatibile con file Excel (.xls), file ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e altre estensioni di file (.xml). Questo permette di importare ed esportare dati con facilità senza ricorrere a processi manuali che possono portare ad errori. SAS è anche dotato di una buona interfaccia grafica interattiva. Tuttavia, SAS può essere macchinoso a volte per creare grafici perfetti con la sintassi.
Some of the down features or benefits of SAS is linked to its size and proprietary license ownership. Key among this, is the time to implementation of new ideas and methods and the technicalities in the documentation process. SAS has gained popularity among Financial Services, Government, Manufacturing and Health and Scienze della vita.
5. IBM SPSS
La versione iniziale di SPSS è stata sviluppata nel 1968 fino all'acquisizione di IBM nel 2009. IBM SPSS è abbastanza completo e serve come strumento per quasi tutte le discipline e i professionisti. Il software ha una profondità di capacità con una funzione di interfaccia grafica facile da usare. Tuttavia, il software funziona meglio per i ricercatori che hanno una conoscenza di base della statistica, in particolare degli elementi di dati come la misurazione dei dati, l'identificazione dei tipi di dati, l'assegnazione e la codifica delle variabili e la selezione dei casi.
IBM SPSS è compatibile con i file Excel (.xls, .xlsx), file di testo (.csv, .txt, .dat), SAS (. sas7bdat) e Stata (.dta). è dotato di una caratteristica sorprendente in 'Chart Builder' che permette agli utenti di trascinare e rilasciare i grafici e fare modifiche. A parte la facilità d'uso e la capacità di gestire automaticamente i dati mancanti, gli utenti possono eseguire modelli di equazione strutturale attraverso SPSS Amos.
Tuttavia, alcuni metodi statistici robusti e complessi non possono essere stimati, per esempio, la Regressione della deviazione assoluta minima e la Regressione Quantile.
6. MATLAB
MATLAB (The Mathworks) was released in 1984. MATLAB is a complete command line interface (CLI) or programming language used by scientist and engineers. As with R, the learning path is steep, and you will be required to create your own code at some point. A plentiful number of toolboxes are also available to help answer your research questions (such as EEGLab for analysing EEG data). The difficult to use feature is complemented by a vast array of statistical methods and flexibility in terms of what the software can handle. MATLAB gained popularity among scientist in the areas of engineering, numerical analysis, linear algebra and image processing.
MATLAB is compatible with Excel files (.xls, .xlsx), Text files (.txt, .dat, .csv), Other (. xml, json). MATLAB has a good graphic and integrates easily with high-end programming software like Pitone and C++ but does not boast the huge statistical methods that is available for SAS and IBM SPSS.
Inoltre, c'è una lista di strumenti software statistici impopolari là fuori che si comportano bene in termini di facilità d'uso, con efficaci funzioni point and click.
7. JMP
JMP combines powerful statistics with dynamic graphics, in memory and on the desktop. Its interactive and visual paradigm enables JMP to reveal insights that are impossible to gain from raw tables of numbers or static graphs. Originally stood for ‘John’s Macintosh Program’ with five bespoke products: JMP, JMP Pro, JMP Clinical, JMP Genomica and JMP Graph Builder App.
JMP è compatibile con file Excel (.xls, .xlsx), file di testo (.csv, .txt, .dat), SAS (.sas7bdat), Stata (.dta), SPSS (.sav). JMP viene fornito con una grafica interattiva, tabelle di dati collegati dinamicamente e un linguaggio di scripting e ha anche un'interfaccia che permette l'uso di add-in per R ed Excel. Simile a IBM SPSS, alcuni metodi robusti essenziali: regressione; 2SLS (two-stage least squares), LAD, Quantile sono assenti.
8. Minitab
Minitab offre una gamma di strumenti statistici sia di base che abbastanza avanzati per l'analisi dei dati ed è stato sviluppato nel 1972 da OMNITAB 80 che è una versione leggera. Simile a GraphPad Prism, i comandi possono essere eseguiti sia attraverso la GUI che attraverso comandi scriptati, rendendolo accessibile ai novizi così come agli utenti che cercano di effettuare analisi più complesse.
Il software è compatibile con file Excel (.xls), file ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e altre estensioni di file (.xml). Questo permette di importare ed esportare i dati con facilità senza ricorrere a processi manuali che possono portare ad errori. Minitab automatizza i calcoli e permette la creazione efficiente di grafici.
9. Statistica
Statistica is a suite of analytical software tool originally developed by StatSoft and acquired by Dell in 2014 and TIBCO entering agreement to buy in 2017. Statistica is great with data management, analysis, visualization, data mining and machine learning.
SAS è compatibile con file Excel (.xls), file ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e altre estensioni di file (.xml). Questo permette di importare ed esportare i dati con facilità senza ricorrere a processi manuali che possono portare ad errori. Statistica permette l'integrazione dell'ambiente di programmazione R dove sono disponibili ulteriori tecniche analitiche.
10. Excel
Microsoft Office Excel è originariamente sviluppato per gestire la gestione dei dati Senza alcun bisogno di presentazioni, Microsoft Corp Excel è ampiamente utilizzato nell'analisi statistica per il set di dati presi per questa recensione. Il programma ha una portata più ampia e la conoscenza dell'uso è abbastanza diffusa che la quantità di sconosciuti è molto minore riguardo al modo d'uso e quindi la facilità d'uso raggiunge il massimo tra i software esaminati.
Excel ha anche un add-in chiamato Meta-Essentials, MetaXL e MetaEasy che aggiunge la possibilità di eseguire statistiche meta-analitiche con Excel come base.
There are several factors that affect the outcome of analysis, including sample size, data collection methods, choice of test used, methodology, and more. Statistical analysis needs to be carefully done by experts to obtain reliable results. Hiring an experienced statistico medico freelance o consulente di biostatistica può aiutarti a risparmiare tempo ed energia, mentre ti concentri sulla tua ricerca. Far verificare i dati della tua ricerca prima della pubblicazione è anche essenziale per poter comunicare la tua ricerca al mondo con fiducia. Kolabtree offre accesso a statistici freelance esperti in diversi software e strumenti. Vedi gli esperti ora o semplicemente pubblicare un progetto e ottenere preventivi in 24 ore.