Top 10 Statistical Tools Used in Medical Research

0

Kolabtree statisticien indépendant Kingsley Ukwuoma writes about the top statistical tools used in medical recherche et clinique analyse des données

Il fut un temps où la validation des expériences par les données se faisait entièrement par calcul manuel. Cela ouvrait la voie à l'erreur humaine et augmentait le coût de la recherche, surtout lorsque les données étaient volumineuses, par exemple plus de 1000 observations sur le terrain. Aujourd'hui, grâce à l'avancée progressive de la technologie, les outils statistiques sont utilisés dans la recherche médicale pour plus d'efficacité et de précision.

In the medical research field, stretching from systematic reviews, meta-analysis and les essais cliniques, exactness and precision is paramount. Validation parameters must be more stringent. In testing research hypothesis, the assumption is based on 100% correctness. However, since data in itself is never normally distributed or perfect, it becomes important to apportion a percentage of 0.01 (1%) as the level of significance or margin of error or probability that the result will produce an error, though slight but gets better as the benchmark approaches 100%, in other words, 0.001 (0.1%) or 0.0001 (0.01%).

Les données en elles-mêmes, composées d'un mélange de chiffres, de chaînes de caractères et de points alphanumériques, peuvent sembler intimidantes, mais l'analyse des données ne doit pas être toujours complexe. Le processus peut être décomposé en trois étapes claires :

-Comprendre l'origine des données, à travers les objectifs de la recherche.
-Que faire des données (choix du test d'estimation) ?
-Comment donner du sens aux données (interprétation des résultats) ?

Il existe un vaste univers d'outils statistiques utilisés dans la recherche médicale. Ces outils accomplissent le travail de manière similaire, mais les différences résident dans la facilité d'utilisation et de présentation ainsi que dans les différences de licence (propriétaire ou non), d'interface (pointer et cliquer ou ligne de commande) et de coût (gratuit ou payant). Ces outils gèrent les processus de bout en bout de la collecte, de l'organisation, de l'analyse et de l'interprétation des données statistiques. Examinons les 10 principaux outils statistiques utilisés dans la recherche médicale par les scientifiques, les médecins et les professionnels de la R&D de l'industrie.

1. Stata

Stata is a complete toolbox that provides a data management capability, data analysis and a colorful graphical interface. Stata can be termed as the policy statistical software common to institutions, including international organizations like the United Nations, governments and academicians for Santé publique, Économie, Social Work and Medicine. It remains the most powerful software available in the analytics space. The name Stata is a syllabic abbreviation of the words statistiques and data and was released in 1985 and then the graphical user interface option in 2003.

Les caractéristiques de Stata comprennent une interface utilisateur graphique (GUI) ou simplement une interface de type pointer-cliquer accompagnée d'une option d'interface de ligne de commande (CLI) qui est rapide, authentique et facile à utiliser. STATA est compatible avec Excel (.xls, .xlsx), des fichiers texte (.txt, .csv, .dat), SAS (.XPT) et autres (.XML).

Il existe de nombreuses fonctionnalités statistiques, allant de l'analyse descriptive, de l'analyse par tableaux croisés à des techniques plus avancées comme la modélisation par équations structurelles, les modèles de probabilité, l'analyse de survie, les séries chronologiques et les modèles multiniveaux. Stata permet aux utilisateurs d'avoir le contrôle sur les données, les variables et aussi la compilation statistique des groupes. Stata fonctionne bien avec les données longitudinales mais ne peut contenir qu'un seul jeu de données en mémoire qui doit être réécrit pour ajouter ou accéder à un nouveau jeu de données. Les graphiques de Stata ne sont pas très flexibles par rapport à d'autres logiciels et les différents paquets limitent la taille des ensembles de données utilisables (Stata/IC, Stata/SE et Stata/MP).

2. R

R est un outil logiciel statistique à source ouverte that is well equipped to handle, visualization, analysis and aspects of apprentissage machine ‘heavy computing’ and it’s strictly a programming ‘command line interface (CLI) software tool though relatively new in the user space, R now commands a strong fan base, boasting over 6000 packages, contributed by data scientists, bioinformatics and medical researchers, covering an expanse of disciplines from cancer research, clinical analysis, biologie moléculaire, phylogeny, to meta-analysis.

L'environnement de développement intégré (IDE) R-studio, qui abrite les outils R, fonctionne comme le moteur de base de données d'Oracle où l'on utilise SQL. La version précédente a été lancée en 1993 et l'IDE est sorti en 2011. R est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .dat, .csv), SPSS (.sav), Stata (.dta), SAS (. sas7bdat), autres (. xml, json). R interagit bien avec les autres logiciels, avec une courbe d'apprentissage assez raide, étant donné les différents types de données.

Plus précisément, Metafor est l'un des nombreux paquets R disponibles pour réaliser des méta-analyses et contient les outils d'analyse les plus complets. Son site Web contient des exemples très utiles d'analyses et de graphiques avec le code correspondant. Cependant, comme le paquetage nécessite l'utilisation de l'environnement R, il peut être difficile pour ceux qui n'ont jamais utilisé R auparavant de s'y habituer rapidement. Les exemples suivants méritent d'être mentionnés JASP ou Jamovi paquets.

3. GraphPad Prism

GraphPad Prism est populaire parmi les biologistes du monde universitaire et de l'industrie. Il est également doté de fonctionnalités qui permettent aux chercheurs d'effectuer des recherches en laboratoire et des essais cliniques à l'aide du test t, de l'ANOVA à sens unique, du tableau de contingence, de l'analyse de survie et de modèles de probabilité comme le modèle de régression logistique.

Le logiciel, contrairement à tout autre, est accompagné d'une page d'analyse des résultats interprétée après la production des estimations. Le langage est facile à comprendre, avec moins de technicité. Le logiciel dispose également d'une fonction automatisée intégrée qui combine l'analyse et la sortie graphique en un seul instantané - ce qui ajoute au comportement permanent de la réanalyse automatique des données dans les cas où l'un des points de données est modifié, le tout en cours d'exécution sans qu'il soit nécessaire de refaire l'analyse ou le graphique.

L'outil logiciel est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .dat, .csv), et autres (. xml, json). Les fonctionnalités graphiques sont exceptionnelles.

Lisez aussi : Comment les statisticiens indépendants peuvent améliorer la recherche

4. SAS

SAS est le fondement de l'analyse avancée, dont les fonctionnalités touchent un large éventail d'entreprises et d'organisations scientifiques et techniques. Le développement de SAS (Statistical Analysis System) a commencé en 1966 par Anthony Bar de l'Université d'État de Caroline du Nord, rejoint ensuite par James Goodnight. Le National Institute of Health a financé ce projet dans le but d'analyser les données agricoles pour améliorer le rendement des cultures.

SAS est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans recourir à des processus manuels susceptibles d'entraîner des erreurs. SAS est également doté d'une bonne interface graphique interactive. Cependant, SAS peut parfois s'avérer fastidieux pour créer des graphiques parfaits avec la syntaxe.

LIRE AUSSI  Comment un statisticien médical indépendant peut-il aider à analyser les données sur les soins de santé ?

Some of the down features or benefits of SAS is linked to its size and proprietary license ownership. Key among this, is the time to implementation of new ideas and methods and the technicalities in the documentation process. SAS has gained popularity among Financial Services, Government, Manufacturing and Health and Sciences de la vie.

5. IBM SPSS

La version initiale de SPSS a été développée en 1968 jusqu'à son acquisition par IBM en 2009. IBM SPSS est assez complet et sert d'outil de référence pour presque toutes les disciplines et tous les professionnels. Le logiciel est doté de capacités approfondies et d'une interface utilisateur graphique facile à utiliser. Cependant, le logiciel fonctionne mieux pour les chercheurs qui ont une connaissance de base des statistiques, plus particulièrement des éléments de données comme les mesures de données, l'identification des types de données, l'affectation et le codage des variables et la sélection des cas.

IBM SPSS est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.csv, .txt, .dat), SAS (. sas7bdat) et Stata (.dta). Il est doté d'une fonctionnalité remarquable, le 'Chart Builder', qui permet aux utilisateurs de glisser-déposer des graphiques et de les modifier. Outre sa facilité d'utilisation et sa capacité à traiter automatiquement les points de données manquants, SPSS Amos permet aux utilisateurs de réaliser des modèles d'équations structurelles.

Cependant, certaines méthodes statistiques robustes et complexes ne peuvent pas être estimées, par exemple, la régression de la moindre déviation absolue et la régression quantile.

6. MATLAB

MATLAB (The Mathworks) was released in 1984. MATLAB is a complete command line interface (CLI) or programming language used by scientist and engineers. As with R, the learning path is steep, and you will be required to create your own code at some point. A plentiful number of toolboxes are also available to help answer your research questions (such as EEGLab for analysing EEG data). The difficult to use feature is complemented by a vast array of statistical methods and flexibility in terms of what the software can handle. MATLAB gained popularity among scientist in the areas of engineering, numerical analysis, linear algebra and image processing.

MATLAB is compatible with Excel files (.xls, .xlsx), Text files (.txt, .dat, .csv), Other (. xml, json). MATLAB has a good graphic and integrates easily with high-end programming software like Python and C++ but does not boast the huge statistical methods that is available for SAS and IBM SPSS.

Il existe également une liste d'outils logiciels statistiques impopulaires qui se distinguent par leur facilité d'utilisation, avec des fonctions efficaces de type "pointer-cliquer".

7. JMP

JMP combines powerful statistics with dynamic graphics, in memory and on the desktop. Its interactive and visual paradigm enables JMP to reveal insights that are impossible to gain from raw tables of numbers or static graphs. Originally stood for ‘John’s Macintosh Program’ with five bespoke products: JMP, JMP Pro, JMP Clinical, JMP Génomique and JMP Graph Builder App.

JMP est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.csv, .txt, .dat), SAS (. sas7bdat), Stata (.dta), SPSS (.sav). JMP est doté d'un graphique interactif, de tableaux de données liés dynamiquement et d'un langage de script, ainsi que d'une interface permettant l'utilisation de compléments R et Excel. Les utilisateurs bénéficient également d'une gestion efficace des résultats. Comme dans IBM SPSS, certaines méthodes robustes essentielles : régression, moindres carrés à deux étapes (2SLS), LAD, quantile sont absentes.

8. Minitab

Minitab offre une gamme d'outils statistiques de base et assez avancés pour l'analyse des données et a été développé en 1972 à partir d'OMNITAB 80 qui est une version légère. Comme pour GraphPad Prism, les commandes peuvent être exécutées à la fois par l'interface graphique et par des scripts, ce qui le rend accessible aux novices comme aux utilisateurs cherchant à effectuer des analyses plus complexes.

Le logiciel est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans recourir à des processus manuels susceptibles d'entraîner des erreurs. Minitab automatise les calculs et permet la création efficace de graphiques.

9. Statistica

Statistica is a suite of analytical software tool originally developed by StatSoft and acquired by Dell in 2014 and TIBCO entering agreement to buy in 2017. Statistica is great with data management, analysis, visualization, data mining and machine learning.

SAS est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans avoir recours à des processus manuels qui peuvent conduire à des erreurs. Statistica permet l'intégration de l'environnement de programmation R où des techniques analytiques supplémentaires sont disponibles.

10. Excel

Microsoft Office Excel a été développé à l'origine pour la gestion des données. Sans qu'il soit nécessaire de le présenter, Microsoft Corp Excel est largement utilisé pour l'analyse statistique, conformément à l'ensemble de données utilisé pour cette étude. Le programme a une portée plus large et la connaissance de l'utilisation est assez répandue que la quantité d'inconnu est très faible sur la façon d'utiliser et donc la facilité d'utilisation atteint le plus haut niveau parmi les logiciels examinés.

Excel dispose également d'un module complémentaire appelé Meta-Essentials, MetaXL et MetaEasy qui ajoute la possibilité d'effectuer des statistiques méta-analytiques avec Excel comme base.

There are several factors that affect the outcome of analysis, including sample size, data collection methods, choice of test used, methodology, and more. Statistical analysis needs to be carefully done by experts to obtain reliable results. Hiring an experienced statisticien médical indépendant ou consultant en biostatistique peut vous aider à gagner du temps et de l'énergie, tout en vous concentrant sur vos recherches. La vérification de vos données de recherche avant leur publication est également essentielle pour que vous puissiez communiquer votre recherche au monde entier en toute confiance. Kolabtree offre un accès à des statisticiens indépendants expérimentés dans différents logiciels et outils. Voir les experts maintenant ou simplement publier un projet et obtenir des devis en 24 heures.

 


Kolabtree helps businesses worldwide hire freelance scientists and industry experts on demand. Our freelancers have helped companies publish research papers, develop products, analyze data, and more. It only takes a minute to tell us what you need done and get quotes from experts for free.


Unlock Corporate Benefits

• Secure Payment Assistance
• Onboarding Support
• Dedicated Account Manager

Sign up with your professional email to avail special advances offered against purchase orders, seamless multi-channel payments, and extended support for agreements.


Partager.

À propos de l'auteur

Ramya Sriram gère le contenu numérique et la communication chez Kolabtree (kolabtree.com), la plus grande plateforme de freelancing pour scientifiques au monde. Elle a plus de dix ans d'expérience dans l'édition, la publicité et la création de contenu numérique.

Laissez une réponse