Kolabtree estatístico freelance Kingsley Ukwuoma writes about the top statistical tools used in medical pesquisa and clinical análise de dados.
Houve um tempo em que a validação de experimentos através de dados era feita totalmente por meio de computação manual. Isto abriu lacunas para erros humanos e maior custo de realizar pesquisas, especialmente quando os dados eram grandes, por exemplo, mais de 1000 observações de campo. Hoje, devido ao avanço gradual da tecnologia, ferramentas estatísticas estão sendo utilizadas na pesquisa médica para maior eficiência e precisão.
In the medical research field, stretching from systematic reviews, meta-analysis and ensaios clínicos, exactness and precision is paramount. Validation parameters must be more stringent. In testing research hypothesis, the assumption is based on 100% correctness. However, since data in itself is never normally distributed or perfect, it becomes important to apportion a percentage of 0.01 (1%) as the level of significance or margin of error or probability that the result will produce an error, though slight but gets better as the benchmark approaches 100%, in other words, 0.001 (0.1%) or 0.0001 (0.01%).
Os dados em si mesmos, que consistem de uma mistura de pontos numéricos, de cadeia e numéricos alfa, podem parecer intimidadores, mas a análise dos dados não precisa ser sempre complexa. O processo pode ser decomposto em 3 passos claros:
-Entender a origem dos dados, por meio dos objetivos da pesquisa
-O que fazer com os dados (escolha do teste de estimativa)
-Como fazer sentido a partir dos dados (interpretação dos resultados)
Há um vasto universo de ferramentas estatísticas utilizadas na pesquisa médica. Essas ferramentas fazem o trabalho de maneira semelhante, mas as diferenças estão na facilidade de uso e apresentação como diferenças no licenciamento (proprietário ou não), interface (apontar e clicar ou linha de comando) e custo (gratuito ou pago). Estas ferramentas tratam dos processos ponta a ponta de coleta, organização, análise e interpretação de dados estatísticos. Vejamos as 10 principais ferramentas estatísticas utilizadas em pesquisa médica por cientistas, médicos e profissionais de P&D da indústria.
1. Stata
Stata is a complete toolbox that provides a data management capability, data analysis and a colorful graphical interface. Stata can be termed as the policy statistical software common to institutions, including international organizations like the United Nations, governments and academicians for Saúde pública, Economia, Social Work and Medicine. It remains the most powerful software available in the analytics space. The name Stata is a syllabic abbreviation of the words estatísticas and data and was released in 1985 and then the graphical user interface option in 2003.
As características Stata incluem, interface gráfica do usuário (GUI) ou simplesmente, interface ponto-e-clique acompanhada de uma opção de interface de linha de comando (CLI) que é rápida, autêntica e fácil de usar. A STATA é compatível com Excel arquivos (.xls, .xlsx), arquivos de texto (.txt, .csv, .dat), SAS (.XPT) e Outros (.XML).
Há muitas características estatísticas, que vão desde a análise descritiva, análise de tabulação cruzada até técnicas mais avançadas como modelagem de equações estruturais, modelos de probabilidade, análise de sobrevivência, séries temporais e modelos multiníveis. Stata permite aos usuários ter controle sobre dados, variáveis e também a compilação estatística de grupos. O Stata funciona bem com dados longitudinais, mas só pode manter um conjunto de dados em memória que tem que ser reescrito para adicionar ou acessar um novo conjunto de dados. Os gráficos Stata não são tão flexíveis quando comparados a outros softwares e os diferentes pacotes limitam o tamanho dos conjuntos de dados utilizáveis (Stata/IC, Stata/SE, e Stata/MP).
2. R
R é um ferramenta de software estatístico de código aberto that is well equipped to handle, visualization, analysis and aspects of aprendizagem de máquinas ‘heavy computing’ and it’s strictly a programming ‘command line interface (CLI) software tool though relatively new in the user space, R now commands a strong fan base, boasting over 6000 packages, contributed by data scientists, bioinformatics and medical researchers, covering an expanse of disciplines from cancer research, clinical analysis, biologia molecular, phylogeny, to meta-analysis.
O Ambiente de Desenvolvimento Integrado (IDE) R-studio, que abriga as ferramentas R, funciona como o motor de banco de dados Oracle onde o SQL é usado. A versão anterior foi lançada em 1993 e a IDE foi lançada em 2011. R é compatível com arquivos Excel (.xls, .xlsx), arquivos de texto (.txt, .dat, .csv), SPSS (.sav), Stata (.dta), SAS (. sas7bdat), Other (. xml, json). R interage bem com outros softwares com uma curva de aprendizagem bastante íngreme, dados os diferentes tipos de dados.
Especificamente, Metafor é um dos muitos pacotes R disponíveis para realizar meta-análises e contém as ferramentas de análise mais abrangentes. Seu website contém algumas análises muito úteis e exemplos de tramas com o código correspondente. Entretanto, como o pacote requer o uso do ambiente R, pode ser difícil para aqueles que nunca usaram R antes se acostumarem ao pacote tão rapidamente. Digno de menção são os JASP ou Jamovi embalagens.
3. Prisma GraphPad
O GraphPad Prism é popular entre os biólogos no meio acadêmico e industrial. Ele também vem com funcionalidades que permitem aos pesquisadores realizar pesquisas de laboratório e testes clínicos usando o teste t, ANOVA unidirecional, tabela de contingência, análise de sobrevivência e modelos de probabilidade como o modelo de regressão logística.
O software, diferente de qualquer outro, vem com uma página de análise de resultados interpretada após as estimativas terem sido produzidas. A linguagem é fácil de entender com menos detalhes técnicos. O software também possui um recurso automatizado integrado que combina a análise e a saída gráfica em um único instantâneo - o que acrescenta ao comportamento correspondente da re-análise automática dos dados nos casos em que qualquer um dos pontos de dados é alterado, tudo em tempo de execução, sem qualquer necessidade de refazer a análise realizada ou o gráfico desenhado.
A ferramenta de software é compatível com arquivos Excel (.xls, .xlsx), arquivos de texto (.txt, .dat, .csv), e Outros (. xml, json). As características gráficas são excepcionais.
Leia também: Como os estaticistas freelance podem melhorar a pesquisa
4. SAS
O SAS é a base de uma análise avançada com funcionalidades que abrangem uma ampla gama de empresas e organizações científicas e de engenharia. O desenvolvimento do SAS (Statistical Analysis System) começou em 1966 por Anthony Bar, da Universidade Estadual da Carolina do Norte, e mais tarde se juntou a James Goodnight. O Instituto Nacional de Saúde financiou este projeto com o objetivo de analisar dados agrícolas para melhorar o rendimento das colheitas.
SAS é compatível com arquivos Excel (.xls), arquivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e Outras extensões de arquivos (.xml). Isto permite que os dados sejam importados e exportados com facilidade sem recorrer a processos manuais que possam levar a erros. O SAS também vem com uma boa interface gráfica interativa. No entanto, o SAS pode ser incômodo às vezes para criar gráficos perfeitos com sintaxe.
Some of the down features or benefits of SAS is linked to its size and proprietary license ownership. Key among this, is the time to implementation of new ideas and methods and the technicalities in the documentation process. SAS has gained popularity among Financial Services, Government, Manufacturing and Health and Ciências da Vida.
5. IBM SPSS
A versão inicial do SPSS foi desenvolvida em 1968 até a aquisição da IBM em 2009. O SPSS da IBM é bastante abrangente e serve como ferramenta para quase todas as disciplinas e profissionais. O software tem profundidade de capacidade com uma função de interface gráfica do usuário fácil de usar. Entretanto, o software funciona melhor para pesquisadores que têm um conhecimento básico de estatística, especialmente elementos de dados como medições de dados, identificação de tipos de dados, atribuição e codificação de variáveis e seleção de casos.
O IBM SPSS é compatível com arquivos Excel (.xls, .xlsx), arquivos Texto (.csv, .txt, .dat), SAS (. sas7bdat) e Stata (.dta). ele vem com uma característica marcante no 'Chart Builder' que permite aos usuários arrastar e soltar gráficos e fazer modificações. Além da facilidade de uso e da capacidade de lidar automaticamente com pontos de dados ausentes, os usuários podem executar modelos de equações estruturais através do SPSS Amos.
Entretanto, alguns métodos estatísticos robustos e complexos não podem ser estimados, por exemplo, a Regressão de Desvio Menos Absoluto e a Regressão de Quantidade.
6. MATLAB
MATLAB (The Mathworks) was released in 1984. MATLAB is a complete command line interface (CLI) or programming language used by scientist and engineers. As with R, the learning path is steep, and you will be required to create your own code at some point. A plentiful number of toolboxes are also available to help answer your research questions (such as EEGLab for analysing EEG data). The difficult to use feature is complemented by a vast array of statistical methods and flexibility in terms of what the software can handle. MATLAB gained popularity among scientist in the areas of engineering, numerical analysis, linear algebra and image processing.
MATLAB is compatible with Excel files (.xls, .xlsx), Text files (.txt, .dat, .csv), Other (. xml, json). MATLAB has a good graphic and integrates easily with high-end programming software like Python and C++ but does not boast the huge statistical methods that is available for SAS and IBM SPSS.
Além disso, há uma lista de ferramentas de software estatístico impopulares por aí que se sai bem em termos de facilidade de uso, com recursos eficazes de apontar e clicar.
7. JMP
JMP combines powerful statistics with dynamic graphics, in memory and on the desktop. Its interactive and visual paradigm enables JMP to reveal insights that are impossible to gain from raw tables of numbers or static graphs. Originally stood for ‘John’s Macintosh Program’ with five bespoke products: JMP, JMP Pro, JMP Clinical, JMP Genômica and JMP Graph Builder App.
JMP é compatível com arquivos Excel (.xls, .xlsx), arquivos de texto (.csv, .txt, .dat), SAS (. sas7bdat), Stata (.dta), SPSS (.sav). JMP vem com um gráfico interativo, tabelas de dados dinamicamente ligadas e linguagem de scripting e também tem uma interface que permite o uso de add-ins R e Excel, Usuários também obtêm os benefícios adicionais de gerenciar a saída de forma eficaz. Semelhante ao IBM SPSS, alguns métodos robustos essenciais: regressão; dois estágios de mínimos quadrados (2SLS), LAD, Quantile estão ausentes.
8. Minitab
O Minitab oferece uma gama de ferramentas estatísticas básicas e bastante avançadas para análise de dados e foi desenvolvido em 1972 a partir da OMNITAB 80, que é uma versão leve. Similar ao GraphPad Prism, os comandos podem ser executados tanto através do GUI como de comandos com scripts, tornando-o acessível tanto para os novatos quanto para os usuários que procuram realizar análises mais complexas.
O software é compatível com arquivos Excel (.xls), arquivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e Outras extensões de arquivos (.xml). Isto permite que os dados sejam importados e exportados com facilidade sem recorrer a processos manuais que possam levar a erros. O Minitab automatiza os cálculos e permite a criação eficiente de gráficos.
9. Statistica
Statistica is a suite of analytical software tool originally developed by StatSoft and acquired by Dell in 2014 and TIBCO entering agreement to buy in 2017. Statistica is great with data management, analysis, visualization, data mining and machine learning.
SAS é compatível com arquivos Excel (.xls), arquivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), e Outras extensões de arquivos (.xml). Isto permite que os dados sejam importados e exportados com facilidade sem recorrer a processos manuais que possam levar a erros. A estatística permite a integração do ambiente de programação R onde técnicas analíticas adicionais estão disponíveis.
10. Excel
O Microsoft Office Excel foi originalmente desenvolvido para lidar com o gerenciamento de dados Sem qualquer necessidade de introdução, o Microsoft Corp Excel é amplamente utilizado na análise estatística de acordo com o conjunto de dados tomados para esta revisão. O programa tem um alcance mais amplo e o conhecimento de uso é bastante difundido de que a quantidade de desconhecido é muito menor sobre o modo de uso e, portanto, a facilidade de uso atinge o máximo entre o software revisado.
O Excel também tem um suplemento chamado Meta-Essentials, MetaXL e MetaEasy que adiciona a capacidade de realizar estatísticas meta-analíticas com o excel como base.
There are several factors that affect the outcome of analysis, including sample size, data collection methods, choice of test used, methodology, and more. Statistical analysis needs to be carefully done by experts to obtain reliable results. Hiring an experienced médico autônomo ou consultor em bioestatística pode ajudá-lo a economizar tempo e energia, ao mesmo tempo em que se concentra em sua pesquisa. A verificação dos dados de sua pesquisa antes de sua publicação também é essencial para que você possa comunicar sua pesquisa ao mundo com confiança. A Kolabtree oferece acesso a estatísticos freelance experientes em diferentes softwares e ferramentas. Ver especialistas agora ou simplesmente postar um projeto e obter citações em 24 horas.