Mis à jour : 19 août 2019
In this post, Christopher Frye, a science des données consultant and Kolabtree freelancer, provides the top open-source data visualization tools that can help you easily visualize and interpret complex data.
Les outils de visualisation des données permettent de stocker, de nettoyer, de traiter et d'afficher les données complexes, vastes et en croissance rapide que nous générons et recueillons à chaque instant. Visualisation des données facilite les processus décisionnels qui permettent aux entreprises d'être compétitives et de s'adapter rapidement à des environnements changeants. Le flux toujours plus important de flux de données en temps réel et en quasi temps réel nécessite l'utilisation de tableaux de bord dynamiques, ce qui entraîne une demande d'outils, de plateformes et d'applications sophistiqués. Les visualisations les plus efficaces combinent des techniques de nettoyage et d'analyse des données, et nécessitent souvent l'intervention d'un data scientist compétent. Néanmoins, il existe un certain nombre d'outils de visualisation de données open source qui peuvent aider les entreprises à visualiser facilement leurs données.
Outils de visualisation de données à code source ouvert
Recherche conducted for this post revealed more than 50 data visualization tools that can be considered “open source”. Open source can sometimes generate a bit of confusion as being synonymous with “free”. The définition la plus simple of open source in the context of software is “software with source code that anyone can inspect, modify, and enhance”. Open source data visualization tools require the user to have some programming ability, whereas free visualization tools may not necessarily need the user to have programming ability. Tableau Public is an example of a free data visualization software, however, it is not open source. I have tried to cover some Tableau alternatives in this post.
Cet article présente des outils de visualisation de données gratuits et open source, et comprend une matrice de comparaison qui peut être utilisée pour comparer et opposer chaque outil.
1. Candela
Candela est un progiciel de visualisation de données mis à disposition par l'intermédiaire du site Web de la Commission européenne. Résonant plate-forme. Candela se distingue des autres outils en fournissant une suite complète de composants de visualisation de données. La documentation de formation permet aux novices de se mettre rapidement au travail, et le code peut être utilisé via JavaScript, PythonL'installation de Candela en local peut se faire par le biais de la dernière version publique d'un dépôt, bien que la documentation de l'outil suggère d'installer le paquet à partir des sources, car cela permet d'obtenir la dernière version de développement.
2. Charted
Charted est sans doute l'un des outils de visualisation de données les plus faciles à utiliser, puisqu'il suffit d'un lien vers un fichier .csv ou un emplacement Google Sheets ; il suffit d'appuyer sur GO et Charted crée un affichage visuel à l'aide d'un graphique à barres ou linéaire. Selon les développeurs de Charted (créé par l'équipe de la Équipe scientifique chargée des produits chez Medium), l'outil a été construit autour de trois principes : il ne stocke pas les données, ne les transforme pas et n'est pas un outil de formatage. Il extrait les données à une cadence régulière (rafraîchissement toutes les 30 minutes), de sorte que les modifications apportées à la feuille sous-jacente sont toujours à jour dans le graphique. Il prend également en charge les fichiers délimités par des tabulations et les liens Dropbox. Formation ? Elle est inexistante, mais elle n'est pas non plus obligatoire.
3. Datawrapper
Datawrapper est un outil qui existe depuis 2011 et qui est principalement utilisé par les journalistes, bien qu'il soit suffisamment complet pour être utile à tout scientifique ou chercheur en données. Contrairement à la plupart des outils présentés ici, Datawrapper dispose de versions gratuites et payantes. Il n'est pas non plus techniquement open-source car aucune compétence en codage n'est nécessaire. Comme l'explique la page d'accueil du site, il suffit de couper et de coller, de visualiser et de publier. Les graphiques sont interactifs, ce qui signifie que les spectateurs peuvent voir les valeurs sous-jacentes, et les visualisations peuvent également être intégrées à un site Web. Il existe un large éventail d'options graphiques, du simple diagramme à barres au diagramme de dispersion, ainsi qu'une fonctionnalité de cartographie.
Dans le graphique hebdomadaire de cette semaine, nous louons #worldcup les visualisations, l'introduction de symboles dans les dotplots et le triplement de nos données pour de meilleurs effets de survol : https://t.co/uZoRwM5R81 pic.twitter.com/RHOYSlAsKL
- Datawrapper (@Datawrapper) 5 juillet 2018
4. Dépliant
Leaflet ne concerne que les cartes. En fait, il n'a aucune capacité graphique mais se présente comme la "principale bibliothèque JavaScript à code source ouvert pour les cartes interactives conviviales pour les mobiles". L'outil offre une variété de couches cartographiques et des fonctions d'interaction telles que des contrôles de zoom et des fonctions de survol de la souris. Il offre également des possibilités de personnalisation telles que des projections de cartes et un restylage CSS3 facile. Des fonctionnalités supplémentaires peuvent être fournies par le biais de plugins, et les utilisateurs peuvent voter pour des plugins supplémentaires s'ils ne sont pas disponibles. Il existe à la fois des didacticiels de base, comme un guide de démarrage rapide, et des formations plus avancées pour le développement de plugins. Les fichiers d'installation sont accessibles par le biais d'un référentiel (versions stables et en cours de développement) ainsi que par le code source.
5. RawGraphs
Semblable à certains égards à Charted et Datawrapper, RawGraphs, dont le slogan est la le chaînon manquant entre les feuilles de calcul et les visualisations de données, Il suffit à l'utilisateur de couper/coller des données, de les télécharger ou de fournir un lien pour créer une grande variété de graphiques. L'une des caractéristiques qui différencient RawGraphs est qu'un certain nombre de modèles de visualisation non conventionnels sont fournis (par exemple, les diagrammes ensoleillés, les diagrammes alluviaux, les dendrogrammes pour le regroupement hiérarchique, etc.) ). Ne vous inquiétez pas, novices - les suspects habituels (barre, ligne, tarte, dispersion) sont également inclus. Pour les utilisateurs avancés, de nouveaux types de graphiques peuvent également être créés. Les créations visuelles peuvent être exportées sous forme d'images vectorielles ou matricielles pour être affichées sur votre site Web, et les didacticiels, bien qu'ils ne soient pas exhaustifs, peuvent être complétés rapidement afin que vous puissiez vous mettre directement au travail sur votre magnum opus visuel.
6. Chartist.js
Chartist.js est une autre bibliothèque JavaScript qui incarne son slogan comme suit Graphiques simples et réactifs. En effet. Pas de cascades ou de boxplots ici, mais ce que Chartist.js perd en diversité, il le compense largement en personnalisation. Les feuilles de style (CSS) peuvent être personnalisées dans une large mesure dans cet outil, la personnalisation permettant l'animation des visualisations, certaines utilisant le SVG. Qu'est-ce que le SVG ? SVG est graphiques vectoriels à échelle variableSVG est un format qui permet l'interactivité et l'animation, et qui est extensible (sans perte de qualité de résolution). Chartist.js considère SVG comme une technologie de pointe, une vision apparemment partagées par d'autres. Il y a quelques problèmes de compatibilité avec les navigateurs, mais le site fournit un tableau concis indiquant les navigateurs compatibles.
7. D3.js
D3.js est une autre bibliothèque JavaScript qui développe des visualisations de données à l'aide de html, svg et css. D3 signifie Documents fondés sur des donnéesle document étant ici un Document Object Model (DOM). L'idée centrale de D3.js est de tirer parti de toutes les capacités du navigateur moderne pour développer des visualisations à l'aide de normes Web, sans s'attacher à un cadre propriétaire. En termes de courbe d'apprentissage, c'est le contraire d'autres outils de copier-coller, donc D3.js n'est décidément pas pour ceux qui évitent l'appellation redoutable de code. Cela dit, si vous recherchez un outil offrant des fonctionnalités quasi illimitées en termes de créativité et d'options graphiques, D3.js est peut-être ce qu'il vous faut !
8. Plotly
La nouvelle version de Plotly #Python interface : rendu rapide d'énormes ensembles de données, interactivité, etc. #Jupyter carnets, validation... C'est énorme ! https://t.co/iRzERrUdQX par @jonmmease 👍 pic.twitter.com/VvnGdmgGEk
- Radim Řehůřek (@RadimRehurek) 6 juillet 2018
Plotly is another example of a tool that has both open-source and proprietary (paid) products, each tier containing its own functionality. Offerings can be grouped into two platforms (Plotly On-Premises and Plotly Cloud) with four primary business intelligence tools covering charting, dashboards, slide decks, and SQL client. The SQL client is free, while Plotly libraries are available as open-source through JavaScript, Python, and R. One of the oft-marketed features of Plotly (at least in the paid tools) includes the ability to collaborate and share data visualizations with other team members.
9. Polymaps
Semblable à Leaflet, et comme son nom l'indique, Polymaps est un outil composé d'une bibliothèque JavaScript permettant de "créer des cartes dynamiques et interactives dans les navigateurs Web modernes". Polymaps est un autre outil qui exploite la fonctionnalité SVG, facilitant le stylisme par le biais de CSS, et permet une interactivité accrue. Parmi les exemples de visualisations cartographiques, citons la cartographie générale des couches de rues, les cartes de chloroplèthe (par exemple, pour comparer les données au niveau des États), la densité de population et même l'utilisation du clustering k-means.
10. OpenHeatMaps
Dans la catégorie du téléchargement et de la création, OpenHeatMaps est un outil assez basique qui permet à l'utilisateur de télécharger soit un csv, excel, or Google Sheets file, and create a map instantly. OpenHeatMap can also be used by developers (as a JQuery plugin) to provide for mapping functionality within their own website. Users uploading a file for rendering are recommended to include a full street address in one field, with values represented in another field (for instance, housing value, sales price, number of employees, etc.). Geographies can be point-based (i.e. one address), or aggregates such as city, county, state, etc.
11. DyGraphs
DyGraphs revendique comme l'une de ses principales caractéristiques la possibilité de gérer d'énormes ensembles de données, de tracer des millions de points de données sans "s'enliser". Une autre fonctionnalité, pour ceux qui se considèrent comme des férus de statistiques, est la possibilité d'afficher des barres d'erreur et/ou des intervalles de confiance. Pour les utiliser, un écart-type doit être spécifié dans le fichier de données. Les démonstrations du tutoriel sont assez basiques mais devraient permettre à quelqu'un de commencer assez rapidement à créer ses propres visualisations.