Social science is in the midst of a data revolution. Education, economics, behavioural sciences, history, archaeology, sociology – all these fields are increasingly becoming dependent on the interpretation of large data sets. Organizations worldwide are already exploiting the power of science des données - en utilisant la saisie, l'analyse et la visualisation de données complexes pour prendre des décisions commerciales judicieuses. Les entreprises utilisent de plus en plus le big data pour analyser les performances, prévoir la croissance et accroître l'efficacité. Cependant, la plupart des données que nous collectons peuvent également être utilisées à des fins sociales. Les données, quelle que soit leur taille, nous donnent des informations qui peuvent être appliquées dans des domaines tels que l'élaboration de politiques, la planification urbaine et la lutte contre la pauvreté, la faim et l'hygiène.
Les données sont collectées à partir d'une grande variété de sources - du web, des mobiles, des bâtiments, des épiceries et même des poubelles. Elles ont une valeur scientifique, sociale, politique et économique. La quantité de données à laquelle nous avons accès augmente quotidiennement, notamment grâce aux enregistrements des interactions humaines dans le monde numérique. Comment alors "filtrer" ces données pour que les spécialistes des sciences sociales puissent élaborer des méthodologies et des solutions efficaces ?
Voici quelques exemples intéressants de la façon dont l'analyse est utilisée pour résoudre des défis du monde réel.
Le big data au service de la détection d'Ebola : Un algorithme a détecté l'épidémie d'Ebola avant les humains.
Une semaine avant l'identification de l'épidémie d'Ebola, HealthMap, un outil de cartographie qui permet de suivre la propagation des maladies, avait déjà détecté la maladie. L'outil de surveillance de la maladie a pu détecter une "fièvre hémorragique mystérieuse" le 19 mars. L'organisation a alerté l'OMS, qui a confirmé officiellement l'épidémie d'Ebola le 22 mars.
Using data from social media, news articles, government bodies, and soins de santé blogs, HealthMap’s algorithm scans websites, picks up data, filters it and extracts useful information that helps identify and classify diseases. Once the data is obtained, a panel of experts in épidémiologie et infectious diseases review it to make sure that it’s as accurate as possible.
HealthMap fournit également un carte interactive qui vous donne une idée du nombre de cas et des nouvelles relatives à la maladie, et vous permet également de suivre sa propagation.
Du big data pour une ville plus sûre : New York utilise l'analyse de données pour identifier les bâtiments sujets aux incendies.
Une équipe de huit membres du MODA (The Mayor's Office of Data Analytics) de New York utilise l'analyse des données pour rendre la ville plus sûre et plus efficace. Databridge est une plateforme de partage de données qui permet d'intégrer des données géographiques avec des flux provenant d'agences et d'organisations. L'analyse de ces données débouche sur une multitude d'informations qui aident les analystes à identifier et à cibler les problèmes liés à la propreté, à la criminalité, à l'urbanisme et à la sécurité.
Par exemple, l'escouade était capable d'identifier les restaurants qui déversaient de l'huile dans les égouts au lieu d'utiliser un service de charretiers en comparant une liste de restaurants sans charretiers aux données géospatiales sur les égouts. Ils ont ainsi trouvé un moyen beaucoup plus efficace de repérer les restaurants fautifs que la méthode traditionnelle consistant à envoyer une personne du service de santé dans le quartier, dans l'espoir de prendre quelqu'un en flagrant délit.
Le service des incendies de New York (FDNY) utilise également l'analyse de données pour identifier les bâtiments les plus exposés aux risques d'incendie. Les systèmes d'inspection puisent des données dans l'entrepôt du FDNY, ainsi que dans les organismes et agences gouvernementales concernés. Sur la base de divers critères tels que le matériau de construction, les caractéristiques de protection contre l'incendie du bâtiment, la date de la dernière inspection, etc., le système est en mesure d'effectuer une analyse rapide des bâtiments les plus à risque. Cela réduit considérablement la charge de travail des pompiers, qui inspectent manuellement environ 50 000 bâtiments par an.
Le Big Data au service de la lutte contre la cybercriminalité : Le gouvernement gallois et l'université de Cardiff
L'analyse des données a trouvé une application dans la lutte contre la cybercriminalité, comme le montre un récent projet entrepris par la Commission européenne. Université de Cardiff and the Welsh Government. A study of the data obtained from Twitter showed that there was a trend: hate speech increased after an important (and controversial) event, such as the UK referendum. Professor Matthew Williams from the University’s Social Science des données Lab and Dr Pete Burnup (Co-Director of the Social Data Science Lab) developed, along with the Welsh Government, online hate speech guides that help spread awareness about the laws and prevention of cyberhate.
La science des données et les outils statistiques pour les chercheurs en sciences sociales
It is becoming imperative for a social scientist to be able to work with data and communicate data-driven findings effectively. Here is a list of tools that are useful for analytics in social science recherche:
-Chorus Analyticspour la collecte et la visualisation de données obtenues à partir de Twitter pour la recherche en sciences sociales.
-DiscoverTextqui fournit des outils logiciels basés sur le cloud computing pour évaluer rapidement de grandes quantités de données textuelles, d'enquêtes et de données Twitter.
-Empreintes numériquespour la collecte de données Facebook fermées avec le consentement de l'utilisateur (disponible uniquement pour les chercheurs universitaires).
-The Initiative de documentation des données (DDI)une norme internationale pour la description des données produites par les enquêtes et autres méthodes d'observation dans le domaine des sciences sociales, comportementales, économiques et de la santé.
-NodeXLun modèle pour Microsoft Excelqui permet d'explorer facilement les graphes de réseaux
-Programmes tels que R, SAS, SPSS et Excel pour l'analyse statistique.
Les développements dans le monde de la science des données progressant à une vitesse vertigineuse, les spécialistes des sciences sociales doivent combler le déficit de compétences. Les collaborations entre les spécialistes des sciences sociales et les scientifiques des données peuvent déboucher sur des innovations passionnantes. Experts en science des données peuvent également être engagés par des spécialistes des sciences sociales pour travailler sur des projets à court terme.
Do you know of any interesting applications or tools that can be used by social scientists for analyse des données? Feel free to suggest them in the comments below, or Tweetez-nous.
--
Voir aussi : Cinq projets intéressants dans le domaine des humanités numériques
Besoin d'engager un expert en analyse de données ? Consultez un spécialiste des données sur Kolabtree. C'est gratuit de poster votre projet !