Social-Media-Forschung
-
Upload
katrin-weller -
Category
Social Media
-
view
354 -
download
2
description
Transcript of Social-Media-Forschung
Social Media Daten als Grundlage sozialwissenschaftlicher Forschung:
Chancen und Herausforderungen
Kassel, 11.06.2014
Dr. Katrin Weller, [email protected], @kwelle
http://katrinweller.net
Dr. Katrin Weller GESIS – Leibniz Institut für Sozialwissenschaften
Datenarchiv für Sozialwissenschaften
2006-2012: Heinrich-Heine-Universität Düsseldorf,
Promotion in Informationswissenschaft
Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (Eds.) (2014). Twitter and Society. New York et al.: Peter Lang.
Fragen & Kommentare
Slides: http://de.slideshare.net/katrinweller
Hintergrund / Forschungsstand
5 http://www.conversationprism.com//
© Statista
GmbH
Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört?
Umfrage zur Bekanntheit von Social Media Plattformen in Deutschland (2012)
30
40
55
56
58
62
67
68
69
71
72
80
87
96
Yappy
Flickr
Lokalisten
MeinVZ
MyVideo
MySpace
SchülerVZ
StudiVZ
Stayfriends
Wer-kennt-…
YouTube
0 20 40 60 80 100 120
Anteil der Befragten in %
Quelle: PwC, Entwicklung sozialer Medien im Vergleich, Seite 11 ID 76144
http://de.statista.com/statistik/daten/studie/76144/umfrage/umfrage-zur-bekanntheit-von-social-media-plattformen-in-deutschland/
Social Media Forschung in (Publikations)zahlen
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000Anzahl an Publikationen in Scopus
(TITLE-ABS-KEY("social media") OR TITLE-ABS-KEY("social web") OR TITLE-ABS-KEY("social software") OR TITLE-ABS-KEY("web 2.0")) AND PUBYEAR > 1999 [ März 2014]
Publikationen nach Fachgebieten (Scopus)
10650; 36%
5542; 19%
2384
2288
2151
1535
773
772
65 Computer ScienceSocial SciencesEngineeringMedicineBusiness, Management and AccountingMathematicsArts and HumanitiesDecision SciencesPsychologyNursingEconomics, Econometrics and FinanceBiochemistry, Genetics and Molecular BiologyHealth ProfessionsEnvironmental ScienceEarth and Planetary SciencesAgricultural and Biological SciencesPharmacology, Toxicology and PharmaceuticsPhysics and AstronomyMaterials ScienceMultidisciplinaryNeuroscienceImmunology and MicrobiologyChemical EngineeringVeterinaryDentistryChemistryEnergy
http://kwelle.wordpress.com/2014/04/07/bibliometric-analysis-of-social-media-research/#more-149
Forschungsthemen
pointless babble?
Top Thema: Wahlen
#egypt
Dauerthemen
E-Learning Marketing
Marktforschung / Nutzerstudien
Journalismus
Trends?
Vorhersagen Gesundheit Big Data
Was wird erforscht?
• Nutzergruppen • Ereignisse • Zielgruppen • Nutzungspraxis • Informationsflüsse • Einfluss • Meinungen und Stimmungen • Netzwerke • Interaktionen • …
Social Media Daten
Social Media Daten
• Texte
• Bilder
• Videos
• Multimedia
• Verbindungen I (Freunde, Follower)
• Verbindungen II (Links/URLs)
• Verbindungen/Aktionen (Likes, Favs, Kommentare, Downloads)
Beispiel: Twitter Daten
Datenzugang? Twitter APIs
• Nicht explizit für Wissenschaftler entwickelt
• Nicht rückwirkend zugänglich
• Nicht vollständig
Änderungen möglich
https://dev.twitter.com/console
Eige
ne
Use
r-ID
fin
den
: h
ttp
://w
ww
.idfr
om
use
r.co
m/
2013: Twitter und Wahlen No. of Tweets No. Of publications (2013)
0-500 3
501-1.000 4
1.001-5.000 1
5.001-10.000 1
10.001-50.000 7
50.001-100.000 4
100.001-500.000 5
500.001-1.000.000. 3
1.000.001-5.000.000 3
mehr als 5.000.000 3
mehr als 100.000.000 1
mehr als 1.000.000.000 1
keine/ungenaue Angabe 13
Weller, K. (im Druck): Twitter und Wahlen: Zwischen 140 Zeichen und Milliarden von Tweets. Erscheint im R. Reichert:Big Data. http://www.transcript-verlag.de/978-3-8376-2592-9/big-data
Chancen
Top 4: Chancen
#1
Beobachtung von spontanen Interaktionen und flüchtiger
Kommunikation
#2
Daten sind für eine Vielzahl von Ereignissen, Kontexten und Fragestellungen verfügbar.
#3
„Rich data“: Multimedia plus Netzwerke plus Interaktionen
#4
Interdisziplinäres Forschungsumfeld; Möglichkeit, neue Methoden
auszuprobierne und zu kombinieren
Methoden & Tools
Methoden
Content Analysis (qual. / quant.)
Umfrage / Interview) Experiment / Feldforschung
Mehr Methoden?
34
Methoden (in der sozialw. Twitter Forschung)
Weller, K. (2014). What do we get from Twitter – and what not? A close look at Twitter research in the social sciences. Knowledge Organization 41(3), 238-248.
TOOLS
• Datensammlung
• Analyse
Data collection
• dapper: http://open.dapper.net/ • SocSciBot “Web crawler and link analyser for the social sciences and
humanities http://socscibot.wlv.ac.uk • Chorus: http://www.chorusanalytics.co.uk/ • SODATO (Copenhagen Business School):
http://cssl.cbs.dk/software/sodato/ • NVivo 10 (eigenltich Tool für qualitative Inhaltsanalyse), jetzt mit
Import von Tweets, Facebook Posts, YouTube Daten, LinkedIn. • YourTwapperkeeper – für Twitter • Python Packages, z.B. für Wikipedia
36
Social Network Analysis
• NodeXL (mit Datenimport-Funktion)
• ORA (http://www.casos.cs.cmu.edu/projects/ora), a social network analysis (SNA) software package, for basic manipulations and visualization of the network data
• UCINET (http://www.analytictech.com/ucinet)
37
Digital Methods Initiative • https://wiki.digitalmethods.net/Dmi/ToolDatabase
GNIP
TOPSY
YourTwapperkeeper
NodeXL
Network Analysis – basierend auf Excel. Integrierte Funktion zur Sammlung von Daten aus u.a.: • Facebook • Twitter • YouTube • Flickr • Wikipedia
NodeXL
NodeXL
Gephi
Gephi
46
Stephen Wolfram
Daten: Facebook
http://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/ 47
Alternative: Crowdsourcing
48
Sentiment Analysis
Dictionaries:
z.B. ANEW
NLP / Sentiment Analysis
• Discover text: http://discovertext.com/
• Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/
• Internet Community Text Analyzer (ICTA) http://textanalytics.net
• Twitter NLP and Part-of-Speech Tagging: http://www.ark.cs.cmu.edu/TweetNLP/
• SentiStrength http://sentistrength.wlv.ac.uk/
• Sentiment analysis of Danish texts (by Copenhagen Business School): http://130.226.34.13/dh/sentiment_workshop/demo.php
50
Tool-Klassiker
• Nicht auf Social Media spezialisierte Tools, die man aus der klassischen Methoden-Arbeit kennt.
51
Inhaltsanalyse
52
CAQDAS Computer-Assisted Qualitative Data AnalysiS
– (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo)
– Speech Act Analyse
– Statistik
Data Science?
Oxford Internet Institute
Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome
Wichtig: Hintergrundwissen
54
Herausforderungen
Top 4: Herausforderungen
#1
Mangel an Theorie
Ende der Theorie?
58
because it’s there?
Big Data vs. Found Data
Ende der Theorie? Sozialwissenschaften
1. Problem
2. Forschungsfrage/
Hypothesen
3. Theorien
4. Methoden
5. Daten
6. Analyse
7. Ergebnispräsentation
Typische Big Data-Analyse
1. Methoden
2. Daten
3. Analyse
4. Ergebnispräsentation
5. Problem
Korrelation vs. Kausalität
Pfeffer, J. (2013). Big data, big research? Opportunities and constraints for computer supported social science.
Keynote zur „Digital methods“-Tagung der DGPuK-Fachgruppe Computervermittelte Kommunikation, Wien.
Abgerufen von http://www.pfeffer.at/slides/DigitalMethods-BigData.pdf
Anfang der Theorie?
“The interesting point is that these limitations can (and have to) be addressed by theory guided research that is typically conducted by social scientists. Accordingly, opportunities emerge for those social and behavioral scientists who are willing to collaborate with the Big Data researchers in the natural, engineering, and computer sciences.”
60
Snijders, C., Matzat, U., & Reips, U.-D. (2012). ‘Big Data’: Big gaps of knowledge in the field of Internet. International Journal of Internet Science, 7, 1-5. Retrieved from http://www.ijis.net/ijis7_1/ijis7_1_editorial.html
#2
„data haves“ vs. „data have-nots“
boyd, danah and Kate Crawford. (2012). “Critical Questions for Big Data”
Technische Herausforderungen
• Zugänglichkeit • Data Sharing • Änderungen • Manipulation (z.B. Twitter Bomb) & Spam • Personalisierte Ergebnisse
• Fehlende Reproduzierbarkeit und
Nachvollziehbarkeit
62
#3
Representativität?
Local Following
Repräsentativität
“The core challenge is that most big data that have received popular attention are not the output of instruments designed to produce valid and reliable data amenable for scientific analysis.“
Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps in big data analysis. Science, 343(6176), 1203-1205.
Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14. Retrieved from: http://conftool.gor.de/conftool14/index.php?page=downloadPaper&filename=Blank-Who_uses_Twitter_Representativeness-119.pptx&form_id=119&form_version=final
34
26
812
1814
10
1712
2328
333035
0
20
40
60
80
100
% w
ho h
ave
done m
ore
th
an n
eve
r
InterestPolitical activities
Interestin politics
Sendpolitical
message
ContactMP online
Re-postpoliticalnews
Politicalcommenton SNS
Findpolitical
facts
Signonline
petition
OxIS current users: 2013 N=1,613
Figure 6: Political Activities of Twitter Users
Twitter user Non-user
Repräsentativitätsprobleme auf mehreren Ebenen
“About a third of all UK Internet users have a twitter profile; a subset of that group are the active tweeters who produce the bulk of content; and then a tiny subset of that group (about 1%) geocode their tweets (essential information if you want to know about where your information is coming from).”
Graham M. (2012). Big data and the end of theory?". The Guardian. Retrieved from: http://www.theguardian.com/news/datablog/2012/mar/09/big-data-theory
Gefahren durch fehlende Repräsentativität
• Diskussion: Menschen, die durch Big Data nicht repräsentiert sind
http://streetbump.org
Siehe auch: http://www.wired.com/2014/03/potholes-big-data-crowdsourcing-way-better-government/
#4
Interdisziplinarität und methodische Standards
Fazit
• Spannendes Forschungsfeld mit viel Pioniergeist
• Beginnende Professionalisierung im Bereich Methoden und Standards
Literatur • Literaturliste zum Thema Big Data in den Sozialwissenschaften:
http://kwelle.wordpress.com/2014/04/12/big-data-links-and-literature/
Literaturempfehlungen
• Ackland, R. (2013). Web Social Science. Los Angeles et al: SAGE.
• Boyd, D., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication, & Society, 15(5), 662-679.
• Bruns, A. (2013). Faster than the speed of print: Reconciling ‘big data’ social media analysis and academic scholarship. First Monday 10(18). Available http://firstmonday.org/ojs/index.php/fm/article/view/4879
• Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services, 30(3-4), 145–159.
• Karpf, D. (2012). Social science research methods in internet time. Information, Communication & Society, 5(15), 639-661.
• Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (2014). Twitter and Society. New York et al.: Peter Lang.
• Williams, S. A., Terras, M. M., Warwick, C. (2013). What do people study when they study Twitter? Classifying Twitter related academic papers. Journal of Documentation, 69(3), 384-410.
Grüße aus Köln!
73
Fragen und Feedback:
Dr. Katrin Weller
GESIS Leibniz Institute for the Social Sciences
@kwelle
http://katrinweller.net
74