Charakterisierung der freigegebenen Dateien im modernen Gnutella · 2016. 8. 31. ·...

Post on 20-Jan-2021

2 views 0 download

Transcript of Charakterisierung der freigegebenen Dateien im modernen Gnutella · 2016. 8. 31. ·...

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Charakterisierung der freigegebenen Dateien im modernen Gnutella

Yu, Xiao Tai25.02.2009

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 2

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Agenda

EinführungMessungAnalyseErgebnisse

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 3

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Gnutella

P2P-FilesharingPopulares Overlay-NetzwerkBrowse-Host Feature

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 4

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Zweischichtige Overlay-Topologie

Obere Schicht UltrapeersLegacy-Peers

Untere SchichtLeaf-Pears

Verbunden mit Ultrapeers

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 5

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Messung

CrawlerSnapshotsSharing-Listen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 6

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Snapshots

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 7

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Das Tool CruiserTopologie-Crawl

Für Topologie15 min

Inhalt-Craw Für Sharing-Listen5,5 Stunden

Präzise SnapshotsZwei mal Topologie-Crawl Langfristige vs. Kurzfristige Peers

200,000 Peers

•Master/Slave-Architektur•6 Off-The-Shelf

1GHz

GNU/Linux

Geräten

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 8

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Analyse

Statische AnalyseTopologische AnalyseDynamische Analyse

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 9

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Distribution-Funktionen

Power-Law-DistributionF(x) = axk + o(xk)Kleiner Anteil häufig, großer Anteil selten

Zipf-DistributionRankedKleiner Anteil häufig, großer Anteil selten

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 10

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Power-Law-Distribution

Freigegebene Speichergröße

Bis zu 100GB, aber selten

häufig 100MB

y = C x-a bedeutet log(y) = log(C) - a log(x)

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 11

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Zipf-Distribution

Popularität

10 Millionen Dateien

stabil innerhalb 4 Monanten

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 12

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Popularität der freigegebenen Dateitypen

Multimedia-Dateien (93%) populärste MP3

1/3 SpeicherplatzVideodateien:

1/10 weniger als Audiodateien, aber 25% Bytes mehrPopularität und Speichergröße verdreifacht

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 13

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Ergebnisse der statischen Analyse

Free-RidersAnteil 13%Keine Relation zwischen Sharing und Peertyp

Ultrapeers vs. Leaf-Peers

Anzahl und SpeichergrößePower-Law-Distribution

PopularitätZipf-Distribution

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 14

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Topologische Analyse

Verteilung der freigegebenen Dateien auf die Overlay-TopologieGemeinsamkeit zwischen Peers

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 15

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Cumulative Distribution Function (CDF)

Verteilung der freigegebenen Dateien auf die Overlay-TopologieCDF: Suche 5 Kopien einer Datei5 CDF: 5 ExamplareY:100 PeersX: minimale Suchanfragen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 16

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Gemeinsamkeit zwischen Peers

3 CDF: 1, 2 und 3-HopsY:100 PeersX: Gemeinsamkeit

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 17

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Ergebnisse der topologischen Analyse

Churn ist dominantSharing-Listen zufällig auszuwählenDateien zur Simulation für P2P-Filesharing zufällig zu verteilen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 18

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Dynamische Analyse

Änderungen der freigegebenen DateienPopularitätsänderungenEntwicklung der Popularitätsänderungen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 19

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Änderungen der freigegebenen Dateien

4 CDF: 2 Std., 6 Std., 1 T. und 1 W.

Y: 3000 PeersX: Änderungen der Dateien

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 20

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Popularitätsänderungen –

ein Tag

Änderungen an einem TagX: 50,000 RankY: Popularitätsänderung

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 21

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Popularitätsänderungen –

Tage

Im kurzen ZeitraumCDF: 6 Std. und1, 2, 3 TageY: Top-1000 populärsten DateienX: Popularitätsänderung

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 22

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Popularitätsänderungen –

1 Woche

Verteilung auf Top 10, 100, 1000 und 10000 populärsten DateienÄnderungen in 8 Tagen

Abgesehen vom Rausch sind die Änderungen stabil

Top 10-10,000 populärsten DateienX: TageY: Popularitätsänderungen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 23

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Entwicklung der Popularitätsänderungen –

Tage

Top-10 populärsten DateienX: TageY: Popularitätsänderungen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 24

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Entwicklung der Popularitätsänderungen –

Monate

Top-10 populärsten DateienX: TageY: Popularitätsänderungen

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 25

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Ergebnisse der dynamischen Analyse

Änderungenpopulärsten Dateien größerschneller mit der Zeitgroß über Monateklein innerhalb einer Woche

Caching bandbreitesparende Strategie

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 26

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Zusammenfassung

Das moderne GnutellaMessungsmethodeAnalyse

Anzahl, Speichergröße, Dateitypen und PopularitätTopologische AnalyseÄnderungen der freigegebenen Dateien

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 27

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Literatur VerzeichnisD.Stutzbach and R.Rejaie: "Characterizing the Two-Tier Gnutella Topology", S. Zhao, D. Stutzbach & R. Rejaie: "Characterizing Files in theModern Gnutella Network: A Measurement Study“Verteilungsfunktionen: http://www.hpl.hp.com/research/idl/papers/ranking/ranking.htmlEin ultimatives P2P-Buch ist gewünscht

Überblick des weiten Bereichs von P2PStand der TechnikenArchitekturKonzepte des Designs

Charakterisierung der freigegebenen Dateienim modernen Gnutella - 28

Technische Universität BerlinFakultät IV – Elektrotechnik und InformatikSeminar: Internet MeasurementIntelligent Networks / Intelligente Netze (INET)Research Group of Prof. Anja Feldmann, Ph.D.

Vielen Dank

im modernen Gnutella

Charakterisierung der freigegebenen Dateien