5min analyse

Die PostgreSQL Performance Schnelldiagnose

Hans-Jurgen Schonig

www.postgresql-support.de

Hans-Jurgen Schonigwww.postgresql-support.de

Performance Probleme diagnostizieren

Unser Ziel

I Finden der haufigsten Bottlenecks

I Losen der wichtigsten Probleme

I Viele Probleme konnen mit wenigen Handgriffen gelostwerden.

I Diese Anleitung ist in keinster Weise vollstandig!

Langsame Abfragen

pg stat statements: Queries tracken

I pg stat statements hilft, langsame Abfragen zu finden.

I Eines der wichtigsten Module uberhaupt

I Sollte in jeder Database aktiviert sein

pg stat statements aktivieren

I postgresql.conf editieren:

“‘bash shared preload libraries = ‘pg stat statements’ -PostgreSQL muss neu gestartet werden

I Die Extension installieren:

CREATE EXTENSION pg_stat_statements;

Wertvolle Information (1)

test=# \d pg_stat_statements

View "public.pg_stat_statements"

Column | Type | Modifiers

---------------------+------------------+-----------

query | text |

calls | bigint |

total_time | double precision |

min_time | double precision |

max_time | double precision |

mean_time | double precision |

stddev_time | double precision |

Ausfuhrungszeiten

I total time sagt uns, wieviel Zeit eine Art von Query in Summebenotigt hat.

I Viele kurze Abfragen machen oft viel mehr Aufwand alswenige große Queries.

I Die Standardabweichung (stddev time) sagt, wie gleichmaßigdie Database antwortet.

I Eine hohe Standardabweichung kann viele Ursachen haben:

I Ungleiche Verteilung der DatenI Probleme im Zusammenhang mit Locking

rows | bigint |

shared_blks_hit | bigint |

shared_blks_read | bigint |

shared_blks_dirtied | bigint |

shared_blks_written | bigint |

local_blks_hit | bigint |

local_blks_read | bigint |

local_blks_dirtied | bigint |

local_blks_written | bigint |

Speichermanagement

I *blkshit und *blksread konnen zur Berechnung der Cache HitRate verwendet werden.

I Interessante Fragen:

I Ist die Anzahl der Blocke pro Query sinnvoll?I Ist die Cache Hit Rate brauchbar?I Werden viele lokale Buffer verwendet?I Gibt eine Query unnaturlich viele Zeilen zuruck?

temp_blks_read | bigint |

temp_blks_written | bigint |

blk_read_time | double precision |

blk_write_time | double precision |

I Hohe temp * Werte konnen auf falsche work mem Settingsoder fehlende Indices hinweisen

I/O Timing

I blk * time ist in den Default-Settings deaktiviert.I track io timing in postgresql.conf kann eingeschaltet werden.I Das Messen der Zeit kann etwas Overhead erzeugen.I Um diesen Overhead zu bestimmen, gibt es ein Tool names

pg test timing.

pg test timing

I Ergebnisse zwischen 19 und 1400 ns

iMac:~ hs$ pg_test_timing

Testing timing overhead for 3 seconds.

Per loop time including overhead: 39.18 nsec

Histogram of timing durations:

< usec % of total count

1 96.14291 73610005

2 3.85010 2947759

4 0.00032 248

8 0.00012 92

16 0.00636 4866

32 0.00016 123

Relevanz erzeugen

I pg stat statements sollte sortiert abgefragt werden.I Idealerweise immer im Context:

SELECT query, total_time, calls, sum(total_time) OVER ()

FROM pg_stat_statements

ORDER BY total_time DESC

LIMIT 20;

I Ein Beispiel:http://www.cybertec.at/2015/10/pg stat statements-the-way-i-like-it/

Indexing . . .

Der ubliche Bottleneck

I Indices haben bei der Optimierung das großte Potential

I Indices sind oft der einfachste Weg, die Performance zuverbessern

I Nichts wird so oft vergessen wie ein Index

I Nicht ist so “uncool” wie ein Index

I Leute optimieren lieber RAID Level, Filesystem Settings,Kernel Parameter, Speicher, etc.

Was passieren kann

I Man stelle sich vor:

I Wir haben eine Tabelle mit 60.000 EintragenI Es fehlt ein einziger IndexI Wir haben 1.000 Requests / Sekunde

I Das System liest 60.000.000 Zeilen vollkommen umsonst.

I Liest Du gerne das ganze Telefonbuch, um eine einzigeNummer zu finden?

Wie findet man das?

I Fehlenden Indices kann auf die Spur gekommen werden:

I Durch das Auffinden langsamer Statements inpg stat statements

I Durch geschicktes Auswerten von pg stat user tables

I Oft sind die problematischen Spalten offensichtlich

Die wichtigste Query

I Die wichtigste Query eures Lebens:

SELECT schemaname, relname, seq_scan, seq_tup_read,

idx_scan, seq_tup_read / seq_scan AS avg

FROM pg_stat_user_tables

WHERE seq_scan > 0

ORDER BY seq_tup_read DESC

LIMIT 25;

Interpretation der Daten

I Wieso liest jemand 5 Millionen Zeilen 5 Millionen mal?

I Im “Problemfall” sieht man in seq tup read so etwas wieeinen “Hockeystick”

I Es wird immer Sequential Scans geben

I Viele teure Scans sind das Problem

I Die Daten sind alle da

I Oft werden die Daten ignoriert oder falsch interpretiert

Zu viele Indexes (1)

I Auch zu viele Indexes sind ein ProblemI pg stat user indexes hilft bei der Diagnose:

test=# \d pg_stat_user_indexes

View "pg_catalog.pg_stat_user_indexes"

Column | Type | Modifiers

---------------+--------+-----------

schemaname | name |

relname | name |

indexrelname | name |

idx_scan | bigint |

Zu viele Indexes (2)

I Zu viele Indexes sind viel “subtiler” als fehlende IndexesI Bedenke: Schreibzugriffe mussen auch die Indexes updatenI Indexes fuhren sehr oft zu Random I/OI Random I/O ist teuer

Typische Probleme mit Abfragen

LIKE: Der klassische Killer

I LIKE Abfragen fuhren in vielen Anwendungen zu SequentialScans

I Abfragen konnen sehr leicht beschleunigt werden:

CREATE EXTENSION pg_trgm;

CREATE INDEX idx ON tab USING gist (spalte gist_trgm_ops);

UNION vs. UNION ALL

SELECT 1 AS n UNION ALL SELECT 1;

(2 rows)

test=# SELECT 1 AS n UNION SELECT 1;

(1 row)

Semantische Fehler

I Meistens ist es ein semantisches Problem, das als PerformanceProblem daher kommt.

I Bedenke: UNION filtert doppelte Eintrage.

I Beachte: Kann es uberhaupt doppelte Eintrage geben?

I/O Performance

Schreibperformance

I Wer kennt diese Meldung?

checkpoints are occurring too frequently (%d second apart)

Checkpoints

I Checkpoints sind teuerI Die Default Distanz zwischen zwei Checkpoints ist sehr sehr

niedrigI Hohere Checkpoint Distanzen beschleunigen Schreibzugriffe

Finally . . .

Contact us . . .

Cybertec Schonig & Schonig GmbH

Grohrmuhlgasse 26

A-2700 Wiener Neustadt Austria

I More than 15 years of PostgreSQL experience:

I TrainingI ConsultingI 24x7 support

5min analyse

Software

Transcript of 5min analyse

1. Formale Analyse Teil 1: Analyse. Schumann “Dichterliebe“ … · Teil 1: Analyse. Schumann “Dichterliebe“ 1. Formale Analyse a) Analysieren Sie das Lied “Aus alten Märchen

Strukturierte Analyse

SWOT Analyse - changes.AWARDExterne Analyse SWOT Analyse Vorlage Title SWOT_03.indd Created Date 8/18/2017 1:12:28 PM ...

System Analyse

Nussknacker - Der Marsch; Motivische Analyse · Hubert Wißkirchen 24.03.1993 motivische Analyse 1 Fortbildung für fachfremde Lehrer Motivische Analyse 24.03.1993 Klangbeispiele

Basiswissen AV-Materialien: Analyse von Spielfilmen im ... · LEITFADEN FÜR LEHRER/INNEN ANALYSE EINES SPIELFILMES Impulsfragen, die Schülerlnnen für die Analyse von Spielfilmen

Kosten Nutzen Analyse. Strategische Planung Ist-Erhebung und Analyse Konzeptuelle Modellierung Fachliches Konzept IT-Konzept Kosten-Nutzen-Analyse Systemausschreibung.

ESCA: Chemische Analyse mit Photoelektronenspektroskopie fileAuger-Energien qualitative Analyse: Peak-Identifikation chemische Analyse: chemischen Verschiebung. Patrick Hoffmann Vorlesung

EKG BEI AKUTEM KORONARSYNDROM - ordensklinikum.at · F.F., 65a männl. deutscher Staatsbürger bricht beim Spaziergang auf der Landstrasse zusammen, 5min Laien-Reanim., 2x Defibrillation

Analyse des Mobilitätsverhaltens Innsbrucker Studierender beim Wintersport: Eine statistische Analyse

ISA Informations-Sicherheits-Analyse Fragenkatalog … · ISA+ Informations-Sicherheits-Analyse Fragenkatalog Mit dem Projekt ISA+ - Informations-Sicherheits-Analyse bietet der Bayerische

Zistersdorf - Analyse

Forensischer Stimmenvergleich mitForensischer …hoole/kurse/mampf/... · 2014. 1. 29. · Stimmrekordern Analyse von VogelstimmenStimmrekordern, Analyse von Vogelstimmen ENF-Analyse

Piraten analyse

UntersuchungvonInteraktiven Analyse-und ......UntersuchungvonInteraktiven Analyse-und VisualisierungsumgebungenimBrowser fürNetCDF-Daten —Masterarbeit— ArbeitsbereichWissenschaftlichesRechnen

Einführung in die Programmierung · • zum Vergleich berechnen wir die Differenz und vergleichen mit epsilon • zum Beispiel: ϵ = 10−14 = 1 1014 Übungsaufgabe - 5min 1. Schreiben

Analyse und Simulation von Geschäftsprozessen. Prof. Dr. Knut Hinkelmann 2 Analyse und Simulation von Geschäftsprozessen Analyse und Optimierung von Geschäftsprozessen.

Auf den Punkt gebracht: Tipps für Ihr Kommunikationskonzept€¦ · Strategien zur SWOT-Analyse 11 Hildesheimer Tag des Stiftungsmanagements 29.09.2016 SWOT- Analyse Interne Analyse

Projektarbeit - Analyse

Kommunikationskonzept: Analyse