Heiße Links und kalter Kaffee, Google-Bildersuche … · Mein SEO-Einstieg mit der Hommingberger...
Transcript of Heiße Links und kalter Kaffee, Google-Bildersuche … · Mein SEO-Einstieg mit der Hommingberger...
Heiße Links und kalter Kaffee, Google-Bildersuche aufgewärmt
Entwicklung der Google-Bildersuche
Bilder in Webseiten einbinden
Was sind Hotlinks und Bildkopien?
Hotlinks und Bildkopien finden
Was kann man gegen Hotlinks tun?
Entwicklung der Google-Bildersuche
Info-Grafik von Martin Mißfeldt zur „Chronologie der Google Bildersuche“ bis 2013
Mein SEO-Einstieg mit der Hommingberger Gepardenforelle (Mai 2005)
Erste Bilder bei Google Ende August
Meine Bilder Mitte September
Mitte Oktober Platz 2
Entwicklung der Google-Bildersuche
Mitte 2006 erste „Erfolge“
mit Babybel, Gurke und Salat
Bilder nur verlinkt,
Keyword im Dateiname
und Linktext
Ende 2006 Gurke auf Platz 2
März 2007 Gurke und Salat auf Platz 1
Entwicklung der Google-Bildersuche
Bildersuche war damals langsam, Bot-Lauf ca. alle zwei bis drei Monate
Ranking-Update nochmal zwei bis drei Monate später
Seit 2008 ca. alle 6 Wochen ein Bilder-Update
Info-Grafik von Martin zur „Google Bildersuche Update“
Heute kommen Bilder fast in Echtzeit in den Index
Man kann über die Webmaster-Tools etwas nachhelfen
Abruf wie durch Google -> [An den Index senden] für Seite mit den Bildern
Funktioniert technisch auch für Bilder selbst
Bringt laut John Müller von Google aber nichts bzw. ist nicht dafür gedacht
Entwicklung der Google-Bildersuche, Filter und Funktionen
Seit ich die Bildersuche kenne, gibt es ein Filter nach Bildgrößen
Anfangs nur vier Größenklassen (Extra groß, Groß, mittel, klein), später weitere
Klassen mit „größer als“ und freie Eingabe
Erster auf den Inhalt bezogener Filter: Typ
Typen: Clipart, Lineart, Fotos und Gesichter
Die ersten drei über globale Statistik (Histogramm)
„Gesicht“ ist da schon anspruchsvoller (Formen)
Entwicklung der Google-Bildersuche, Filter und Funktionen
Nächster auf den Inhalt bezogener Filter: Farben
12 Farben, „Farbig“ und „Schwarz/Weiß“ zur Auswahl
läßt sich einfach über globale Statistik (Histogramm) machen
Entwicklung der Google-Bildersuche, Filter und Funktionen
Erster Meilenstein bei inhaltsbezogenen Filtern: Ähnliche Bilder
Übereinstimmende Farben, Flächen und Konturen (Formen)
ohne Bezug zum Suchbegriff, nur Bildinhaltsbezogen
Merkmale erheben relativ einfach, speichern und vergleichen anspruchsvoll
Entwicklung der Google-Bildersuche, Filter und Funktionen
Später dann Einbeziehung des Suchbegriffs bei Ähnliche Bilder
Vorteil für Nutzer: Es werden besser passende Bilder angezeigt
Nachteil: Trefferliste wird stark eingeschränkt, sprachabhängige Ergebnisse
aktuell ist kein Suchbegriff mehr erforderlich, aber möglich
Entwicklung der Google-Bildersuche, Filter und Funktionen
Nächste Funktion: Weitere Größen
Größere Übereinstimmung, als bei „Ähnliche Bilder“
anfangs wenige, später viel mehr Treffer
gibt auch mal Fehler, die bei Bildern sofort offensichtlich sind
Entwicklung der Google-Bildersuche, Filter und Funktionen
Die Krönung: Suche mit Bild / Seiten mit übereinstimmenden Bildern
Weniger Übereinstimmung, findet auch Bildteile oder „Bild im Bild“
Funktioniert um so besser, je individueller ein Bild ist
Layout nicht wie Bildersuche, sondern normale Suche (Seitenweise blättern)
Beispiel: Zeitung
Möglickeiten, Bilder in Webseiten einzubinden
Testprojekt obst-bilder.de läuft seit Dezember 2013, Vorstellung SEO-Campixx 14
16 Bilder mit 16 Unterseiten, 10 sind in der Bildersuche zu finden
Neu seit September 2014, Birnen, externes Javascript
Obst Technik GB BS Bing Yanx Kontrolle Anmerkung
Äpfel Inline Image nein Nythiligua
Aprikosen Inline CSS relativ nein Staumipstert
Ananas Extern CSS relativ nein Plettfesarm
Bananen Inline Javascript relativ ja ja Dibbalrauham
Birnen Extern Javascript relativ ja ja Korztruapam
Clementinen Header og:image absolut ja ja ja Klanamtuma
Erdbeeren Link relativ ja ja ja ja Mirdhelpkogal
Kiwis Link von Startseite ja ja ja Haudalpaara Artikel existiert, nicht verlinkt, Strehlamgruffals
Kirschen Text-URL ja ja Nereschumi
Limetten Text-Dateiname nein Lunimalla
Orangen Iframe extern ja ja Ebfalsuma
Pflaumen Image relativ ja ja ja ja Schlahdirm longdesc, Kerentschu
Pfirsiche Iframe direkt ja ja Peochmeht
Physalis Iframe extern Inline Image nein Jodamkurscha
Weintrauben Header image_src + Inline Image ja ja ja Bflemzamertam
Zitronen Header image_src ja ja ja Wirdarumduam
Möglickeiten, Bilder in Webseiten einzubinden
Neues Testprojekt gemuese-bilder.de läuft seit Dezember 2014
15 Bilder mit 15 Unterseiten, 14 sind in der Bildersuche zu finden
als HTML5 picture mit großem und kleine Standardbild
als img und srcset mit großem und kleine Standardbild
als embed und object
als video poster
per Javascript als img, picture und „kompliziert“
als img, ohne und mit IPTC
in den Bildformaten webp, jpg, png
als Text-URL
<picture>
<source srcset='auberginen-800.jpg' media='(min-width:800px)'>
<source srcset='auberginen-700.jpg' media='(min-width:700px)'>
<source srcset='auberginen-600.jpg' media='(min-width:600px)'>
<source srcset='auberginen-500.jpg' media='(min-width:500px)'>
<source srcset='auberginen-400.jpg' media='(min-width:400px)'>
<source srcset='auberginen-300.jpg' media='(min-width:300px)'>
<source srcset='auberginen-200.jpg' media='(min-width:200px)'>
<source srcset='auberginen-100.jpg'>
<img src='auberginen.jpg' />
</picture>
Bilder einbinden, mit HTML5 <picture ... >
Aubergine kleines Standardbild (100x75), Blumenkohl großes (800x600)
Entsprechend kommen nur die Standardbilder in die Bildersuche
Google-Bot hat keines der anderen Bilder abgefragt
<img src='broccoli.jpg'
sizes='100vw‚
srcset='broccoli-800.jpg 800w, broccoli-700.jpg 700w, broccoli-600.jpg 600w,
broccoli-500.jpg 500w, broccoli-400.jpg 400w, broccoli-300.jpg 300w, broccoli-
200.jpg 200w, broccoli-100.jpg 100w' />
Bilder einbinden, mit <img srcset ... >
Broccoli kleines Standardbild (100x75), Champignons großes (800x600)
Entsprechend kommen nur die Standardbilder in die Bildersuche
Google-Bot hat keines der anderen Bilder abgefragt
der Yandex-Bot schon
<embed src='erbsen.jpg' width='100%' height='75%‚
type='image/jpeg' border='0' />
Bilder einbinden, mit <embed ... >
kein Problem für Google und für den Nutzer
<object data='gurken.jpg' width='100%' height='75%‚
type='image/jpeg' border='0'>Gurken</object>
Bilder einbinden, mit <object ... >
wird von Google ignoriert, für den Nutzer aber sichtbar
<video src='karotten.mp4' poster='karotten.jpg'>Karotten</video>
Bilder einbinden, mit HTML5 <video poster ... >
YouTube in der Bildersuche immer erfolgreicher
Platz 2 im Bidox (921), vor einem Jahr auf 9 (166), vor zwei Jahren auf 79 (26)
Ursachen: Javascript-Update, Abschied vom Flash-Player?
sinnvoll für den Nutzer der Bildersuche?
<img src='mangold-o.jpg' />
<img src='mangold-i.jpg' />
Bilder einbinden, mit und ohne IPTC-Daten
Beide Bilder im Google Index (QSkOG9iMFreACM:, l6QpiO_EIJ1wdM:)
Such nach Mangold, Site-Abfrage: ohne IPTC-Daten
Suche nach Kontroll-Wort: mit IPTC-Daten
<img src='tomaten.webp' />
<img src='tomaten.jpg' />
Bilder einbinden, Bildformate webp und jpg
Bilder haben etwa die selbe Dateigröße (37.642 bzw. 37.680 Bytes)
Beide Bilder im Google Index (b9kefaoh3hwEmM:, NAwXweIjnrFeXM:)
Such nach Kontroll-Wort, Site-Abfrage: JPEG-Bild (auch in Google-Chrome)
nur „Suche mit Bild“ zeigt WebP-Bild an
keine Unterstützung im Firefox für WebP-Format
<img src='zwiebeln.png' />
<img src='zwiebeln.jpg' />
Bilder einbinden, Bildformate png und jpg
PNG-Bild (409.969 Bytes) größer als JPEG-Bild (234.304 Bytes)
Beide Bilder im Google Index (b9kefaoh3hwEmM:, NAwXweIjnrFeXM:)
Suche nach Zwiebeln, Site-Abfrage: PNG-Bild
Suche nach Kontroll-Wort zeigt JPG-Bild an
Suche nach „weiteren Größen“ zeigt beide Bilder
Google bevorzugt PNG?
http://gemuese-bilder.de/paprika/paprika.jpg
Bilder einbinden, als Text-URL
Nur Text, kein Link
Bild wird zum Kontroll-Wort und mit der Site-Abfrage angezeigt
Beispiele aus dem „richtigen Leben“
Latte Macchiato
Bild als Quelle angegeben
Tomate
Meine Bilder-Testseite bilderu.de
Wird von Google wie echter Link gewertet
Bilder einbinden, Übersicht
alles außer „object“ funktioniert mit Google
JavaScript ist für Google kein Problem mehr
Bei „picture“ und „img srcset“ kommt nur das Standardbild in die Bildersuche
Texte-URLs werden wie Links gewertet
Google Crawalt keine Verzeichnisse aus URLs (Rosenkohl, Kiwis)
longdesc hat keine Bedeutung (Pflaumen)
Gemüse Technik GB BS Bing Yanx Kontrolle Anmerkung
Auberginen picture, img klein ja ja Istesuams
Blumenkohl picture, img groß ja ja Heobtechsa
Broccoli img srcset, img klein ja ja Prikkilu
Champignons img srcset, img groß ja 802 Lenallambulza
Erbsen embed ja ja Gertamerbse
Gemüse img ja 3 ja Kertiffal Startseite
Gurken object Treopamgurken
Karotten video, poster ja 108 Dildamgavöchsa
Kartoffeln Extern Javascript relativ ja ja Rasarwastiffa
Lauch Extern Javascript, picture ja ja Zvuapalstenn
Mangold img, ohne und mit IPTC ja 279 Hybikityl IPTC: Nemgildselet
Paprika Text-URL ja ja Ceyammabfaffars
Radieschen Extern Javascript, kompliziert ja 223 Hanusbhöra
Rosenkohl Link von Startseite ja ja ja Risamkihl Artikel existiert, nicht verlinkt, Echsalkmisbam
Tomaten Bildformate: webp, jpg ja ja Luapasebfal
Zwiebeln Bildformate: png, jpg ja 201 ja (2) Sinnarzwiebelm
Was sind Hotlinks und Bildkopien?
Die Verwendung von Bildern auf anderen Websites als die Bildquelle
Kopie
Website A kopiert ein Bild von Website B und nutzt es auf Webseite A
Domain von Seite (Referenz) und Bild stimmen überein
Hotlink
Website A nutzt ein Bild von Website B direkt
Domain von Seite (Referenz) und Bild stimmen nicht überein
Sichtbarkeit auf Website A
Bild sichtbar einbinden: img, iframe, video-poster, embed
Bild unsichtbar einbinden: Link, Text-URL, im Header og:image und image_src
Arten von Hotlinkern und Bildkopierern
Der Gelegenheits-Hotlinker/Kopierer aus Foren, Blogs und kleinen Websites
u.a. auch jappy.de, testedich.de, gutefrage.net, mydealz.de
Arten von Hotlinkern und Bildkopierern
Die professionellen Hotlinker/Kopierer, Hotlink-Farmen, Spamseiten
aktuell besonders .tk- und .xyz-Domains
auch blogspot.com
automatisch generierte „Inhalte“
Bilder teilweise versteckt
gaaanz viel Werbung
„seriöse“ Anbieter wie Personen-Suchmaschinen
z.B. vebidoo
längere Zeit auch Rezepte-Seiten
Hotlinks und Bildkopien finden
Hotlinks mit der Bildersuche finden: Suchparameter inurl: und site: kombinieren
Findet Bilder von Seite A, welche nicht auf Seite A zu sehen ist.
Bilder von Seite A finden, die von Seite B gehotlinkt bzw. gelinkt werden
Es ist auch mehrfach –site: bzw. site: möglich
Vereinfachung mit Formular und JavaScript
Testen bei schnurpsel.de
lokale Version möglich
inurl:http://seite-a.de -site:seite-a.de
inurl:http://seite-a.de site:seite-b.de
Hotlinks und Bildkopien finden
Mit Dienstleister wie z.B. Plaghunter von Marco Verch
Hotlinks durch Auswertung der Server-Logfiles finden (Referrer)
Selber Hotlinks und Kopien mit der Google-Bildersuche finden
Suche mit Bild / Seiten mit übereinstimmenden Bildern oder weitere Größen
Auswertung mit Bookmarklet
- JavaScript als Bookmark im Browser
- wird direkt auf aktueller Webseite ausgeführt
- Datenspeicherung in localStorage (Cookie-Nachfolger in HTML5)
Was kann man gegen Hotlinks tun? Präventive Maßnahmen
Keine Bilder im Web verwenden
Bilder als Inline-Image in Seite einbinden
Verhindern, daß Bilder über Google gefunden werden
- in robost.txt sperren
- im Seiten-Header robots/googlebot noindex, noimageindex
- Verzeichnis in den Google-Webmaster-Tools entfernen
Verhindern, daß Bilder genutzt werden
sichtbares Wasserzeichen im Bild
- hält möglicherweise von Nutzung ab
- je nach Text „Werbung in eigener Sache“
- hilft nicht gegen Hotlink-Farmen
Was kann man gegen Hotlinks tun? Präventive Maßnahmen
die „Hotlink-Sperre“ in der .htaccess
- hält möglicherweise von Nutzung ab
- je nach Text im Ersatzbild „Werbung in eigener Sache“
- hilft nicht gegen Hotlink-Farmen
meine aktuell verwendete
mit Blacklist nur bestimmte Domains/URLs auschließen
mit Whitelist nur eigene Seiten erlauben, wichtig: auch leeren Referrer zulassen
Ersatzbild oder einfach sperren (403, Zugriff verweigert)
Beispiel: mydealz.de
# Bilderdieb
RewriteCond %{HTTP_REFERER} ^https?://(([^\.]+?\.)?([^\.]+?\.)?[^\.]+?)/ [NC]
RewriteRule .* - [E=DOM_REFERER:%1]
RewriteCond %{REQUEST_FILENAME} -f
RewriteCond %{REQUEST_URI} !^/images/ersatzbild.png$
RewriteRule \.(jpg|gif|png)$ - [NC,C]
RewriteCond %{ENV:DOM_REFERER} \.tk$ [NC,OR]
RewriteCond %{ENV:DOM_REFERER} \.xyz$ [NC,OR]
RewriteCond %{ENV:DOM_REFERER} \.cf$ [NC,OR]
RewriteCond %{ENV:DOM_REFERER} mydealz\.de$ [NC,OR]
RewriteCond %{ENV:DOM_REFERER} example\.com
RewriteRule . /images/ersatzbild.png [T=image/png,L]
Bilder-Hotlink/-Kopie gefunden, und nun?
Was will ich erreichen?
Wie schnell will ich es erreichen?
Nutzung untersagen / mit Bedingungen erlauben (z.B. Backlink)
Webmaster kontaktieren, „im Guten“ einigen
ggf. rechtliche Schritte einleiten
Verhindern, daß die andere Website über Google gefunden wird
bei Hotlink-Farmen / Bilder-Spam -> Webspam-Bericht an Google
- Bearbeitung dauert lange
- Auswertung für algorithmische Verbesserung der Spam-Erkennung
- nur in Ausnahmefällen eine kurzfristige, manuelle Maßnahme
DMCA Beschwerde an Google
- Bearbeitung in 6 bis 10 Tagen
- wird ggf. abgelehnt, z.B. „Fair Use“ nach amerikanischen recht
- Beispiel für erfolgreiche Beschwerde: Frohes neues Jahr
Bilder-Hotlink/-Kopie gefunden, und nun?
Frohes Neues Jahr 2016, mein Spamabwehr-Test
Bild kopieren und mit neuem Namen in eigene Seite einbinden
Bild und gänderte Seite in den GWT an Index senden
Bildkopie wird relativ schnell erkannt
Altes, verhotlinktes Bild in den GWT entfernen (dauert ca. 2 bis 4 Stunden)
im günstigsten Fall rankt dann das kopierte Bild und die eigene Seite
Bilder-Hotlink/-Kopie gefunden, und nun?
Bilderspam-Abwehr vorbereiten
Kopien unter mehreren Namen in Webseite einbinden, damit Google sie „kennt“
Ich verwende virtuelle Kopien per .htaccess
Skript-unterstütze Konfiguration und .htaccess-Erstellung bei bilder.de
Frohe Ostern 2016