In seinem SEO Artikel „Ranking-Faktoren 2018: Nischengenaue Analysen statt allgemeiner Aussagen“ hat Marcus Tober, CTO von Searchmetrics einen interessanten Artikel über verschiedene branchenspezielle SEO Variablen und deren Ranking Potential publiziert. „Mithilfe dieser Granularisierung konnten viel aussagekräftigere Werte gewonnen werden, die den wirklichen Einfluss auf das Ranking in einzelnen Branchen beschreiben.“, so der CEO.
In einem sich anschliessenden thread diskutieren Jan Grundmann, Content Marketing Manager bei Searchmetrics und ich, inwieweit prozentuale Verteilungen wie die in der Analyse vorliegenden Form – beispielsweise die der Variablen Browserladegeschwindigkeit und Wortanzahl – erweitert werden können, um noch genauere Aussagen über die analysierten Ranking Signale abzuleiten.
Die Basis der Analyse ist der Kommentar von Gary Illyes, Web-Trends Analyst bei Google, in Bezug auf die Top 3-Ranking-Faktoren „It much depends on the query and the results which signals count more“, so Gary Illyes“.
Im folgenden Artikel wird versucht, den Artikel von Marcus Tober zu erweitern und noch tiefer herauszukristallisieren, was „It much depends on the query and the results which signals count more“ bedeutet.

Background

Definition Korrelationskoeffizient

Der Korrelationskoeffizient ist ein Maß für den Grad eines (linearen) Zusammenhangs zwischen zwei Merkmalen. Der Koeffizient kann Werte zwischen -1 und 1 annehmen.

Beispiel:
Merkmal 1 = Rankingposition bei Google
Merkmal 2 = Ladegeschwindigkeit der rankenden Webpage.
Liegt ein positiver Zusammenhang vor (Beispiel: hohe Ladezeiten = mögliche hohe (also schlechte) Google Position), so ist der Wert größer als Null. Liegt ein negativer Zusammenhang vor (Beispiel: hohe Wortanzahl = wahrscheinliche, niedrige (also gute) Google Position), so ist der Wert kleiner als Null. Liegt kein Zusammenhang vor (Beispiel = Merkmal beeinflusst das Ranking wahrscheihnlich nicht), so ist der Wert Null.
Anlehnend an den SEO Artikel von Marcus Tober werden beispielhaft für die Branche Tourismus folgende Merkmale ausgesucht und deren query bezogene Korrelation untersucht:

1. Ladezeit der rankenden Webpage
2. Anzahl der Wörter auf der rankenden Webpage
3. Rankingposition der Webpage

Query: „reise buchen online“
Die searchmetrics essentials research cloud listet folgende pages als Top Ten platziert auf. Daneben befinden sich die jeweiligen Seitenladezeiten (fully loaded, Quelle: webpagetest.org, Serverstandort Deutschland, Kabelgeschwindigkeit für Desktop) und die Wortanzahl (Quelle: https://wordcounter.net/website-word-count)

Top Ten pages

Platz 1: https://www.expedia.de 23, 3090

Platz 2: https://www.holidaycheck.de/wo/reise-angebote 16, 2052

Platz 3: https://www.weg.de/ 31, 614

Platz 4: www.travel24.com/ 7, 1876

Platz 5: https://www.fti.de/reiseangebote/guenstig-reisen.html 17, 6247

Platz 6: https://www.opodo.de/ 104, 5592

Platz 7: https://online-reisesuche.de/ 8, 3592

Platz 8: https://www.thomascook.de/ 26, 2395

Platz 9: https://www.neckermann-reisen.de/ 19, 1967

Platz 10: www.lastminute.de/ 20, 1216

Frage (A): Besteht ein möglicher Zusammenhang zwischen Ladezeit und dem Ranking im Umfeld des queries „reise buchen online“?

Wir tragen die Wertepaare in eine Tabelle ein, bestimmen den Korrelationskoeffizienten und lassen Graphen von Excel zeichnen. Wie in dem unten stehenden Graph zu sehen ist, exisitiert eine schwache lineare Korrelation zwischen dem Merkmal Position und Ladegeschwindigkeit, was durch den minimalen positiven Anstieg der durchgezeichneten Trendlinie angezeigt wird. Die Relevanz ist jedoch relativ gering, da der Korrelationskoeffizient einen geringen Wert von 0.038331 aufweist (Quelle: Excel).

Ableitungshypothese (A): Ladegeschwindigkeiten scheinen für das query „reise buchen online“ keinen großen Einfluss auf die Rankingposition zu haben.

Frage (B): Besteht ein möglicher Zusammenhang zwischen dem Merkmal Wortanzahl und dem Merkmal Rankingposition?

Wieder tragen wir die Wertepaare in eine Tabelle ein, bestimmen den Korrelationskoeffizienten und lassen Graphen von Excel zeichnen:

Der leicht absteigende Graph signalisiert, dass Seiten mit einer geringeren Wortanzahl einen schlechteren rang bei Google einnehmen. Auch hier ist jedoch die Relevanz mit einem Korrelationskoeffizienten von -0,0409 nicht besonders stark ausgeprägt.
Eine Gegenüberstellung von Rankingposition und Wortanzahl für ein anderes query für die gleichen urls liefert jedoch Überraschendes und Hinweis darauf, was Gary Illyes mit „It much depends on the query and the results which signals count more“ meint.

Frage (C): Besteht der gleiche mögliche Zusammenhang zwischen dem Merkmal Wortanzahl und dem Merkmal Rankingposition beim query „reise buchen online“?

Searchmetrics liefert für das query folgende Rankingverteilung (die Zahl hinter den jeweiligen urls steht für den Rankingplatz):

https://www.expedia.de, 9

https://www.holidaycheck.de/wo/reise-angebote, 4

https://www.weg.de/, 2

www.travel24.com/, 8

https://www.fti.de/reiseangebote/guenstig-reisen.html, kein Top Ten ranking

https://www.opodo.de/, 10

https://online-reisesuche.de/, kein Top Ten ranking

https://www.thomascook.de/, 5

https://www.neckermann-reisen.de/, 21

www.lastminute.de/, 7

Wieder tragen wir die Wertepaare in eine Tabelle ein, bestimmen den Korrelationskoeffizienten und lassen Graphen von Excel zeichnen:

Hier ergibt sich nun ein äußerst unerwartetes Bild. Der positiv ansteigende Graph signalisiert: Je höher die Wortanzahl, desto höher der Rankingplatz. Ein hoher Rankingplatz bedeutet jedoch ein schlechteres ranken. Im Umfeld des queries „urlaub buchen online“ führen also pages mit einer höheren Anzahl von Wörtern zum schlechteren ranken! Darüber hinaus ist der Zusammenhang sogar sehr viel stärker relevant, als der Zusammenhang mit der Ladezeit, da der Korrelationskoeffizient mit 0,243316 sechsmal so groß, wie der Korrelationskoeffizient für das query „reise buchen online“. Wer bis hierhin durchgehalten hat, erahnt nun, was Gary Illyes mit „It much depends on the query and the results which signals count more“ meint. Augenscheinlich können gleiche potentielle Rankingsignale für unterschiedlich queries für gleiche Seiten eine unterschiedliche Relevanz haben.

Abschliessend sei noch darauf hingewiesen (danke Jan Grundmann), dass durch die Kausalzusammenhänge, die durch die oben beschriebenen Korrelationskoeffizienten offensichtlich zu beobachten sind, nicht darauf geschlossenen werden kann, dass es bei einer Umsetzung auch tatsächlich zu einer Rankingverbesserung kommt. Es kann lediglich festgehalten werden, dass die Zusammenhänge bei den untersuchten Seiten und Merkmalen bestehen.