Technologische Neuigkeiten, Bewertungen und Tipps!

So analysieren Sie die SERPs mit NLP

Hinweis: Der folgende Artikel hilft Ihnen weiter: So analysieren Sie die SERPs mit NLP

In diesem Video erfahren wir, wie wir mit ein wenig Hilfe von NLP aussagekräftige Informationen aus den Suchmaschinen aufdecken können. Wenn Sie keinen technischen Hintergrund haben, machen Sie sich keine Sorgen! Ich führe Sie Schritt für Schritt durch den Prozess und habe ein kostenloses Tool für Sie, um es ganz einfach zu machen.

Ressourcen:

Videotranskript:

Wie ich eingangs sagte, werden wir uns mit der Verarbeitung natürlicher Sprache befassen und wie wir diese nutzen können, um die Ergebnisseite einer Suchmaschine besser zu verstehen. Nun, Sie haben vielleicht keinen Hintergrund in Informatik oder Python oder dergleichen, aber es ist absolut cool. Wir führen Sie Schritt für Schritt durch. Wir haben sogar eine Colab-Datei, in der Sie eigentlich nur Ihr Schlüsselwort hinzufügen und ein paar Tasten drücken müssen, um eine Menge wirklich aussagekräftiger Informationen zu extrahieren. Bevor wir uns mit der eigentlichen Arbeit befassen, die wir in diesem Video durchführen werden, möchte ich noch einmal kurz darauf eingehen.

Entitäten verstehen

Wir haben ein ganzes Video dazu gemacht, und ich werde auf dieses Video über Entitäten verlinken. Aber in diesem Video werden wir genau das mithilfe des NLP-Modells von spaCy extrahieren. Eine Entität, eine Sache oder ein Konzept. Es ist einzigartig. Es ist einzigartig. Es ist klar definiert und unterscheidbar. Entitäten sind das, was Google betrachtet, wenn es versucht, Konzepte zu verstehen. Sie verstehen Entitäten. Entitäten haben offene Datenpunkte verknüpft. Sie verfügen über Knoten, die sie mit anderen Entitäten verbinden. So gewinnt Google die Bedeutung unseres Textes. So verstehen sie unseren Text. Dies ist nun die Grundlage und die Bausteine ​​unseres Wissensgraphen. Ein Wissensgraph ist eine Ansammlung miteinander verbundener Einheiten. Im SEO-Bereich wissen wir um die Macht der Verlinkung. Die Verlinkung sowohl von Seiten außerhalb unserer Website als auch von der Website, die intern verlinkt, ist äußerst wichtig.

Nutzen Sie Google Colab

Durch das Extrahieren dieser Entitäten erhalten wir eine bessere Vorstellung von den Konzepten, die Google bei der Darstellung von Suchergebnissen berücksichtigt. Wir gehen eine Google Colab-Datei durch und ich zeige Ihnen, wie Sie Google Colab nutzen können, auch wenn Sie kein Programmierer sind. Ich bin kein Programmierer, aber ich kann ziemlich gut kopieren und einfügen und im Internet nach Lösungen für einige Probleme suchen. Durch eine Reihe verschiedener Ressourcen und Verbindungen konnte ich einige dieser Tools intern entwickeln, die uns wirklich einen Vorteil verschaffen und es uns ermöglichen, zu sehen, was unter den Suchergebnissen passiert. Bevor wir angefangen haben, wollte ich das ganz schnell besprechen. Um mehr über Entitäten zu erfahren, schauen Sie sich bitte das verlinkte Video an. Alles klar, hier sind wir in Google Colab. Jetzt ist Google Colab ein Arbeitsbereich, den Sie zum Erstellen von Software oder Tools nutzen können.

Nutzung von Python

In diesem Fall werden wir Python nutzen. Wenn Sie keine Python-Kenntnisse haben, ist das völlig in Ordnung. Ich gebe Ihnen Zugriff auf diese Colab-Datei, von der Sie eine Kopie erstellen und in Ihrer eigenen Google Colab-Datei herumspielen können. Es ist völlig kostenlos, das zu tun. Python ist eine Programmiersprache. Wenn Sie Websites erstellt oder irgendetwas in dieser Welt getan haben, könnten Sie sich wahrscheinlich mit Python auskennen. Ich lerne immer noch Python. Ich bin keineswegs ein Programmierer. Ich behaupte nicht einmal, einer zu sein. Ich bin gut im Kopieren und Einfügen, wie ich bereits sagte. In dieser Colab-Datei werden wir einige Dinge tun. Wir fangen damit an, die Ergebnisse von Google zu erhalten, und dann werden wir die Ergebnisse durchsuchen, alle Daten und eigentlich den Inhalt aus den Top-Ergebnissen abrufen. Dann analysieren wir diesen Inhalt und extrahieren die aussagekräftigsten Texte, die aussagekräftigsten Begriffe und Konzepte.

Extrahieren Sie Entitäten aus den Top-Fünf-Seiten

Nachdem wir damit fertig sind, werden wir uns weiter mit NLP befassen, Entitäten aus unseren Top-5-Seiten extrahieren und das Ergebnis visualisieren. Von dort aus können wir diese Daten dann verwenden, um unsere Inhalte und andere Dinge zu informieren. Um es allen einfacher zu machen, werde ich hier ein wenig hineinzoomen. Das ist wahrscheinlich etwas zu weit. Das erste, was wir tun müssen, ist, diese Zellen laufen zu lassen. Sie müssen sich hier um keinen Code kümmern. Wenn Sie Python kennen und es manipulieren möchten, fahren Sie fort. Aber eigentlich fangen wir an, indem wir einfach auf diese Spielsymbole klicken.

Es werden die notwendigen Bibliotheken installiert und alle Tools bereitgestellt, die wir dazu benötigen. Wir werden diese durchgehen. Hier installieren wir gerade Google und Trafilatura, was uns beim Scrapen hilft, und Google hilft uns beim Abrufen der Informationen. Dann haben wir hier einige ziemlich normale Python-Importe mit Pandas, NumPy, Pretty Print und solchen Dingen. Als nächstes werden wir die Dinge installieren, die die meiste Arbeit machen werden, und das sind die Transformatoren. Die Transformatoren ermöglichen es uns, SERP-Analysen durchzuführen, die SERPs zusammenzufassen, Fragen und Antworten zu erhalten und den Inhalt aus dem Web zu extrahieren. Hier kommt das Kraftpaket mit TensorFlow und Transformatoren ins Spiel. Auch hier muss man nicht viel darüber wissen, aber genau das bewirken diese Dinge. Hier haben wir gerade einiges zu tun mit Abfragen und dergleichen. Dadurch wird die Abfrage abgerufen. Es geht darum, welche Ergebnisse wir erzielen wollen.

Hier gibt es etwas mehr Input und Sie können bei Interesse die gesamte Dokumentation lesen, aber wir haben es super einfach gemacht. Eigentlich müssen Sie nur auf diese Seite gehen und Ihre Anfrage eingeben. Zum Beispiel können wir hier alles einfügen, was wir wollen, und der Freude halber werden wir hier einfach semantisches SEO einfügen. Sobald Sie das getan haben, führen Sie nun diese Abfrage aus. Das erscheint jetzt und ruft die Top-10-Ergebnisse von Google ab. Hier sind sie. Dies sind die Top-10-Ergebnisse von Google. Ziemlich einfach, oder? Jetzt müssen wir die Ergebnisse zusammenfassen. Nun, Trafilatura wird, wie ich schon sagte, auf diese Seiten oben gehen und den gesamten Inhalt für uns aussortieren und ihn in einem riesigen Textkorpus zusammenfassen.

Dies manuell durchzuführen, würde viel Zeit in Anspruch nehmen. Zum Glück kann man das dank der Informatik, Python, Codes wie diesem und diesen Paketen, die die Leute erstellt haben, relativ schnell erledigen. Drücken Sie den Knopf und los geht’s zu den Rennen. Das wird natürlich einige Zeit dauern, denn es wird veröffentlicht und alle diese Websites durchsucht, alle Texte abgerufen, und los geht’s. Die 10 Artikel sind abgerufen und wir können loslegen.

Analysieren Sie die Informationen

Der nächste Schritt besteht darin, es tatsächlich zu analysieren. Wir wollen den Text sehen. Wir werden es in diesem Fall in einem Scattertext sehen, der es uns ermöglicht, dies auf einer HTML-Karte darzustellen und uns dabei hilft, die Bedeutung verschiedener Begriffe basierend auf der Rangfolge zu erkennen. Auch hier müssen wir nichts Besonderes tun. Wir müssen nur den Play-Button drücken und schon wird es losgehen. Beachten Sie hier, dass wir bereits mit der Verwendung von spaCy begonnen haben. SpaCy übernimmt das NLP für uns. Wir haben all diese Daten und sie befinden sich tatsächlich in einem sogenannten Datenrahmen, in dem sie gespeichert werden. Jetzt teilen wir diesen Datenrahmen auf. Wir werden also eine Seite der Ergebnisse haben, die die ersten drei sein wird, und die andere Seite, die die ersten vier bis zehn sein wird.

Nachdem wir das ausgeführt und die Ergebnisse gruppiert haben, ist es nun an der Zeit, unsere Visualisierung zu erstellen. Das ist, wie gesagt, hilfreich, um zu sehen, welche Texte und Themen in den Top-10-Ergebnissen am wichtigsten sind, aber die Aufteilung in die wichtigsten unter den ersten drei und die wichtigsten zwischen den Positionen vier bis zehn. Das kann dauern einige Zeit, nur abhängig von der gesamten Visualisierung, allen Daten, die gescrapt werden. Aber sobald es fertig ist, ist es ziemlich, ziemlich, ziemlich cool, was man machen kann. Alles klar, hier sind wir. Auf der rechten Seite sehen Sie die ersten drei und dort werden uns die aussagekräftigsten Begriffe angezeigt. Dann sehen wir hier unten die Positionen vier bis zehn und es werden uns die aussagekräftigsten Begriffe angezeigt. Dann erhalten Sie Merkmale für das gesamte Korpus.

Hier sehen wir Begriffe auf einer Achse. Diese Achse hier, die untere, ist selten. Top ist häufig. 4 bis 10, niedriger ist selten. Hier ist der Weg ganz nach rechts häufig. Sie werden feststellen, dass hier in den Top 3 einige Begriffe verwendet werden, die auf den übrigen Websites nicht verwendet werden: Ziel-Keyword-Phrase, Zielphrase, Schlüsselwort, breiteres Thema, semantische Ausrichtung. Dies sind einige interessante Begriffe, die auf den anderen Seiten nicht so oft verwendet werden. Wenn Sie darauf klicken, ist das wirklich cool: Es zeigt uns tatsächlich, wie häufig diese Begriffe vorkommen. In den Top 10 von 25.000 Begriffen wurde dieser Begriff semantisch 206 Mal referenziert. Aber als wir uns die vier bis zehn und die 25.000 wichtigsten Begriffe ansahen, wurde darauf nur 17 Mal verwiesen.

Dies korreliert hier stark mit den Top-3-Ergebnissen. Wenn Sie Inhalte schreiben, sollten Sie darüber nachdenken, was dieser Begriff bedeutet. Hier oben ist es das, worüber alle reden: Inhalt, semantische Suche, Ergebnisse, Daten, Abfrage, Seite, SEO, Ranking. All dies steht in einem relativen Zusammenhang sowohl mit eins bis drei als auch mit vier bis 10. Wenn wir hier nach unten gehen, handelt es sich um Begriffe, die in den Bereichen vier bis 10 etwas häufiger verwendet werden, in den ersten drei jedoch nicht so häufig .

Nehmen wir an, Sie stehen beim Erstellen von Inhalten vielleicht auf Platz sieben. Wie kann ich weitere dieser Begriffe einarbeiten? Zähle oder überdecke ich diese Begriffe hier auch? Dadurch kann ich auch sehen, wie diese erwähnt und formuliert werden. Wir kopieren und fügen nicht ein, aber wir können damit beeinflussen, was wir beim Erstellen von Inhalten erstellen müssen. Nehmen wir an, Sie haben versucht, hierfür Inhalte zu erstellen. Sie können hier in diesem kleinen Korpus, den wir erstellt haben, Schema.org, viele gute Informationen zu den für Sie wichtigen Begriffen erhalten. Sie können alles sehen, was wichtig ist. Wenn wir nun weiter nach unten gehen, wird hier tatsächlich eine Möglichkeit geschaffen, die wichtigsten 25 Begriffe zu extrahieren. Sie können diese Zelle anklicken und sie wird tatsächlich aufgebaut. Sie können die 25 häufigsten Begriffe kopieren und einfügen und sehen, wie häufig sie in den ersten drei oder vier bis zehn verwendet werden.

NLP in SEO

Heutzutage gibt es in der SEO-Welt viele Tools, die dies ermöglichen. NLP wird im SEO-Bereich immer häufiger eingesetzt. Frase.io ist ein erstaunliches Tool zur Inhaltsoptimierung. Wir werden dazu ein Video machen. Es ist ein Werkzeug, das wir ständig nutzen. Sie extrahieren tatsächlich viele Themen, was es einfach macht. Aber wenn Sie gerade erst anfangen und vielleicht kein Tool kaufen möchten, ist Python eine großartige Möglichkeit, einige dieser Tools selbst zu erstellen und sie auch an Ihre spezifischen Verwendungszwecke und Bedürfnisse anzupassen. Wie Sie sehen, haben wir bei der Suche bisher die Top 10 gelistet. Wir haben jede Menge Informationen über den verwendeten Text und wie er verwendet wird, und dann haben wir auch eine Liste der 25 häufigsten Begriffe.

Einige davon sind relevant, andere möglicherweise nicht. Ich frage mich vielleicht: Ist das wirklich relevant? Wahrscheinlich nicht. Nehmen Sie es also mit Vorsicht. Das ist nicht perfekt. Wenn wir diese Dinge in dieser Welt tun, müssen wir sie nur betrachten und dann die Bedeutung herausarbeiten, die für uns Sinn macht. Wenn das Sinn macht, dann ja, nutzen wir es. Wenn nicht, werfen wir es weg. Lassen Sie uns nun etwas mehr natürliche Sprachverarbeitung durchführen. Als nächstes werden wir uns dem Extrahieren von Entitäten zuwenden. Eigentlich nehme ich hier nur die fünf besten Ergebnisse und schränke sie etwas weiter ein. Auf diese Weise werden wir nicht mit Daten überlastet und ziehen dann den Inhalt aus den fünf besten Ergebnissen. Das haben wir schon früher gemacht, aber dieses Mal zerschlagen wir es und machen einen kleineren Korpus. Hier sind all die lustigen Inhalte.

Jetzt extrahieren wir die Entitäten. Hier kommt spaCy ins Spiel. SpaCy macht NLP relativ einfach. Das kannst du dir doch einfach ansehen. Ich werde auch einen Link zur spaCy-Site setzen. Auch wenn Sie neu bei NLP oder Python sind, finden Sie auf ihrer Website auch tolle Materialien, die Ihnen dabei helfen können, zu erklären, was es ist und was es tut, und Ihnen auch etwas Übung geben können. Wir drücken den Play-Button und spaCy macht sich für uns auf den Weg zu den Rennen. Es betrachtet den gesamten Inhalt hier und extrahiert ihn. Was es tut, ist, den gesamten Inhalt im gesamten Inhalt zu betrachten, was hier oben der Fall ist, und es werden sowohl die Entitäten als auch die Typen extrahieren. Dies wird uns bei der Organisation helfen.

Mach es sauber

Als nächstes werden wir es aufräumen. Wir werden Duplikate entfernen, da wir in diesem Fall die Duplikate nicht sehen müssen. Wir wollen nur die Entitäten selbst sehen. Dann visualisiere ich die Daten gerne. Es kann unser Leben viel einfacher machen. Dies ist ein Tool namens Plotly oder ein Plugin namens Plotly. Dann machen wir weiter und führen das durch. Sie können sehen, dass es nach verschiedenen Arten von Entitäten aufgeschlüsselt wird. Wir haben Zahlen, wir haben Menschen, Datum, Organisationen, Geld, Ereignisse, Kardinalität, Produkt. Das Coole daran ist wiederum, dass man tatsächlich hineinzoomen kann. Auch hier wird es nicht perfekt sein, denn wie bei Google ist Bing keine Person. BERT ist keine Person. Sie möchten also dort hineingehen und spaCy verfeinern, viel mehr lernen und lernen, wie man es verfeinert.

Für sich genommen leistet es ziemlich gute Arbeit, aber wie Sie sehen, ist BERT eine wichtige Einheit, ebenso wie Bing, Google und Bing. Die Frage „ABFRAGE“ ist wichtig. Hier wird Quora angezeigt. Sie können immer weiter gehen. Schauen Sie sich die verschiedenen Termine an. Schauen Sie sich die Organisationen an, die dieser Suchverbindung angeschlossen sind Twitter. Wir haben Algorithmen drin Apple und all die anderen lustigen Sachen. Sie können die verschiedenen Konzepte, die hier verwendet werden, direkt in den Suchergebnissen erkunden und sehen. Sobald Sie fertig sind, können Sie alle diese Informationen für sich selbst speichern. Sie können es durchgehen und damit beginnen, Inhalte für die Suchmaschinen und für Sie selbst zu erstellen. Dann können Sie damit beginnen, bessere Inhalte für die Suchmaschinen zu erstellen und gleichzeitig die Erwartungen Ihrer Benutzer zu erfüllen.

Um Ihre Steuer zu markieren und zusätzliche Strukturdaten hinzuzufügen, gibt es verschiedene Möglichkeiten. Wir haben in mehreren unserer Videos darüber gesprochen. Wir haben auch einige Kurse, an denen Sie teilnehmen können, um zu lernen, wie das geht, auf vereinfachtsearch.net, und wir werden diese Links hier veröffentlichen. Wir haben auch über Tools wie WordLift gesprochen, die Ihnen dies ebenfalls ermöglichen und dabei helfen, dies zu automatisieren. Aber die Durchführung einer SERP-Analyse ist wirklich sehr, sehr cool, weil sie Ihnen ermöglicht, darunter zu sehen. Dabei handelt es sich um die Daten innerhalb der Strukturebene, die Sie besser sichtbar machen und die Ihnen beim Aufbau einer SEO-Strategie als Orientierungshilfe dienen können. Lassen Sie mich wissen, wenn Sie Fragen haben. Ich weiß, dass es dieses Mal etwas technischer ist, aber ehrlich gesagt, wenn Sie eine Kopie dieser Colab-Datei erstellen, drücken Sie einfach die Wiedergabetaste und machen mit. Ich denke, Sie werden einige wirklich interessante Erkenntnisse finden. Bitte kommentieren Sie unten. Ich würde gerne hören, was Sie denken. Bis zum nächsten Mal, viel Spaß beim Marketing.