Technologische Neuigkeiten, Bewertungen und Tipps!

Interview: Die Wissenschaft hinter Brandwatch Search mit Aykut Firat

Hinweis: Der folgende Artikel hilft Ihnen dabei: Interview: Die Wissenschaft hinter Brandwatch Search mit Aykut Firat

Die Suche, die neueste Funktion von Brandwatch, bietet einige ziemlich beeindruckende Funktionen.

Genau wie bei einer Google-Suche können Benutzer beginnen, die Entität einzugeben, nach der sie suchen möchten (sei es eine Marke, eine Person, ein Ereignis usw.), und Brandwatch schlägt automatisch potenzielle Suchanfragen vor.

Ich war fasziniert, als ich es zum ersten Mal ausprobierte. Als jemand, der Hunderte von Stunden damit verbracht hat, Anfragen zu schreiben, konnte ich sofort erkennen, wie viel Zeit ich und unsere Kunden dadurch sparen würden.

Ich wollte mehr über die Wissenschaft hinter diesem großartigen Update erfahren und habe deshalb mit den Köpfen dahinter gesprochen: Brandwatch Chief Data Scientist Aykut Firat. Hier ist unsere Diskussion:

Beginnen wir mit dir, Aykut, was ist dein Hintergrund?

Ich bin derzeit Chief Data Scientist bei Brandwatch. Ich bearbeite NLP- und Bildverarbeitungsprobleme mithilfe von Deep-Learning-Techniken. Zuvor habe ich bei Start-ups gearbeitet, die sich auf intelligente Informationsintegration, evolutionäre Berechnungen und KI konzentrierten – darunter eines, das ich zusammen mit meinem Berater während meiner Doktorarbeit am MIT gegründet habe.

Die Suche verwendet etwas, das als Entitätsdisambiguierung bezeichnet wird. Was ist es?

Entitätsdisambiguierung extrahiert Entitäten im Text und verknüpft sie mit Entitäten in einer eindeutigen Wissensdatenbank. In unserem Fall ist diese Wissensdatenbank Wikipedia.

Im Wesentlichen ermöglicht es uns, die Milliarden verschiedener Gespräche, die online stattfinden, zu verstehen und sie in Einheiten zu gruppieren. Eine Entität kann übrigens alles sein, von einer Marke, einer Person oder einem Ereignis bis hin zu einem breiten Thema wie Radfahren oder Cybersicherheit.

Welches Problem löst die Entitätsdisambiguierung?

Die Suche nach mehrdeutigen Konzepten in Brandwatch ist schwierig. Wenn Sie suchen Apple Wenn Sie mit dem Unternehmen interagieren, erhalten Sie möglicherweise auch unerwünschte Ergebnisse, wie zum Beispiel zum Thema Apfelkuchen. Mit der Entitätsdisambiguierung erfassen wir nur die von Ihnen gewünschten Entitäten, indem wir unerwünschte Ergebnisse reduzieren oder eliminieren.

Und wie funktioniert die Entitätsdisambiguierung eigentlich?

Aus Benutzersicht ist es so einfach, die gewünschte Entität aus einer Liste auszuwählen und schon erhalten Sie die Ergebnisse.

Technisch gesehen besteht es für uns aus vier Hauptkomponenten:

    Extrahieren Sie die Wörter und Phrasen, die auf Entitäten in Texteinheiten verweisen können. Verknüpfen Sie diese Wörter und Phrasen mithilfe des Kontexts des Textes mit Features. Ordnen Sie Entitäten aus einer Wissensdatenbank kontextbezogenen Features zu. Und ordnen Sie sie einer Suche zu

Könnten Sie ein Beispiel dafür in Aktion geben?

Betrachten Sie diese Erwähnung:

Wir identifizieren Blackberry und Apple als interessante Wörter, die auf Entitäten in Wikipedia verweisen. Für einen Menschen geben „Sicherheit“ und „Benutzererfahrung“ Hinweise auf den Kontext dieser Aussage.

In ähnlicher Weise extrahiert unsere zum Patent angemeldete, KI-basierte Begriffsklärungsmaschine automatisch Bedeutungen, die über das hinausgehen, was im gegebenen Text erscheint. So erkennt unsere KI, dass das Wort „Slam Dunk“ mit „Michael Jordan“ verbunden ist, auch wenn die beiden Begriffe nicht im selben Beitrag erwähnt werden.

Wenn Sie suchen Apple das Unternehmen, bzw Apple Die Telefon-, gespeicherten Entitäts- und Eingabetextfunktionen stimmen höchstwahrscheinlich überein und der obige Text wird als Ergebnis zurückgegeben.

Sie könnten also argumentieren, dass es sich um eine Verbesserung gegenüber dem normalen Schreiben von Abfragen handelt?

Beim normalen Schreiben von Abfragen versuchen Sie oft, Kontext mit zusätzlichen Begriffen wie (Telefon ODER iPhone ODER Mac ODER …) hinzuzufügen. Dieser Prozess ist sehr schwierig, unvollständig und manchmal unmöglich.

Beispielsweise kann eine gebräuchliche Präposition wie „zu“ oder ein Possessiv „mein“ zwischen den Entitäten „Ort“ und „Auto“ unterscheiden, wie in „Ich fahre gerne nach Malibu“ und „Ich fahre gerne meinen Malibu“. Den meisten von uns fällt es schwer, beim Schreiben einer Suchanfrage solche Begriffe einzubeziehen, aber bei der Suche übernimmt die intelligente KI das für Sie.

In vielen Fällen stellt dies eine große Verbesserung gegenüber dem normalen Schreiben von Abfragen dar, da im Vergleich zu einer von Menschen erstellten Abfrage wahrscheinlich mehr Elemente und eine genauere Übereinstimmung gefunden werden.

Was sollten Benutzer bei der Verwendung der Suche beachten?

Es gibt einige Dinge, die Benutzer beachten sollten. Die Suche ist eine brandneue Innovation von Brandwatch, an der noch gearbeitet wird. Das bedeutet, dass Sie in naher Zukunft mit einer Reihe von Updates rechnen sollten, aber auch nicht damit rechnen müssen, dass es sofort perfekt ist. Die Suche funktioniert für einige Entitäten besser als für andere.

Wenn beispielsweise zwei ähnliche Marken mit demselben Wort bezeichnet werden, macht das System möglicherweise mehr Fehler. Wenn die Kontexte konkurrierender Bedeutungen weiter voneinander entfernt sind, sind die Ergebnisse genauer. Es ist auch wichtig zu beachten, dass die Entitätsdisambiguierung der Suche ab heute auf der englischen Sprache basiert.

Und schließlich: Wie geht es mit der Suche weiter?

Wir arbeiten hart daran, Updates bereitzustellen. Zu den großen Dingen, mit denen wir uns derzeit befassen, gehört die Einführung der Begriffsklärung für Entitäten in mehr Sprachen als Englisch.

Vielen Dank an Aykut, dass er sich die Zeit genommen hat, mit dem Blog-Team zu sprechen.

Wenn Sie Search selbst ausprobieren möchten, klicken Sie hier, um eine Demo anzufordern. Wenn Sie bereits Kunde sind, ist der Zugriff auf die Suche jetzt ohne zusätzliche Kosten verfügbar.