Technologische Neuigkeiten, Bewertungen und Tipps!

Identifizieren von Entitätsattributbeziehungen – Go Fish Digital

Hinweis: Der folgende Artikel hilft Ihnen weiter: Identifizieren von Entitätsattributbeziehungen – Go Fish Digital

Strukturierte Daten können dabei helfen, Attributbeziehungen besser zu identifizieren

Die Identifizierung von Attribut-Entitätsbeziehungen erfolgt in strukturierten Suchergebnissen.

Strukturierte Suchergebnisse Präsentieren Sie eine Liste von Attributen mit Antworten für eine in einer Benutzeranfrage angegebene Entität, z. B. eine Abfrage.

Daher können die strukturierten Suchergebnisse für „Kevin Durant“ Attribute wie Gehalt, Team, Geburtsjahr, Familie usw. sowie Antworten enthalten, die Informationen zu diesen Attributen liefern.

Die Erstellung solcher strukturierter Suchergebnisse kann die Identifizierung von Entitäts-Attribut-Beziehungen erfordern.

Eine Entitäts-Attribut-Beziehung ist ein besonderer Fall einer Textbeziehung zwischen einem Begriffspaar.

Der erste Begriff im Begriffspaar ist eine Entität, eine Person, ein Ort, eine Organisation oder ein Konzept.

Der zweite Begriff ist ein Attribut oder eine Zeichenfolge, die einen Aspekt der Entität beschreibt.

Beispiele beinhalten:

  • „Geburtsdatum“ einer Person
  • „Bevölkerung“ eines Landes
  • „Gehalt“ des Sportlers
  • „CEO“ einer Organisation

Durch die Bereitstellung weiterer Inhalts- und Schemainformationen (und strukturierter Daten) zu Entitäten erhält eine Suchmaschine mehr Informationen, um bessere Informationen über die spezifischen Entitäten zu finden, Daten zu testen und zu sammeln, das, was sie weiß, eindeutig zu machen und mehr und besseres Vertrauen in die Entitäten zu gewinnen es ist sich dessen bewusst.

Entitäts-Attribut-Kandidatenpaare

Dieses Patent erhält ein Entitäts-Attribut-Kandidatenpaar, um eine Entität und ein Attribut zu definieren, wobei das Attribut ein Kandidatenattribut der Entität ist. Zusätzlich zum Lernen aus Fakten über Entitäten in strukturierten Daten kann Google Informationen nutzen, indem es den Kontext dieser Informationen betrachtet und auch aus Vektoren und dem gleichzeitigen Vorkommen anderer Wörter und Fakten über diese Entitäten lernt.

Werfen Sie einen Blick auf die Patent für Wortvektoren um ein Gefühl dafür zu bekommen, wie eine Suchmaschine jetzt ein besseres Gefühl für die Bedeutung und den Kontext von Wörtern und Informationen über Entitäten bekommen kann. (Dies ist eine Gelegenheit, aus der Patentforschung zu lernen, wie Google jetzt einige der Dinge tut, die es tut.) Google sammelt Fakten und Daten über die Dinge, die es indiziert, und erfährt möglicherweise etwas über die Entitäten, die es in seinem Index hat, und die Attribute, die es über sie kennt.

Dies geschieht in:

  • Bestimmen mit Sätzen, die die Entität und das Attribut enthalten, ob das Attribut ein tatsächliches Attribut der Entität im Entitäts-Attribut-Kandidatenpaar ist
  • Generieren von Einbettungen für Wörter in der Satzmenge, die die Entität und das Attribut enthalten
  • Erstellen einer Verteilungsattributeinbettung für die Entität mit bekannten Entitätsattributpaaren, wobei die Verteilungsattributeinbettung für die Entität eine Einbettung für die Entität basierend auf anderen Attributen angibt, die mit der Entität aus den bekannten Entitätsattributpaaren verknüpft sind
  • Basierend auf Einbettungen für Wörter in den Sätzen, der Verteilungsattributeinbettung für die Entität und für das Attribut, ob das Entitäts-Attribut-Kandidatenpaar ein wesentliches Attribut der Entität im Entitäts-Attribut-Kandidatenpaar ist.

Einbettungen für Wörter werden aus Sätzen mit der Entität und dem Attribut gebildet

Erstellen einer ersten Vektordarstellung, die die erste Einbettung von Wörtern zwischen der Entität und dem Punkt in der Satzmenge angibt

  • Erstellen einer zweiten Vektordarstellung, die eine doppelte Einbettung für die Entität basierend auf der Satzmenge definiert
  • Konstruieren einer dritten Vektordarstellung für eine dritte Einbettung für das Attribut basierend auf der Satzmenge
  • Das Auswählen mit einem bekannten Entitätsattribut kombiniert eine Verteilungsattributeinbettung für die Entität. Dies bedeutet, dass eine vierte Vektordarstellung unter Verwendung verfügbarer Entitäts-Attributpaare erstellt wird, um die Verteilungsattributeinbettung für die Entität anzugeben.
  • Der Aufbau einer Verteilungsattribut-Einbettung mit diesen bekannten Entitäts-Attribut-Paaren erfordert die Entwicklung einer fünften Vektordarstellung mit verfügbaren Entitäts-Attribut-Teams und der Verteilungsattribut-Einbettung für das Attribut.
  • Entscheiden, basierend auf den Einbettungen für Wörter in der Satzmenge, der Verteilungsattributeinbettung für die Entität und der Verteilungsattributeinbettung für das Attribut, ob das Attribut im Entitäts-Attributkandidatenpaar ein wesentliches Attribut der Entität in der ist Entitäts-Attribut-Kandidatenpaar
  • Bestimmen, basierend auf der ersten Vektordarstellung, der zweiten Vektordarstellung, der dritten Vektordarstellung, der vierten Vektordarstellung und der fünften Vektordarstellung, ob das Attribut im Entitäts-Attributkandidatenpaar ein wesentliches Attribut der Entität in der Entität ist -Attribut-Kandidatenpaar
  • Auswählen aus der ersten Vektordarstellung, der zweiten Vektordarstellung, der dritten Vektordarstellung, der vierten Vektordarstellung und der fünften Vektordarstellung, ob das Attribut im Entitäts-Attribut-Kandidatenpaar ein wesentliches Attribut der Entität im Entitäts-Attribut ist. Attributkandidatenpaar wird mithilfe eines Feedforward-Netzwerks ausgeführt.
  • Auswählen, basierend auf der ersten Vektordarstellung, der zweiten Vektordarstellung, der dritten Vektordarstellung, der vierten Vektordarstellung und der fünften Vektordarstellung, ob das Attribut im Entitäts-Attributkandidatenpaar ein wesentliches Attribut der Entität in der Entität ist -Attribut-Kandidatenpaar, bestehend aus:
  • Erzeugen einer einzelnen Vektordarstellung durch Verketten der ersten Vektordarstellung, der zweiten Vektordarstellung, der dritten Vektordarstellung, der vierten Vektordarstellung und der fünften Vektordarstellung; Eingeben der Einzelvektordarstellung in das Feedforward-Netzwerk
  • Bestimmen durch das Feedforward-Netzwerk und unter Verwendung der Einzelvektordarstellung, ob das Attribut im Entitäts-Attribut-Kandidatenpaar ein wesentliches Attribut der Entität im Entitäts-Attribut-Kandidatenpaar ist

Das Erstellen einer vierten Vektordarstellung mit bekannten Entitäts-Attributpaaren, die die Einbettung der Verteilungsattribute für die Entität spezifiziert, umfasst Folgendes:

  • Identifizieren eines Satzes von Attributen, die der Entität in den bekannten Entitäts-Attribut-Teams zugeordnet sind, wobei der Satz von Attributen das Attribut weglässt
  • Generieren einer Verteilungsattributeinbettung für die Entität durch Berechnen einer gewichteten Summe von Merkmalen im Satz von Attributen

Wählen Sie eine fünfte Vektordarstellung mit bekannten Entitäts-Attribut-Paaren und geben Sie die Verteilungsattributeinbettung für das Attribut an

  • Identifizieren einer Reihe von Entitäten aus den bekannten Entitäts-Attribut-Paaren mithilfe des Attributs; für jede Entität in der Sammlung von Entitäten
  • Bestimmen einer Reihe von Merkmalen, die der Entität zugeordnet sind, wobei die Position der Attribute das Attribut nicht einschließt
  • Generieren einer Verteilungsattributeinbettung für die Entität durch Berechnen einer gewichteten Summe von Merkmalen in der Attributsammlung

Der Vorteil genauerer Entitäts-Attribut-Beziehungen gegenüber der modellbasierten Entitäts-Attribut-Identifizierung nach dem Stand der Technik

Frühere Techniken zur Identifizierung von Entitätsattributen verwendeten modellbasierte Ansätze wie Funktionen der Verarbeitung natürlicher Sprache (NLP), Fernüberwachung und traditionelle Modelle des maschinellen Lernens, die Entitätsattributbeziehungen identifizieren, indem sie Entitäten und Attribute auf der Grundlage von Datensätzen darstellen. Diese Begriffe erscheinen.

Im Gegensatz dazu identifizieren die in dieser Spezifikation beschriebenen Innovationen Entitäts-Attribut-Beziehungen in Datensätzen, indem sie Informationen darüber verwenden, wie Entitäten und Attribute in den Daten ausgedrückt werden, in denen diese Begriffe vorkommen, und indem sie Entitäten und Attribute mithilfe anderer Merkmale darstellen, mit denen bekanntermaßen eine Verbindung hergestellt wird diese Begriffe. Dies ermöglicht die Darstellung von Entitäten und Attributen mit Details, die von ähnlichen Entitäten gemeinsam genutzt werden, und verbessert die Genauigkeit der Identifizierung von Entitäts-Attribut-Beziehungen, die sonst nicht durch Betrachtung der Sätze, in denen diese Begriffe vorkommen, erkannt werden können.

Stellen Sie sich beispielsweise ein Szenario vor, in dem der Datensatz Sätze mit zwei Entitäten, „Ronaldo“ und „Messi“, enthält, die mit dem Attribut „record“ beschrieben werden, und eine Strafe, bei der die Entität „Messi“ mit dem Attribut „goals“ beschrieben wird. Attribut. In einem solchen Szenario können die Techniken des Standes der Technik die folgenden Entitätsattributpaare identifizieren: (Ronaldo, Rekord), (Messi, Protokoll) und (Messi, Ziele). Die in dieser Spezifikation beschriebenen Innovationen gehen über diese Ansätze des Standes der Technik hinaus, indem sie Entitäts-Attribut-Beziehungen identifizieren, die durch die Art und Weise, wie diese Begriffe im Datensatz verwendet werden, möglicherweise nicht erkannt werden.

Anhand des obigen Beispiels bestimmt die in dieser Spezifikation beschriebene Innovation, dass „Ronaldo“ und „Messi“ ähnliche Entitäten sind, da sie das Attribut „Rekord“ gemeinsam haben und dann das Attribut „Rekord“ mithilfe des Attributs „Ziele“ darstellen. Auf diese Weise können die in dieser Spezifikation beschriebenen Innovationen beispielsweise die Identifizierung von Entitäts-Attribut-Beziehungen ermöglichen, z. B. (Cristiano, Ziele), auch wenn eine solche Beziehung möglicherweise nicht aus dem Datensatz erkennbar ist.

Das Patent für identifizierende Attributbeziehungen

Erfinder: Dan Iter, Xiao Yu und Fangtao Li

Identifizieren von Entitätsattributbeziehungen im Text

Ein Kandidaten-Entitäts-Attribut-Paar (wobei das Attribut ein Kandidatenattribut einer Entität ist) wird in ein Klassifizierungsmodell eingegeben. Das Klassifizierungsmodell verwendet eine Pfadeinbettungs-Engine, eine Verteilungsdarstellungs-Engine, eine Attribut-Engine und ein Feedforward-Netzwerk. Es bestimmt, ob das Attribut im Kandidaten-Entitäts-Attribut-Paar eine wesentliche Entität im Kandidaten-Entitäts-Attribut-Paar ist.

Die Pfadeinbettungs-Engine generiert einen Vektor, der eine Einbettung der Pfade oder Wörter darstellt, die die alltäglichen Vorkommen der Entität und des Attributs in einer Reihe von Sätzen (z. B. 30 oder mehr Sätzen) eines Datensatzes verbinden. Die Verteilungsdarstellungsmaschine generiert Vektoren, die eine Einbettung für die Entität darstellen, und ordnet Begriffe basierend auf dem Kontext zu, in dem diese Begriffe in der Satzmenge vorkommen. Die Verteilungsattribut-Engine generiert einen Vektor, der eine Einbettung für die Entität darstellt, und einen weiteren Vektor, der eine Einbettung für das Attribut darstellt.

Die Attributverteilungs-Engine Die Einbettung der Entität basiert auf anderen Merkmalen (z. B. anderen Attributen als dem Kandidatenattribut), von denen bekannt ist, dass sie mit der Entität im Datensatz verknüpft werden. Die Einbettung der Qualität durch die detaillierte Verteilungs-Engine basiert auf verschiedenen Merkmalen, die mit bekannten Entitäten des Kandidatenattributs verknüpft sind.

Das Klassifizierungsmodell Verkettet die Vektordarstellungen der Pfadeinbettungs-Engine, der Verteilungsdarstellungs-Engine und der Verteilungsattribut-Engine zu einer einzigen Vektordarstellung. Das Klassifizierungsmodell gibt dann die Einzelvektordarstellung in ein Feedforward-Netzwerk ein, das anhand der Einzelvektordarstellung bestimmt, ob das Attribut im Kandidaten-Entitäts-Attribut-Paar ein wesentliches Attribut der Entität im Kandidaten-Entitäts-Attribut-Paar ist.

Angenommen, das Feedforward-Netzwerk stellt fest, dass der Punkt im Kandidaten-Entitäts-Attribut-Paar für die Entität im Kandidaten-Entitäts-Attribut-Paar notwendig ist. In diesem Fall wird das in Frage kommende Entitäts-Attribut-Paar zusammen mit anderen bekannten/tatsächlichen Entitäts-Attribut-Paaren in der Wissensdatenbank gespeichert.

Entitätsattributbeziehungen extrahieren

Die Umgebung umfasst ein Klassifizierungsmodell, das für Kandidaten-Entitäts-Attributpaare in einer Wissensdatenbank bestimmt, ob ein Attribut in einem Kandidaten-Entitäts-Attributpaar ein wesentliches Attribut der Entität im Kandidatenpaar ist. Das Klassifizierungsmodell ist ein neuronales Netzwerkmodell und die Komponenten werden im Folgenden beschrieben. Das Klassifizierungsmodell kann auch mit anderen überwachten und unbeaufsichtigten Modellen des maschinellen Lernens verwendet werden.

Die Wissensdatenbank, zu der Datenbanken (oder andere geeignete Datenspeicherstrukturen) gehören können, die auf nichtflüchtigen Datenspeichermedien (z. B. Festplatten, Flash-Speicher usw.) gespeichert sind, enthält einen Satz in Frage kommender Entitäts-Attributpaare. Die Kandidaten-Entitäts-Attribut-Paare werden mithilfe einer Reihe von Inhalten in Textdokumenten wie Webseiten und Nachrichtenartikeln ermittelt, die aus einer Datenquelle stammen. Die Datenquelle kann jede beliebige Inhaltsquelle umfassen, beispielsweise eine Nachrichten-Website, eine Datenaggregator-Plattform, eine Social-Media-Plattform usw.

Die Datenquelle bezieht Nachrichtenartikel von einer Datenaggregatorplattform. Die Datenquelle kann ein Modell verwenden. Das überwachte oder unüberwachte Modell des maschinellen Lernens (ein Modell zur Verarbeitung natürlicher Sprache) generiert einen Satz von Kandidaten-Entitäts-Attribut-Paaren, indem es Sätze aus den Artikeln extrahiert und die extrahierten Sätze mithilfe von Wortarten in Tokens umwandelt und kennzeichnet, z. B. als Entitäten und Attribute und Abhängigkeitsanalysebaum-Tags.

Die Datenquelle kann die extrahierten Sätze in ein maschinelles Lernmodell eingeben. Es kann beispielsweise mithilfe einer Reihe von Trainingssätzen und den zugehörigen Entitäts-Attribut-Paaren trainiert werden. Ein solches Modell für maschinelles Lernen kann dann die Kandidaten-Entitätsattribut-Teams für die eingegebenen extrahierten Sätze ausgeben.

In der Wissensdatenbank speichert die Datenquelle die Kandidaten-Entitäts-Attributpaare und die von der Datenquelle extrahierten Sätze, die die Wörter der Kandidaten-Entitäts-Attributpaare enthalten. Die Kandidaten-Entitäts-Attribut-Paare werden nur dann in der Wissensdatenbank gespeichert, wenn die Anzahl der Sätze, in denen die Entität und das Attribut vorhanden sind, eine Schwellenwertanzahl von Sätzen (z. B. 30 Sätze) erfüllt (z. B. erreicht oder überschreitet).

Ein Klassifizierungsmodell bestimmt, ob das Attribut in einem Kandidaten-Entitäts-Attribut-Paar (in der Wissensdatenbank gespeichert) ein tatsächliches Attribut der Entität im Kandidaten-Entitäts-Attribut-Paar ist. Das Klassifizierungsmodell umfasst eine Pfadeinbettungs-Engine 106, eine Verteilungsdarstellungsquelle, eine Attribut-Engine und ein Feedforward-Netzwerk. Wie hierin verwendet, bezieht sich der Begriff „Engine“ auf ein Datenverarbeitungsgerät, das eine Reihe von Aufgaben ausführt. Die Operationen dieser Engines des Klassifizierungsmodells bei der Bestimmung, ob das Attribut in einem Kandidaten-Entitäts-Attribut-Paar ein wesentliches Attribut der Entität ist.

Ein Beispielprozess zum Identifizieren von Entitätsattributbeziehungen

Im Folgenden werden die Vorgänge des Prozesses beschrieben, die von den Systemkomponenten ausgeführt werden, und die Funktionen des Prozesses werden im Folgenden nur zur Veranschaulichung beschrieben. Die Vorgänge des Prozesses können von jedem geeigneten Gerät oder System durchgeführt werden, z. B. von jedem geeigneten Datenverarbeitungsgerät. Funktionen des Prozesses können auch als Anweisungen implementiert werden, die auf einem nichtflüchtigen computerlesbaren Medium gespeichert sind. Die Ausführung der Anweisungen führt dazu, dass Datenverarbeitungsgeräte Vorgänge des Prozesses ausführen.

Die Wissensdatenbank ruft ein Entitäts-Attribut-Kandidatenpaar aus der Datenquelle ab.

Die Wissensdatenbank ruft eine Reihe von Sätzen aus der Datenquelle ab, die die Wörter der Entität und des Attributs im Kandidaten-Entitäts-Attribut-Paar enthalten.

Basierend auf der Satzmenge und dem Paar aus Kandidatenentität und Attribut bestimmt das Klassifizierungsmodell, ob das Kandidatenattribut ein tatsächliches Attribut der Kandidatenentität ist. Der Satz an Strafen kann eine große Anzahl von Sätzen umfassen, beispielsweise 30 oder mehr Sätze.

Das Klassifizierungsmodell führt die folgenden Operationen aus

  • Das Einbetten von Wörtern in den Satzsatz, der die Entität und das Attribut enthält, wird im Folgenden hinsichtlich des folgenden Prozesses ausführlicher beschrieben
  • Erstellt unter Verwendung bekannter Entitäts-Attribut-Paare, einer Verteilungsattribut-Einbettung für die Entität, die im Folgenden hinsichtlich der Funktionsweise ausführlicher beschrieben wird
  • Erstellen unter Verwendung der bekannten Entitäts-Attribut-Paare und der Einbettung von Verteilungsattributen für das Attribut, was im Folgenden hinsichtlich der Funktionsweise ausführlicher beschrieben wird
  • Auswählen, basierend auf den Einbettungen für Wörter in der Satzmenge, der Verteilungsattributeinbettung für die Entität und der Verteilungsattributeinbettung für das Attribut, ob das Attribut im Entitäts-Attributkandidatenpaar ein wesentliches Attribut der Entität im ist Entitäts-Attribut-Kandidatenpaar, das im Folgenden hinsichtlich der Funktionsweise ausführlicher beschrieben wird.

Die Pfadeinbettungs-Engine generiert eine erste Vektordarstellung, die die ersten Wörter angibt, die zwischen der Entität und dem Attribut in den Sätzen eingebettet werden. Die Pfadeinbettungs-Engine erkennt Beziehungen zwischen in Frage kommenden Entitätsattributbegriffen, indem sie die Pfade oder Wörter, die das alltägliche Vorkommen dieser Begriffe verbinden, in den Satzsatz einbettet.

Für die Phrase „Schlange ist ein Reptil“ generiert die Pfadeinbettungs-Engine eine Einbettung für die Spur „ist ein“, die beispielsweise zur Erkennung von Gattungs-Art-Beziehungen verwendet werden kann, die dann zur Identifizierung anderer Entitätsattribute verwendet werden kann Paare.

Generieren der Wörter zwischen der Entität und dem Attribut

Die Pfadeinbettungs-Engine führt Folgendes aus, um Wörter zwischen der Entität und dem Attribut in den Sätzen zu generieren. Für jeden Satz im Satzsatz extrahiert die Pfadeinbettungs-Engine zunächst den Abhängigkeitspfad (der eine Wortgruppe angibt) zwischen der Entität und dem Attribut. Die Pfadeinbettungs-Engine wandelt den Satz von einer Zeichenfolge in eine Liste um, wobei der erste Begriff die Entität und der letzte Begriff das Attribut ist (oder der erste Begriff das Attribut und der vorherige Begriff die Entität ist).

Jeder Begriff (der auch als Kante bezeichnet wird) im Abhängigkeitspfad wird durch die folgenden Merkmale dargestellt: das Lemma des Begriffs, ein Wortart-Tag, die Abhängigkeitsbezeichnung und die Richtung des Abhängigkeitspfads (links). , rechts oder root). Jedes dieser Merkmale wird eingebettet und verkettet, um eine Vektordarstellung für den Term oder die Kante (V.sub.e) zu erzeugen, die eine Folge von Vektoren (V.sub.l, V.sub.pos, V.sub.dep) umfasst , V.sub.dir), wie durch die folgende Gleichung gezeigt: {rechter Pfeil über (v)}.sub.e=[{right arrow over (v)}.sub.l,{right arrow over (v)}.sub.pos,{right arrow over (v)}.sub.dep,{right arrow over (v)}.sub.dir]

Die Pfadeinbettungs-Engine gibt dann die Folge von Vektoren für die Begriffe oder Kanten in jedem Pfad in ein Netzwerk mit langem Kurzzeitgedächtnis (LSTM) ein, das eine einzelne Vektordarstellung für den Satz (V.sub.s) erzeugt, wie in gezeigt die folgende Gleichung: {rechter Pfeil über (v)}.sub.s=LSTM({rechter Pfeil über (v)}.sub.e.sup.(1). … {rechter Pfeil über (v)}.sub .e.sup.(k))

Schließlich gibt die Pfadeinbettungs-Engine die Einzelvektordarstellung für alle Sätze in der Satzmenge in einen Aufmerksamkeitsmechanismus ein, der einen gewichteten Mittelwert der Satzdarstellungen (V.sub.sents(e,a)) bestimmt, wie durch gezeigt untere Gleichung: {rechter Pfeil über (v)}.sub.sents(e,a)=ATTN({rechter Pfeil über (v)}.sub.s.sup.(1). . . {rechter Pfeil über (v )}.sub.s.sup.(n))

Das Verteilungsrepräsentationsmodell generiert basierend auf den Sätzen eine zweite Vektordarstellung für die Entität und eine dritte Vektordarstellung für das Attribut. Die Verteilungsrepräsentations-Engine erkennt Beziehungen zwischen Kandidaten-Entitäts-Attribut-Begriffen basierend auf dem Kontext, in dem Punkt und die Entität des Kandidaten-Entitäts-Attribut-Paares in der Satzmenge vorkommen. Beispielsweise kann die Verteilungsdarstellungsmaschine feststellen, dass die Entität „New York“ in der Satzsammlung auf eine Weise verwendet wird, die darauf hindeutet, dass sich diese Entität auf eine Stadt oder einen Bundesstaat in den Vereinigten Staaten bezieht.

Als weiteres Beispiel kann die Verteilungsdarstellungsmaschine feststellen, dass das Attribut „Hauptstadt“ in der Satzmenge auf eine Weise verwendet wird, die darauf hindeutet, dass sich dieses Attribut auf eine bedeutende Stadt innerhalb eines Staates oder Landes bezieht. Somit generiert die Verteilungsdarstellungsmaschine eine Vektordarstellung, die eine Einbettung für die Entität (V.sub.e) unter Verwendung des Kontexts (dh der Satzmenge), in dem die Entität erscheint, angibt. Die Verteilungsdarstellungsmaschine generiert eine Vektordarstellung (V.sub.a), die eine Einbettung für das Attribut angibt, indem sie die Satzmenge verwendet, in der das Merkmal vorkommt.

Die Verteilungsattribut-Engine generiert eine vierte Vektordarstellung, die eine Verteilungsattributeinbettung für die Entität unter Verwendung bekannter Entitäts-Attributpaare angibt. Bei den bekannten Entitäts-Attribut-Paaren, die in der Wissensdatenbank gespeichert werden, handelt es sich um Entitäts-Attribut-Paare, für die bestätigt wurde (z. B. durch vorherige Verarbeitung durch das Klassifizierungsmodell oder basierend auf einer menschlichen Bewertung), dass jedes Attribut in der Entitäts- Das Attributpaar ist ein wesentliches Attribut der Entität im Entitäts-Attributpaar.

Die Verteilungsattribut-Engine führt die folgenden Operationen aus, um eine Verteilungsattributeinbettung zu bestimmen, die eine Einbettung für die Entität unter Verwendung einiger (z. B. der häufigsten) oder aller anderen bekannten Attribute unter den bekannten Entitäts-Attributpaaren angibt, mit denen diese Entität verknüpft wird.

Identifizieren anderer Attribute für Entitäten

Für Entitäten im Entitäts-Attribut-Kandidatenpaar identifiziert die Verteilungsattribut-Engine andere Attribute als diejenigen, die im Entitäts-Attribut-Kandidatenpaar enthalten sind, das mit der Entität in den bekannten Entitäts-Attribut-Teams verknüpft ist.

Für eine Entität „Michael Jordan“ im Kandidaten-Entitäts-Attribut-Paar (Michael Jordan, berühmt) kann die Attributverteilungs-Engine die bekannten Entitäts-Attribut-Paare für Michael Jordan verwenden, z. B. (Michael Jordan, wohlhabend) und (Michael Jordan, Datensatz), um Attribute wie Wohlstand und Beschreibung zu identifizieren.

Die Attributverteilungs-Engine generiert dann eine Einbettung für die Entität, indem sie eine gewichtete Summe der identifizierten bekannten Attribute berechnet (wie im vorherigen Absatz beschrieben), wobei die Gewichte mithilfe eines Aufmerksamkeitsmechanismus gelernt werden, wie in der folgenden Gleichung dargestellt: {rechts Pfeil über (v)}.sub.e=ATTN(.epsilon.(α.sub.1) . . . .epsilon.(α.sub.m))

Die Verteilungsattribut-Engine generiert eine fünfte Vektordarstellung, die eine Verteilungsattribut-Einbettung für das Attribut unter Verwendung der bekannten Entitäts-Attribut-Paare angibt. Die Verteilungsattribut-Engine führt die folgenden Vorgänge aus, um ein Modell basierend auf einigen (ob am häufigsten) oder allen bekannten Attributen zu bestimmen, die mit bekannten Entitäten des Kandidatenattributs verknüpft sind.

Für den Punkt im Entitäts-Attribut-Kandidatenpaar identifiziert die Verteilungsattribut-Engine die bekannten Entitäten unter den bekannten Entitäts-Attribut-Paaren, die die Qualität haben.

Für jede identifizierte bekannte Entität identifiziert die Verteilungsattribut-Engine andere Attribute (d. h. andere Attribute als die im Entitäts-Attribut-Kandidatenpaar enthaltenen), die mit der Entität in den bekannten Entitäts-Attribut-Teams verknüpft sind. Die Verteilungsattribut-Engine kann eine Teilmenge von Attributen aus den identifizierten Attributen identifizieren, indem sie:

(1) Rangfolge von Attributen basierend auf der Anzahl bekannter Entitäten, die jeder Entität zugeordnet sind, z. B. Zuweisen eines höheren Rangs für Attribute, die einer höheren Anzahl von Entitäten zugeordnet sind, als für Attribute, die mit weniger Entitäten verbunden sind.

Über Bill Slawski

Mit mehr als 26 Jahren SEO-Erfahrung und einem juristischen Doktortitel ist Bill Slawski der führende Experte für Google-Patente im Zusammenhang mit SEO. Patent Exploration ist eine der schnellsten und detailliertesten Möglichkeiten, neue Informationen über SEO zu finden. Bill ist Herausgeber von SEO by the Sea, einem bekannten Blog zur Suchmaschinenoptimierung, in dem er über 1.300 Beiträge verfasst hat. Bills Erfahrung umfasst Fortune-500-Marken und einige der größten Websites der Welt. Bill ist Autor für Moz, Search Engine Land und Search Engine Journal. In den Jahren 2014–2021 sprach er auf branchenführenden internationalen Konferenzen über Themen wie Suchmaschinenalgorithmen, universelle und gemischte Suche, Personalisierung in der Suche, Suche und soziale Netzwerke sowie Probleme mit doppelten Inhalten, strukturierte Daten und Schemata

Table of Contents