Der Prozess beginnt mit der Umwandlung von Texten in sogenannte Embeddings. Dabei werden Inhalte mathematisch als Vektoren dargestellt. Diese Vektoren bilden die semantische Bedeutung eines Textes ab, sodass nicht nur einzelne Keywords, sondern ganze Inhalte miteinander verglichen werden können. Ähnliche Inhalte liegen im Vektorraum nah beieinander, unabhängig von ihrer konkreten Formulierung.
Beispiel: Zwei thematisch ähnliche Texte liegen im Vektorraum nah beieinander.











