Mit Stable Diffusion können Sie praktisch jedes beliebige Bild auf Textbasis erstellen. Beispielsweise kann es sein, dass Sie für Ihr Projekt ein KI-Gesicht verbessern müssen, aber Probleme mit der Verbesserung des Originals haben. In diesem Fall könnten Ihnen einige unserer Tipps zur Verbesserung Ihres Stable Diffusion-Gesichterstellungsprozesses helfen. Lesen Sie weiter, um mehr zu erfahren.
Wie erstellen Sie mit stabiler Diffusion bessere Gesichter?
Um mit Stable Diffusion bessere Gesichter zu erstellen, müssen Sie ein Google Colab namens Deforum Stable Diffusion v0.5 einrichten. So können Sie das tun:
- Ă–ffnen Sie Ihren Browser und gehen Sie zu diese Website.
- Drücken Sie die Schaltfläche „Verbinden“ und klicken Sie auf „NVIDIA GPU“. Da es sich um die GPU des Google-Servers handelt, besteht kein Grund zur Sorge – Sie benötigen keine NVIDIA-Grafikkarte.
- Erteilen Sie der Website die Systemberechtigungen, Ihren Computer zu verwenden.
- Drücken Sie auf den Abschnitt unter der GPU-Karte („Modell- und Ausgabepfade“).
- Verbinden Sie Ihr Google Colab mit Ihrem Google Drive und warten Sie, bis das Häkchen neben „Modell- und Ausgabepfade“ erscheint.
- Wählen Sie „Umgebung einrichten“ und lassen Sie das System Ihr Konto verbinden. Machen Sie dasselbe für „Python-Definitionen“.
- Gehen Sie zu „Modell auswählen und laden“. Für diesen Abschnitt müssen Sie das Modell, das Sie hochladen möchten, auf Ihrem Google Drive haben. Laden Sie dazu die .ckpt-Datei von herunter diese Website indem Sie im Abschnitt „Gewichte herunterladen“ auf „sd-v1.4.ckpt“ klicken. Laden Sie diese Datei in Ihren Google Drive AI-Ordner hoch, der die Modelle enthält, die Sie verbessern möchten.
- Klicken Sie auf die Schaltfläche „Abspielen“ neben dem Abschnitt „Modell auswählen und laden“. Warten Sie, bis das grüne Häkchen angezeigt wird, und Ihr Google Colab ist einsatzbereit.
Nachdem Ihr Google Colab nun eingerichtet ist, können Sie Ihre KI-Gesichter mit Stable Diffusion verbessern. Dieser Vorgang wird auch als Verbessern alter Renderings bezeichnet und läuft darauf hinaus, die Auflösung Ihrer Bilder zu ändern:
- Schneiden Sie das Gesicht aus, das Sie verbessern möchten, und speichern Sie es als separates Bild.
- Laden Sie das Gesicht hoch, indem Sie es auf Ihr temporäres Google Colab-Laufwerk ziehen (das linke Feld).
- Klicken Sie mit der rechten Maustaste auf das Bild und klicken Sie auf die Schaltfläche „Pfad kopieren“.
- Fügen Sie das Bild in das Feld „init_image“ im rechten Menü ein.
- Navigieren Sie zum Fenster „Eingabeaufforderungen“ und geben Sie die gewünschten Eingabeaufforderungen für Ihr Gesicht ein. Geben Sie unbedingt Folgendes ein:
in den Eingabeaufforderungen innerhalb der Anführungszeichen, um die besten Ergebnisse zu erhalten. - Gehen Sie zum Abschnitt „Ausführen“ und suchen Sie das Menü „Bildeinstellungen“.
- Ändern Sie die Pixelauflösung, um die Klarheit des Gesichts zu verbessern. 800 × 800 ist beispielsweise in den meisten Fällen gut geeignet.
- Drücken Sie die rote „Play“-Taste unter dem „Ausführen“-Fenster, um das Bild zu rendern.
- Ihr Bild wird nun mit einer anderen Auflösung gerendert. Probieren Sie das Verfahren aus, bis Sie den gewünschten Effekt erzielen.
- Laden Sie das Bild von Ihrem Laufwerk herunter und legen Sie es ĂĽber das Original.
Wie verwenden Sie Variationen mit stabiler Diffusion, um bessere Gesichter zu erstellen?
Neben der direkten Verbesserung von Gesichtern durch Ändern der Auflösung können Sie auch Variationen einführen, um schärfere Bilder zu erzeugen. Der erste Schritt besteht darin, Ihre „Animation“-Einstellungen auf „keine“ zu setzen. So gehen Sie vor:
- Verbinden Sie Ihr Google Drive mit dem Google Deforum Stable Diffusion 0.5 Colab mit den oben genannten Schritten.
- Laden Sie das Bild des Gesichts in den linken Bereich des Colab hoch.
- Gehen Sie zum Menü „Animation“ und ändern Sie die Einstellung „animation_mode“ auf „none“.
- Klicken Sie auf die Schaltfläche „Wiedergabe“ neben dem Abschnitt „Animation“, um Ihre Änderungen zu speichern.
Nachdem Sie Ihre „Animation“-Einstellungen geändert haben, können Sie die meisten anderen Einstellungen ignorieren, da Sie keine Animation erstellen möchten. Sie müssen jedoch einige Anpassungen im Abschnitt „Eingabeaufforderungen“ vornehmen. Folgen Sie diesen Schritten:
- Verwenden Sie die ursprĂĽngliche Eingabeaufforderung als Ausgangspunkt.
- Nehmen Sie die erforderlichen Variationen vor, indem Sie die Linie ändern, je nachdem, ob Sie Ihrem KI-Gesicht Merkmale hinzufügen oder daraus entfernen möchten. Arbeiten Sie im Abschnitt „Eingabeaufforderungen“ und nicht im Fenster „Animationseingabeaufforderungen“.
- Setzen Sie AnfĂĽhrungszeichen am Anfang und Ende Ihrer Eingabeaufforderungen.
- Setzen Sie am Ende der Eingabeaufforderung ein Komma (nach den AnfĂĽhrungszeichen).
- Klicken Sie auf die Schaltfläche „Wiedergabe“ in der oberen linken Ecke des Fensters „Eingabeaufforderungen“, um Ihr Bild zu rendern und Ihren Fortschritt zu speichern.
Das nächste Menü, das Sie optimieren möchten, ist das Menü „Ausführen“. Genauer gesagt müssen Sie zum Fenster „Bildeinstellungen“ gehen und die folgenden Änderungen vornehmen:
- Navigieren Sie zu „Sampling-Einstellungen“ und setzen Sie die „Seed“-Einstellung auf „-1“.
- Probieren Sie mit der „Sampler“-Einstellung herum, bis Sie den gewünschten Effekt erzielen.
- Legen Sie so viele „Schritte“ fest, wie Sie möchten. Auch der „Skalenwert“ bleibt Ihnen überlassen.
- Wenn Sie das „ddim“-Rendering im Fenster „Sampler“ verwendet haben, setzen Sie „ddim_eta“ auf „1“.
- Scrollen Sie nach unten, bis Sie „Batch-Einstellungen“ finden, und gehen Sie zur Zeile „n_batch“. Geben Sie die Anzahl der gewünschten Variationen in das Textfeld ein.
- Gehe zu den „Init-Einstellungen“ und drücke auf das Kästchen neben der Option „use_init“. Neben der Einstellung sollte nun ein Häkchen stehen.
- Geben Sie im Feld „Stärke“ „0,5“ ein, wenn Sie 50 % des Originalbilds wiederverwenden möchten. Sie können höhere oder niedrigere Werte eingeben, je nachdem, wie stark Sie das Quellmaterial wiederverwenden möchten.
- Klicken Sie im linken Bereich auf das Symbol „Datei“. Gehen Sie zu dem Ordner, der das Bild des Gesichts enthält, das Sie optimieren möchten, und ziehen Sie es in den linken Bereich. Warten Sie, bis das System Ihr Bild geladen hat, klicken Sie mit der rechten Maustaste darauf und drücken Sie die Schaltfläche „Pfad kopieren“.
- Fügen Sie den Pfad in das Feld „init_image“ ein und klicken Sie oben links im Menü „Bildeinstellungen“ auf die rote Schaltfläche „Wiedergabe“.
- Lassen Sie das Programm Ihr Bild rendern und Variationen hinzufĂĽgen. Sie sollten nun das neue Gesicht mit Ihren Variationen im unteren Teil des Bildschirms sehen.
So verbessern Sie die Bilderzeugung durch stabile Diffusion
Beim Verbessern von Gesichtern mit Stable Diffusion besteht der Großteil der Arbeit darin, entsprechende Eingabeaufforderungen zu schreiben. Das System nutzt diese Funktion, um mithilfe der „txt2img“-Technologie ein Bild zu generieren. Es verwendet die Texteingabeaufforderung und andere Parameter, um basierend auf Ihrer Eingabe ein Bild zu erstellen.
Wie bereits erwähnt, müssen Sie den „Seed“-Wert an einer Stelle eingeben, um die gewünschten Ergebnisse zu erzielen. Sie können beim Einbinden von Variationen auch die Anzahl der „Schritte“ ändern.
Diese Funktionen tragen jedoch möglicherweise nicht viel zur Verbesserung der resultierenden Gesichter bei. Stattdessen müssen Sie Ihre „Eingabeaufforderungen“ verbessern, um eine qualitativ hochwertige Bildgenerierung sicherzustellen. Hier sind einige Tipps, die Ihnen dabei helfen.
- Seien Sie präzise – Ihre Textanregungen müssen sehr detailliert sein, insbesondere der Anfang, da der Anfang Ihrer Phrase mehr Bedeutung hat als das Ende. Wenn Sie wichtige Informationen weglassen, erzielen Sie möglicherweise nicht das gewünschte Ergebnis.
- Bleiben Sie beim Englischen – Die Entwickler von Stable Diffusion haben mehr als zwei Milliarden englische Text-Bild-Paare verwendet. Die anderen über 100 Sprachen machten weniger Paare aus, was bedeutet, dass der Anteil der einzelnen Sprachen viel geringer ist als der des Englischen. Daher führen Schreibaufforderungen in anderen Sprachen möglicherweise nicht zum richtigen Ergebnis.
- Geben Sie Kunstgenre und -typ an – Stable Diffusion kann alle Arten von Bildern erzeugen, darunter Acryl- und Ölgemälde, Modefotos, Cartoons und Drucke. Daher macht die Angabe der gewünschten Bildform den Algorithmus präziser.
- Seien Sie im Trend – Wenn Sie nach künstlerischen Bildern suchen, können Sie „im Trend bei ArtStation“ oder andere Namen hinzufügen, damit Stable Diffusion dem gewünschten Bild so nahe wie möglich kommt.
- Spielen Sie mit verschiedenen Wörtern – Beim Schreiben Ihrer Eingabeaufforderungen können Sie es mit den Beschreibungen nie übertreiben. Spielen Sie daher mit verschiedenen technischen Eigenschaften wie „scharfer Fokus“ und „dramatische Beleuchtung“ oder Adjektiven wie „fantastisch“, „wunderschön“ und „umwerfend“.
- Fügen Sie den Namen eines Künstlers hinzu – Stable Diffusion ermöglicht es Ihnen, Bilder im Stil berühmter Künstler zu erstellen. Um diesen Effekt zu erzielen, fügen Sie Ihrer Eingabeaufforderung den Namen Ihrer Künstler hinzu, beispielsweise Andry Warhol, Caspar David Friedrich oder Auguste Renoir.
- Negative verwenden – Einige Versionen Ihrer Schnittstelle reagieren auf negative Eingabeaufforderungen. Damit können Sie angeben, was Ihr System bei der Bilderzeugung vermeiden soll.
Lassen Sie Ihrer Fantasie und Kreativität freien Lauf in stabiler Diffusion
Das Beherrschen der stabilen Diffusion kann eine Weile dauern, insbesondere wenn Sie Ihre KI-Gesichter und andere Bilder verbessern möchten. Ein oder zwei falsche Zeilen können Ihr Projekt leicht verschlechtern. Sie müssen daher beim Schreiben Ihrer Eingabeaufforderungen und Eingeben der Generierungsparameter äußerst vorsichtig sein. Mit ein paar Optimierungen sollten Sie in der Lage sein, Gesichter und andere Teile Ihrer Bilder problemlos zu verschönern.
Wie oft verwenden Sie die stabile Diffusion? Haben Sie Ihren Bildern schon einmal Variationen hinzugefĂĽgt? Wenn ja, welche Effekte haben diese erzielt? Teilen Sie Ihre Erfahrungen im Kommentarbereich unten.
