Über das Wochenende, Google hat seine Datenschutzrichtlinie aktualisiert, um die Nutzer darüber zu informieren, dass alle öffentlich verfügbaren Daten zum Trainieren seiner großen Sprachmodelle, wie beispielsweise Bard, verwendet werden.
Das Unternehmen gab außerdem an, dass die Daten verwendet werden, um Google Translate und seine Cloud-KI zu trainieren, damit sie besser funktionieren. Dieser Schritt löste in der Community große Aufregung aus, da Experten warnten, dass ein solches Scraping den Benutzern letztendlich schaden würde, da die Unternehmen beim Trainieren ihrer Produkte oft auch gestohlene private Daten berücksichtigen.
Schulung zu öffentlichen Daten
Da generative KI immer beliebter wird, passen die großen Technologieunternehmen ihre Richtlinien entsprechend an. Nachdem sie sich beeilt haben, ihre großen Sprachmodelle zu entwickeln, passen die Technologieunternehmen nun ihre Regeln für die Datensammlung an, um ihre Produkte besser zu begünstigen – auf Kosten der Privatsphäre der Community.
Das Neueste in diesem Bestreben ist Google hat am Wochenende seine Datenschutzrichtlinien geändert, um die öffentlich verfügbaren Daten zum Trainieren seiner Produkte Bard, Cloud AI und Google Translate zu verwenden.. Das Unternehmen hat in seinen Richtlinien den Wortlaut von „KI-Modellen“ in „Sprachmodelle“ geändert, wie Sie hier sehen können.
Dies ist eine formelle Möglichkeit, die Öffentlichkeit darüber zu informieren (ohne um Erlaubnis zu bitten), dass sie ihre öffentlichen Daten für ihr Produkttraining verwenden können. Experten warnten, dass ein solcher Trend in Zukunft die Privatsphäre der Öffentlichkeit schädigen könnte. Einige haben OpenAI bereits verklagt, weil es massenhaft persönliche Daten aus dem Internet sammelt, darunter „“, um seine GPT-Modelle ohne vorherige Zustimmung zu trainieren.
Auch in Zukunft werden wir viele solcher Klagen erleben, da immer mehr Unternehmen ihre eigenen Produkte auf Basis generativer KI entwickeln. Dies hat dazu geführt, dass einige öffentliche Websitebesitzer konkrete Schritte unternommen haben, um den Boom der generativen KI zu verhindern oder davon zu profitieren.
Und Unternehmen wie Reddit und Twitter haben neue Regeln erlassen, um die Nutzung ihrer kostenlosen Ressourcen einzuschränken. Reddit hat beispielsweise seine API-Preispolitik überarbeitet und verlangt nun hohe Beträge, während Twitter die Anzeige von Tweets für alle seine Benutzer einschränkt, um übermäßiges Daten-Scraping zu vermeiden.