Eine Umfrage ergab diese Woche, dass große Namen im Technologiesektor; Anthropic (Besitzer des Claude-Chatbots), NVIDIA und Apple; trainierten ihre verschiedenen KI-Modelle mit Untertiteln aus YouTube-Videos. Somit mehr als 170.000 Videos (darunter einige von großen YouTubern wie Mr. Beast oder MKBHD) wäre zum Trainieren von OpenELM verwendet wordeneine Familie von Open-Source-LLMs von Apple, die im vergangenen April vorgestellt wurde.
Apple widerspricht diesen Vorwürfen jedoch und bekräftigt dies 9to5Google dass OpenELM keine seiner Funktionen für künstliche Intelligenz unterstützt oder maschinelles Lernen, einschließlich Apple Intelligence.
OpenELM: ein Tool, das ausschließlich der Forschung gewidmet ist
Laut Apple existiert OpenELM ausschließlich für den Zweck Förderung der Forschung und Entwicklung von Open-Source-Sprachmodellen. Auch die Wissenschaftler des Apfelkonzerns beschreiben es als „ hochmodernes offenes Sprachmodell . Das Unternehmen besteht darauf, dass diese Initiative Teil eines rein wissenschaftlichen und nichtkommerziellen Ansatzes ist und OpenELM niemals in seinen für die breite Öffentlichkeit bestimmten Produkten verwendet wird.
Aus Gründen der Transparenz und Zusammenarbeit hat sich der Technologieriese entschieden, dieses Modell als Open Source zu veröffentlichen. Dadurch wird es der wissenschaftlichen Gemeinschaft allgemein zugänglich gemacht. Interessierte Forscher können es im s einsehenDiese Seite ist dem maschinellen Lernen von Apple gewidmet wo es auch den direkten Link gibt das Projekt auf GitHub.
Somit der YouTube-Untertiteldatensatz wäre absolut nicht an der Entwicklung von Apple Intelligence beteiligt. Das Unternehmen hat immer behauptet, dass seine Modelle trainiert wurden auf „s lizenzierte Daten, einschließlich Daten, die zur Verbesserung bestimmter Funktionen ausgewählt wurden, sowie öffentlich verfügbare Daten, die von unserem Webcrawler erfasst werden .
Ist OpenELM 2.0 bereits fertig?
Apple wollte mit klären 9to5Google QEs gibt keine Pläne, neue Iterationen des OpenELM-Modells zu entwickeln. Diese Klarstellung erfolgt in einem bestimmten Kontext und folgt einem Artikel in Verdrahtet Darin wurde die Verwendung des Datensatzes durch mehrere Unternehmen, darunter Apple, erwähnt YouTube-Untertitel. Letzteres ist Teil einer größeren Sammlung namens Der Haufengegründet von der gemeinnützigen Organisation EleutherAI.
Das Unternehmen scheint aufrechterhalten zu wollen eine klare Trennung zwischen seinen offenen Forschungsinitiativen und seinen proprietären Entwicklungen. Die Einstellung der Entwicklung von OpenELM nach der Aufdeckung dieser Praxis wirft immer noch Fragen auf. Sollte dies als stillschweigendes Eingeständnis seitens Apple gewertet werden, dass die Verwendung dieser Daten problematisch war? Oder ist dies einfach eine strategische Entscheidung, um zukünftige Kontroversen zu vermeiden? Ein Rätsel, das sicherlich schwer zu lösen sein wird.
Laut Apple unterstützt OpenELM keine seiner KI- oder maschinellen Lernfunktionen. Dieses Modell dient ausschließlich Forschungszwecken und wurde für wissenschaftliche Zwecke entwickelt. Das Unternehmen sagte, es plane nicht, neue Versionen von OpenELM zu entwickeln.