Als Transformer bezeichne ich einen Computer, mit dem ich Text übersetzen kann. Transformieren trifft die Sache nicht, das Wort stammt von KI-Menschen, die sich nicht um ihre Sprache kümmern. Sie hätte für übersetzen wohl besser translate verwendet.
Eigentlich bezeichnet Transformer ein im Gerät aufgehobenes Verfahren, das auch als "maschinelles Lernen" bezeichnet wird, wobei ein neuronales Netzwerk mit grossen Mengen von Daten "trainiert" - was ieder ein unsinniges Wort ist - wird.
Transformer werden mit Deep-Learning-Architekturen hergestellt. Das Verfahren wurde 2017 im Rahmen der Neural-Information-Processing-Systems-Konferenz veröffentlicht.
Deep-L ist ein Übersetzungsprogramm, während viele weitere Anwendungen von Transformern der Textgenerierung oder dder Zusammenfassung dienen. Transformer weisen hierbei eine bessere Effizienz gegenüber Long-short-term-memory-Architekturen (LSTM) auf und sind die Grundarchitektur vieler vortrainierter Machine-Learning-Modelle.
https://bsky.app/profile/did:plc:v7l7eo7hbkl4vkzz3qucy5jm/post/3kiihnwcqf52m