N-Gramm (englisch N-Gram) steht auch für:
|
Als N-Gramm bezeichne ich eine Sequenz von n Schriftzeichen, die in einem Textkorpus gesucht werden. N-Gramme sind Textfragmente, es können auch Wörter sein. Weil n die jeweilige Anzahl der Schriftzeichen bezeichnet ist auch von Trigrammen oder four-gram die Rede. Google stellt grosse N-Gramm-Datenbanken zur Verfügung und einen Ngram Viewer, in welchem man N-Gramme betrachten kann. N-Gramme werden in maschinellen Textanalysen, Kryptologie und Korpuslinguistik, speziell auch in der Computerlinguistik. Das LLM (Sprachmodell) beruht auf N-Grammen (und hat das Wort nach dem Google-Viewer nochmals populärer gemacht). [ ] Bildquelle: Wikipedia Abbildung 1 zeigt mehrere Beispielsequenzen und die entsprechenden 1-Gramm-, 2-Gramm- und 3-Gramm-Sequenzen. |
Bildquelle: Wikipedia |