Was enthält der Datensatz?
Dieser Datensatz enthält die häufigsten 840.000 Wörter der deutschen Sprache. Die Liste ist ansteigend nach Häufigkeit geordnet.
Welche Datenfelder sind vorhanden?
Die Datenfelder enthalten den Rangplatz, das Wort selbst, die absolute und relative Häufigkeit sowie die Wortart (also Nomen, Artikel, Adjektiv, Adverb etc.) Wobei ein Wort je nach Bedeutung im Satz auch mehrere Wortarten zugeordnet haben kann. So kann man sich z.B. nur alle deutschen Substantive/Nomen oder Adjektive filtern und eine getrennte Liste erzeugen.
Hinweis: Nicht bei jedem Wort ist die Wortart vermerkt, aber bei mehr als 80% der Einträge.
In welchem Datenformat wird geliefert?
Das Datenformat ist SQL und CSV.
Welche Verwendungen sind möglich?Wortartbestimmung, Häufigkeitsanalyse, Namenerkennung, Stoppwortgenerierung, Rechtschreibprüfung, Tagging etc.
Was sind Wortarten ?
Es gibt 8 grundlegende Wortarten in der Deutschen Grammatik, die als Klassifizierungsmethode verwendet werden, um Sätze in Teile aufzuteilen. Diese Wortarten sind Nomen, Verben, Adjektive, Adverbien, Präpositionen, Pronomen, Interjektionen und Konjunktionen.
Nomen sind Wörter, die eine Person, eine Sache, ein Phänomen oder ein Konzept bezeichnen, z.B. Personen, Orte, Tiere, Gegenstände, Ideen usw.
Verben beschreiben eine Tätigkeit, Handlung oder Zustand, z.B. Laufen, Essen, Denken oder Sein.
Adjektive beschreiben oder erläutern ein Nomen, z.B. Groß, Kühn oder Farbenfroh.
Adverbien modifizieren ein Verb, ein Adjektiv oder ein anderes Adverb, z.B. Schnell, Sehr oder Sorgfältig.
Präpositionen sitzen vor einem Nomen oder einem Pronomen und geben eine Beziehung an, z.B. Auf, Um oder Bis.
Pronomen ersetzen Nomen und vermeiden Wiederholungen, z.B. Er, Sie, Es, Wir usw.
Interjektionen sind kurze Ausrufe, die spontan und meistens gefühlvoll sind, z.B. Wow, He! oder Ahh!
Konjunktionen verbinden Sätze.
Noch keine Kommentare zu diesem Datensatz vorhanden.