De mest almindelige græske ord?

Jagten på det græske sprog: kapitel 12

af Carsten Buus Nørgaard

Anbefalinger til dit valg af frekvensordbog

Frekvensliste over græske ord.
En liste over de 20 mest almindelige græske lemmaer ifølge Det Hellenske Nationalkorpus.

Indledning

Indtil nu har denne serie fokuseret på forud­sætningerne for at lære græsk, med en blanding af værktøjer og grundlæggende sproglig viden, både generel viden og specifik viden om det moderne, græske sprog.

Dette kapitel bygger videre på forud­sætningerne. Det handler om en problemstilling, som det er svært at finde pålidelige kilder til, hvis man ønsker at prioritere at lære de mest almindelige ord på sproget.


Indhold

  1. Indledning
  2. Prioritér evt. at lære de mest almindelige ord på sproget…
  3. …hvis du ellers kan finde frekvensen!
  4. Almindelige ordbøger hjælper ikke altid
  5. Frekvensordbøger
  6. Anbefalinger
    1. Det Hellenske Nationalkorpus (ΙΕΛ / ILSP)
    2. MostUsedWords: ”Greek Frequency Dictionary
      1. Styrker
      2. Svagheder
    3. Wiktionary
      1. Styrker
      2. Svagheder
  7. Afsluttende bemærkninger
  8. Bibliografi

Prioritér evt. at lære de mest almindelige ord på sproget…

Meget af det at lære et fremmedsprog handler om at udvide sit ordforråd (inkl. faste vendinger). Ord findes der jo utallige af, og det rejser spørgsmålet om ens prioriteter, mens man lærer sproget.

Det virker oplagt at fokusere på de mest almindelige ord. Hvis man fx ved, at ord som ”du”, ”den” eller ”at” er meget almindelige, så er det oplagt at fokusere mere på dem end mindre almindelige ord såsom ”glædesblus” eller ”visnepolitik”.

Princippet nævnes bl.a. i lærebogen ”Fremmedsprog i gymnasiet –⁠ teori, praksis og udsyn”:

”Det virker relevant på eleverne, og det giver dem meget hurtigt et lille sprog med stor brugsværdi. Dette gælder både i sprogproduktion og i læse- og lytte­færdighed.” (Andersen 2014, 61)

Formålet med at lære de mest almindelige ord er hurtigere at få mulighed for at skabe sætninger og tale om almene emner. Disse ord finder anvendelse i flere situationer. At prioritere dem er særligt relevant tidligt i læringsprocessen.


…hvis du ellers kan finde frekvensen!

Hvor finder man så informationer om, præcis hvilke ord er mere almindelige end andre? Det er faktisk vanskeligere, end man umiddelbart skulle tro.

Korpuslingvistikken er den disciplin indenfor den almene sprog­videnskab, som analyserer store samlinger af tekster (kaldet tekst­korpusser eller ”korpora”), og som bruger statistiske metoder til at analysere deres indhold til at lære noget om sprogets beskaffenhed.

Man taler om leksikalsk frekvens. De allermest almindelige ord i korpusset er ”højfrekvente”. Helt sjældne ord er til gengæld ”lavfrekvente”. (Typisk har funktionsord en højere frekvens end indholdsord/semantiske rødder.)

Den leksikalske frekvens er en beregnet talværdi, som varierer med det anvendte korpus og regnemetoden. Der findes ikke én autoritativ frekvensliste for et sprog. I stedet finder man sin løsning ved at overveje flere forskellige lister og sikre, at de er udarbejdet på et fornuftigt grundlag.


Almindelige ordbøger hjælper ikke altid

De leksikografer, som udarbejder ordbøgerne, bruger korpuslingvistik i deres arbejde, men de markerer ikke altid ordenes hyppighed i bøgerne. Det ville ellers være gavnligt for folk, som ønsker at prioritere de mest almindelige ord på sproget som en del af deres læringsproces.

”Den Danske Ordbog” af Det Danske Sprog- og Litteraturselskab markerer primært de lavfrekvente ord med betegnelserne ”sjældent” eller ”nu sjældent”. Se fx opslaget for substantivet ”rayon”.

Modsat har den tyske ”Wörterbuch der deutschen Sprache (Duden Online)“ af Cornelsen Verlag et frekvensbarometer med fem trin, men det vises ikke altid. Det kan ses på opslaget for substantivet ”Information” under betegnelsen ”Häufigkeit” (som betyder ”hyppighed”).

Denne parameter bør man holde øje med som forbruger, når man leder efter en ny ordbog.

Desværre står der ikke noget om frekvens i de ordbøger mellem græsk og dansk, som jeg har fundet og kommenteret på i kapitel 5 –⁠ og de er tilsyneladende de eneste på markedet.


Frekvensordbøger

En frekvensordbog er en form for specialordbog, som indeholder en rangordnet liste af tusindvis af de mest almindelige ord på et sprog. Den udarbejdes på baggrund af en optælling af ordene i et korpus.

Mig bekendt findes der ingen danskudgivet frekvensordbog for moderne græsk. Derfor har jeg fundet nogle alternativer, som har hver sine styrker og svagheder.


Anbefalinger

Det Hellenske Nationalkorpus (ΙΕΛ / ILSP)

Det græske Institut for Sprog- og Taleprocessering er et offentligt understøttet forsknings- og udviklingscenter, som arbejder med sprog og informationsteknologi for at skabe nye sprogteknologier til græsk.

Instituttet udgiver den mest troværdige kilde, jeg har kunnet finde: Det Hellenske Nationalkorpus (Εθνικός Θησαυρός Ελληνικής). Siden er tilgængelig på græsk og engelsk.

Styrker

Svagheder


MostUsedWords: ”Greek Frequency Dictionary

Den amerikanske virksomhed MostUsedWords udgiver et sæt af engelsksprogede frekvensordbøger til græsk. Sættets fire bøger er inddelt efter niveau: ”essential”, ”intermediate”, ”advanced”, og ”master”. Hver bog dækker 2.500 ord, så sættet indeholder i alt 10.000 ord.

Jeg har ikke selv brugt sættet til græsk, men har haft mulighed for at få et førstehåndskig på virksomhedens tilsvarende sæt til andre sprog. Bøgerne har stort set den samme indledning og struktur uanset det pågældende fremmedsprog. Man må derfor formode, at den nedenstående vurdering også er (i det mindste delvist) gyldig for sættet til græsk.

Styrker

Svagheder


Wiktionary

Den engelske udgave af Wiktionary har en frekvensliste til græsk, som i skrivende stund skulle være baseret på indhold fra opensubtitles.org.

Styrker

Svagheder


Afsluttende bemærkninger

Jeg kender ikke til nogen danskudgivet frekvensordbog til græsk. Til gengæld findes der nogle ressourcer derude, som ”går igennem” det engelske sprog.

Blandt de nævnte anbefalinger findes der ingen helt ideel løsning. Man kan med fordel kombinere listen fra Det Hellenske Nationalkorpus med en af de to andre løsninger. ■

Udgivet 28. november 2023.
Sidst opdateret 4. januar 2024.


Bibliografi

  1. Andersen, Hanne Leth. 2014.
    ”Progression.” I: ”Fremmedsprog i gymnasiet –⁠ teori, praksis og udsyn,” 55⁠-⁠68. Frederiksberg: Samfundslitteratur.
    https://samfundslitteratur.dk/bog/fremmedsprog-⁠i⁠-⁠gymnasiet
  2. Det Danske Sprog- og Litteraturselskab. Uden dato.
    ”Den Danske Ordbog.”
    https://ordnet.dk/ddo
  3. Dudenredaktion. Uden dato.
    Wörterbuch der deutschen Sprache.Duden Online. Berlin: Cornelsen Verlag GmbH.
    https://duden.de/woerterbuch
  4. Ινστιτούτο Επεξεργασίας του Λόγου /⁠ Institute for Language and Speech Processing. Uden dato.
    Εθνικός Θησαυρός Ελληνικής /⁠ Hellenic National Corpus.”
    https://hnc.ilsp.gr
  5. Kirchmeier, Sabine. 2009.
    ”Korpus.” Den Store Danske.
    https://denstoredanske.lex.dk/korpus
  6. MostUsedWords. Uden dato.
    Greek Frequency Dictionaries.”
    https://mostusedwords.com/collections/greek-frequency-dictionaries