Indledning
Indtil nu har denne serie fokuseret på forudsætningerne for at lære græsk, med en blanding af værktøjer og grundlæggende sproglig viden, både generel viden og specifik viden om det moderne, græske sprog.
Dette kapitel bygger videre på forudsætningerne. Det handler om en problemstilling, som det er svært at finde pålidelige kilder til, hvis man ønsker at prioritere at lære de mest almindelige ord på sproget.
Indhold
- Indledning
- Prioritér evt. at lære de mest almindelige ord på sproget…
- …hvis du ellers kan finde frekvensen!
- Almindelige ordbøger hjælper ikke altid
- Frekvensordbøger
- Anbefalinger
- Afsluttende bemærkninger
- Bibliografi
Prioritér evt. at lære de mest almindelige ord på sproget…
Meget af det at lære et fremmedsprog handler om at udvide sit ordforråd (inkl. faste vendinger). Ord findes der jo utallige af, og det rejser spørgsmålet om ens prioriteter, mens man lærer sproget.
Det virker oplagt at fokusere på de mest almindelige ord. Hvis man fx ved, at ord som ”du”, ”den” eller ”at” er meget almindelige, så er det oplagt at fokusere mere på dem end mindre almindelige ord såsom ”glædesblus” eller ”visnepolitik”.
Princippet nævnes bl.a. i lærebogen ”Fremmedsprog i gymnasiet –⁠ teori, praksis og udsyn”:
”Det virker relevant på eleverne, og det giver dem meget hurtigt et lille sprog med stor brugsværdi. Dette gælder både i sprogproduktion og i læse- og lyttefærdighed.” (Andersen 2014, 61)
Formålet med at lære de mest almindelige ord er hurtigere at få mulighed for at skabe sætninger og tale om almene emner. Disse ord finder anvendelse i flere situationer. At prioritere dem er særligt relevant tidligt i læringsprocessen.
…hvis du ellers kan finde frekvensen!
Hvor finder man så informationer om, præcis hvilke ord er mere almindelige end andre? Det er faktisk vanskeligere, end man umiddelbart skulle tro.
Korpuslingvistikken er den disciplin indenfor den almene sprogvidenskab, som analyserer store samlinger af tekster (kaldet tekstkorpusser eller ”korpora”), og som bruger statistiske metoder til at analysere deres indhold til at lære noget om sprogets beskaffenhed.
Man taler om leksikalsk frekvens. De allermest almindelige ord i korpusset er ”højfrekvente”. Helt sjældne ord er til gengæld ”lavfrekvente”. (Typisk har funktionsord en højere frekvens end indholdsord/semantiske rødder.)
Den leksikalske frekvens er en beregnet talværdi, som varierer med det anvendte korpus og regnemetoden. Der findes ikke én autoritativ frekvensliste for et sprog. I stedet finder man sin løsning ved at overveje flere forskellige lister og sikre, at de er udarbejdet på et fornuftigt grundlag.
Almindelige ordbøger hjælper ikke altid
De leksikografer, som udarbejder ordbøgerne, bruger korpuslingvistik i deres arbejde, men de markerer ikke altid ordenes hyppighed i bøgerne. Det ville ellers være gavnligt for folk, som ønsker at prioritere de mest almindelige ord på sproget som en del af deres læringsproces.
”Den Danske Ordbog” af Det Danske Sprog- og Litteraturselskab markerer primært de lavfrekvente ord med betegnelserne ”sjældent” eller ”nu sjældent”. Se fx opslaget for substantivet ”rayon”.
Modsat har den tyske ”Wörterbuch der deutschen Sprache (Duden Online)“ af Cornelsen Verlag et frekvensbarometer med fem trin, men det vises ikke altid. Det kan ses på opslaget for substantivet ”Information” under betegnelsen ”Häufigkeit” (som betyder ”hyppighed”).
Denne parameter bør man holde øje med som forbruger, når man leder efter en ny ordbog.
Desværre står der ikke noget om frekvens i de ordbøger mellem græsk og dansk, som jeg har fundet og kommenteret på i kapitel 5 –⁠ og de er tilsyneladende de eneste på markedet.
Frekvensordbøger
En frekvensordbog er en form for specialordbog, som indeholder en rangordnet liste af tusindvis af de mest almindelige ord på et sprog. Den udarbejdes på baggrund af en optælling af ordene i et korpus.
Mig bekendt findes der ingen danskudgivet frekvensordbog for moderne græsk. Derfor har jeg fundet nogle alternativer, som har hver sine styrker og svagheder.
Anbefalinger
Det Hellenske Nationalkorpus (ΙΕΛ / ILSP)
Det græske Institut for Sprog- og Taleprocessering er et offentligt understøttet forsknings- og udviklingscenter, som arbejder med sprog og informationsteknologi for at skabe nye sprogteknologier til græsk.
Instituttet udgiver den mest troværdige kilde, jeg har kunnet finde: Det Hellenske Nationalkorpus (Εθνικός Θησαυρός Ελληνικής). Siden er tilgængelig på græsk og engelsk.
Styrker
-
Gratis:
Indholdet er gratis og frit tilgængeligt. -
Troværdighed:
Udarbejdet af en troværdig, akademisk kilde. -
Stort og målrettet korpus:
Man har indsamlet ”flere end 97.000.000 ord” i et korpus designet til at ”afspejle den faktiske brug af moderne græsk”. -
Varierede kilder:
Bygget på tekster fra flere forskellige organisationer, herunder forlag, NGO’er, ministerier, og visse andre offentlige organisationer. Teksterne spænder desuden over mange forskellige former for sprog, både skriftsprog og talesprog, såvel som genrer og formater. -
Detaljeret varedeklaration:
Målgruppen er fagfolk, og derfor udgives korpusset med en beskrivelse af det sproglige indhold og de kategorier, man har brugt til at sortere i indholdet. -
Lemmatiseret frekvensliste:
Frekvenslisten er lemmatiseret, så man undgår at have mange forskellige former af det samme ord på listen pga. deres bøjningsmønstre.
Svagheder
-
Begrænset omfang (uden en konto):
Lige nu giver hjemmesiden kun mulighed for at vise de 100 mest frekvente ord (eller lemmaer) i korpusset. Registrerer man en gratis konto, kan man se op til 2.000 ord eller lemmaer.
(Bemærk: Registreringsprocessen var lidt bøvlet, da formularen ikke giver feedback som fx at man prøver at vælge et navn, der allerede er taget. Desuden står listen af lande kun på græsk, hvor Danmark hedder Δανία.) -
Ingen markering af ordklasser:
Man har ikke markeret ordklasserne. Det kan skabe forvirring, hvis enkelte ord i forskellige ordklasser staves på samme måde eller ligner hinanden. Man har dog også udgivet et alternativt, mindre korpus med anførte ordklasser, men det er svært tilgængeligt for den gennemsnitlige bruger. -
Overrepræsentation af indhold fra internettet og aviser:
Indholdet består af 55,9 procent onlineindhold og 40,6 procent indhold fra aviser. De andre kategorier, altså bøger, magasiner, og ”andet”, udgør (desværre) kun 3,5 procent tilsammen. -
Ikke pædagogisk præsentation:
Korpusset er til fagpersoner. Frekvenslisten indeholder stort set ingen supplerende informationer om det enkelte ord.
MostUsedWords: ”Greek Frequency Dictionary”
Den amerikanske virksomhed MostUsedWords udgiver et sæt af engelsksprogede frekvensordbøger til græsk. Sættets fire bøger er inddelt efter niveau: ”essential”, ”intermediate”, ”advanced”, og ”master”. Hver bog dækker 2.500 ord, så sættet indeholder i alt 10.000 ord.
Jeg har ikke selv brugt sættet til græsk, men har haft mulighed for at få et førstehåndskig på virksomhedens tilsvarende sæt til andre sprog. Bøgerne har stort set den samme indledning og struktur uanset det pågældende fremmedsprog. Man må derfor formode, at den nedenstående vurdering også er (i det mindste delvist) gyldig for sættet til græsk.
Styrker
-
Pædagogisk præsentation:
Frekvenslisten indeholder informationer om ordklasse, udtale, en oversættelse til engelsk, og eksempler på ordets anvendelse på fremmedsproget. -
Lemmatiseret frekvensliste:
Frekvenslisten er lemmatiseret, så man undgår at have mange forskellige former af det samme ord på listen pga. deres bøjningsmønstre. -
Lister for individuelle ordklasser:
Bøgerne indeholder afsnit med populære ord per ordklasse.
Svagheder
-
Koster penge:
i skrivende stund koster hele sættet mindst 522 kroner (som ebøger i PDF⁠-⁠format) og helt op til 895 kroner. -
Manglende kilder:
Der mangler kilder til stort set alle faktuelle informationer om korpusset og databehandlingen. I forbindelse med en læringsproces er det afgørende, at man kan stole på de fakta, man præsenteres for. -
Uklarhed om datasættet:
Bøgerne nævner, at man har analyseret en stor mængde undertekster til at lave frekvenslisten. Der angives (som nævnt) ingen kilde, og der er heller ingen noter om, hvilken type sprog og/eller genrer, der oftest forekommer i korpusset. -
Uklare og urealistiske sprogniveauer:
Bøgerne er ikke inddelt efter en standardiseret ramme for sprogniveauer som fx Den Fælles Europæiske Referenceramme for Sprog (CEFR), og det er slet ikke tydeligt, at man overhovedet kan gøre dette ifm. en frekvensliste. Man kan ikke sige, at lige netop de ord, der ligger mellem plads 5.000 og 7.500 på listen skulle være karakteristiske for et ”avanceret” læringsniveau.
Wiktionary
Den engelske udgave af Wiktionary har en frekvensliste til græsk, som i skrivende stund skulle være baseret på indhold fra opensubtitles.org.
Styrker
-
Gratis:
Indholdet er gratis og frit tilgængeligt. -
Pædagogisk præsentation:
Mange af ordene på listen har sit eget opslag på Wiktionary, hvor man kan finde information om ordklasser og betydninger. -
Indholdsfortegnelse:
Frekvenslisten er inddelt i 20 overskrifter for hurtigere og lettere at kunne hoppe rundt i rangordningen.
Svagheder
-
Uklarhed om datasættet:
Der gives ingen anden baggrundsinformation om det korpus, frekvenslisten er beregnet ud fra, end ophavet til teksterne. Der står intet om det samlede antal ord i korpusset, sprogets kvaliteter, genrerne, medietyperne, eller lignende. -
Muligvis manglende lemmatisering:
Der angives intet om, at listen skulle være lemmatiseret. Det kan gøre den mindre praktisk for sproglæring. -
Manglende artikler om visse ord:
Det er langt fra alle ordene, som har et opslag på Wiktionary. Dem må man selv finde information om i sin egen (traditionelle) ordbog eller lignende.
Afsluttende bemærkninger
Jeg kender ikke til nogen danskudgivet frekvensordbog til græsk. Til gengæld findes der nogle ressourcer derude, som ”går igennem” det engelske sprog.
Blandt de nævnte anbefalinger findes der ingen helt ideel løsning. Man kan med fordel kombinere listen fra Det Hellenske Nationalkorpus med en af de to andre løsninger. ■
Udgivet 28. november 2023.
Sidst opdateret 4. januar 2024.
Bibliografi
-
”Progression.” I: ”Fremmedsprog i gymnasiet –⁠ teori, praksis og udsyn,” 55⁠-⁠68. Frederiksberg: Samfundslitteratur.
https://samfundslitteratur.dk /bog /fremmedsprog-⁠i⁠-⁠gymnasiet -
”Den Danske Ordbog.”
https://ordnet.dk /ddo -
”Wörterbuch der deutschen Sprache.” Duden Online. Berlin: Cornelsen Verlag GmbH.
https://duden.de /woerterbuch -
”Εθνικός Θησαυρός Ελληνικής /⁠ Hellenic National Corpus.”
https://hnc .ilsp.gr -
”Korpus.” Den Store Danske.
https://denstoredanske.lex.dk /korpus -
”Greek Frequency Dictionaries.”
https://mostusedwords.com /collections /greek-frequency-dictionaries