Alfabetiese orde
Alfabetiese volgorde is 'n stelsel waardeur karakterstringe in volgorde geplaas word op grond van die posisie van die karakters in die konvensionele ordening van 'n alfabet . Dit is een van die metodes van samestelling . In wiskunde, 'n leksikografiese orde is die veralgemening van die alfabetiese volgorde aan ander vorme van data, soos rye van syfers of nommers.
As dit toegepas word op toutjies of rye wat syfers, getalle of meer uitgebreide soorte elemente kan bevat, word die alfabetiese volgorde benewens alfabetiese karakters gewoonlik 'n leksikografiese volgorde genoem .
Om vas te stel watter van die twee stringe karakters eerste kom as hulle in alfabetiese volgorde rangskik, word hul eerste letters vergelyk. As dit verskil, kom die tou waarvan die eerste letter vroeër in die alfabet kom, voor die ander tou. As die eerste letters dieselfde is, word die tweede letters vergelyk, ensovoorts. As 'n posisie bereik word waar die een snaar nie meer letters het om te vergelyk terwyl die ander dit het nie, word die eerste (korter) string geag eerste in alfabetiese volgorde te kom.
Hoofletters (hoofletters) word gewoonlik beskou as identies aan hul ooreenstemmende kleinletters vir die doeleindes van alfabetiese ordening, alhoewel konvensies aanvaar kan word om situasies te hanteer waar twee snare slegs in hoofletters verskil . Verskeie konvensies bestaan ook vir die hantering van snare wat spasies bevat , aangepaste letters (soos diakritiese tekens) en nie-letter karakters soos leestekens .
Die resultaat van die plasing van 'n stel woorde of snare in alfabetiese volgorde is dat al die snare wat met dieselfde letter begin, saam gegroepeer is; binne daardie groepering word alle woorde wat met dieselfde volgorde van twee letters begin, gegroepeer; en so aan. Die stelsel is dus geneig om die aantal algemene voorletters tussen aangrensende woorde te maksimeer.
Geskiedenis
Noordwes-Semitiese skrifgeleerdes het die eerste keer in die 1ste millennium vC gebruik gemaak van die Abjad- stelsel. [1] ' n Reeks ander metodes om materiaal te klassifiseer en te orden, insluitend geografies, chronologies , hiërargies en volgens kategorieë , het eeue lank voorkeur bo alfabetiese volgorde gehad. [2]
Die Bybel is gedateer in die 6de-7de eeu v.G.J. In die boek Jeremia gebruik die profeet 'n vervangingsyfer van Atbash , gebaseer op alfabetiese volgorde. Net so het Bybelse outeurs akrostieke gebruik op grond van die (geordende) Hebreeuse alfabet . [3]
Die eerste effektiewe gebruik van alfabetiese volgorde as katalogiseertoestel onder geleerdes was moontlik in antieke Alexandrië, [4] in die Groot Biblioteek van Alexandrië , wat gestig is omstreeks 300 VC. Die digter en geleerde Callimachus , wat daar gewerk het, het vermoedelik die eerste biblioteekkatalogus ter wêreld , bekend as die Pinakes , geskep , met boekrolle wat in alfabetiese volgorde volgens die eerste letter van die outeurs se name geplaas is. [2]
In die 1ste eeu vC het die Romeinse skrywer Varro alfabetiese lyste van outeurs en titels saamgestel. [5] In die 2de eeu GJ skryf Sextus Pompeius Festus 'n ensiklopediese toonbeeld van die werke van Verrius Flaccus , De verborum significatu , met inskrywings in alfabetiese volgorde. [6] In die 3de eeu HJ het Harpocration 'n Homeriese leksikon geskryf wat in alfabetis met al die letters geskryf is. [7] In die 10de eeu het die outeur van die Suda alfabetiese orde met fonetiese variasies gebruik.
Alfabetiese volgorde as hulpmiddel vir konsultasie het in die tweede helfte van die 12de eeu die hoofstroom van die Wes-Europese intellektuele lewe begin betree , toe alfabetiese instrumente ontwikkel is om predikers te help om die Bybelse woordeskat te ontleed . Dit het gelei tot die samestelling van alfabetiese ooreenstemmings van die Bybel deur die Dominikaanse broeders in Parys in die 13de eeu, onder Hugh van Saint Cher . Ouer naslaanwerke soos St. Jerome se interpretasies van Hebreeuse name is alfabeties gemaak om die konsultasie te vergemaklik. Die gebruik van alfabetiese volgorde is aanvanklik weerstaan deur geleerdes, wat van hul studente verwag het om hul studiegebied volgens sy eie rasionele strukture te bemeester; die sukses daarvan is gedryf deur instrumente soos Robert Kilwardby se indeks vir die werke van St. Augustine , wat lesers gehelp het om toegang tot die volledige oorspronklike teks te kry, in plaas daarvan om te afhang van die samestellings van uittreksels wat in die 12de eeuse skolastiek prominent geword het . Die aanneming van alfabetiese volgorde was deel van die oorgang van die primaat van die geheue na die van geskrewe werke. [8] Die idee om inligting volgens die alfabetiese volgorde te orden, het ook weerstand gekry van die samestellers van ensiklopedieë in die 12de en 13de eeu, wat almal toegewyde kerkmanne was. Hulle verkies om hul materiaal teologies te orden - in die volgorde van die skepping van God, begin met Deus (wat God beteken). [2]
In 1604 moes Robert Cawdrey in Tabel Alphabeticall , die eerste eentalige Engelse woordeboek , verduidelik: "Nou, as die woord wat u wil vind, begin met (a) kyk dan in die begin van hierdie tabel, maar as met (v) kyk na die einde ". [9] Alhoewel Samuel Taylor Coleridge reeds in 1803 ensiklopedieë veroordeel het met ''n reëling wat bepaal is deur die ongeluk van die eerste letters' ', [10] is baie lyste vandag gebaseer op hierdie beginsel.
Rangskikking in alfabetiese volgorde kan gesien word as 'n krag vir die demokratisering van toegang tot inligting, aangesien dit nie uitgebreide voorkennis benodig om te vind wat nodig is nie. [2]
Bestelling in die Latynse skrif
Basiese volgorde en voorbeelde
Die standaardvolgorde van die moderne ISO-basiese Latynse alfabet is:
- ABCDEFGHIJKLMNOPQRSTU-VWXYZ
'N Voorbeeld van reguit alfabetiese volgorde:
- As; Aster; Astrolabe; Sterrekunde; Astrofisika; By; Ataman; Aanval; Baa
Nog 'n voorbeeld:
- Barnacle; Wees; Was; Voordeel; Gebuig
Bogenoemde woorde is alfabeties gerangskik. Soos voor Aster kom omdat hulle met dieselfde twee letters begin en As daarna nie meer letters het nie, terwyl Aster dit doen. Die volgende drie woorde kom agter Aster omdat hul vierde letter (die eerste een wat verskil) r is , wat na e (die vierde letter van Aster ) in die alfabet kom. Hierdie woorde word self georden op grond van hul sesde letters (onderskeidelik l , n en p ). Dan kom At , wat verskil van die voorafgaande woorde in die tweede letter ( t kom na s ). Ataman kom agter At om dieselfde rede dat Aster agter As aangekom het . Aanval volg Ataman op grond van die vergelyking van hul derde letters, en Baa kom agter al die ander aan omdat dit 'n ander eerste letter het.
Behandeling van meervoudige snare
As sommige van die snare wat bestel word uit meer as een woord bestaan, dit wil sê, hulle bevat spasies of ander skeiers soos koppeltekens , dan kan twee basiese benaderings gevolg word. In die eerste benadering word alle snare aanvanklik volgens hul eerste woord georden, soos in die volgorde:
- Eikehout; Oak Hill; Oak Ridge; Oakley Park; Oakleyrivier
- waar alle snare wat met die afsonderlike woord Oak begin , al diegene begin wat Oakley begin , omdat Oak Oakley in alfabetiese volgorde voorafgaan .
In die tweede benadering word snare in alfabetisering gemaak asof hulle geen spasies het nie, wat die volgorde gee:
- Eikehout; Oak Hill; Oakley Park; Oakley-rivier; Oak Ridge
- waar Oak Ridge nou na die Oakley- toutjies kom, soos dit sou wees as dit 'Oakridge' sou staan.
Die tweede benadering is die een wat gewoonlik in woordeboeke [ aanhaling nodig ] gebruik word , en dit word dus dikwels deur uitgewers woordeboekorde genoem . Die eerste benadering is dikwels in boekindekse gebruik , hoewel elke uitgewer tradisioneel sy eie standaarde stel vir watter benadering om te gebruik; daar was voor 1975 geen ISO-standaard vir boekindekse ( ISO 999 ) nie.
Spesiale gevalle
Gewysigde briewe
In Frans word gewysigde letters (soos diakritiese ) vir alfabetiese ordenings dieselfde as die basisletter behandel. Byvoorbeeld, rôle kom tussen rock en rose , asof dit geskryf is rol . Tale wat sulke letters stelselmatig gebruik, het egter gewoonlik hul eie bestelreëls. Sien Taalspesifieke konvensies hieronder.
Bestel volgens van
In die meeste kulture waar familiename na voorname geskryf word , is dit steeds wenslik om eers lyste met name (soos in telefoongids) op familiename te sorteer. In hierdie geval moet name herrangskik word om behoorlik te sorteer. Juan Hernandes en Brian O'Leary moet byvoorbeeld as 'Hernandes, Juan' en 'O'Leary, Brian' gesorteer word, selfs al word hulle nie so geskryf nie. Dit is moeilik om hierdie reël in 'n algoritme vir rekenaarversameling vas te lê, en eenvoudige pogings sal noodwendig misluk. Tensy die algoritme byvoorbeeld 'n uitgebreide lys met familiename het, is daar geen manier om te besluit of "Gillian Lucille van der Waal" "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der" is nie, of selfs "Lucille van der Waal, Gillian".
Ordening volgens van kom gereeld voor in akademiese kontekste. Binne 'n enkele multi-outeur-artikel word die outeurs alfabeties op van gesorteer, eerder as op ander metodes soos omgekeerde senioriteit of subjektiewe mate van bydrae tot die vraestel, as 'n manier om 'soortgelyke bydraes te erken' of 'vermy' [ing] disharmonie in samewerkende groepe ". [11] Daar is gevind dat die praktyk op sekere terreine om aanhalings in bibliografieë deur die vanne van hul outeurs te orden, vooroordeel skep ten gunste van outeurs met vanne wat vroeër in die alfabet voorkom, terwyl hierdie effek nie voorkom in velde waarin bibliografieë voorkom nie. chronologies bestel. [12]
Die en ander algemene woorde
As 'n frase begin met 'n baie algemene woord (soos "die", "a" of "an", genaamd artikels in grammatika), word daardie woord soms geïgnoreer of na die einde van die frase geskuif, maar dit is nie altyd die saak. Die boek ' The Shining ' kan byvoorbeeld behandel word as 'Shining', of 'Shining, The' en dus voor die boektitel ' Summer of Sam ', hoewel dit ook bloot as 'The Shining' en na ' Somer van Sam ". Net so kan ' n rimpel in die tyd 'behandel word as' rimpel in die tyd ',' rimpel in die tyd ',' of ''n rimpel in die tyd'. Al drie alfabetiseringsmetodes is redelik maklik om met algoritme te skep, maar baie programme vertrou eerder op eenvoudige leksikografiese volgorde .
Mac- voorvoegsels
Die voorvoegsels M ' en Mc in Ierse en Skotse vanne is afkortings vir Mac en word soms alfabeties gemaak asof die spelling Mac volledig is. Dus kan McKinley voor Mackintosh gelys word (soos wanneer dit as "MacKinley" uitgespel is). Sedert die koms van rekenaar-gesorteerde lyste, kom hierdie soort alfabetisering minder gereeld voor, hoewel dit steeds in Britse telefoongids gebruik word.
Ligature
Ligaturen (twee of meer letters wat saamgevoeg is in een simbool) wat nie as afsonderlike letters, soos Æ en Œ in Engels beskou word nie, word gewoonlik saamgevoeg asof die letters apart is - "æther" en "aether" sou dieselfde bestel word t.o.v. alle ander woorde. Dit geld selfs as die ligatuur nie suiwer stilisties is nie, soos in leenwoorde en handelsname.
Spesiale reëls moet moontlik aangeneem word om snare te sorteer, wat net wissel of twee letters deur 'n ligatuur gevoeg word.
Behandeling van syfers
As sommige van die snare syfers bevat (of ander karakters wat nie letterletters is nie), is verskillende benaderings moontlik. Soms word sulke karakters behandel asof dit voor of na al die letters van die alfabet kom. 'N Ander metode is dat getalle alfabeties gesorteer word soos dit gespel sou word: 1776 sou byvoorbeeld gesorteer word asof' sewentien ses-en-sewentig 'uitgespel word, en 24 heures du Mans asof dit' vingt-quatre ... '(Frans) vir "vier-en-twintig"). Wanneer syfers of ander simbole as spesiale grafiese vorms van letters gebruik word, soos 1337 vir leet of die film Seven (wat gestileer is as Se7en ), kan dit gesorteer word asof dit daardie letters is. Natuurlike sorteervolgorde orden alfabeties, behalwe dat meersyferige getalle as 'n enkele karakter behandel word en volgens die waarde van die getal wat deur die syfers gekodeer is, gerangskik word.
Taalspesifieke konvensies
Tale wat 'n uitgebreide Latynse alfabet gebruik, het gewoonlik hul eie reëlings vir die behandeling van ekstra letters. In sommige tale word sekere digrawe ook as enkelletters behandel vir samestellingsdoeleindes. Die 29-letter-alfabet van Spaans behandel byvoorbeeld ñ as 'n basiese letter na aanleiding van n , en het vroeër die digrawe ch en ll as onderskeidelik basiese letters soos c en l behandel. Ch en ll word steeds as letters beskou, maar is nou alfabeties as tweeletterkombinasies. (Die nuwe alphabetization reël uitgereik deur die Royal Spaans Akademie in 1994) Aan die ander kant, die digraaf RR volg rqu as wat verwag is, en het toe so gedoen nog voordat die 1994 alphabetization reël.
In enkele gevalle, soos Kiowa , is die alfabet heeltemal herorden.
Alfabetiseringsreëls wat in verskillende tale toegepas word, word hieronder gelys.
- In Azerbeidjans is daar agt addisionele letters in die standaard Latynse alfabet. Vyf daarvan is vokale: i, ı, ö, ü, ə en drie is medeklinkers: ç, ş, ğ. Die alfabet is dieselfde as die Turkse alfabet , met dieselfde klanke wat met dieselfde letters geskryf is, behalwe vir drie addisionele letters: q, x en ə vir klanke wat nie in Turks bestaan nie. Alhoewel al die "Turkse letters" in hul "normale" alfabetiese volgorde soos in Turks saamgevoeg word, word die drie ekstra letters na willekeur versamel na letters waarvan die klanke hulle s'n nader. Dus, q word net na k saamgevoeg, x (uitgespreek soos 'n Duitse ch ) word net na h saamgestel en ə (ongeveer soos 'n Engelse kort a uitgespreek ) word net na e saamgevat.
- In Bretons is daar geen "c", "q", "x" nie, maar wel die digrawe "ch" en "c'h", wat tussen "b" en "d" saamgevoeg word. Byvoorbeeld: «buzhugenn, chug, c'hoar, daeraouenn» (erdwurm, sap, suster, traandruppel).
- In Bosnies , Kroaties en Serwies en ander verwante Suid-Slawiese tale word die vyf karakters met aksent en drie saamgevoegde karakters gesorteer na die oorspronklike: ..., C, Č, Ć, D, DŽ, Ž, E, ..., L , LJ, M, N, NJ, O, ..., S, Š, T, ..., Z, Ž.
- In Tsjeggies en Slowaaks het klinkers met aksent sekondêre gewig - in vergelyking met ander letters word dit as hul ongeaccentreerde vorms behandel (A-Á, E-É-Ě, I-Í, O-Ó-Ô, U-Ú-Ů , Y-Ý), maar dan word hulle gesorteer na die ongeaksentreerde letters (byvoorbeeld, die korrekte leksikografiese volgorde is baa, baá, báa, bab, báb, bac, bác, bač, báč). Akkonsonante met aksent (dié met karon ) het die primêre samestellingsgewig en word onmiddellik na hul eweknie-eweknieë saamgevoeg, met die uitsondering van Ď, again en Ť, wat weer sekondêre gewig het. CH word beskou as 'n aparte brief wees en gaan tussen H en I . In Slowaaks word DZ en DŽ ook as afsonderlike letters beskou en geposisioneer tussen Ď en E (A-Á-Ä-BC-Č-D-Ď-DZ-DŽ-E-É ...).
- In die Deense en Noorse alfabette is dieselfde ekstra vokale as in Sweeds (sien hieronder) ook aanwesig, maar in 'n ander volgorde en met verskillende letters (..., X, Y, Z, Æ , Ø , Å ). Ook, "Aa" versamel as 'n ekwivalent aan "Å". Die Deense alfabet het tradisioneel 'W' gesien as 'n variant van 'V', maar vandag word 'W' as 'n aparte letter beskou.
- In Nederlands moes die kombinasie IJ (wat ing voorstel ) vroeër as Y (of soms, as 'n aparte letter Y
Uitsonderings is telefoongids; IJ word altyd hier as Y saamgevat, want in baie Nederlandse familiename word Y gebruik waar moderne spelling IJ sou vereis. Let op dat 'n woord wat begin met ij wat met 'n hoofletter I geskryf word, ook met 'n hoofletter J is, byvoorbeeld die stad IJmuiden , die rivier IJssel en die land IJsland ( Ysland ). - In Esperanto , konsonante met kappie aksent ( c , G , H , J , S ), sowel as u (u met breve ), word gereken as afsonderlike letters en vergelyk apart (c, c, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z).
- In Esties word õ , ä , ö en ü as afsonderlike letters beskou en saamgevoeg na w . Letters š , z en ž verskyn slegs in leenwoorde en buitelandse eiename en volg die letter s in die Estse alfabet , wat andersins nie van die basiese Latynse alfabet verskil nie.
- Die Faroese alfabet bevat ook enkele Deense, Noorse en Sweedse ekstra letters, naamlik Æ en Ø . Verder het die Faroëreilande alfabet gebruik die Yslandse ETH, wat die volg D . Vyf van die ses vokale A , I , O , U en Y kan aksente kry en word daarna as afsonderlike letters beskou. Die medeklinkers C , Q , X , W en Z word nie gevind nie. Daarom is die eerste vyf letters A , Á , B , D en Ð , en die laaste vyf is V , Y , Ý , Æ , Ø
- In Filipino (Tagalog) en ander Filippynse tale word die letter Ng as 'n aparte letter behandel. Dit word uitgespreek soos in sing, tafeltennis, ens. Op sigself word dit uitgespreek as nang , maar in die algemeen word die Filippynse ortografie gespel asof dit twee aparte letters (n en g) is. Letterafgeleides (soos Ñ ) volg ook dadelik die basisletter. Filipino is ook met diakritici geskryf, maar die gebruik daarvan kom baie skaars voor (behalwe die tilde ). (Filippynse ortografie bevat ook spelling.)
- Die Finse alfabet en samestellingsreëls is dieselfde as dié van Sweeds.
- Vir Frans bepaal die laaste aksent in 'n gegewe woord die volgorde. [13] In Frans sou die volgende vier woorde byvoorbeeld so gesorteer word: cote
- In Duitse letters met umlaut ( Ä , Ö , Ü ) word oor die algemeen net soos hul weergawes nie behandel nie; ß word altyd as ss gesorteer. Dit maak die alfabetiese orde Ärgerlich, Arg, Arm, Assistent, Aßlar, Assoziation. Vir telefoongids en soortgelyke lyste met name moet die skerms saamgevoeg word soos die letterkombinasies "ae", "oe", "ue", want 'n aantal Duitse vanne verskyn beide met die umlaut en in die nie-gegloeide vorm met "e "(Müller / Mueller). Dit maak die alfabetiese volgorde Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
- Die Hongaarse vokale het aksente, omlope en dubbele aksente, terwyl medeklinkers met enkele, dubbele (digrafieke) of driedubbele (driehoekige) karakters geskryf word. Klanke met aksent is gelykstaande aan hul eweknieë sonder aksent, en dubbele en drievoudige karakters volg hul enkele oorspronklike. Hongaarse alfabetiese volgorde is: A = Á , B, C, Cs , D, Dz , Dzs , E = É , F, G, Gy , H, I = Í , J, K, L, Ly , M, N, Ny , O = Ó , Ö = Ő , P, Q, R, S, Sz , T, Ty , U = Ú , Ü = Ű , V, W, X, Y, Z, Zs . (Voor 1984, dz en dzs is nie beskou as 'n enkele letters vir inbring, maar twee letters elk, d + z en d + ZS plaas.) Dit beteken dat bv nádcukor voorafgaan nádcsomó (selfs al is gewoonlik voorafgaan u ), want c voorafgaan cs in die samestelling. Verskil in vokaallengte moet slegs in ag geneem word as die twee woorde andersins identies is (bv. Egér, éger ). Ruimtes en koppeltekens binne frases word in die samestelling geïgnoreer. Ch kom ook in sommige woorde as 'n digraaf voor, maar dit word nie op sigself beskou as 'n grafeme in terme van samestelling nie.
- 'N Spesifieke kenmerk van Hongaarse samestelling is dat saamgestelde vorms van dubbele di- en trigrafieke (soos ggy van gy + gy of ddzs van dzs + dzs ) saamgevat moet word asof dit volledig geskryf is (onafhanklik van die feit dat die sametrekking en die elemente van die di- of trigrafieke). Byvoorbeeld, kaszinó voorafgaan kassza (selfs al is die 4de karakter z normaalweg sou kom nadat s in die alfabet), omdat die vierde "karakter" ( grafeem ) van die woord kassza n tweede word beskou as sz (ontbindende ssZ in sz + sz ) , wat wel op i (in kaszinó ) volg.
- In Yslands word Þ bygevoeg, en D word gevolg deur Ð . Elke vokaal (A, E, I, O, U, Y) word gevolg deur sy korrespondent met akuut : Á, É, Í, Ó, Ú, Ý. Daar is geen Z nie, dus eindig die alfabet: ... X, Y, Ý, Þ , Æ , Ö.
- Albei letters is ook gebruik deur Anglo-Saksiese skrifgeleerdes wat ook die Runiese letter Wynn gebruik het om / w / voor te stel.
- Þ (genoem doring; kleinletter þ) is ook 'n runiese letter.
- Ð (genaamd eth; kleinletter ð) is die letter D met 'n ekstra slag.
- Kiowa word op fonetiese beginsels georden, soos die Brahmaniese skrifte , eerder as op die historiese Latynse orde. Klinkers kom eerste, stop dan medeklinkers wat van voor tot agter in die mond bestel word, en van negatiewe tot positiewe stemtyd , dan die affikate, frikatiewe, vloeistowwe en neus:
- A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
- In Litaus gaan spesifiek Litaus letters na hul Latynse oorspronklike. Nog 'n verandering is dat Y net voor J kom : ... G, H, I, Į, Y, J, K ...
- In Pools word spesifiek Poolse letters afgelei van die Latynse alfabet versamel na die oorspronklike: A, Ą, B, C, Ć, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó , P, ..., S, Ś, T, ..., Z, Ź, Ż. Die grawe vir samestellingsdoeleindes word behandel asof dit twee aparte letters is.
- In Portugees is die samevolgorde net soos in Engels: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Grafieke en letters met diakrite is nie in die alfabet ingesluit nie.
- In Roemeens word spesiale karakters afgelei van die Latynse alfabet versamel na die oorspronklike: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
- Spaans het (tot 1994) "CH" en "LL" as enkelletters behandel , wat die volgorde van cinco , credo , chispa en lomo , luz , llama gegee het . Dit is nie meer waar nie, aangesien die RAE in 1994 die meer konvensionele gebruik aanvaar het, en nou word LL tussen LK en LM, en CH tussen CG en CI, saamgevoeg. Die ses karakters met diakritiek Á, É, Í, Ó, Ú, Ü word behandel as die oorspronklike letters A, E, I, O, U, byvoorbeeld: radio , ráfaga , rana , rápido , rastrillo . Die enigste Spaans spesifieke vraag is Ñ ( eñe ) as 'n ander letter na N.
- In die Sweedse alfabet is daar drie ekstra vokale aan die einde daarvan geplaas (..., X, Y, Z, Å , Ä , Ö ), soortgelyk aan die Deense en Noorse alfabet, maar met verskillende letters en 'n ander volgorde. Die letter "W" is behandel as 'n variant van "V", maar in die 13de uitgawe van Svenska Akademiens ordlista (2006) word "W" as 'n aparte brief beskou.
- In die Turkse alfabet is daar 6 bykomende letters: ç, ğ, ı, ö, ş en ü (maar geen q, w en x nie). Hulle word saamgestel met ç na c, ğ na g, ı voor i, ö na o, ş na s, en ü na u. Oorspronklik, toe die alfabet in 1928 bekendgestel is, is ek na i saamgevat, maar die volgorde is later verander sodat letters met vorms wat kolletjies, cedilles of ander versieringstekens bevat altyd die letters volg met ooreenstemmende kaal vorms. Let op dat in die Turkse ortografie die letter I die majuscule van puntlose ı is, terwyl İ die majuscule van stippel i.
- In baie Turkse tale (soos Azeri of die Jaꞑalif- ortografie vir Tatar ) was daar vroeër die letter Gha (Ƣƣ) wat tussen G en H gekom het . Dit is nou in onbruik.
- In Viëtnamees is daar 7 bykomende letters: ă , â , đ , ê , ô , ơ , ư terwyl f , j , w , z afwesig is, alhoewel dit steeds gebruik word (soos internetadres, vreemde leningstaal) . "f" word vervang deur die kombinasie "ph". Dieselfde as vir "w" is "qu".
- In Volapük ä word ö en ü as afsonderlike letters getel en afsonderlik saamgevoeg (a, ä, b ... o, ö, p ... u, ü, v) terwyl q en w afwesig is. [14]
- In Wallies word die grafieke CH, DD, FF, NG, LL, PH, RH en TH as enkele letters behandel, en elkeen word gelys na die eerste karakter van die paar (behalwe vir NG wat na G gelys word), wat die bestel A, B, C, CH, D, DD, E, F, FF, G, NG, H, ensovoorts. Soms kan dit egter gebeur dat samestelling van woorde lei tot die jukstaposisie van twee letters wat nie 'n digraaf vorm nie. 'N Voorbeeld is die woord LLONGYFARCH (saamgestel uit LLON + GYFARCH). Dit lei tot so 'n ordening soos byvoorbeeld LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG is 'n digraaf in LLONG, maar nie in LLONGYFARCH nie). Die letterkombinasie R + H (anders as die digraaf RH) kan op soortgelyke wyse ontstaan deur mekaar te plaas in verbindings, alhoewel dit geneig is om geen pare te produseer waarin verkeerde identifisering die ordening kan beïnvloed nie. Vir die ander potensieel verwarrende letterkombinasies wat kan voorkom - naamlik D + D en L + L - word 'n koppelteken in die spelling gebruik (bv. AD-DAL, CHWIL-LYS).
Outomatisering
Samestelling algoritmes (in kombinasie met sorteeralgoritmes ) word gebruik in rekenaarprogrammering te plaas snare in alfabetiese volgorde. 'N Standaardvoorbeeld is die Unicode Collation Algorithm , wat gebruik kan word om snare wat enige Unicode- simbole bevat in alfabetiese volgorde te plaas. [13] Dit kan gemaak word dat dit voldoen aan die meeste van die taalspesifieke konvensies wat hierbo beskryf word, deur die verstek-samestellingstabel aan te pas. Verskeie sulke aanpassings word in Common Locale Data Repository versamel .
Soortgelyke bestellings
Die beginsel agter alfabetiese ordening kan steeds toegepas word in tale wat nie streng gesproke 'n alfabet gebruik nie - byvoorbeeld, dit kan met behulp van 'n sillabary of abugida geskryf word - mits die gebruikte simbole 'n vaste ordening het.
Vir logografiese skryfstelsels, soos Chinese hanzi of Japannese kanji , word die metode van radikale en beroertesortering gereeld gebruik as 'n manier om 'n ordening op die simbole te definieer. Japannees gebruik soms uitspraakvolgorde, meestal met die Gojūon- orde, maar soms met die ouer Iroha- ordening.
In die wiskunde is leksikografiese volgorde 'n manier om rye te orden op 'n analoog manier wat gebruik word om alfabetiese volgorde te produseer. [15]
Sommige rekenaartoepassings gebruik 'n weergawe van alfabetiese volgorde wat bereik kan word met behulp van 'n baie eenvoudige algoritme wat suiwer gebaseer is op die ASCII- of Unicode- kodes vir karakters. Dit kan nie-standaard effekte hê, soos om alle hoofletters voor kleinletters te plaas. Sien ASCII-bestelling .
'N Rymwoordeboek is gebaseer op die sorteer van woorde in alfabetiese volgorde vanaf die laaste tot die eerste letter van die woord.
Sien ook
- Versameling
- Hulp: Alfabetiese volgorde
- Sorteer
Verwysings
- ^ Reinhard G. Lehmann: "27-30-22-26. Hoeveel letters het 'n alfabet nodig? Die saak van Semities", in: Die idee om te skryf: Skryf oor grense heen , geredigeer deur Alex de Voogt en Joachim Friedrich Quack, Leiden : Brill 2012, pp. 11–52.
- ^ a b c d Street, Julie (10 Junie 2020). "Van A tot Z - die verrassende geskiedenis van alfabetiese volgorde" (teks en klank) . ABC News (ABC Radio National) . Australian Broadcasting Corporation . Besoek op 6 Julie 2020 .
- ^ bv. Psalms 25, 34, 37, 111, 112, 119 en 145 van die Hebreeuse Bybel
- ^ Daly, Lloyd. Bydraes tot die geskiedenis van alfabetisering in die Oudheid en die Middeleeue . Brussel, 1967. p. 25.
- ^ O'Hara, James (1989). "Messapus, Cycnus en die alfabetiese orde van Vergilius se katalogus van Italiaanse helde". Phoenix . 43 (1): 35–38. doi : 10.2307 / 1088539 . JSTOR 1088539 .
- ^ LIVRE XI - texte latin - traduction + commentaires .
- ^ Gibson, Craig (2002). Interpretasie van 'n klassieke: Demosthenes en sy antieke kommentators .
- ^ Rouse, Mary A .; Rouse, Richard M. (1991), " Statim invenire : Schools, Preachers and New Attitudes to the Page", Authentic Witnesses: Approaches to Middeleeuse tekste en manuskripte , University of Notre Dame Press, pp. 201–219, ISBN 0-268-00622-9
- ^ Cawdrey, Robert (1604). 'N Tabel Alfabeties . Londen. bl. [A4] v.
- ^ Coleridge's Letters, No.507 .
- ^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (Januarie 2007). "Skrywersvolgorde en krediet vir bydraes in multiautoriseerde publikasies" . PLOS Biol . 5 (1): e18. doi : 10.1371 / joernaal.pbio.0050018 . PMC 1769438 . PMID 17227141 .
- ^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "Bestel aangeleenthede: alfabetiserende aanhalingsvoorstellings in teks-aanhalingskoerse" (PDF) . Psigonomiese bulletin en oorsig . 26 (3): 1020–1026. doi : 10.3758 / s13423-018-1532-8 . PMID 30288671 . S2CID 52922399 . Lay-opsomming - Inside Higher Ed (22 Oktober 2018).
- ^ a b Msgstr "Unicode Tegniese Standaard # 10: Unicode - versamelingsalgoritme" . Unicode, Inc. (unicode.org). 20 Maart 2008 . Besoek op 27 Augustus 2008 .
- ^ Midgley, Ralph. "Volapük na Engelse woordeboek" (PDF) . Op 1 September 2012 vanaf die oorspronklike (PDF) geargiveer . Besoek op 24 September 2019 .
- ^ Franz Baader; Tobias Nipkow (1999). Kwartaal herskryf en alles . Cambridge University Press. bl. 18–19. ISBN 978-0-521-77920-3.
Verdere leeswerk
- Chauvin, Yvonne. Pratique du classement alphabétique . 4de uitg. Parys: Bordas, 1977. ISBN 2-04-010155-1
- Vlaandere, Judith . 'N Plek vir alles: die nuuskierige geskiedenis van alfabetiese orde . New York: Basiese boeke / Hatchette-boeke, 2020. ISBN 978-1-5416-7507-0