Málfarslögreglan – 1. þáttur

Verið velkomin í fyrsta þátt Málfarslögreglunnar.

Hér á eftir verður flutt lítil stefnuskrá sem gefur tóninn fyrir það sem fjallað verður um í komandi þáttum.

Málfarslögreglan ætlar að fjalla um málvillur, stafsetningarvillur og klaufalega orðanotkun í íslensku máli. Það er sama hvaðan villurnar koma. Fjölmiðlafólk, bloggarar, virkir í athugasemdum, greinahöfundar, viðmælendur í sjónvarpi og útvarpi – allir sem tjá sig opinberlega í ræðu og riti verða undir sömu smásjánni.

Málfarslögreglan ætlar að gagnrýna allar villur, hversu smávægilegar eða ómerkilegar sem þær kunna að vera.

Málfarslögreglan er sjálf ekki undanþegin gagnrýni. Hlustendur sem verða varir við staðreyndavillur eða ranga málnotkun hjá Málfarslögreglunni eru hvattir til að láta í sér heyra. Best er að nota gamla góða tölvupóstinn til slíkra samskipta, en hægt er að senda póst í gegnum vefinn ordabokin.is.

Málfarslögreglan vill auka veg og vanda íslenskunnar og ætlar því að koma með tillögur til úrbóta hér í þáttunum þegar hún rekst á málvillur, hvers eðlis sem þær eru.

En hér er líka ætlunin að flytja fræðandi pistla um íslenskt mál og málnotkun og segja frá því sem vel er gert.

Málfarslögreglan ætlar að vera fræðandi, en um leið skemmtileg.

Heimili og varnarþing Málfarslögreglunnar verður vefurinn ordabokin.is. Þar má nálgast hlaðvarpsþættina og fleira skemmtilegt og spennandi efni.

Málfarslögreglan vill fá íslenskunörda, málfarsfasista og stafsetningarperverta landsins í lið með sér. Hlustendur sem vilja koma einhverju á framfæri við Málfarslögregluna, s.s. ábendingum um stafsetningarvillur, málvillur eða annað sem tengist íslensku máli mega senda tölvupóst á netfangið malfarslogreglan@ordabokin.is.

Það er líka hægt að hafa samband á Fésbókinni og á Twitter. Tenglar á Fésbókar- og Twittersíður Málfarslögreglunnar eru á vefnum ordabokin.is.

Þá er þessari litlu stefnuskrá lokið. Ég hlakka til samfylgdarinnar í komandi þáttum. Skemmtið ykkur vel þar til í næsta þætti og gerið allt sem ég mundi gera.

Tuttugu orða múrinn rofinn

Tuttugu orð komin í orðabókina!

Þeim á enn eftir að fjölga jafnt og þétt næstu daga. Stefnan er að bæta við tveimur til þremur orðum á dag uns yfir lýkur, þ.e. fram til 16. janúar.

En fyrst koma jólin.

Níu nóttum fyrir jól

Þetta mjakast.

Ég er ekki að hugsa um að það séu níu dagar til jóla, heldur að það sé rétt rúmur mánuður í skil á þessu öllu saman.

Á fjórum dögum tókst mér að bæta 12 blaðsíðum við greinargerðina. Það vantar samt ýmislegt í hana ennþá.

Uppkast af henni er a.m.k. komið út í kosmosið og til yfirlestrar hjá leiðbeinanda!

Næst á dagskrá er að setja inn eitthvað efni á vefinn og fínstilla hann.

Sem betur fer lenda jólin á helgi þetta árið!

Jólafrí

Ég er þá kominn í eins mikið jóla„frí“ og hægt er úr þessu.

Það eru komin tvö almennileg orð í orðabókina. Þeim á eftir að fjölga jafnt og þétt á næstu dögum.

Það er að koma einhver mynd á greinargerðina. Hún er orðin 33 blaðsíður að lengd, en er samt langt frá því að vera tilbúin.

Búinn að taka upp þrjá stutta hlaðvarpsþætti sem verður skilað með vefnum. Á eftir að klippa þá saman.

Fínstillingar á vefnum halda áfram.

Næsti mánuðurinn (og rúmlega það) fer í loka- lokafrágang á þessu öllu saman.

Minntist einhver á jólafrí?

Fokheldur

Skjáskot af ordabokin.is
Skjáskot af vefnum ordabokin.is tekið 25. nóvember 2016
Í tvær og hálfa viku er ég búinn að fikta í uppsetningu á vefnum. Ég keypti þemað Flatbase til að laga útlit vefsins að skissum sem ég teiknaði.

Nú er tilbúin frumútgáfa af aðalvefnum sem virkar nokkurn veginn eins og ég vil hafa hana. Það vantar enn allt innihaldið. Ýmsar fínstillingar og breytingar á smáatriðum eru eftir. Einnig er ekki víst að núverandi litir fái að halda sér. Ef vefurinn væri hús væri hann núna orðinn fokheldur.

Næstu daga ætla ég að gera nokkrar notendaprófanir. Því allir sem eitthvað hafa fjallað um miðlun efnis á vefnum og undirbúning vefverkefna eru sammála um gagnsemi notendaprófana.

Notendaprófun snýst um að fylgjast með einum notanda í einu nota vefinn. Þannig má komast að því hvernig notendur hegða sér á vefnum og mögulega finna villur, sjá hvað má bæta og hverju er ofaukið. Mælt er með því að prófa lítið í einu en oft, ekki þarf að fá marga notendur í hvert skipti og ekki þarf að hafa áhyggjur af því hverjir eru prófaðir.

Nú þegar er ein prófun búin. Ég á eftir að fá tvo til þrjá notendur í viðbót.

Á degi íslenskrar tungu

Dagur íslenskrar tungu er í dag.

Í dag eru líka tveir mánuðir þangað til allt þarf að vera tilbúið, samkvæmt kennslualmanaki hugvísindasviðs.

Það hefði verið snilld að geta opnað orðabókarvefinn í dag, jafnvel við hátíðlega athöfn. En því miður er hann of stutt á veg kominn til að það sé hægt.

Held bara opnunarpartý að ári liðnu.

Í dag verður þessi mynd af Holu íslenskra fræða að duga:

Hola íslenskra fræða. Hótel saga í bakgrunni
Hola íslenskra fræða 16. nóvember 2016.

Kynning

Ég hélt stutta kynningu á stöðu verkefnisins í morgun fyrir samnemendum í hagnýtri menningarmiðlun sem eru í sömu stöðu og ég, þ.e. að vinna að lokaverkefni eða undirbúa það.

Fékk líka margar góðar hugmyndir á meðan sem ef til vill verða að veruleika síðar.

Sé smellt á myndina hér fyrir neðan má sækja glærupakka á pdf-formi sem ég notaði við kynninguna.

Glæar númer 1 í glærukynningu

Samkeppnisgreining

Í upphafi verkefnisins tók ég saman fimm íslenskar veforðabækur til að hafa með í samkeppnisgreiningu. Það mætti líka tala um samanburðarmat – það er nær enska hugtakinu Comparative assessment. Matið er unnið eftir aðferð Leah Buley í bókinni The user experience team of one.

Í þessari greiningu verða tekin fyrir nokkur atriði sem eru vel gerð á viðkomandi vefjum (og ég vil taka til fyrirmyndar) og hvaða atriði mættu betur fara (og ég vil forðast).

Niðurstöðurnar verða notaðar við samsetningu þarfagreiningar ásamt niðurstöðum úr netkönnun.

Atriði sem tekin voru fyrir sérstaklega voru:

  • Hönnun (útlit)
  • Innihald
  • Virkni
  • Leit
  • Styrkleikar
  • Veikleikar

Íslenska.org

Hönnunin er einföld og þægileg. Enginn leitargluggi er á forsíðu vefsins. Leiðakerfi nær þvert yfir skjáinn. Vefurinn er ekki skalanlegur.

Vefurinn inniheldur íslenska rímorðabók og orðskiptibók, hvora á sinni síðu. Einnig er hægt að hlaða orðskiptilýsingunni niður sem einfaldri textaskrá. Leit á vefnum er einföld, hægt er að leita að hvaða orði sem er og vefurinn stingur upp á rímorði eða orðskiptingum. Leitargluggarnir gera ekki greinarmun á venjulegum orðum og bullorðum eða tilviljanakenndum stafarunum.

Helsti veikleiki vefsins er sá að hann virðist ekki hafa verið uppfærður síðan 2008, sem er hálfgerð synd, því hugmyndin og framtíðaráætlunin sem sagt er frá á vefnum lofa svo góðu.

Íslenska Wikiorðabókin

Orðabókin byggir á sömu hugmynd og alfræðiritið Wikipedia, þ.e. að allir með aðgang að nettengingu geti unnið saman að því að búa til orðabók. Vefurinn lítur út eins og hefðbundin síða á Wikipediu og virkni þessarra tveggja vefja er eins. Forsíðan er nokkuð efnismikil. Leiðakerfi birtist vinstra megin á forsíðunni. Vefurinn er ekki skalanlegur, en til er sérútgáfa með sömu virkni og innihaldi fyrir snjalltæki. Vefurinn inniheldur íslenska orðabók, sem samin er af notendum. Stundum fylgja beygingarlýsingar, myndir og þýðigar yfir á önnur tungumál.

Leitargluggi í tölvuútgáfunni er efst í hægra horni. Í snjallsímaútgáfunni nær hann þvert yfir skjáinn. Leitin er ekki ritstýrð og ekki er tekið tillit til rangrar stafsetningar. Ef notandi slær inn rangt stafsett orð eða annað orð sem ekki er til í orðabókinni er honum strax vísað á síðu sem býður upp á að bæta því við. Notendur verða að skrá sig inn undir notandanafni til að geta bætt og breytt orðabókinni.

Helstu styrkleikar orðabókarinnar, en jafnframt helstu veikleikar hennar, eru þeir að hún er samin af notendum. Ritstjórar fara ekki yfir efnið áður en það birtist. Þess vegna er alltaf hætta á því að rangar upplýsingar slæðist með. Hætta á skemmdarverkum er einnig til staðar. Kosturinn er sá að ef notendur rekast á rangar upplýsingar geta þeir sjálfir leiðrétt þær milliliðalaust – breytingarnar birtast strax. Vefurinn er gefinn út undir opnu höfundarleyfi og hver sem er má afrita og breyta textanum.

Orðabók.is

Vefurinn skiptist í þrjár orðabækur: Íslenska–enska–íslenska, Íslenska–danska–íslenska og stafsetningarorðabók. Að auki má finna beygingarmyndir íslenskra orða. Uppsetning vefsins er einföld og hefðbundin. Vefurinn er skalanlegur og kemur vel út í snjallsíma.

Til að fá nánari upplýsingar um uppflettiorðið geta notendur smellt á tengla yfir á utanaðkomandi vefi, s.s. Orðabanka Íslenskrar málstöðvar og Hugtakasafn Þýðingamiðstöðvar utanríkisráðuneytisins. Vefurinn er undir valdi ritstjóra. Auk orðabókarinnar má finna Orðabloggið; fróðleik um íslenska málnotkun. Þá má einnig kaupa leiðréttingarforrit sem hleðst niður í tölvu notenda. Notendur geta vistað orð með því að glósa þau og tekið miserfið stafsetningarpróf á ensku.

Helstu styrkleikar vefsins eru að hann býður upp á forskoðun og prófun áður en notendur ákveða hvort þeir vilja gerast áskrifendur. Áskrift er ókeypis fyrir notendur 20 ára og yngri. Vefurinn nýtir sér möguleika á fjölbreyttari miðlunarleiðum með hljóðdæmum. Efni hans er ekki komið úr orðabók á prentformi, heldur hefur það alla tíð verið stafrænt. Helsti veikleiki vefsins er sá að yfirleitt innihalda orðskýringarnar fremur takmarkaðar upplýsingar. Það sama má segja um beygingarlýsingar íslenskra orða. Vefurinn er þó góður til síns brúks ef aðeins þarf að vita hvað viðkomandi orð þýðir.

Leitin á vefnum er ekki ritstýrð en stungið er upp á niðurstöðum ef leitarorð eru rangt stafsett eða þau finnast ekki í orðasafninu. Þá er notendum boðið upp á að senda tillögu að nýju orði. Einnig er hægt að leita að orðum í öllum beygingarmyndum.

Slangurorðabók Snöru

Vefurinn er ekki skalanlegur – hann kemur best út ef hann er skoðaður á tölvuskjá. Uppsetningin minnir dálítið á bloggsíðu og gefur til kynna að vefurinn eigi að vera léttur og skemmtilegur. Myndir taka á móti notandanum á forsíðunni. Vefurinn inniheldur slangurorðabók sem notendur hafa sett saman. Orðabókin er ekki byggð á prentuðu efni.

Leitargluggi er efst á vefnum, u.þ.b. fyrir miðju. Einnig er hægt að leita að orðum eftir stafrófsröð. Tíu nýjustu orðin birtast á lista vinstra megin á forsíðunni. Fyrir ofan leitargluggann er notendum boðið að smella á séríslenska stafi með músinni. Það kemur sér vel ef notendur hafa ekki aðgang að íslensku lyklaborði. Leitin er ekki ritstýrð, ekki er tekið tillit til rangrar stafsetningar og ekki er boðið upp á algildisleit. (Wildcard-leit).

Styrkleikar vefsins eru þeir að notendur ráða efninu að mestu leyti. Hann er þó undir valdi ritstjóra. Hægt er að flokka orð eftir efnisflokkum. Auðvelt er að senda inn tillögur að breytingum og nýju efni. Hugleiðingar notenda birtast strax.

Helstu veikleikar vefsins eu þeir að hann er ekki skalanlegur og erfiðara er að skoða hann í snjallsímum. Hann virðist ekki vera uppfærður nema endrum og eins – svo er a.m.k. um forsíðuna. Athugasemdir sem birtast strax bjóða upp á rifrildi og leiðindi meðal notenda. Umræður minna oft óþarflega mikið á virka í athugasemdum á íslenskum fréttavefjum. (Sjá t.d athugasemdir við orðið Hugari).

Snara.is

Leitarglugginn á vefnum er áberandi efst á forsíðunni. Uppsetningin er óhefðbundin – merki vefsins er t.d. ekki efst í vinstra horni, heldur undir leitarglugganum og nær yfir mestallan skjáinn. Vefurinn er skalanlegur og virkar vel fyrir snjallsíma. Flestir hlutar vefsins krefjast áskriftargjalds, en hægt er að skoða hann allan í gegnum nettengingu hjá Háskóla Íslands.

Stungið er upp á leitarorðum um leið og orðið er slegið inn. Leitin er ritstýrð og tekur að hluta tillit til rangrar stafsetningar. Stungið er upp á leitarorðum ef stafsetning er röng. Mögulegt er að nota algildisleit.

Af íslenskum veforðabókum býður þessi vefur líklega upp á mesta úrvalið. (Kannski að vefjum Árnastofnunar undanskildum). Á vefnum eru 34 orðasöfn á átta tungumálum auk tveggja matreiðslubóka. Efnið er sótt úr bókum sem áður hafa verið gefnar út á prenti. Notendum er ekki boðið að gera breytingar, heldur er efnið samið af sérfræðingum í samsetningu orðabóka.

Áherslan er lögð á leitargluggann á forsíðunni, mikið hefur verið lagt upp úr því að hafa hann góðan, og notendum er strax beint þangað. Ekki er boðið upp á að leita í orðalistum fyrr en byrjað er að slá leitarorðið inn. Áður en að því kemur er hægt að velja í hvaða orðasafni á að leita. Það er einnig hægt eftir að leit er hafin, þannig má þrengja leitina ef niðurstöður eru of margar.

Styrkleiki vefsins er fjöldi orðasafnanna sem hægt er að fletta upp í. Vefurinn byggir á áður útgefnu efni á prentformi sem unnið er af sérfræðingum í orðabókagerð og þess vegna má gera ráð fyrir því að upplýsingar séu réttar.

Veikleikar vefsins eru að efni hans ber of mikil merki þess að vera komið úr prentformi. Rekast má á stytt orð og skammstafanir sem eru ekki eins nauðsynlegar þegar út á vefinn er komið. (Til dæmis má rekast á orðið „framkvsemd“ við leit að enska orðinu „Transaction“). Hann nýtir sér vefformið og möguleika þess ekki nógu vel. Leitarniðurstöður geta orðið langar og erfitt að komast í gegnum þær, sérstaklega ef leitað er að algengum orðum.

Er leitinni lokið?

Ég held ég sé dottinn niður á sæmilega lausn á leitarvirkninni í WordPress með aðstoð nokkurra viðbóta. Hér verður fjallað um viðbæturnar sem ég nota til að fá leitina til að virka eins og ég vil, í þeirri röð sem ég held að best sé að setja þær inn.

Orðabókin

Fyrst er það viðbótin WordPress dictionary. Hún auðveldar smíði orðabóka og orðasafna í WordPress. Upphaflega er hún á ensku, en framenda hennar má auðveldlega þýða yfir á hvaða tungumál sem er. Hún kostar tæpa 30 dali, eða um 3500 íslenskar krónur. Best er að nota hana í WordPress-þema sem styður a.m.k. tvær valmyndir.

Þegar búið er að setja viðbótina upp og virkja hana skýrir það sig nokkurn veginn sjálft hvernig hún virkar. Á Youtube má nálgast nokkur kennslumyndbönd. Á vef viðbótarinnar er einnig fræðsluefni, þannig að hér verður ekki farið út í frekari smáatriði.

Aukasvæði

Beint úr kassanum inniheldur orðabókin þrjú textasvæði:

  • Meginmál færslunnar, eða orðskýringu.
  • Uppruna orðsins (entry origin).
  • Tengd orð (Related entries).

Ég vildi bæta nýju textasvæði sem innihéldi allar beygingarmyndir viðkomandi orðs. Til þess notaði ég Advanced custom fields. Innahald textasvæðisins er fyrst og fremst hugsað sem leitarorð og því ekki nauðsynlegt að þau birtist með færslunum á framenda vefsins. Ég þurfti því ekki að fara út í frekari forritunarvinnu.

Ég bjó til svæðaflokkinn „Orðabókarupplýsingar“. Svæði í þessum flokki eru stillt þannig að þau birtast bara ef færslan er skrifuð með Orðabókarviðbótinni. Þau birtast ekki þegar skrifaðar eru venjulegar bloggfærslur eða síður í WordPress.

Inni í þessum svæðaflokki er eitt svæði: „Orðmyndir“. Þetta er einfalt textasvæði og ekki er skylda að fylla það út. Hægt er að breyta stillingunum á því og jafnvel bæta við fleiri svæðum ef þörf er á.

Nýr leitargluggi

Þá er það leitarglugginn. Með viðbótinni Search-live er hægt að bæta leitarglugga við hvaða WordPress-síðu eða -færslu sem er. Aðeins þarf að setja inn einfaldan kóða sem viðbótin býr til þegar búið er að stilla hvernig leitarglugginn á að virka.

Ég held að þessi viðbót sé ekki nauðsynleg fyrir framhaldið. Hún skilar ekki enn niðurstöðunum sem ég vil. En það er gott að geta haft leitargluggann hvar sem er, en ekki bara á fyrirfram ákveðnum stöðum sem WordPress ákveður. Þannig að þessi viðbót fær að vera með á þessu stigi málsins.

Falið efni

Viðbótin Search exclude útilokar færslur og síður frá því að birtast í leitarniðurstöðum. Þegar búið er að virkja viðbótina birtist lítið textasvæði sem hægt er að haka við ef óskað er eftir því að leitin fari framhjá viðkomandi færslu eða síðu. Þetta hefur bara áhrif á leitina í WordPress en ekki á Google.

Leitarvirknin

Ég vil að hægt verði að leita að orðum í öllum beygingarmyndum. Leitarorðin „Orðabókarinnar“ og „Orðabókanna“ ættu til dæmis að skila sömu færslu undir fyrirsögninni „Orðabók“.

Hér kemur Relevanssi til sögunnar. Grunnútgáfa hennar er ókeypis en hægt er að borga fyrir „advanced“ og „premium“ útgáfur, sem gefa fleiri möguleika. Ókeypis útgáfan virðist virka nógu vel hjá mér. Hægt er að láta hana leita í ákveðnum svæðum (til dæmis í textasvæðinu sem inniheldur beygingarmyndirnar) en útiloka önnur.

Hún leitar samt enn í meginmálssvæði orðabókarfærslunnar, þ.e. orðskýringunni. Og það vil ég ekki. Af hverju ekki?

Segjum að skýringin á orðinu „Orðabók“ sé:

„Rit sem inniheldur lista af orðum ákveðins tungumáls, yfirleitt í stafrófsröð. Yfirleitt fylgja orðskýringar með, stundum á sama tungumáli, en stundum á öðru tungumáli.“

Ef ég leita að orðinu „stundum“ gæti orðið „Orðabók“ komið upp í leitarniðurstöðunum, því að skýringin á orðinu inniheldur „stundum“. En þessi orð eru ekkert sérstaklega nátengd og því óþarfi að „Orðabók“ verði ein af niðurstöðum leitarinnar.

Þetta má leysa með því að hafa allar orðskýringar innan kóðans [noindex][/noindex]. Vandamálið við það er þó að þá gætu orðskýringarnar orðið ósýnilegar fyrir Google.

Engu að síður er þetta besta lausnin hingað til.

Ritstýrð leit

Þegar Relevanssi er komin upp er hægt að sækja viðbótina Autocomplete for Relevanssi. Eins og nafnið gefur til kynna býður hún upp á ritstýrða leit, þ.e. stingur upp á leitarorðum um leið og orðið er slegið inn í leitargluggann. Þannig má koma í veg fyrir að notendur slái inn rangt stafsett orð.

Hægt er að prófa leitarvirknina og samspil þessarra viðbóta í WordPress-sandkassanum. Sem stendur eru fjögur orð í orðabókinni: Api, banani, áttaviti og tæki. Hægt á að vera að leita að öllum orðmyndum þessarra orða.

Mér finnst þetta a.m.k. vera ásættanleg lausn, þangað til eitthvað annað kemur í ljós. Nú get ég farið að snúa mér að einhverju öðru í bili.