Det står en-og-førti øl
 

Bloggen er blitt 20 år gammel

Det skjedde i sommer, men uten at jeg helt hadde merket meg datoen: ølbloggen fylte altså 20 år. Rundt årsdagen pleier jeg å koste på meg et innlegg som fokuserer på bloggingen, ikke på ølet. I år vil jeg gjerne fortellet om frustrasjoner med generativ AI på nettet, og dessuten si litt om hva jeg håper å blogge om i jubileumsåret.

Jeg pleide å regne 26. juli 2005 som fødselsdagen for ølbloggen, for da publiserte jeg et innlegg om en smaking med øl og sjokolade i regi av Nøgne Ø, holdt av Kjetil Jikiun på Åsines i Herefoss. Men jeg fant et litt tidligere innlegg med kommentarer rundt mulige bryggerinedleggelser, skrevet 22. juni 2005.

Et fullt pint-glass med mørkt, skummende øl stående på et bord. Godt øl må gjerne være enkelt men innholdsrikt, og uten for mye fancy stuff rundt – akkurat som god informasjon på nettet.
JIP, via Wikimedia Commons, CC BY-SA-40

Publiseringsfrekvensen på bloggen har variert, men det kommer da tidvis noe. Dessuten bruker jeg endel tid på å skrive en bok om juleølets historie. Og neida, den kommer ikke denne jula, for å si det sånn. Jeg er blitt stadig mer interessert i øl- og bryggerihistorie. Det er et tema der det er rikelig med stoff å ta av.

Jeg kunne tenke meg å bruke «jubileumsåret» til å dykke langt ned i kildene til 1800-tallets norske øltyper. Men før jeg forteller mer om det, trenger jeg å blåse ut noe agg rundt generativ AI og retningen Internet og informasjonsspredningen der skjærer ut i.

Utfordringene med AI og LLM-er

Det skjer dramatiske ting på Internet. Til syvende og sist tror jeg det blir denne bloggens død. Alle har vel fått med seg at generativ AI og LLM-er har kommet for å bli, selv om de langt fra innfrir alle løftene og spådommene som surret rundt for et par år siden. Jeg tror det ender tragisk, for med dem kan man raskt generere velformulert, men ikke nødvendigvis fakta-basert tekst om det aller meste. Dersom teksten faktisk sier noe korrekt, så er det oftest velkjente og omtrentlige fakta som i liten grad bringer noen fundamental ny kunnskap og innsikt til torgs. Imidlertid ender utdataene altfor ofte opp som plausible, men delvis oppdiktede data. Det er nå 2,5 år siden jeg spurte ChatGPT om øl og norske bryggerier, og selv om det er kommet nye modeller siden da, så virker det som de konseptuelle problemstillingene fremdeles de samme.

Noen vil hevde at slik hallusinering skyldes dårlig «prompting», og jeg ser at de har et visst poeng der. Mekanismen er ofte at LLM-ene tvinges inn i et hjørne der de konstruerer de mest plausible (eller minst usannsynlige) detaljrike forklaringene rundt et fiktivt scenario. Det var nettopp slik det gikk til at ChatGPT i linken over påsto at et navngitt, større norsk bryggeri hadde glemt å vaske gjæringstankene skikkelig etter å ha lagret insektsmiddel på dem, med påfølgende 10 dødsfall og 23 alvorlig skadde blant norske øldrikkere. Se dialogboks 7 og 8 på den siden jeg linket over, eller let etter ordet «poisonous». Det burde være unødvendig å si at det var rent dikt og forbannet løgn, selvfølgelig.

Men problemet er at mange av dem som «prompter» seg frem til svar ikke nødvendigvis vet hvor grensa for relevant bruk går. LLM-ene sklir tilsynelatende friksjonsfritt mellom reelle fakta og mer eller mindre plausible men fiktive forklaringer. De som spør botene vet trolig heller ikke hvor hvert enkelt svar ligger ifht gråsonen mellom fakta og fri fantasi. Trolig blir de selv lurt av veltalende forklaringer uten rot i virkeligheten. Nåvel, man kunne på påpeke at LLM-er er verktøy, og så kunne man sagt fy-skam-deg til dem som bruker dem til noe som de ikke er egnet til. Men verden er jo sjelden så enkel.

Noen duster er ikke selv interessert i fakta, bare en-eller-annen fakta-lignende tekst som andre personer måtte synes er potensielt interessant. De ønsker seg noe som søkemotorer på Internett kan henvise trafikk til, slik at de kan tjene penger på reklame. Det er smertefullt å innrømme det, men Internet er i ferd med å oversvømmes av slik søppel-info med innpodet reklame. Joda, det har nesten alltid vært masse søppel og reklame der, for det er lettere å lire av seg lallende synsing enn etterprøvbart innhold med kvalitet. Men det kostet i det minste bitte-litt innsats å generere søpla i gamle dager, det måtte tastes inn med en rettskriving som var mulig å tyde og en tankegang som var mulig å følge.

Nå går det både super-fort å generere det, og i et format og med en rettskriving som ser perfekt ut, og med et innhold som på overordnet nivå ser veldig lovende ut. Vi har nok undervurdert hvor mye vekt vi tidligere har lagt på det ytre formatet til en tekst, som kriterium for å evaluere innholdets kvalitet. Det svir vi for nå, og verre skal det bli.

Jeg liker ikke å linke til AI-søppel, men jeg føler at jeg trenger å gi et konkret eksempel etter denne tiraden. Jeg lette forleden etter info om ølstilen Erlanger. Det er en stil som E. C. Dahls brygget fra 1874 eller et par år før, og Morten Kvam og jeg har et lite korstog gående rundt å finne bakgrunnen for dette. I den forbindelse snublet jeg over moderne AI-søppel. Det tronet aller øverst blant ikke-reklamen på et google-søk om Erlanger, og det var en totalt intetsigende men velformulert tekst om at noen var sluttet å brygge Erlanger.

Det er søppel, så FØR DU KLIKKER PÅ LINKEN, så vær oppmerksom på de i skrivende stund selv oppgir at nett-cookies lagres i 13 måneder og deles med 819 forretningspartnere, så åpne linken i et inkognito-vindu eller ta ansvar på andre måter. Teksten er formulert som en slags gravtale eller minneord om Erlanger … ikke står det engang hva bryggeriet het. Innholdet er generisk, faktafritt og blomstrende velformulert, og med hyppige mellomrom er det klippet inn litt reklame. La meg kun sitere én setning av denne velformulerte bullshitten: «The impact it made on the beer industry cannot be erased, and its distinct flavor will forever be etched in the taste buds of those who were fortunate enough to enjoy it.» Enkeltvis ser ikke setningene så ille ut, men i større flokker blir det bare komisk. Se for deg tyve sånne setninger etter hverandre, uten én eneste bit med noe som likner på fakta. Skjønt komisk, det er vel heller tragisk at dette er hva søkemotorene finner er av det mest informative om Erlangerøl.

Nå er vel ikke ølbloggen min noen ufattelig viktig del av Internet. Ikke for å snakke den ned, men om den skulle drukne i AI-generert søppel, så er vel i bunn og grunn fremdeles et slags lavnivå I-landsproblem. Men det samme rammer nær sagt alle deler av Internet, og da blir det et reelt problem for oss alle. Du kjenner kanskje munnhellet «En dåre kan spørre mer enn ti vise kan svare»? Kanskje fremtidens versjon blir «En dåre med LLM kan spørre raskere enn ti vise klarer å lese.»

For ølverdenen tror jeg dette leder ut i en kollektiv informasjonståke av misoppfatninger rundt øl og bryggerier, basert på urban legends, misforståelser, antakelser, «gode» historier og en god porsjon ren diktning. Jeg er overbevist om det, fordi vi har vært der før. Vi ser noe lignende i mange av de halvgamle historiebøkene om øl og ølhistorie, spesielt i engelsk litteratur. Man kan nesten følge feilene fra bok til bok, for det er så innlysende at de har lest og omformulert hverandre, med begrenset tanke på faktasjekking og primærkilder.

En komisk vinkling er også at et kjennetegn på AI-generert stoff — ifølge mange — er bruken av emdash. En emdash — eller tankestrek som vi ville si på norsk — er en bindestrek med samme bredde som bokstaven «m». Ironisk nok er jeg — som vist i denne setningen — en flittig bruker av tankestreker, slik at detektorer for AI-generert stoff sikkert vil trigge på ølbloggen. Når det brukes for mye — og nå skjønner du sikkert tegningen — kan teksten bli snirklete på grunn av innskutte bisetninger — samt også etterplasserte bisetninger. De fleste som bruker tankestrek bruker en vanlig bindestrek, men LLM-ene bruker tegnet som faktisk er ment som en tankestrek. Skrivestilen min inneholder slike tankestreker, og de er ikke så vanskelig å skrive på tastatur heller. Tasten som gir bindestrek, altså «-», gir sammen med Alt-Gr en endash «–» og sammen med Alt-Gr og Shift gir den en emdash «—».

Og når jeg sjekker etter så viser det seg at jeg stort sett har brukt endash-er i stedet for emdash-er. En opptelling viser at det er brukt «bare» 58 emdash-er på bloggen før dette innlegget, hvorav 6 er i tekster som er eldre enn fem år. Dernest er det brukt 4028 endash-er, hvorav 3180 er eldre enn fem år, og dessuten har jeg brukt 2075 vanlige bindestreker med mellomrom på hver side, hvorav 2005 er i innlegg som er eldre enn fem år. Det er totalt 6161 tankestreker på 1078 innlegg, ca 6 tankestreker pr innlegg, eller gitt 137.754 linjer og 1.169.491 ord, så er det en tankestrek i gjennomsnitt pr ca 22 linjer eller 189 ord.

Nå var det ikke meningen å bruke endash-er som tankestrek i stedet for emdash-er, men det var kanskje hell i uhell. Det kommer ikke til å skje at jeg endrer skrivestil bare fordi noen bruker tankestreker som indikator på AI-generert tekst, og langt mindre at jeg skriver om gammel tekst for å unngå tankestreker. (Og vennligst ikke kom med vitser om at jeg burde brukt LLM-er til å skrive om disse tankestrekene!)

Jeg burde kanskje rydde i typografien, og endre til 6161 emdash-er, men da blir vel bloggen flagget som å ha brukt AI-generert materiale i 20 år. Apropos, det nevnte gravskriftet over Erlangerøl som jeg linket til over bruker ikke tankestreker, for de fleste LLM-ene er vel sikkert allerede blitt instruert til å ikke bruke det. Forøvrig, innlegget mitt om øl og sjokolade fra sommeren 2005 brukte tankestreker syv ganger, riktignok i form av vanlig bindstrek. For ordens skyld, ingen tekst på bloggen er AI-generert, med unntak av det som er tydelig merket i innlegget jeg lenket til over, og den ene setningen som er sitert i dette innlegget. Jeg har heller ikke brukt generativ AI for å finne tema eller informasjon, annet enn i dialogen som er gjengitt i det ene innlegget som er nevnt. Jeg laget en håndfull generelle illustrasjonsbilder med generativ AI, men jeg blir stadig mindre stolt av det, og jeg kommer sannsynligvis til å fjerne dem.

Her har jeg ikke engang grepet tak i ting rundt opphavsrett, personvern og en rekke andre problemstillinger. Om du bruker søkemotorer og sosiale mediers algoritmer for å finne informasjon på Internet, så forvent at fremover vil kvaliteten på det du finner via søk komme til å synke i retning av søppel. Kanskje stopper det opp og etterlater noe som i det minste er underholdende, men det stopper neppe opp på noe som er bedre en marginalt nyttig. Forvent at manuell omdømmebygging og lenkesamlinger av bokmerker blir det vi ender opp med, og det vet jeg ikke om jeg orker å gå løs på det.

Gamle ølstiler fra 1800-tallet

Så over til planen min for hva jeg skal gjøre fremover på bloggen. Jeg har lenge ønsket å dypdykke i kildemateriale rundt de av 1800-tallets ølstiler som forsvant, for det er umulig å fullt ut forstå utviklingen av bryggerier og bruken av øl i Norge uten å ha innsikt i dagligølet på 1800-tallet. Jeg har imidlertid dyttet det foran meg, for det er et ufattelig langt lerret å bleke, av flere grunner:

  • Det mange slike ølstiler, ett eller to dusin.
  • Ølstilene endres over tid, selv om navnet beholdes.
  • Geografiske variasjoner i ølstilen
  • Gråsoner mellom ølstilnavn og produktnavn.
  • Opphavet til stiler kobles løselig til en antatt etymologi.
  • Det er en enorm mengde med tekst om dem.

Jeg har jo lett litt rundt omkring og har noen idéer om hva jeg kommer til å finne, men det blir garantert mange overraskelser og aha-opplevelser underveis. Akkurat det gjør det til en spennende prosess for meg, siden jeg tidligere stort sett har gravd meg ferdig rundt noe før jeg publiserte et innlegg. Med 1800-tallets øltyper kommer jeg garantert til å påstå ting som jeg i senere innlegg drar teppet under beina på. Sånn er livet. Dette blir vel så mye en kladde- og notatbok som det er formidling av noe som er ferdig avklart. Noen omveier og sidegater blir det sikkert også, dersom det ligger illustrerende historier der, og det kan belyse norske ølstiler og -historie på 1800-tallet.

Planen er å starte med Potøl og deretter fortsette med Sødtøl. En viss magefølelse rundt Potølet har jeg jo. Det var for det meste en Oslo-greie frem til midten av 1800-tallet. Hvorfor vet jeg ikke, men jeg mistenker at det har med Forsvaret å gjøre. Så vet jeg jo at det har rast en debatt rundt hvorvidt alle en gang i tiden hovedsaklig drakk øl eller vann. Det var en debatt jeg holdt meg unna med vilje, men med Potølet slipper jeg neppe unna den.

Etterhvert kommer jeg til å måtte innom sære øl som Prinsesseøl og underlige navn som Fiskeøl. Jeg ser at jeg trenger å skrive om en ølstil som Krusøl, fra bryggerier jeg ikke visste eksisterte, og som eksplisitt er hoppet over når man listet bryggerier i sin egen samtid.

Og hva var egentlig forskjellen mellom Potøl, godt Potøl, meget godt Potøl og udmærket godt Potøl. Magefølelsen min er at det var fint liten forskjell. Men hvorfor betalte da kjøpmenn for ekstra trykksverte til rosende adjektiver i annonser som ellers var temmelig kjedelige og kortfattede?

Noen ting har jeg en rimelig god idé om, som hvorfor hvidtøl er mørkt og ikke hvitt — det var visst en by-greie. Kanskje vi snuser opp hvorfor Norge tilsynelatende aldri fikk noe stort volum av lettøl — der er den hovedmistenkte skattleggingen og 40 år med sommel for å legge den om. Vi kommer til å måtte se litt tilbake til 1700-tallet også, og støte på ølstiler som marsøl, skipsøl, skillingsøl og koventøl. Vi kommer til å se hvor de kom fra, og hva ble det av dem på 1800-tallet.

Jeg vet ikke helt selv hvor vi kommer til å ende opp, men jeg skal forsøke å la de ulike innleggene henge litt vagt i sammen, slik at de i det minste på overordnet nivå kan sys sammen til et slags hele. De ulike blogginnleggene kommer til å bli litt som brikker i et digert puslespill.

Og så trenger jeg å finne ut av noe rundt skrivemåter. Er det stor forbokstav på øltyper, dvs skal jeg skrive Potøl eller potøl. Og står valget kanskje mellom Pot-Øl eller pot-øl? Eller kanskje det er pottøl, som det ville blitt dersom vi tar hensyn til utviklingen av skrivereglene. Og skal jeg veksle mellom Oslo, Kristiania og Christiania avhengig av hvilket år det handler om? Akk og ve!

Vi sees i neste blogginnlegg. Skål!