Mer om personvern på denne bloggen
La meg først gjøre klart at jeg støtter all denne lovgivningen, selv om jeg også er frustrert over den labyrinten av paragrafer og domsavsigelser som følger med på kjøpet, og alle de tekniske snubletrådene. Jeg jobber med IT forskningsstøtte ved NTNU, så tro meg når jeg forsikrer at personvern på den ene siden er komplekst og frustrerende, og samtidig på den andre siden er viktig og nødvendig.
Så var det personvern i forbindelse med denne bloggen. Siden bloggen i sin natur hovedsaklig er enveiskommunikasjon – fra meg til dere – så begrenser det personvernproblemene. Det trengs ingen innlogging for å lese bloggen. Jeg har fjernet all js-kode à la «like»-knapper og visningstellere som trigget oppdatering av informasjon hos en tredjepart. I praksis fører slikt til at man trigger denne tredjeparten som så kan oppdatere sin profil over deg med hensyn til hva, hvor og når du gjør noe på nettet.
Automagiske knapper for «like»
I en dom fra ... gjøres det klart at en innbygget knapp på en bloggside for å trykke «like» eller «share» på leserens Facebook-side gjør at bloggen blir med-databehandler sammen med Facebook. Slik jeg ser det er ikke dette farbar vei for bloggen og meg. Jeg poster sammendrag og peker til blogginnleggene på Facebook og Twitter, og jeg ser gjerne at du både «like»-er og deler disse innleggene der, men det blir i så fall et mellomliggende mellom deg og Facebook eller Twitter, og uten noen automagisk knapp for det på bloggen.
Det har kommet noe kode for å lage like-knapper som er i tråd med GDPR, i praksis betyr det at ikke noe sendes til sosiale medier som Facebook før man faktisk trykker på knappen. Jeg har ikke implementert det på bloggen ennå, men kommer trolig til å gjøre det.
Logging av IP
Et annet tema er logging av IP-adresse, dvs av nettadressen som en leser bruker når en blogg-side lastes ned. Dette er i prinsippet persondata, fordi det er informasjon som potensielt kan knyttes til en person. Selv om ikke jeg kan gjøre det, finnes det noen som har oversikt over hvilke IP-adresser som er knyttet til hvilke husstander eller til hvilke innloggende brukere, og da er det identfiserbare data.
Det er lett å tenke at logg er bra, for det er jo bare potensielt nyttig informasjon. Men på den andre siden er det lett å synke ned en argumentasjon der det potensielt nyttige begrunner den vagt målformulerte loggingen av persondata. Med andre ord bør det være en god begrunnelse for å logge persondata. Det har jeg egentlig ikke ifm logging av trafikk annet enn for sideteller og annen statistikk som gir innsikt i bruk (se under). Jeg har derfor valgt at jeg ikke logger IP-adresse i relasjon til brukslogger.
Imidlertid logger jeg statistikk over antall ganger en side er lest. Det gjør jeg dels for å se hvilke sider som er populære, og dels fordi jeg har masse redirects for å støtte gamle linker ifm omorganiseringer av navnrommet på bloggen. For å vite hvilke linker som er i bruk, og hvilke som ikke er det, er det nyttig å ha bruksstatistikk.
Imidlertid har jeg bevisst latt være å aktivere slikt som Google Analytics og lignende som i sin natur samler informasjon om brukerne og bruken, og som jeg ikke har kontroll på om gjøres på en god og ryddig måte.
Sideteller
Noe tilsvarende gjelder for sidetelleren. Det er kult å ha en sideteller, men med mindre man gjør tellingen lokalt, så gir man også fra seg informasjon til den tredjeparten som holder telleren oppdatert.
Slik telling er egentlig litt tricky. Man skal ekskludere søkemotorer og andre automatiserte besøk, man skal kun telle én gang for repetitive besøk samme dag fra samme person, og det er interessant å skille mellom antall sider som er sett på og antall ulike personer som har sett på dem.
Her har jeg valgt å installere en egendrevet logganalysator. Den aggregerer informasjon om bruk, og trenger å bruke IP-adresse blant annet for å kunne skille mellom duplikate visninger for samme person og visninger for to ulike personer. For denne sidetelleren logges IP-adresse, browser-versjon, tidspunkt, URL. Loggene blir akkumuleres frem til kl 0400 om natta, da de slettes, etter at aggregert – og anonymisert – informasjon blir ferdigstilt for det foregående døgnet.
Syndikering og repostinger
Bloggen er syndikert andre steder, som referanser fra Facebook og Twitter. Lesere som ønsker å følge bloggpostingene der er velkomne til det, og i så fall er personvern et mellomliggende mellom den aktuelle platformen og brukeren selv. På de platformene der jeg bare poster et sammendrag, vil lesing på denne måten gjøre at bloggen får informasjon om hvilken platform du kom fra. Det er noe jeg logger for å vite mer om hvilke platformer som er effektive å reposte og syndikere på. Utover den daglige akkumueringen av loggdata frem mot kl 0400 på natta er det ingen identifiserende data her.
RSS-strømmer
Det er mulig å følge bloggen via RSS. Dette er en relativt gammel og enkel protokoll, men den er ekstremt praktisk og nyttig. Fra et personvern-perspektiv er den temmelig bra. Alle de N siste innleggene hentes ned én operasjon, og blading, lesing og slikt foregår lokalt hos leseren. Den typiske RSS-leseren henter ned dataene med jevne mellomrom, så sånn sett etterlater den svært få analyserbare spor. Noen RSS-lesere er skybaserte, men da er det et mellomliggende mellom deg som leser og den skybaserte leverandøren.
Epost-lister
Jeg har planer om å sette opp en epostliste der nye innlegg postes. Lista vil håndteres på min egen maskin. Dersom du melder deg på lista, så sendes det en epost til deg når nye innlegg postes. Her har jeg logget epost-adressen som skal motta meldingen, men utover det logges det ingen data.
Kommentarer
Det store minefeltet er kommentarer. Jeg ønsker ikke å ha full åpning for anonyme kommentarer, for å unngå spam og useriøse kommentarer. Dermed trengs det autentisering. Jeg har installert remark42 som kommentar-system. De har følgende tre metoder for å legge igjen kommentarer:
- Anonyme kommentarer, der man legger igjen en kommentar og oppgir hva man ønsker i fra-feltet. Slike kommentar bør modereres før de publiseres. Jeg har ikke åpnet for dette.
- Autentisering med epost, der du oppgir epostadressen før du skriver kommentaren, så sendes det en epost med en kode à la engangspassord til deg, som du oppgir til bloggen. kommentarene postes umiddelbart.
- Autentisering via OAuth fra tredjepart som Twitter, Github, Facebook og Patreon Det betyr ikke at jeg eller bloggen får tilgang til dine data på disse tjenestene, men kun at denne tjenesten borger for at du er den du er.
Kommentarsystemet har lagt vekt på å lagre minst mulig persondata. Identifiserende informasjon lagres i tillegg som en hash, det vil si at det en-veiskrypteres som en sjekksum. Det betyr at jeg ikke kan hente ut id'en annet enn at man kan kryptere en annen identitet for å se om den har samme SHA1-sjekksum.