ISSN 1651-6737

den 19 juni 2003

   Efter ett par dygn med K9 är felfrekvensen nere i en knapp procent och än så länge stadigt sjunkande. Jag har funderat en del över tekniken som används. Man borde på samma sätt som man skiljer ut skräppost kunna skilja olika personers texter från varandra.

Jag tror att vårt sätt att skriva nästan är som fingeravtryck som kan avgöra vem som är vem. Vårt sätt att förkorta ord, frekvensen för olika ord och även ordföljden skiljer nog mycket mellan olika skribenter.

Om det fanns fler kategoriseringsmöjligheter i K9, inte bara "good" och "spam" skulle det vara lätt att prova att använda programmet till andra saker också. Förmodligen behövs det ganska stora textmängder från varje person för att träffsäkerheten ska vara godtagbar.

Vad man ska använda det till vet jag egentligen inte. Jag är bara fascinerad av tanken på att kunna identifiera människor utifrån deras sätt att skriva. Vem vet, det kanske går att göra personlighetsprofiler genom att analysera vila sorters ord människor använder. "Jag ser framför mig ...", "om vi tittar på ...", "tänk dig en bild där ..." kan tyda på en visuell person. "Jag känner att ...", "min känsla är ...", "det känns som ...", "hur känns det?" kan tyda på en känslomässig person. Och så vidare.