I denna tutorial kommer vi bygga ett enkelt system för central analys av loggar från webbservrar. Tanken är att man har en agent på varje webbserver som ligger och läser av den sk. access-loggen i Apache. Denna agent skickar sedan vidare dessa loggar till en central server som lagrar loggarna och gör realtidsanalys. All kommunikation som sker asynkront mellan agenterna och servern.
Tutorial är uppbyggd så att infrastukturen finns på plats, men logik måste skapas för de actors som ska användas.
Instruktioner för att sätta upp en utvecklingsmiljö finns här.
Första uppgiften går ut på att få upp ett flöde där en agent på en webbserver scannar loggar och skickar logg-objekt vidare till en server. Med hjälp av Akka kan detta ske helt utan att agent-actorn behöver veta var servern befinner sig utan agenten har bara en referens (ActorRef) till server-actorn.
- Ta emot LogMessage-objekt
- Skriv ut en logg om att objektet är mottaget (loggning görs med
log.info(...)
)
LogServer-actorn finns under: server/src/main/scala/se/callista/loganalyzer/server/LogServer.scala
Använd följande kommando för att verifiera att LogServer tar emot LogMessage-objekt:
sbt 'server/test-only se.callista.loganalyzer.server.LogServerSuite'
Startskripten för Windows finns i rot-katalogen för projektet med namnen start_server.bat
och start_agent.bat
men behöver editeras. Uppdatera USER_HOME och PROJECT_HOME, så att de pekar på din hemkatalog, resp var du har checkat ut projektet
Kör kommandot: sbt start-script
och scripten server/target/start
och agent/target/start
ska ha genererats.
Kompilera koden med kommandot: sbt compile
Starta sedan servern i ett terminal-fönster med kommandot: server/target/start
för Linux/Mac och start_server.bat
för Windows.
Starta sedan agenten i ett annat terminal-fönster med kommandot: agent/target/start
för Linux/Mac och start_agent.bat
för Windows.
- Ta emot AccessLog-objekt
- Generera ett löpnummer. Börja på 1 och plussa på ett för varje ny logg (i++ fungerar inte i scala, använd
i += 1
elleri = i + 1
) - Skapar ett nytt LogMessage-objekt med hostname, löpnummer och AccessLog-objektet
- Skicka LogMessage-objektet till server-actorn
LogAgent-actorn finns under: agent/src/main/scala/se/callista/loganalyzer/agent/LogAgent.scala
Använd följande kommando för att verifiera att LogAgent fungerar enligt kraven ovan:
sbt 'agent/test-only se.callista.loganalyzer.agent.LogAgentSuite'
Kompilera koden med kommandot: sbt compile
Starta servern och sedan agenten med start-scripten.
Agenten ska nu skicka logg-meddelanden över nätverket till servern där meddelanden ska visas i ett terminalfönster. Verifiera att meddelanden loggas från servern.
I AccessLog-objektet anges den HTTP Status som varje anrop har.
- Om HTTP status är 200 betyder detta att anropet gått bra
- Om HTTP status börjar på 400 betyder detta att anropet misslyckats p.g.a ett klientfel, t.ex 404 om klienten försöker nå en resurs som inte finns.
- Om HTTP status börjar på 500 betyder detta att ett fel uppstod på servern.
För att se hur väl våra webbservrar fungerar vill vi sätta upp en dashboard som visar hur många lyckade anrop, felaktiga och misslyckade som gjorts. Detta kan åstakommas genom sätta upp actors som räknar varje typ av status.
-
Skapa tre StatusCounter-actors, en för varje typ av HTTP-status (Success, ClientError och ServerError). En actor skapar man med
context.actorOf(Props(new MyActor(p1, p2)), "childActorName")
-
Skicka logg-meddelandet till rätt StatusCounter beroende på HTTP-status:
- Success om HTTP-status är under 400
- ClientError om HTTP-status är 400-499
- ServerError om HTTP-status är över 500
- Ta emot LogMessage objekt
- Räkna upp med ett varje gång en logg kommer in
- Skapa ett Count-objekt med nuvarande antal anrop och skicka detta till presenter-actorn.
Använd följande kommando för att verifiera att StatusCountern fungerar:
sbt 'server/test-only se.callista.loganalyzer.server.StatusCounterSuite'
Kompilera genom att köra kommandot: sbt compile
Starta återigen servern med: server/target/start
(windows: start_server.bat
)
...och agenten med: agent/target/start
(windows: kör start_agent.bat
)
Gå in på localhost:8080 och verifiera att siffrorna räknar upp
Vi kommer i detta steg spara ner alla logg-meddelanden till en databas. Då databasen är något instabil och ibland returnerar exceptions vill vi inte att server-actorn själv ska spara meddelandena utan låta en egen actor, DatabaseWorker, ta hand om det något riskfyllda jobbet.
- Skapa en DatabaseWorker-actor.
- Forwarda alla logg-meddelanden till DatabaseWorker-actorn. Använd
actorReferens.forward([meddelande])
för att vidarebefordra meddelande och behålla referens till actorn som skickade meddelandet från början.
- Ta emot LogMessage objekt
- Spara logg-meddelanden(LogMessage) till databasen.
database.save([hostname], [löpnummer], [AccessLog])
- Skicka tillbaks ett bekräftelsemeddelande (ConfirmationMessage) med löpnumret (id) till actorn som skickade meddelandet (actor-referens:
sender
)
DatabaseWorker-actorn finns under: server/src/main/scala/se/callista/loganalyzer/server/DatabaseWorker.scala
Använd följande kommando för att verifiera att DatabaseWorkern fungerar som förväntat:
sbt 'server/test-only se.callista.loganalyzer.server.DatabaseWorkerSuite'
Kompilera om och starta server och agent igen.
Gå in på localhost:8080/logs för att verifiera att logglistan uppdateras.
Notera att databasen ibland missar att spara logg-meddelanden och fel uppstår. Detta vill vi kunna hantera.
På servern vill vi tillämpa strategin "let it crash". Det innebär att om databasen returnerar ett fel ska vi helt enkelt starta om DatabaseWorkern och sedan fortsätta hantera loggar utan att påverka LogServer-actorn. Detta åstakommer vi genom att sätta en supervisionStrategy i LogServer-actorn som är DatabaseWorkern:s parent actor:
override val supervisorStrategy = OneForOneStrategy() {
case d: DatabaseFailureException => Restart
}
Om fel uppstår i databasen på serversidan eller om loggmeddelanden försvinner på väg till servern vill vi på agent-sidan ha möjlighet att skicka om dessa. Detta kan göras genom att inom en viss tidsperiod kontrollera om ett bekräftelsemeddelande (ConfirmationMessage) för ett loggmeddelande inkommit från servern. Om detta inte skett, skicka om loggmeddelandet med samma löpnummer. Vi vill att alla meddelanden ska skickas minst en gång ( at-least-once ) .
Tips på lösning:
- Alla loggmeddelanden som skickas kan läggas till i en Map med löpnumret som nyckel. När sedan ett ConfirmationMessage kommer in kan man plocka bort loggen.
// skapa (mutable) map
val map = Map[Int, String]()
// lägg till
map += 1 -> "value"
// ta bort
map -= 1
// iterera igenom en map och kör en funktion med varje nyckel och värde
map.foreach { case (key, value) => funktion(key, value) }
- Ett schemalagt jobb kan sättas upp med hjälp av en scheduler som skickar meddelanden till actorn inom ett visst tidsintervall för att trigga omsändning av loggar:
context.system.scheduler.schedule(2 seconds, 2 seconds, self, HandleUnprocessedLogs)
Använd följande kommando för att verifiera att LogAgent skickar om meddelanden inom fem sekunder:
sbt 'agent/test-only se.callista.loganalyzer.agent.LogAgentResendSuite'
När en skrivning till databasen fallerar och omsändning sker från LogAgenten kommer StatusCountern räkna anropet två gånger. Detta måste hanteras av StatusCountern så den tar hänsyn till om samma loggmeddelande kommer in flera gånger. Utgå ifrån att ett loggmeddelandes hostname tillsammans med id (löpnummer) är unikt.
Använd följande kommando för att verifiera att StatusCountern nu inte räknar upp samma loggmeddelande två gånger:
sbt 'server/test-only se.callista.loganalyzer.server.StatusCounterIdempotentSuite'
Tutorialen är skapad av Albert Örwall och Pär Wenåker för Cadec 2013 som arrangeras av Callista Enterprise AB.