I denna tutorial kommer vi bygga ett enkelt system för central analys av loggar från webbservrar. Tanken är att man har en agent på varje webbserver som ligger och läser av den sk. access-loggen i Apache. Denna agent skickar sedan vidare dessa loggar till en central server som lagrar loggarna och gör realtidsanalys. All kommunikation som sker asynkront mellan agenterna och servern.
Tutorial är uppbyggd så att infrastukturen finns på plats, men logik måste skapas för de actors som ska användas.
Instruktioner för att sätta upp en utvecklingsmiljö finns här.
Första uppgiften går ut på att få upp ett flöde där en agent på en webbserver scannar loggar och skickar logg-objekt vidare till en server. Med hjälp av Akka kan detta ske helt utan att agent-actorn behöver veta var servern befinner sig utan agenten har bara en referens (ActorRef) till server-actorn.
- Ta emot LogMessage-objekt
- Skriv ut en logg om att objektet är mottaget (loggning görs med
log.info(...)
)
LogServer-actorn finns under: server/src/main/scala/se/callista/loganalyzer/server/LogServer.scala
Använd följande kommando för att verifiera att LogServer tar emot LogMessage-objekt:
sbt 'server/test-only se.callista.loganalyzer.server.LogServerSuite'
- Ta emot AccessLog-objekt
- Generera ett löpnummer. Börja på 1 och plussa på ett för varje ny logg.
- Skapar ett nytt LogMessage-objekt med löpnummer, hostname och AccessLog-objektet
- Skicka LogMessage-objektet till server-actorn
LogAgent-actorn finns under: agent/src/main/scala/se/callista/loganalyzer/agent/LogAgent.scala
Använd följande kommando för att verifiera att LogAgent fungerar enligt kraven ovan:
sbt 'agent/test-only se.callista.loganalyzer.agent.LogAgentSuite'
Skapa först start-script genom att köra kommandot: sbt start-script
Kompilera koden med kommandot: sbt compile
Starta sedan servern i ett terminal-fönster med kommandot: server/target/start
(windows: )
Starta sedan agenten i ett annat terminal-fönster med kommandot: agent/target/start
(windows: )
Agenten ska nu skicka logg-meddelanden över nätverket till servern där meddelanden ska visas i ett terminalfönster. Verifiera i terminalen på för servern att meddelanden kommer fram.
I AccessLog-objektet anges den HTTP Status som varje anrop har.
- Om HTTP status är 200 betyder detta att anropet gått bra
- Om HTTP status börjar på 400 betyder detta att anropet misslyckats p.g.a ett klientfel, t.ex 404 om klienten försöker nå en resurs som inte finns.
- Om HTTP status börjar på 500 betyder detta att ett fel uppstod på servern.
För att se hur väl våra webbservrar fungerar vill vi sätta upp en dashboard som visar hur många lyckade anrop, felaktiga och misslyckade som gjorts. Detta kan åstakommas genom sätta upp actors som räknar varje typ av status.
-
Skapa StatusCounter-actors för varje typ av HTTP-status (Success, ClientError och ServerError)
-
Skicka logg-meddelandet till rätt StatusCounter beroende på HTTP-status:
- Success om HTTP-status är 200
- ClientError om HTTP-status är 400-499
- ServerError om HTTP-status är över 500
- Ta emot LogMessage objekt
- Räkna upp med ett varje gång en logg kommer in
- Skapa ett Count-objekt och skicka till presenter-actorn
Använd följande kommando för att verifiera att StatusCountern fungerar:
sbt 'server/test-only se.callista.loganalyzer.server.StatusCounterSuite'
Kompilera genom att köra kommandot: sbt compile
Starta återigen servern med: server/target/start
(windows: )
...och agenten med: agent/target/start
(windows: )
Gå in på localhost:8080 och verifiera att siffrorna räknar upp
Vi kommer i detta steg spara ner alla logg-meddelanden till en databas. Då databasen är något instabil och ibland returnerar exceptions vill vi inte att server-actorn själv ska spara meddelandena utan låta en egen actor, DatabaseWorker, ta hand om det något riskfyllda jobbet.
- Ta emot LogMessage objekt
- Spara logg-meddelanden(LogMessage) till databasen.
database.save([hostname], [löpnummer], [AccessLog])
- Skicka tillbaks ett bekräftelsemeddelande (ConfirmationMessage) med löpnumret (id) till actorn som skickade meddelandet.
sender ! ConfirmationMessage([löpnummer])
DatabaseWorker-actorn finns under: server/src/main/scala/se/callista/loganalyzer/server/DatabaseWorker.scala
Använd följande kommando för att verifiera att DatabaseWorkern fungerar som förväntat:
sbt 'server/test-only se.callista.loganalyzer.server.DatabaseWorkerSuite'
- Skapa en DatabaseWorker-actor.
val databaseWorker = context.actorOf(Props[DatabaseWorker], "databaseWorker")
- Forwarda alla logg-meddelanden till DatabaseWorker-actorn
databaseWorker.forward([LogMessage])
Kompilera om och starta server och agent igen.
Gå in på localhost:8080/logs för att se att logglistan uppdateras.
Notera att databasen ibland missar att spara logg-meddelanden och fel uppstår. Detta vill vi kunna hantera.
På servern vill vi tillämpa strategin "let it crash". Det innebär att om databasen returnerar ett fel ska vi helt enkelt starta om DatabaseWorkern och sedan fortsätta hantera loggar utan att påverka LogServer-actorn. Detta åstakommer vi genom att sätta en supervisionStrategy i LogServer-actorn som är DatabaseWorkern:s parent actor:
override val supervisorStrategy = OneForOneStrategy() {
case d: DatabaseFailureException => Restart
}
Om fel uppstår i databasen på serversidan eller om loggmeddelanden försvinner på väg till servern vill vi på agent-sidan ha möjlighet att skicka om dessa. Detta kan göras genom att inom en viss tidsperiod kontrollera om ett bekräftelsemeddelande (ConfirmationMessage) för ett loggmeddelande inkommit från servern. Om detta inte skett, skicka om loggmeddelandet med samma löpnummer.
Tips på lösning:
- Alla loggmeddelanden som skickas kan läggas till i en Map med löpnumret som nyckel. När sedan ett ConfirmationMessage kommer in kan man plocka bort loggen.
- Ett schemalagt jobb kan sättas upp med hjälp av en scheduler som skickar meddelanden till actorn inom ett visst tidsintervall för att trigga omsändning av loggar:
context.system.scheduler.schedule(2 seconds, 2 seconds, self, HandleUnprocessedLogs)
Använd följande kommando för att verifiera att LogAgent skickar om meddelanden inom fem sekunder:
sbt 'agent/test-only se.callista.loganalyzer.agent.LogAgentResendSuite'
Varje gång ett logg-meddelande skickas kommer nu StatusCountern att räkna upp ett steg till. Detta måste så att StatusCountern tar hänsyn till om samma loggmeddelande kommer in igen och räkna upp igen om detta sker. Utgå ifrån att ett loggmeddelandes hostname tillsammans med id (löpnummer) är unikt.
Använd följande kommando för att verifiera att StatusCountern nu inte räknar upp samma loggmeddelande två gånger:
sbt 'server/test-only se.callista.loganalyzer.server.StatusCounterIdempotentSuite'
Tutorialen är skapad av Albert Örwall och Pär Wenåker för Cadec 2013 som arrangeras av Callista Enterprise AB.