Skip to content

Log Format es

Rafael JPD edited this page Jan 12, 2025 · 1 revision

Formato esperado del contenido en los archivos de log

Se soporta una serie de formatos de línea. Es importante que cada línea contenga la IP real (IPv4 o IPv6) de la URL accedida, el día y hora de cada acceso, el método HTTP de acceso (GET), el código de estado del acceso (200, 204, 301, entre otros), la URL accedida y el agente de usuario utilizado para obtener el contenido (por ejemplo, navegador en dispositivo móvil). Otras informaciones como tamaño del contenido y tiempo de respuesta también pueden componer el log.

Es extremadamente importante que la IP proporcionada en cada línea de log sea la real, ya que esta información se utiliza para determinar una sesión de usuario, concepto que se usa en los pasos siguientes de la calculadora de accesos para la eliminación de clics dobles y otros ruidos que aumentan de manera artificial los resultados. En caso de que la IP proporcionada sea local (127.0.0.1, 168.0.0.1, 17.0.0.1, 10.0.0.1, entre otros) o esté ausente, la línea se descarta, ya que no permite la definición de una sesión de usuario - esto inviabiliza el conteo de accesos según los estándares del Project COUNTER R5.

En caso de que el acceso sea realizado por un agente de usuario que no sea un navegador web, como un robot o un crawler, la línea también se descarta. Las URLs que representan archivos estáticos (por ejemplo, imágenes, hojas de estilo, entre otros) también se descartan. A continuación, se enumeran algunos ejemplos de líneas de log válidas, es decir, que representan accesos a las páginas de artículos en formato de resumen o completo:

  1. scielo.isciii.es 117.64.147.191 - - [12/Feb/2024:04:23:09 +0100] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 18575 "-" "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36" 90571 364 18950
  2. 45.65.189.47 45.65.189.47, 198.41.230.129 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
  3. 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:12 0300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
  4. 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:120300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
  5. 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
  6. 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"

La siguiente tabla enumera los campos esperados/detectados en cada línea de log destacada en la lista anterior:

IP Método HTTP Código HTTP URL Agente de Usuario
117.64.147.191 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15
186.130.151.215 GET 304 /scielo.php?pid=S0718-07642017000400014&script=sci_arttext Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36
186.130.151.215 GET 304 /scielo.php?pid=S0718-07642017000400014&script=sci_arttext Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15

Clone this wiki locally