-
Notifications
You must be signed in to change notification settings - Fork 1
Log Format es
Se soporta una serie de formatos de línea. Es importante que cada línea contenga la IP real (IPv4 o IPv6) de la URL accedida, el día y hora de cada acceso, el método HTTP de acceso (GET), el código de estado del acceso (200, 204, 301, entre otros), la URL accedida y el agente de usuario utilizado para obtener el contenido (por ejemplo, navegador en dispositivo móvil). Otras informaciones como tamaño del contenido y tiempo de respuesta también pueden componer el log.
Es extremadamente importante que la IP proporcionada en cada línea de log sea la real, ya que esta información se utiliza para determinar una sesión de usuario, concepto que se usa en los pasos siguientes de la calculadora de accesos para la eliminación de clics dobles y otros ruidos que aumentan de manera artificial los resultados. En caso de que la IP proporcionada sea local (127.0.0.1, 168.0.0.1, 17.0.0.1, 10.0.0.1, entre otros) o esté ausente, la línea se descarta, ya que no permite la definición de una sesión de usuario - esto inviabiliza el conteo de accesos según los estándares del Project COUNTER R5.
En caso de que el acceso sea realizado por un agente de usuario que no sea un navegador web, como un robot o un crawler, la línea también se descarta. Las URLs que representan archivos estáticos (por ejemplo, imágenes, hojas de estilo, entre otros) también se descartan. A continuación, se enumeran algunos ejemplos de líneas de log válidas, es decir, que representan accesos a las páginas de artículos en formato de resumen o completo:
- scielo.isciii.es 117.64.147.191 - - [12/Feb/2024:04:23:09 +0100] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 18575 "-" "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36" 90571 364 18950
- 45.65.189.47 45.65.189.47, 198.41.230.129 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
- 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:12 0300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
- 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:120300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
- 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
- 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
La siguiente tabla enumera los campos esperados/detectados en cada línea de log destacada en la lista anterior:
| IP | Método HTTP | Código HTTP | URL | Agente de Usuario |
|---|---|---|---|---|
| 117.64.147.191 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |
| 186.130.151.215 | GET | 304 | /scielo.php?pid=S0718-07642017000400014&script=sci_arttext | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 |
| 186.130.151.215 | GET | 304 | /scielo.php?pid=S0718-07642017000400014&script=sci_arttext | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |