Lea artículos detrás de paywalls haciéndose pasar por Googlebot

Internet está en un punto de inflexión. El continuo aumento del bloqueo de anuncios ha puesto fin al modelo de ingresos que se basa únicamente en dólares publicitarios para operar sitios web y empresas.

Especialmente los sitios de noticias han comenzado a experimentar formas de diversificar las fuentes de ingresos, y una opción destacada que sitios como The Wall Street Journal, Financial Times, The New York Times o The Washington Post han implementado es el sistema de pago.

Existen diferentes tipos de muros de pago, pero todos tienen en común que bloquean el acceso al contenido directamente o después de que se haya leído un cierto número de artículos en el sitio.

Luego se pide a los visitantes que se suscriban al sitio para continuar leyendo artículos sobre él.

Puede tener sentido desde el punto de vista comercial, y puede ser más lucrativo que luchar contra los usuarios que ejecutan bloqueadores de anuncios, pero tiene un inconveniente tanto para el sitio con pagos como para el usuario bloqueado.

Los sitios pierden un alto porcentaje de visitantes si implementan un sistema de muro de pago. No está claro qué tan alto es realmente el porcentaje, y probablemente varía de un sitio a otro, pero es probable que sea mucho más alto que el porcentaje de visitantes que se suscriben al sitio después de que se les presente la opción de suscribirse para leer el artículo deseado.

Enmascarar tu navegador

No es ningún secreto que los sitios de noticias permiten el acceso a agregadores de noticias y motores de búsqueda. Si revisa Google News o Buscar, por ejemplo, encontrará artículos de sitios con paywalls enumerados allí.

En el pasado, los sitios de noticias permitían el acceso a visitantes provenientes de los principales agregadores de noticias como Reddit, Digg o Slashdot, pero esa práctica parece estar tan bien como hoy en día.

Otro truco, pegar el título del artículo en un motor de búsqueda para leer la historia en caché directamente, ya no parece funcionar correctamente, así como los artículos en sitios con paywalls ya no se almacenan en caché.

Actualización : The Wall Street Journal anunció que cerrará el agujero que se describe a continuación. Sin embargo, aún puede leer artículos detrás del muro de pago del sitio utilizando el siguiente método:

  1. Presione F12 cuando esté en la página del artículo con el artículo cortado y la solicitud de suscripción para leerlo en su totalidad.
  2. Abre la pestaña de la consola.
  3. Pegue javascript: window.location = "// m.facebook.com/l.php?u="+encodeURIComponent(window.location.href);
  4. Presione enter.

La página debería recargarse y el artículo debería cargarse por completo. También puede publicar el enlace del artículo en Facebook, por ejemplo, en una nueva publicación que solo usted puede ver. Al hacer clic en el enlace publicado, se debe cargar el artículo en su totalidad en el sitio web de The Wall Street Journal.

Usuario-Agente y Referente

Probablemente se esté preguntando cómo los sitios bloquean o permiten el acceso al contenido del sitio. Los métodos han mejorado a lo largo de los años, y ya no es suficiente simplemente cambiar el referente del navegador a //www.google.com/ para obtener acceso completo al contenido de un sitio.

En cambio, los sitios utilizan varias verificaciones que incluyen agente de usuario, referencia y cookies, y a veces incluso más que eso, para determinar la legitimidad del acceso.

Información general

Probablemente la mejor manera de enmascarar el navegador es hacer que parezca ser Googlebot.

  • Remitente: //www.google.com/
  • User-Agent: Mozilla / 5.0 (compatible; Googlebot / 2.1; + // www.google.com/bot.html

Firefox

Los usuarios de Firefox necesitan dos complementos de navegador para eso: el primero, RefControl, para cambiar el valor de referencia al visitar sitios de noticias, el segundo, User Agent Switcher, para cambiar el agente de usuario del navegador.

  1. Descargue e instale ambas extensiones en el navegador web Firefox.
  2. Toque la tecla Alt y seleccione Herramientas> Opciones de control de referencia.
  3. Haga clic en "agregar sitio", ingrese un nombre de dominio debajo del sitio, seleccione una acción personalizada e ingrese //www.google.com/ como referencia.
  4. Repita esto para todos los sitios de noticias a los que desee acceder (algunos pueden no funcionar incluso si realiza los cambios, así que tenga esto en cuenta).
  5. Cuando haya terminado, cierre la ventana de configuración.
  6. Toque de nuevo la tecla Alt y seleccione Herramientas> Agente de usuario predeterminado> Editar agentes de usuario en el menú.
  7. Seleccione Nuevo> Agente de usuario y reemplace la cadena en el campo Agente de usuario con Mozilla / 5.0 (compatible; Googlebot / 2.1; + // www.google.com/bot.html). Nómbralo Googlebot.
  8. Sal del menú.
  9. Antes de acceder a estos sitios, toque Alt y seleccione Agente de usuario predeterminado> Googlebot.

Esto es todo lo que hay que hacer. Es un poco desafortunado que no haya una extensión para Firefox que cambie el agente de usuario automáticamente en función de los sitios que visita.

Google Chrome

Los usuarios de Google Chrome pueden instalar extensiones como User Agent Switcher y Referer Control que están disponibles para que el navegador haga lo mismo.

Sin embargo, existe otra posibilidad, y es crear una extensión personalizada que automatice el proceso en el navegador.

Las instrucciones se proporcionan en Elaineou. Básicamente, todo lo que se necesita es crear un nuevo directorio en la computadora local, crear los dos archivos background.js y manifest.json dentro de él, y copiar y pegar el código que se encuentra en el sitio en los archivos.

Debe habilitar el "modo de desarrollador" en Chrome: // extensiones /, y luego puede seleccionar "cargar extensión desempaquetada" para elegir la carpeta en la que ha creado los dos archivos para cargar la extensión en Chrome.

Puede modificar la lista de sitios que admite para agregar nuevos.