Operadores de búsqueda avanzada para periodistas

 

1. Qué son

 

Son expresiones para conseguir información o archivos con más rapidez, eliminando el ruido pero sin perder resultados relevantes. Muchas de ellas vertebran (aunque no aparezcan expresamente) la sección «búsqueda avanzada» de los motores de búsqueda o redes sociales:

 

  • Búsqueda avanzada de Google: https://www.google.es/advanced_sePon primeroarch
  • Búsqueda avanzada de Twitter: https://twitter.com/search-advanced

 

Algunos consejos generales para buscar:

  • La máxima ventaja de los operadores se logra combinándolos
  • De cara a búsquedas internacionales, conviene realizar las pesquisas en el idioma del lugar de origen de la información, en inglés y en el idioma propio, por ese orden
  • Realizar las búsquedas en navegadores donde se esté desautenticado, sin el correo electrónico u otros servicios personalizados abiertos
  • En una búsqueda con varios términos, respetar en la medida de lo posible el orden lógico de los términos (mass destruction), poner primero el término que más interese (no es lo mismo Francia Italia que Italia Francia), y repetir varias veces un término que interese mucho (weapons mass destruction bush bush)

 

2. Buscadores

Aunque Google sea el buscador con mayor cantidad de contenido indexado, hay que utilizar también otros buscadores:

 

  • La extensión Storyful de Chrome permite indagar simultáneamente en varios motores de búsqueda

 

A continuación se explican algunos operadores útiles.

 

3. Operadores útiles

Se proponen ejemplos de búsqueda donde sólo habría que cambiar los términos clave de la investigación. Se introduce en la caja de búsqueda toda la expresión en amarillo.

Para hacer pruebas: http://www.google.com

 

  • «…»
    • Una expresión específica que aparezca sin variación: «Responsable de propaganda de ISIS»

 

  • *
    • Una expresión concreta de la que desconocemos una parte (por ejemplo un nombre), que es la que sustituimos por asterisco: «Ministro * Maravall»
    • La siguiente expresión serviría para localizar a usuarios con dudas sobre el Impuesto de la Renta, pero puede adaptarse para detectar a personas con otras inquietudes: “Cómo * IRPF 2016” OR “duda * IRPF 2016”

 

  • – (o NOT)
    • Una expresión concreta excluyendo un término que introduce ruido en los resultados: «Operación Triunfo» -cobra o Apple -fruit u «Operación Triunfo» NOT cobra

 

  •  OR
    • Un término u otro. Ofertas de empleo: “oferta * trabajo” periodista OR publicista
    • Un término u otro. Novedades en la industria: innovación periodismo “nuevo estudio” OR “nuevo informe”
    • Un término u otro. Cupones y descuentos: cupón concierto OR descuento concierto OR promoción concierto

 

  • site
    • A nuestro juicio es el operador más útil, el que más tiempo ahorra
    • Para encontrar un tema dentro de un sitio web: «guerra de Siria» site:elpais.com
    • Uso con subcarpetas: libros sobre yihad en Amazon: yihad site:amazon.com/books
    • Buscar una cosa o la otra: site:amazon.com/books Daesh OR ISIS
    • Dentro de un sitio y con la palabra clave en las url que aparezcan: site:amazon.com inurl:yihad
    • Cuando interesa una palabra y otras que se le relacionen: site:amazon.com ~daesh
    • Cuando interesa una palabra y otras que se le relacionen pero no una que introduce ruido: site:amazon.com ~Islam -terrorism
    • Más que un dominio, interesa un conjunto de dominios: site:mil «Refugees * security»
    • Para obtener información en las redes sociales (o monitorizar lo que se dice de una persona en ellas): site:twitter.com OR site:facebook.com OR site:pinterest.com OR site:instagram.com “Brandon Victor Dixon”
    • Buscar feeds en un sitio: rss site:foreignpolicy.com
    • Combinado con «lists». Encontrar listas de Twitter con un nombre específico (en este caso, «Brussels», Bruselas en inglés). El asterisco corresponde al usuario que ha creado la lista y que no conocemos:  site:twitter.com/*/lists/Brussels. Esta fórmula es de gran utilidad en noticias de última hora.
    • Encontrar listas de Twitter cuyo nombre exacto desconocemos pero que nos interesan sólo si incluyen un término: inurl:lists inurl:syria site:twitter.com

 

  • source
    • Para obtener noticias sólo de un medio: Trump source:elmundo o Rajoy source:theguardian

 

  • related
    • Buscar sitios similares a otro que nos gusta (en este caso, el sitio es Nubareports.org): related:nubareports.org

 

  • info
    • Obtener metainformación sobre un sitio web para evaluar su credibilidad (páginas que enlacen a él o páginas que lo citen, por ejemplo): info:politikon.es

 

  • ext (o filetype)
    • Para buscar sólo documentos en una extensión determinada, que suele abundar en ámbitos como el académico (ext:pdf o ext:doc o ext:docx o  ext:ppt o ext:xlsx): refugiados ext:pdf

 

  •  intitle
    • Si está claro el término que interesa, puede solicitarse que vaya en el título de la página, lo que indicaría que es algo más que un tema colateral dentro del texto: intitle:»Bashar Al Assad»
    • La siguiente expresión serviría para pedir un tema en el título, en ciertos sitios específicos, y excluyendo otros: intitle:refugiados site:realinstitutoelcano.org OR site:cidob.org OR site:gees.org -site:fundacionfaes.org -site:fundacionalternativas.org

 

  • allintitle
    • Busca una cadena de texto en el título de una web (no se puede utilizar con otros operadores): allintitle:refugiados en lesbos

 

  • allintext
    • Busca cadena de texto dentro de una página web (no se puede utilizar con otros operadores): allintext:avance en Mosul

 

  • inurl
    • Que un término aparezca en la dirección url también indica relevancia: inurl:refugiados
    • Ejemplo de uso avanzado de inurl para obtener información que no es de uso público en dominios estratégicos: «not for public release» inurl:gob OR inurl:mil -.com
      -.net -.es

 

  • allinurl
    • Busca una cadena de texto en la url (no puede utilizarse con otros operadores): allinurl:retirada de daesh

 

  • inanchor
    • Para buscar contenidos que tengan determinados términos en el texto Anchor (el anchor text o texto ancla es el que podemos leer encima de un enlace; es decir, el texto sobre el que pinchamos y que nos anuncia lo que hay más allá): inanchor:propaganda

 

  • allinanchor
    • Para buscar una cadena de términos en el texto Anchor: allinanchor:isis recruitment

 

  • link
    • Para buscar enlaces apuntando a un sitio web: link:mosuleye.wordpress.com

 

  • cache
    • Qué aspecto presentaba un sitio en el pasado: cache:globograma.com

 

  • Operadores «prácticos»
    • Páginas con definiciones: define: zika
    • Traducir una frase (aquí al inglés, pero puede utilizarse otro idioma): translate «spiegeltje spiegeltje aan de wand» english
    • La hora en: time Shangai
    • El clima actual: weather New York
    • Convertir (monedas, medidas): convert 10 euros to dollars, convert 20 miles to kilometres, convert 5 lbs to kilos 

 

Hay algún operador que funciona en Bing, no en Google. Por ejemplo, author (author: «maría josé pérez del pozo») que arroja todos los contenidos donde una persona figure como autor.

 

A continuación se explica cómo poner en acción los operadores anteriores mediante alertas.

4. Expresiones útiles para seguimiento/monitorización

Muchas de las expresiones anteriores se pueden convertir en alertas de Google, como explican en este excelente artículo de Papeles de Inteligencia. Con ellas el usuario pasa de buscar la información a recibirla inmediatamente por email cuando se publique.

 

Para hacer pruebas: http://www.google.com

 

  • site:
    • Permite recibir información sobre cómo se expande un artículo titulado de determinada forma en redes sociales: site:twitter.com OR site:facebook.com «Actores de Broadway cargan contra Donald Trump»

 

  • “Titulo” -site:
    • Para saber cuándo un artículo propio ha aparecido en otros sitios (en este ejemplo, se comprueba si un informe sobre bots y trols ha sido citado fuera del sitio donde se publicó, compolitica.com): «politica automatizada: bots, trols» -compolitica.com
    • Para conocer reacciones a un determinado informe o artículo, propio o de la competencia. En este ejemplo, se desconoce el nombre exacto del informe, se sabe que es de CEAR, y se quieren evitar resultados de esta página: “informe * refugiados * CEAR” -cear.es

 

A continuación se explora la aplicación de los operadores anteriores en Twitter y Tweetdeck.

 

5. Operadores para Twitter/Tweetdeck

 

Consejo: refinar la búsqueda en Twitter, probar después si funciona en Tweetdeck (tweetdeck.com)

Para hacer pruebas: https://twitter.com/search-home  

 

  • Tuits con un término pero no otro: Irak -Mosul

 

  • Tuits con un término u otro: Irak OR Syria

 

  • Tuits con dos términos: Irak AND Syria

 

  • Tuits excluyendo retuits (para evitar la repetición): Terremoto -RT

 

  • Tuis que contengan un término y que emita una cuenta concreta (en este caso, @AJEnglish): ISIS from:AJEnglish

 

  • Sólo los tuits emitidos por los usuarios incluidos en una lista (en este caso, la lista de @globograma llamada «Corresponsales españoles«): Mosul list:globograma/corresponsalES

 

  • Tuits con fecha
    • Desde: Terremoto Italia since:2016-09-29 (terremoto en Italia desde el 29 de septiembre de 2016)
    • Hasta: Terremoto Italia until:2016-09-29 (terremoto en Italia hasta el 29 de septiembre de 2016)

 

  • Tuits que estén teniendo mucho eco, con un mínimo de retuits, favoritos o respuestas (en este ejemplo, relacionados con el abucheo a Michael Pence en un teatro de Broadway)
    • Retuits: Pence booed min_retweets:10
    • Favoritos: Pence booed min_fav:10
    • Respuestas: Pence booed min_replies:10
    • Retuits y respuestas: Pence booed min_retweets:5 OR min_replies:3

 

  • Sólo los tuits (filter) que incluyan imágenes, o enlaces, o que sean noticias, o que partan de cuentas verificadas, o que contengan vídeos o vídeos de YouTube (en el ejemplo se investiga sobre Argentina e Irak)
    • Argentina filter:images
    • Argentina card_name:animated_gif (tuits con gifs animados)
    • Argentina filter:links
    • Argentina filter:news
    • Argentina filter:verified
    • Argentina filter:videos (o puede usarse youtu.be, como en Irak youtu.be o paris youtu.be)
    • Argentina filter:periscope (solo tuits con emisiones de Periscope)
    • Argentina filter:media (tuits con foto, video o gif)
    • Argentina filter:replies (selecciona solo respuestas)
    • Argentina filter:hashtag (selecciona solo tuits con etiqueta)

 

  • Tuits que excluyen elementos, formatos o contenidos (exclude)
    • Mosul exclude:videos
    • Mosul exclude:news
    • Mosul exclude:images
    • Mosul exclude:links -> esta expresión es útil para acceder a relatos de testigos que cuentan lo que han visto, no que refieren a contenidos ajenos; otra vía interesante para encontrar testimonios de última hora es combinar la búsqueda del término de interés con el pronombre «me» -en inglés-, que casi todos utilizan para narrar una experiencia personal)
    • También funcionan exclude:media, exclude:periscope, exclude:replies, exclude:hashtag, exclude:verified

 

  • Tuits en distintos idiomas (fuente: Fabrice Deprez / Keepitsimple.fr / Firstdraftnews.com):
Español lang:es
Inglés lang:en
Francés lang:ru
Alemán lang:fr
Árabe lang:ar
Ruso lang:de
Italiano lang:it
Holandés lang:nl
Chino (s) lang:ch-zn
Chino (t)                 lang:ch-tw
Coreano lang:ko
Finés lang:fi
Hindú lang:hi
Indonesio lang:id
Sueco lang:sv
Japonés lang:ja
Polaco lang:pl
Turco lang:tr
Portugués lang:pt

 

Combinados: France lang:en OR lang:fr OR lang:de

Otros operadores de lengua

 

 

  • Ejemplos de columnas con operadores de interés para Tweetdeck
    • tsunami ? Tuits que mencionen la palabra tsunami e incluyan el signo de interrogación
    • to:realDonaldTrump Todos los tuits que empiecen con @realDonaldTrump
    • @realDonaldTrump Todos los tuits que mencionen a @realDonaldTrump
    • Breaking + 10 RT
    • I’m a reporter, I’m a journalist (periodistas haciéndose con información de interés)
    • Mosul list:Reuters/all-journos-list-1 (centrarse en quienes hablen de un tema dentro de una lista)
    • Expresiones locales
    • Palabras malsonantes
    • Elegir bien los términos. Ej.: La importancia del término “me”

 

  • Tuits sobre un tema publicados desde zona específica (near): ISIS near:Bagdad within:1000km

 

  • Tuits emitidos desde un punto concreto, con el operador «geocode»: geocode:40.473471,-3.939617,1km (la latitud y longitud de un sitio se obtienen buscándolo en Google Maps, pulsando con el botón derecho del ratón sobre él -esto en Windows, el equivalente en Mac) y eligiendo la opción ¿Qué hay aquí?)

 

 

[Este conjunto de páginas funciona como una guía y un índice de recursos para la verificación digital de contenidos internacionales. Ha sido realizado entre septiembre de 2016 y enero de 2017. Ten en cuenta que algunas herramientas o aplicaciones señaladas pueden registrar cambios o dejar de funcionar con el tiempo y que pueden haber surgido otras debido a los avances en esta actividad. Si ves algo que se pueda mejorar -> globograma @ gmail.com Información relacionada]