Las investigaciones de Open Source (OSI por sus siglas en inglés) se han vuelto cada vez más importantes y comunes en varios sectores, principalmente en el periodismo y agencias de inteligencia e investigación.
Sin embargo, los investigadores enfrentan varios retos cuando realizan una Investigación de Open Source, lo que puede dificultar la efectividad de sus investigaciones. En esta publicación, exploraremos algunos de los desafíos más comunes que enfrentan los investigadores y brindaremos estrategias para superarlos.
Retos de las Investigaciones Open Source
Llevar a cabo una investigación Open Source puede ser complejo y consumir mucho tiempo, requerir una atención cuidadosa a los detalles y la voluntad de buscar pistas y rastrear la evidencia a donde sea que conduzca.
Sin embargo, incluso los investigadores más hábiles y dedicados pueden enfrentar varios desafíos. Aquí hay algunos de los más comunes:
Reto #1: Sobrecarga de Información
Uno de los principales desafíos es la gran cantidad de información disponible. Como sabemos, una gran parte de una investigación Open Source, es aprovechar la Inteligencia Open Source o Open Source Intelligence (OSINT por sus siglas en inglés).
Hablar de OSINT, es hablar del proceso de extraer información disponible públicamente (Publicly Available Information o PAI) de varias fuentes, analizarla y generar inteligencia procesable a partir de ella. Este proceso es más fácil decirlo que hacerlo.
Dentro de la información que está disponisble, se encuentrar diversas fuentes que cuentan con grandes volúmenes de datos. Datos que muchas veces se encuentran en diferentes formatos.
Clasificar toda esta información y encontrar datos relevantes que sean confiables es toda una labor. A menudo puede parecer que se está ahogando en datos y no sabe cómo mantenerse a flote.
Para superar este desafío, los investigadores deben utilizar herramientas y técnicas especializadas para gestionar los datos. Por ejemplo, las herramientas de visualización de datos pueden ayudarlo a obtener una vista panorámica de la información que tiene y ayudarlo a comprender el panorama general y, por extensión, determinar dónde debe profundizar.
Otro consejo sería usar herramientas de procesamiento de datos automatizados para filtrar información irrelevante y enfocarse solo en señales relevantes.
Reto #2: Gestión de Diversos Formatos de Información
Como ya hemos mencionado, la información Open Source puede venir en diversos formatos, como texto, imágenes y videos. Esta inconsistencia en los datos dificulta la comparación y el análisis de información.
Para superar este desafío, los investigadores deben establecer una organización y una estructura efectivas para la gestión de datos mediante la creación de una arquitectura de datos compartidos que tenga sentido para sus objetivos y el uso de un sistema de notación para rastrear y manejar la información.
Este último paso es fundamental cuando llega el momento de analizar la gestión de la seguridad de la información (lo abordaremos próximamente).
En general, la idea es buscar dimensiones comunes en los datos que puedan usarse como base, ya sea tiempo, espacio (geolocalización), una tipología establecida de categorías de eventos o lo que sea más sensato para su investigación.
Reto #3: Mantener la Precisión y la Credibilidad
La precisión y la confiabilidad son críticas en las investigaciones Open Source. Los investigadores deben asegurarse de que la información que recopilan y analizan sea precisa y confiable, ya que los conocimientos que generan deben ser verificables para poder lograr el impacto y cambio deseado.
Para superar este desafío, los investigadores deben validar las fuentes y usar evidencia que las corrobore. Esto significa verificar la autenticidad de la fuente y cotejar la información con otras fuentes para garantizar la precisión y la confiabilidad.
Aquí es fundamental contar con un enfoque compartido y sistematizado para la validación y evaluación de fuentes e, idealmente, poder contar con el apoyo de herramientas de fusión de datos que faciliten el proceso de corroboración.
Tener un registro de auditoría claro de cómo se llegó a las conclusiones y quién contribuyó a la evaluación dentro del equipo le ahorrará grandes dolores de cabeza en el futuro cuando surjan preguntas o solicitudes de aclaraciones más abajo en la cadena de suministro de información.
Reto #4: Dificultad para Colaborar
Una investigación Open Source a menudo involucra múltiples investigadores y partes interesadas, lo que requiere una colaboración y comunicación efectivas. La colaboración puede ser un desafío, principalmente cuando los investigadores trabajan de forma remota.
Para superar este desafío, los investigadores deben establecer canales de comunicación claros y protocolos de colaboración.
Pueden usar herramientas colaborativas como Slack para comunicarse y compartir información de manera efectiva, pero deben tener en cuenta la seguridad.
Reto #5: Seguridad y Privacidad
Las investigaciones de Open Source puede presentar riesgos significativos para la seguridad y la privacidad, particularmente cuando se maneja información confidencial. Los investigadores deben tomar precauciones para mitigar estos riesgos.
Para superar este desafío, los investigadores deben utilizar plataformas seguras para la recopilación, el almacenamiento (y el intercambio), el análisis y la elaboración de informes de datos.
También deben seguir las mejores prácticas para la protección de datos, como el cifrado de datos de extremo a extremo (en tránsito y en reposo), el doble factor de autenticación y los controles de acceso basados en roles (RBAC).
El último punto es crítico. Desde el punto de vista de la seguridad cibernética, puede tener la fortaleza más impenetrable del mundo, pero si alguien sin darse cuenta abre una puerta desde el interior, los actores malintencionados pueden encontrar la manera de entrar.
Los protocolos RBAC bien diseñados garantizan que los usuarios solo tengan acceso a lo que quieren o necesitan para realizar su trabajo, sin exponer otra información a riesgos innecesarios.
Reto #6: Limitaciones Tecnológicas
A menudo se requieren múltiples herramientas y software especializados para recopilar, procesar y analizar los datos sin procesar con los que se necesite trabajar. Sin embargo, el uso de múltiples herramientas puede ser un desafío y consumir mucho tiempo.
Hemos trabajado con muchos clientes que operan sistemas heredados que están interconectados por enlaces frágiles que pueden romperse rápidamente cada vez que un nodo de una red sufre algún cambio (planeado o no).
Para superar este desafío, los investigadores deben preferir herramientas que cubran todos los aspectos de la cadena de suministro de información (desde la recopilación hasta el almacenamiento, el análisis y la generación de informes), reduciendo así los riesgos de integración y ahorrándole dolores de cabeza, tiempo y dinero en el control de la seguridad de la información.
Reto #7: Procesos Largos y Tediosos
Algunos procesos de gestión de datos pueden consumir mucho tiempo y desviar la atención de las actividades de investigación principales. Esto puede ser un desafío importante para los investigadores que tienen que equilibrar múltiples tareas contrarreloj.
Para superar este desafío, los investigadores deben automatizar tareas repetitivas, como la recopilación manual de datos y el procesamiento analítico básico mediante flujos de trabajo automatizados, procesos de extracción, transformación y carga (ETL) e inteligencia artificial (IA).
Conclusión
El llevar a cabo una investigación Open Source conlleva enfrentarse a diversos retos y desafíos que pueden afectar la efectividad y los resultados de la investigación si no son abordados de manera correcta.
Para superar estos desafíos, los investigadores deben:
- Utilizar herramientas y técnicas especializadas para la gestión de datos,
- Establecer una organización y una estructura eficaces para la gestión de datos,
- Verificar las fuentes y utilizar pruebas que lo corroboren,
- Establecer canales de comunicación y protocolos claros para la colaboración,
- Utilizar plataformas seguras para la recopilación y el análisis de datos que funcionan bien entre sí y automaticen tareas repetitivas.
¿Cómo AKTEK iO Apoya las Investigaciones de Open Source?
Más específicamente, aprovechando varios años de experiencia al servicio de equipos de investigación en todo el mundo, la plataforma AKTEK iO puede ayudar a los investigadores de código abierto a superar estos desafíos de varias maneras:
- AKTEK iO puede ingerir y facilitar la recopilación de datos de varias fuentes, incluidas las plataformas de redes sociales, registros gubernamentales públicos, datos telefónicos anónimos, datos de eventos geopolíticos y peligros naturales, datos de tráfico web y más.
- AKTEK iO permite a los investigadores centralizar sus datos de múltiples fuentes en una arquitectura compartida y brinda capacidades de búsqueda avanzada para encontrar y recuperar rápidamente información relevante para sus fines de investigación.
- AKTEK iO ayuda a reducir el riesgo de errores que pueden ocurrir con la entrada manual de datos y garantiza que los datos sean consistentes y se mantengan actualizados en toda la plataforma, aprovechando una base de datos relacional donde todo está interconectado.
- AKTEK iO permite a los investigadores y analistas trabajar de forma colaborativa y segura en proyectos de investigación complejos y de múltiples fuentes en tiempo real. Su sistema de gestión de casos también ayuda a mantener a todos al día, y la información producida se sistematiza para lograr el máximo impacto en el resultado cuando se comunica a los consumidores.
- AKTEK iO cumple y supera sus expectativas de administración de seguridad y privacidad de datos al ofrecer, no solo cifrado en tránsito y en reposo, doble factor de autenticación y todo lo que espera, sino también micropermisos para el control de acceso basado en funciones, asegurando un control completo sobre quién puede ver o hacer qué con la información de su organización.
Desde el monitoreo de crímenes de guerra hasta el trabajo de investigación en flujos de dinero ilícito, nuestros clientes se benefician del sistema de gestión de datos de extremo a extremo de AKTEK iO para fines de investigación e inteligencia, lo que les permite concentrarse en lo que hacen mejor, sacando a la luz evidencia para retener a individuos, organizaciones y gobiernos responsables