Guía de datos de investigación
Esta guía pretende ayudar a los investigadores de la Universidad de Cádiz en la correcta gestión de los datos de investigación, entendiéndose como una buena práctica de la investigación científica, y en la elaboración de un Plan de Gestión de Datos (PGD). Desde el comienzo del proyecto de investigación se debe definir el tratamiento que recibirán los datos que se utilicen durante la investigación.

Consta de diversos apartados sobre aspectos a tener en cuenta en la gestión de los datos de investigación. Se incluyen una serie de orientaciones y recomendaciones tanto generales como a nivel de la UCA. Además, se incluyen enlaces a recursos para ampliar información, herramientas, etc.
Datos de investigación y datos abiertos
Los datos de investigación o researchdata, según la OECD es todo aquel material que ha sido registrado durante la investigación, reconocido por la comunidad científica y que sirve para certificar los resultados de la investigación que se realiza. Estos datos deben provenir de una fuente única y deben ser difíciles o imposibles de obtener de nuevo (OECD Principles and Guidelines for Access to Research Data from Public Funding, 2007).

Estos pueden ser:
  • Numéricos, descriptivos o visuales.
  • Encontrarse en estado bruto o analizados, pueden ser experimentales u observacionales.

Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. 
 
No son considerados datos finales de investigación: Notas de laboratorio, Sets de datos parciales, Análisis preliminares, Borradores de trabajos, Planes para investigaciones futuras, Informes que han tenido  un proceso de revisión por pares, Comunicaciones con colegas, Objetos físicos, Ejemplares de laboratorio.

Los datos abiertos (open data) son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen. Este concepto está relacionado con el de Open Science (Ciencia abierta). 

Open research science es un concepto amplio que significa acceso abierto a la ciencia y que engloba el open access, que suele referirse al acceso abierto a las publicaciones y open research data que es el acceso abierto a los datos de investigación.
 
Contacto
Si tiene consultas sobre el contenido de esta guía utilice el CAU Repositorio institucional RODIN.

Email: rodin@uca.es
 
Responsable de la guía

Carmen Franco Barroso

Última actualización de la guía
Esta guía ha sido modificada por última vez en Diciembre de 2023.
Normativas a nivel europeo
La Comisión Europea lleva impulsando políticas y medidas relacionadas con el acceso abierto desde 2006, destacando el Mandato Open Access del Consejo Europeo de Investigación (European Research Council) y el Proyecto Piloto de Open Access (Comisión Europea, 7PM) en 2008. Para apoyar este proyecto se creó la red OpenAIRE (FECYT es la Oficina Nacional Española de OpenAIRE) y el proyecto DRIVER. El programa vigente actualmente es Horizonte Europa.
 
Horizonte Europa - Programa Marco Europeo para la Investigación y la Innovación (2021-2027)

Horizonte Europa es el nuevo programa marco de inversión en investigación e innovación para el período 2021-2027,que mantiene y refuerza el apoyo a la ciencia abierta que se había promovido en el programa anterior. 

La ciencia abierta incluye el acceso abierto, la investigación reproducible en abierto, la evaluación de la ciencia en abierto y los datos abiertos. Para ello, el Programa Horizonte Europa incide en dos acciones:
 
  • Acceso abierto obligatorio para las publicaciones: los beneficiarios se asegurarán la conservación de los derechos de la propiedad intelectual necesarios para cumplir los requisitos de acceso abierto.
  • Garantizar el acceso abierto a los datos de investigación: de conformidad con el principio “tan abierto como sea posible y tan cerrado como sea necesario”: plan obligatorio de gestión de datos para datos FAIR (fáciles de encontrar, accesibles, interoperables y reutilizables) y datos de investigación abiertos.
 

Horizonte 2020 – Programa Marco Europeo para la Investigación y la Innovación (2014-2020)

Aprobado por la Comisión Europea en Diciembre de 2013, Horizonte 2020 integra los anteriores programas de financiación, entre ellos el programa Marco de I+D (7PM). Establece el acceso abierto obligatorio a los artículos de investigación revisados por pares resultantes de los proyectos financiados por Horizon 2020 en los 6 meses posteriores a su publicación (12 meses en el caso de ciencias sociales y humanidades) (Directrices para el Acceso Abierto a las Publicaciones Científicas y Datos de Investigación). Y además lanza un programa piloto referido a los datos de investigación.

Proyecto Piloto de Datos abiertos de investigación

Establece el depósito en acceso abierto de los datos de investigación necesarios para validar los resultados presentados en las publicaciones científicas depositadas (conocidos como “underlying data”, datos subyacentes) (Directrices sobre Gestión de Datos en Horizon 2020).

A partir del 1 de enero de 2017 este plan piloto se extendió a todas las áreas del programa marco. Con ello se pretende mejorar y maximizar el acceso y la reutilización de los datos de la investigación generados por los proyectos. 
 
 
El Plan S

Es una iniciativa en favor de la publicación en acceso abierto lanzada en 2018 por Science Europe a través de “cOAlition S“, un consorcio creado por el Consejo Europeo de Investigación y las principales agencias nacionales de investigación y financiadores de doce países europeos. En 2019 es revisada y se lanza la versión final (bajo el lema "Making full and immediate Open Access a reality").

Consiste en un plan con 10 principios, una guía de implementación  y un único objetivo: acelerar la transición hacia el acceso abierto a las publicaciones. 

El objetivo principal del plan es conseguir que, a partir de 2021, todas las publicaciones científicas derivadas de proyectos con financiación pública se publiquen en acceso abierto de manera inmediata.
Ciencia abierta
Cómo cumplir con los mandatos de acceso abierto
Cómo cumplir con los mandatos de Horizonte 2020
Guías Horizonte 2020
Guías de ayuda para cumplir con los mandatos europeos:
 
Normativas a nivel nacional
Mandato nacional

El depósito de trabajos en acceso abierto está regulado a nivel nacional por la Ley 14/2011, de 1 de Junio, de la Ciencia, la Tecnología y la Innovación. Este mandato se recoge también en la Estrategia Española de Ciencia y Tecnología e Innovación y en el Plan Estatal de Investigación Científica y Técnica y de Innovación.
 
- Ley 17/2022, de 5 de septiembre, por la que se modifica la Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación

Con esta reforma, se avanza hacia unos resultados de la investigación, incluidas las publicaciones científicas, datos, códigos y metodologías, disponibles en acceso abierto de manera inmediata

El artículo 37 pasa a denominarse Ciencia abierta y especifica: "El personal de investigación del sector público o cuya actividad investigadora esté financiada mayoritariamente con fondos públicos y que opte por diseminar sus resultados de investigación en publicaciones científicas, deberá depositar una copia de la versión final aceptada para publicación y los datos asociados a las mismas en repositorios institucionales o temáticos de acceso abierto, de forma simultánea a la fecha de publicación."

 Ley 14/2011, de 1 de Junio, de la Ciencia, la Tecnología y la Innovación

Artículo 37Difusión en acceso abierto. Hace referencia al desarrollo de repositorios de acceso abierto a las publicaciones del personal de investigación cuya actividad investigadora esté financiada mayoritariamente con fondos públicos. 

Estrategia Española de Ciencia, Tecnología e Innovación 2021-2027 (EECTI)

EECTI 2021-2027 incluye el acceso abierto como uno de sus principios, y la ciencia abierta como una oportunidad para nuestro sistema nacional de I+D. Además, destaca el papel de los repositorios institucionales.  

Plan Estatal de Investigación Científica y Técnica y de Innovación (PEICTI)

El Plan Estatal es el principal instrumento de la Administración General del Estado para el desarrollo y consecución de los objetivos de la Estrategia Española de Ciencia y Tecnología y de Innovación (EECTI). La EECTI 2021-2027, en vigor, se estructura en dos planes estatales, el Plan Estatal 2021-2023 es el que se está ejecutando en este momento.
 
Estrategia Nacional de Ciencia Abierta
 
Estrategia Nacional de Ciencia Abierta (ENCA) (2023-2027)

Define ciencia abierta como el acceso abierto a los resultados de investigación (publicaciones, datos, protocolos, código, metodologías, software, etc.), la utilización de plataformas digitales basadas en código abierto y la apertura de todo el proceso científico (incluyendo prácticas como la revisión por pares en abierto, los recursos educativos en abierto, el fomento de la ciencia ciudadana y el desarrollo de nuevas formas de medir el rendimiento investigador).
 
Tesis doctorales
 
Por otra parte, el Real Decreto 99/2011, de 28 de enero, por el que se regulan las enseñanzas oficiales de doctorado, establece la obligatoriedad de depositar en acceso abierto las tesis doctorales aprobadas en el correspondiente repositorio institucional.
 
– Real Decreto 99/2011, de 28 de Enero de 2011, por el que se regulan las enseñanzas oficiales de doctorado

Artículo 14.5. Menciona expresamente que una vez aprobada la tesis doctoral, la Universidad se ocupará de su archivo en formato electrónico abierto en un repositorio institucional. 
 
Universidades españolas

Ley Orgánica 2/2023, de 22 de marzo, del Sistema Universitario (LOSU)

Artículo 12. Fomento de la Ciencia Abierta y Ciencia Ciudadana. Considera el conocimiento científico como un bien común y determina que las Administraciones Públicas y las universidades promoverán y contribuirán activamente a la Ciencia Abierta.

Compromisos de las Universidades ante la Open Science

La Asamblea General de Crue Universidades Españolas, aprobó en 2019 un documento que contiene diez acciones concretas para impulsar la Ciencia Abierta, en la misma línea que han seguido otras instituciones y asociaciones europeas afines.
Recomendaciones de FECYT
La FECYT, Fundación Española para la Ciencia y Tecnología, da soporte a la implementación de las políticas de acceso abierto en España.
 
Estrategia Nacional de Ciencia Abierta (ENCA)
Elaborada por el Ministerio de Ciencia e Innovación y el Ministerio de Universidades.
 
Compromisos de las universidades ante la Open Science
Universidad de Cádiz
Las Universidades están aprobando medidas a favor del acceso abierto, orientadas tanto a proyectos de investigación como a artículos procedentes de ayudas o subvenciones propias o bien a tesis doctorales. En el caso de la Universidad de Cádiz:

Reglamentos:

– Reglamento UCA/CG06/2012, de 27 de Junio de 2012, por el que se regula la ordenación de los estudios de doctorado en la Universidad de Cádiz

Artículo 33. La Universidad de Cádiz se ocupará del archivo de la tesis en formato electrónico abierto en su Repositorio Institucional.

– Reglamento Marco UCA/CG07/2012, de 13 de Julio de 2012, de Trabajos Fin de Grado y Fin de Máster de la Universidad de Cádiz

Artículo 7.3. Los trabajos evaluados positivamente con una calificación de 9 o superior merecerán la incorporación de la copia en formato digital al Repositorio Institucional, con acceso abierto.

Repositorio Institucional de la UCA

RODIN es el Repositorio Institucional de la Universidad de Cádiz desde 2010, donde el autor/a puede depositar sus documentos, cumpliendo con las normativas institucionales y aumentando la visibilidad y el impacto de los mismos.
 
Beneficios del acceso abierto
RODIN, Repositorio de la UCA
Gestión de datos de investigación
La Gestión de Datos de Investigación (RDM, Research Data Management) está presente en todas las fases de la investigación y engloba la recopilación, organización, documentación, almacenamiento y preservación de los datos utilizados o generados durante un proyecto de investigación. 

Una gestión de datos adecuada ayuda a los investigadores a llevar a cabo una mejor investigación y supone: 
  • Cumplir con los requerimientos de los organismos financiadores. 
  • Mayor transparencia para la validación de los resultados de la investigación. 
  • Mejorar la protección de datos y minimizar el riesgo de pérdida de los mismos. 
  • Asegurar que los datos sean localizables, accesibles, interoperables y reutilizables: datos FAIR (findable, accessible, interoperable and reusable). 
  • Ahorrar tiempo evitando duplicaciones y haciendo un uso eficiente de los recursos disponibles. 
  • Mejorar el perfil del investigador, el impacto y la visibilidad de los proyectos 
 
Fases en la gestión de datos

Planificar la investigación
  • Políticas y mandatos
  • Plan de Gestión de Datos
  • Recopilar o generar datos

Organizar y almacenar
  • Procesar y analizar los datos
  • Preservar los datos
  • Principios FAIR

Difundir y compartir
  • Depositar los datos
  • Asignar licencias
  • Citar los datos
El ciclo de los datos
Recomendaciones para la gestión de datos de investigación
Gestionar datos de investigación: buenas prácticas

Infoguía sobre buenas prácticas en la gestión de los datos de investigación, elaborada por el Servei de Biblioteques, Publicacións i Arxius de la  Universitat Politècnica de Catalunya y traducida en la Sección de Información y Referencia del Servicio de Biblioteca de la Universidade da Coruña.
Planificar la investigación

Una buena planificación es la mejor forma de asegurar la calidad de los datos, multiplicando su valor tanto durante el proyecto de investigación como una vez finalizado. Para ello, se requiere elaborar un Plan de Gestión de Datos (Data Management Plan: DMP) por cada proyecto. Las agencias que financian la investigación pública y privada obligan a disponer en acceso abierto no sólo las publicaciones científicas derivadas de  una investigación, si no también, a difundir y gestionar apropiadamente los datos que subyacen en dichas publicaciones.

El Plan de Gestión de Datos 

El Plan de Gestión de Datos no es un documento definitivo, sino que irá evolucionando y adquiriendo más precisión y contenido a lo largo del proyecto. La primera versión del Plan de Gestión de Datos deberá entregarse durante los primeros 6 meses de marcha del proyecto. En posteriores etapas del proyecto se podrán entregar versiones más elaboradas y completas. El PGD debería actualizarse al menos una vez hacia la mitad del transcurso del proyecto y otra al final, para hacer los ajustes necesarios, ya que no todos los datos o los usos potenciales que se pueda hacer de ellos están claros desde el principio. Se debe crear nuevas versiones del Plan de Gestión de Datos siempre que haya cambios importantes en el proyecto debidos a la inclusión de nuevos conjuntos de datos.
Requerimientos de agencias de financiación
En el Programa Horizonte 2020 (2014 - 2020) se reforzó el mandato de depósito en acceso abierto y se extendió a los datos de investigación, estableciendo un Proyecto Piloto de Datos abiertos de investigación.

En el actual Programa Horizonte Europa (2021-2027), es obligatorio elaborar el plan de gestión de datos para todos los proyectos que generen o reutilicen datos, dentro de los 6 primeros meses del proyecto, con el fin de:
  • Garantizar el acceso abierto a los datos de investigación, según el principio “tan abierto como sea posible, tan cerrado como sea necesario”, depositando los datos en un repositorio de confianza, bajo una licencia Creative Commons (CC BY), de dominio público (CC0) o equivalente.
  • Realizar de manera obligatoria un Plan de gestión de datos para datos FAIR (fáciles de encontrar, accesibles, interoperables y reutilizables) y datos de investigación abiertos.
Si no se proporciona acceso abierto (a algunos o a todos los datos), deberá justificarse en el plan de gestión de datos (Horizon Europe Model Grant Agreement).
El Plan de Gestión de Datos
Un Plan de Gestión de Datos (PGD) es un documento que describe el tratamiento que van a recibir los datos de investigación recopilados o generados en el curso de un proyecto de investigación, en el que se describe qué datos se van a recoger o generar, qué metodología y normas se van a emplear, cómo se van a compartir y/o poner en abierto, y cómo se van a conservar y preservar.

Guías para elaborar un Plan de Gestión de Datos
Plantillas 
Herramientas para el Plan de Gestión de Datos Herramienta desarrollada por el Digital Curation Centre (DCC), del Reino Unido. Herramienta gratuita del Consorcio MADROÑO, adaptación y traducción al español de la herramienta de gestión DMPonline, así como de las directrices para la Gestión de Datos en Horizonte 2020. Herramienta online desarrollada por OpenAIRE para la creación, gestión, difusión y enlace de un PGD. Servicio incluido en el European Open Science Cloud (EOSC), iniciativa promovida por la Comisión Europea. Ficha Guía sobre Argos.


Recomendaciones para investigadores
Maredata, Red Española sobre Datos de Investigación en Abierto, ha elaborado en 2018 unas Recomendaciones para la gestión de datos de investigación.

Políticas de agencias financiadoras
En el directorio Sherpa Juliet se pueden consultar las políticas y requerimientos de las agencias financiadoras de proyectos.
 
Diseñar un Plan de Gestión de Datos
Un Plan de Gestión de datos debe contemplar los siguientes aspectos:
 
Información del Proyecto

Se incluye: Nombre e identificación del proyecto, Descripción del Proyecto, Institución, Agencia de financiación, Investigador Principal e identificador (ID), Datos de contacto, Plan de Gestión de Datos: versiones.
 
1. Resumen de datos

Se deben describir de forma general los datos que se utilizarán en el proyecto, incluyendo el tipo y el formato, la finalidad, el tamaño y el origen de los datos, así como la utilidad de los datos.
 
2. Datos FAIR

2.1. Hacer que los datos se puedan encontrar, incluidas las disposiciones para metadatos
Se incluyen los identificadores, palabras clave, normas de metadatos que los describen para optimizar su localización.

2.2. Hacer que los datos sean accesibles (Repositorio, Datos y Metadatos)
Se indica el repositorio dónde se depositarán los datos, si les asigna un identificador, y se justifica si hay datos cerrados, por cuánto tiempo se aplica un embargo y si hay restricciones de uso, así como si los metadatos estarán en acceso abierto.

 2.3. Hacer que los datos sean interoperables
Se exponen los vocabularios de datos, las normas, formatos o metodologías que se utilizarán para permitir el intercambio y la interoperabilidad de los datos.

2.4. Aumentar la reutilización de datos
Se documenta la procedencia de los datos y se proporciona la información necesaria para validar los datos y facilitar su reutilización, por ejemplo con los archivos readme. Se indican las licencias de uso de los datos.
 
3. Otros resultados de la investigación

Se consideran qué cuestiones relativas a los datos FAIR pueden aplicarse a la gestión de otros productos de la investigación generados o reutilizados en el proyecto como por ejemplo: softwares, flujos de trabajo, protocolos, nuevos materiales, muestras, etc. y cómo se gestionarán y compartirán, o se pondrán a disposición para su reutilización, de conformidad con los principios FAIR.
 
4. Asignación de recursos

Se indican cuáles serán los costes para hacer que los datos sean FAIR (por ejemplo, costes directos e indirectos relacionados con el almacenamiento, el archivo, la reutilización, la seguridad, etc.) y quién será responsable de la gestión de los datos.
 
5. Seguridad de los datos

Se garantiza que los datos se almacenan de forma segura en repositorios de confianza para su preservación y conservación a largo plazo.
 
6. Ética

Se presentan todas las cuestiones éticas o legales que puedan tener un impacto en el intercambio de datos. Además, cuando la investigación utilice datos personales, deberá hacerse referencia a aspectos como el consentimiento informado y la conservación a largo plazo.
 
7. Otras cuestiones

Se describe si se van a utilizar otros procedimientos nacionales, financiadores, sectoriales o departamentales para la gestión de datos.
 
Resumen basado en la plantilla Horizon Europe Data Management Plan Template.
Recopilar datos
Para recopilar datos sobre un determinado campo científico existen herramientas para consultar o reutilizar los datos ya almacenados por otros investigadores/as, como son los directorios de repositorios de datos de investigación y repositorios de datos:

Re3data.org. Registro internacional de repositorios de datos de investigación, es una importante fuente de información sobre más de 2450 depósitos de datos de investigación, por materias, tipología o países.

Zenodo. Repositorio europeo que ofrece acceso a los resultados de investigación en Europa a partir de la iniciativa OpenAIRE.

Figshare. Repositorio de datos de investigación donde preservar y compartir todos los datos y resultados que genera un proceso de investigación.

Dimensions. Plataforma que indexa datasets facilitando el acceso a datos depositados en repositorios y bases de datos.

DataCiteSearch. Buscador de datasets abiertos con DOI.

European Union Open Data Portal.  Portal de datos abiertos de la Unión Europea

Datos.gob.es. Portal de datos abiertos del Gobierno de España

Data Gov. Portal de datos abiertos del Gobierno de Estados Unidos
El Plan de Gestión de Datos
Guía y plantilla UCA para un PGD
Guía y plantilla basadas en la Horizon Europe Data Management Plan Template. Puede utilizarse con herramientas como DMPonline, PGDonline, Argos, etc. ya que da respuesta a las cuestiones que se plantean en un Plan de Gestión de Datos.
 

 
Acceso a herramientas para PGD
 
 

AVISO: El 31 de Marzo de 2023 PGD Online ha migrado al software de Argos.
Protección de datos
Normativas a tener en cuenta para el tratamiento de datos de carácter personal: 

Normativa de aplicación

Guía de buenas prácticas en materia de Transparencia y Protección de Datos (CRUE)

Delegado de Protección de Datos de la UCA (Contacto: dpd@uca.es)
 
Ver apartado  Anonimización
Organizar y almacenar
Para organizar y documentar los datos es necesario tener en cuenta los aspectos siguientes:

Elegir el formato adecuado
En la etapa de planificación de la investigación es importante considerar en qué formato se guardarán sus archivos. Una vez que se han seleccionado los datos, para conservarlos y garantizar un acceso abierto y usabilidad de éstos, lo conveniente es convertir los datos a formatos estándar que la mayoría de los programas sean capaces de interpretar. 

Nombres de ficheros y estructura de archivo 
Una estructura de ficheros bien organizada y coherente, archivos con nombres definidos, claros y significativos ayudan a encontrar la información de forma rápida y precisa. Es muy importante pensar bien la jerarquía, la estructura, nombres y versiones de los archivos, sobre todo cuando se trabaja en equipo. 

Almacenar los datos de forma segura
Es importante elegir la forma adecuada de almacenar los datos de investigación con los que se está trabajando en el proyecto.

Describir los datos de investigación
La descripción de los datos debe incluir información necesaria para conocer quién creó los datos o la fuente de los datos en el caso de haber sido recolectados, la tipología y formato de los datos, datos relacionados, quién los puede utilizar, cuándo pueden utilizarse. Esta documentación debe estar accesible junto con sus datos para cuando se requiera interpretarlos. Esta descripción detallada, "metadatos", es fundamental para una correcta interpretación de los datos.
 
Procesar y analizar los datos
El formato y el software en el que se crean y digitalizan los datos de investigación generalmente dependen del tipo de análisis que vaya a hacer el investigador, el hardware utilizado, la disponibilidad de software, o incluso de las costumbres de una disciplina específica.

Aunque los investigadores usen el formato de datos y el software más adecuado a su análisis, una vez finalizado, deberían considerar convertirlos a formatos estándares más intercambiables y duraderos para su almacenamiento. 

Para garantizar el acceso y la preservación a largo plazo, hay que tener en cuenta las siguientes consideraciones [FECYT, 2012]:
  • Deben utilizarse, en la medida de lo posible, formatos abiertos, no propietarios.
  • El formato utilizado ha de permitir la indización del contenido para su potencial recuperación.
  • Un formato de compresión de datos utiliza menos espacio de almacenamiento.
  • El formato elegido deberá ser estándar (IANA mime types), o estándar de facto para la comunidad investigadora.

A continuación, se muestran una serie de formatos de ficheros recomendados en función del tipo de datos que contiene:
  • Bases de datos: XML, CSV
  • Texto: TXT, ODT, RTF, XML
  • Estadísticas: ASCII, DTA, POR, SAS, SAV
  • Datos tabulados: CSV, TSV
  • Geospaciales: SHP, DBF, GeoTIFF, NetCDF
  • Vídeo: OGG, MP4
  • Sonido: FLAC, WAV, AIFF, MP3
  • Imágenes: TIFF, BMP
  • Ficheros comprimidos: no se recomienda el uso de ficheros comprimidos

Para más información sobre formatos recomendados en ficheros que contienen datos de investigación se puede consultar el UK Data Service
 
REBIUN recomienda OpenRefine como herramienta para depurar los datos.
Preservar los datos
Es esencial elegir la forma más adecuada de almacenar los datos de investigación "activos", es decir, los que se están utilizando en el proyecto de investigación. Para ello habrá que tener en cuenta:
 
  • Facilidad de acceso para los miembros autorizados, al tiempo que se restringe a los no autorizados
  • Sistema de copias de seguridad  compatible con el sistema de almacenaje
  • La seguridad de los datos, sobre todo si se está trabajando con datos personales y/o confidenciales
  • Problemas de seguridad relacionados con el envío de datos a través de correo electrónico y la compartición de copias
  • Las especificaciones, si existen, de la agencia financiadora.

Los datos se pueden almacenar en:
  • PC/Ordenador portátil
  • Almacenamiento óptico (CDs, DVDs)
  • Unidades externas (USB, discos duros)
  • Servicios de almacenamiento institucional
  • Servicios en la nube (OneDrive, Google drive...)

Servicios de almacenamiento en la Universidad de Cádiz

Se recomienda utilizar los servicios de almacenamiento institucionales. En Almacenamiento en la nube UCA  se encuentra la información sobre los sistemas de almacenamiento existentes en la UCA:
 
  • UCA Drive (software de código abierto Nextcloud, 500 GB/usuario) 
  • Google Drive (500 GB/usuario)
  • Microsoft OneDrive (1 TB/usuario) 
Principios FAIR
Los datos de investigación deben cumplir con los principios FAIR (Findable, Accessible, Interoperable, Reusable), por lo que resulta imprescindible adjuntar a los datos de investigación, los metadatos que los describen de una forma completa y normalizada.

En 2016 se introdujeron los Principios de Datos FAIR para ayudar a proporcionar un conjunto de principios rectores que todas las partes interesadas que participan en el ecosistema de la investigación deben tener en cuenta para garantizar que los resultados de la investigación sean localizables, accesibles, interoperables y, en última instancia, reutilizables.

Para que un dataset cumpla con los Principios FAIR es importante plantearse las siguientes cuestiones:
 
  • ¿Tiene el dataset un identificador persistente (handle, DOI)?
  • ¿Hay documentación/metadatos que permitan entender los datos adecuadamente?
  • ¿Los metadatos están accesibles?
  • ¿Se ha aplicado al dataset una licencia de uso? ¿Es una licencia estándar? ¿Impone algún tipo de restricciones? ¿Permite explícitamente la reutilización?
  • ¿Los ficheros del dataset se encuentran en formatos abiertos o en formatos propietarios ampliamente soportados?
  • ¿Está el dataset/metadatos codificados según algún estándar global?
  • ¿Está el dataset enlazado a otros datasets u otros resultados de investigación? ¿Cómo?
Organizar los archivos

Infografía elaborada por el Grup de treball de Suport a la Recerca del CSUC y traducida por la Sección de Apoyo a la Investigación de la Universidad de Sevilla.
Anonimización
Cuando se trabaja con datos personales es obligatorio garantizar la privacidad y el anonimato de las personas implicadas. Para ello es necesario anonimizar los datos.

La anonimización de datos es el proceso que permite eliminar las posibilidades de identificación de las personas. 

Para anonimizar datos, OpenAire recomienda utilizar la herramienta Amnesia.
 
Almacenamiento en la nube UCA

UCA Drive
Basado en el software de código abierto Nextcloud.

Podemos acceder a nuestros datos de tres maneras diferentes no excluyentes:

1. Mediante una aplicación web en https://ucadrive.uca.es

2. Con cliente de sincronización, instalándonos en el PC o portátil un programa, el cliente de sincronización Nextcloud y configurando una carpeta local para que se sincronice con nuestra nube.

3. Con cliente móvil. Sin sincronización, mediante un acceso remoto con la aplicación para dispositivos móviles Android o iOS. 
 
Ayuda para mIgración desde el sistema antiguo UCA Drive (Owncloud, 5 GB/usuario).
Difundir y compartir
Para difundir y compartir los datos se pueden utilizar las siguientes opciones:

Repositorios. Muchas agencias de financiación, instituciones y revistas académicas tienen mandatos y políticas sobre la publicación en acceso abierto de los datos de investigación. El cumplimiento de estos mandatos y políticas se suele realizar a través del depósito de los datos de investigación en un repositorio de datos.

Data Journals. Además de la difusión en Acceso Abierto de los datos de investigación a través de los repositorios, también es posible publicar estos datos en data journals. Estas revistas publican data papers, que son artículos centrados en los datos en sí mismos (descripción, metodología, motivación, etc.) y no en las hipótesis, análisis y conclusiones extraídas a partir de estos datos.

Licencias. Tal y como se recoge en las Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, es conveniente añadir licencias de uso a los sets de datos que se generen.

Citar los datos. Es importante citar los datos de investigación ya que los conjuntos de datos también son resultados de investigación como artículos, monografías, etc.. Citar facilita la identificación y el acceso a los datos y de esta forma su localización, validación y reutilización; permite reconocer la autoría de sus creadores; facilita la métrica e impacto de los datos y favorece la transparencia de la investigación científica. 
Depositar los datos
Las agencias y organismos financiadores requieren depositar los datos en acceso abierto a través de repositorios de datos temáticos o repositorios institucionales.

RODIN, Repositorio Institucional de la UCA da acceso libre a la producción científica y académica generada por la Universidad de Cádiz y permite el depósito de datos de investigación. 

Es posible depositar datos de investigación en RODIN por medio de archivo delegado, enviando los datos necesarios a rodin@uca.es o a través del CAU del Repositorio.

Se enviará la siguiente documentación:  El fichero Readme contiene información complementaria para interpretar y reutilizar los datos.

RODIN asigna un identificador DOI a los conjuntos de datos, lo que facilita la verificación de los datos, su citación, diseminación, reutilización, impacto y acceso a largo plazo.
 
También se pueden depositar los datos en repositorios temáticos (consultando directorios como Re3data o Data Repositories), repositorios multidisciplinares (como Zenodo o Figshare), o bien junto a publicaciones científicas.
El Repositorio Institucional de la UCA
RODIN es el Repositorio de Objetos de Docencia e Investigación de la Universidad de Cádiz cuya finalidad es recopilar, preservar y difundir la documentación producto de la actividad científica, docente e institucional de la Universidad.
   
Asignar licencias
El documento Guidelines on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020 aconseja que, "en la medida de lo posible, los proyectos deben tomar medidas para permitir que terceros accedan, exploten, reproduzcan y difundan (de forma gratuita para cualquier usuario) los datos de investigación". Para ello se recomienda la utilización de licencias ampliamente reconocidas para definir las condiciones de uso que se deberán cumplir cuando se quieran reutilizar los datos.

Para indicar los usos permitidos se pueden utilizar licencias Creative Commons 4.0. Para los datos de investigación abiertos se recomiendan las licencias CC0 y CC-BY. También se puede utilizar licencias específicas para datos como las Open Data Commons.

Es importante tener en cuenta que, dependiendo del proyecto de investigación y del acuerdo con la agencia financiadora del proyecto, podría ser necesario aplicar un periodo de embargo en el cual los datos no puedan ser accesibles durante el tiempo requerido. O por el contrario, que la agencia indique explícitamente los plazos obligatorios para su difusión pública y bajo qué términos. En Sherpa Juliet se pueden consultar las políticas de las agencias financiadoras.

También atendiendo a la idea general "Tan abierto como sea posible, tan cerrado como sea necesario" contenida en las Guidelines on FAIR Data Management in Horizon 2020, existen situaciones que justifican que no se difundan en abierto los datos de investigación tales como: existencia de cláusulas de confidencialidad, posibilidad de explotación comercial o industrial, etc.
Citar los datos
Los datos deben citarse correctamente, siguiendo un formato de citas específico y deben aparecer con el resto de referencias bibliográficas de la publicación resultante. 

DOI Citation Formatter  es un servicio ofrecido por DataCite que construye automáticamente las citas conforme al estilo que seleccionemos a partir del DOI asignado a los datos.

Citar los datos de investigación permite:
  • Identificarlos fácilmente y atribuirlos correctamente a su creador
  • Reutilizar los datos fácilmente y, además, verificarlos
  • Hacer un seguimiento del impacto que puedan tener los datos
  • Crear una estructura académica que reconozca y recompense a los productores de datos

Para realizar una correcta citación de los datos de investigación se recomienda:
  • Incluir una serie de datos mínimos: Autor, Fecha, Título, Tipo de recurso e Identificador único persistente
  • Identificar unívocamente de los datos de investigación mediante un identificador único persistente (DOI)
  • Citar cada conjunto de datos de forma independiente
Cita tus datos de investigación
Políticas SEA-EU sobre gestión de datos de investigación

El Proyecto H2020 reSEArch-EU es una iniciativa de la Universidad Europea de los Mares (SEA-EU). La Universidad de Cádiz coordina el proyecto junto a las universidades socias del consorcio europeo SEA-EU, las universidades de Bretaña Occidental (Francia), de Kiel (Alemania), de Gdansk (Polonia), de Split (Croacia) y de Malta.

Entre otras acciones, desarrolla la elaboración de un plan conjunto de investigación, la generación de plataformas de ciencia abierta y bases de datos conjuntas, la promoción de políticas de co-creación con los principales actores socio-económicos del territorio y de explotación científica de los resultados de la investigación, así como diversas actividades para acercar la ciencia, la tecnología y la innovación a personas de todas las edades y de todos los ámbitos.

El proyecto reSEArch-EU tiene como objetivos:
 
  • Implementar políticas de gestión de datos de investigación en las universidades socias de SEA-EU.
  • Proporcionar principios y directrices comunes a los responsables políticos de la gestión de la investigación en las universidades socias de SEA-EU.  
  • Facilitar el proceso de gestión, conservación y difusión de los datos de investigación.
  • Facilitar la difusión, visibilidad e impacto de los datos de investigación generados por la Alianza SEA-EU.
 
Políticas SEA-EU para la promoción de la ciencia abierta en el consorcio, elaborado por la Universidad de Malta, y consensuado por el resto de socios de la Alianza.
 
Guía SEA-EU de Datos de investigación
La Alianza SEA-UE reconoce los datos de investigación como un activo valioso, fundamental para la investigación académica y su contribución a la sociedad. A tal efecto, la aplicación de los principios y prácticas de gestión de datos de investigación en las universidades socias de SEA-UE es fundamental para garantizar que los datos de investigación se organicen de forma armonizada a lo largo de todo el ciclo de vida de la investigación. También apoya la protección, el archivo y la puesta en común de los datos, según y donde proceda. 

El propósito de este RDM Toolkit es servir de guía con información relevante sobre cómo gestionar, preservar y difundir eficazmente los datos de investigación con el fin de maximizar el potencial de la investigación. Además, dota a los investigadores de los recursos necesarios para desarrollar Planes de Gestión de Datos (PGD) en línea con los principios de datos FAIR.
 
El movimiento Acceso Abierto
El Open Access o acceso abierto es un movimiento que tiene como objetivo facilitar el acceso a la información científica a través de Internet para su utilización por la comunidad científica. El autor de los trabajos publicados en acceso abierto mantiene el control sobre la integridad de sus publicaciones que deben ser citadas y reconocidas como propias.

Entre los beneficios de publicar en abierto están:
  • Aumento del impacto de la producción científica de los investigadores gracias a una mayor visibilidad de las publicaciones.
  • La visibilidad trae consigo un aumento en el número de citas.
  • Repercusión del impacto en la Universidad que, como institución,  también se beneficia de mejor posicionamiento de sus autores.
  • Acceso a un mayor número de trabajos sin costes de suscripción.
  • Garantia de preservación electrónica de los resultados de investigación a largo plazo.
El Repositorio Institucional de la UCA


RODIN es el Repositorio de Objetos de Docencia e Investigación de la Universidad de Cádiz cuya finalidad es recopilar, preservar y difundir la documentación producto de la actividad científica, docente e institucional de la Universidad.
      
Más información