Buenas Prácticas

Los académicos e investigadores pueden obtener múltiples beneficios al citar adecuadamente los datos de investigación que utilizan en sus publicaciones. Entre ellos se encuentran:

  • Aumentar la visibilidad de su investigación.
  • Realizar un seguimiento del impacto de los conjuntos de datos.
  • Facilitar la ubicación y reutilización de los datos por otros investigadores.
  • Vincular directamente las publicaciones con los conjuntos de datos correspondientes.
  • Fomentar la transparencia en la investigación científica.

Para lograr una citación precisa y completa de los conjuntos de datos, se recomienda seguir estas buenas prácticas:

  • Utilizar identificadores únicos y persistentes como el DOI, que facilitan la identificación y acceso a los datos.
  • Citar los conjuntos de datos de manera independiente.
  • Incluir la cita de los datos en la sección de referencias bibliográficas de una publicación.
  • Agregar los identificadores de autor, como ORCID, en la elaboración de la cita.

En el Repositorio de Datos de Investigación, fomentamos la disponibilidad de datos de investigación bajo licencias abiertas que permitan su reutilización gratuita, garantizando una distribución libre o con restricciones mínimas. Recomendamos el uso de licencias Creative Commons CC0 o CC0-BY 4.0 y sus derivados, que establecen cuatro condiciones:

  1. Reconocimiento (Attribution (BY)): El material puede ser distribuido, copiado y exhibido, siempre y cuando se cite adecuadamente la fuente y el autor sea reconocido en los créditos.
  2. No Comercial (NonCommercial (NC)): El uso de los contenidos no debe generar beneficios económicos para quien los utiliza.
  3. Sin derivar (NoDerivs (ND)): Los conjuntos de datos pueden ser distribuidos, copiados y exhibidos sin cambios, sin permitir la creación de trabajos derivados del original.
  4. Licenciar igual (ShareAlike (SA)): Todas las obras derivadas deben distribuirse siempre bajo la misma licencia del set de datos original.

De esta manera, se busca promover la libre circulación de los datos de investigación y garantizar su correcta atribución y uso, fomentando la transparencia y la colaboración entre investigadores y la comunidad en general.

Por otro lado, es posible que los académicos e investigadores indiquen el nivel de acceso o visibilidad de los archivos que se depositan en el conjunto de datos, lo que puede dar lugar a cuatro situaciones:

  • Acceso abierto: Los archivos están disponibles en su totalidad de forma gratuita y con acceso inmediato.
  • Acceso embargado: Los archivos se encuentran restringidos hasta una fecha determinada en la que se convierte en acceso abierto. Los embargos pueden ser establecidos por políticas de los editores, financiadores o por decisión del autor.
  • Acceso restringido: El conjunto de datos está disponible en su totalidad, pero el acceso a ciertos archivos se encuentra limitado a ciertas comunidades u otras restricciones.
  • Acceso solo a metadatos: En este caso, solo se permite el acceso a los metadatos descriptivos del conjunto de datos.

La gestión ética de los datos de investigación es esencial, especialmente en estudios que involucran participantes humanos. Las consideraciones éticas incluyen la naturaleza y el propósito de la investigación, el consentimiento obtenido, así como la protección y destrucción adecuadas de los datos sensibles. Es fundamental cumplir con estos requisitos éticos para garantizar la confidencialidad e integridad de la información y mantener la confianza del público en la investigación científica.

En términos generales, cualquier investigación que involucre a participantes humanos o animales vivos debe someterse a una revisión ética. Además, las investigaciones que involucran referencias a sujetos individuales también pueden requerir una revisión ética.

La privacidad de los participantes es un aspecto clave de la ética de la investigación. Los académicos e investigadores deben proteger la privacidad de los sujetos, incluyendo la forma en que se accede a la información sobre ellos.

El consentimiento informado es un aspecto esencial de la gestión ética de los datos de investigación. En la mayoría de los casos, se debe describir al sujeto de la investigación cómo se utilizarán sus datos, quién tendrá acceso a ellos y cómo se publicarán antes de obtener su consentimiento.

La confidencialidad es crucial para minimizar el riesgo de divulgar información confidencial durante el diseño de la investigación. Es recomendable considerar los siguientes factores:

  • Recopilar los datos necesarios sin utilizar información de identificación personal, si es posible.
  • Anular la identificación de los datos recopilados tan pronto como sea posible.
  • Evitar la transmisión electrónica de datos personales sin encriptarlos.

El Repositorio de Datos de Investigación de la Universidad de Chile promueve la colaboración entre académicos e investigadores mediante la compartición de datos en formatos y estándares reconocidos por su comunidad de investigación.

La elección de formatos debe estar determinada por las necesidades de investigación y la disciplina correspondiente. No obstante, es crucial asegurarse de que los datos sean compatibles y reutilizables. Por lo tanto, se recomienda como buena práctica utilizar formatos abiertos en lugar de formatos cerrados, y preferir aquellos que sean comúnmente utilizados en la comunidad de investigación como, por ejemplo, los datos tabulados deberán compartirse en formato CSV en lugar de archivos XLS (Excel).

Es importante destacar que los datos de investigación pueden ser compartidos en diferentes formatos y tipos de contenido, algunos de los cuales se enumeran a continuación:

Además, en el depósito de datos en el repositorio es posible comprimir los archivos en formatos como .zip o .tar.

En cuanto al nombre de los archivos y carpetas es una tarea crucial para mantener los datos de investigación organizados. Aquí se presentan algunas recomendaciones para nombrar archivos de datos:

  • Utilizar nombres cortos y descriptivos, con una longitud máxima de 25 caracteres, que reflejen el contenido del archivo.
  • Evitar utilizar caracteres especiales como &, *, %, $, £, ], {, ! o @, ya que pueden interferir con la funcionalidad del sistema operativo.
  • En lugar de espacios o puntos, utilizar guiones bajos para separar palabras en el nombre del archivo, ya que algunos sistemas operativos interpretan de forma diferente estos caracteres.
  • Incluir información descriptiva en el nombre del archivo para facilitar su identificación.
  • Usa consistentemente minúsculas o mayúsculas en el nombre de los archivos, ya que algunos softwares pueden considerar diferentes archivos con el mismo nombre si se utiliza una combinación inconsistente de mayúsculas y minúsculas.
  • Cuando sea posible, utiliza extensiones de archivo predeterminadas para reflejar el software utilizado para crear el archivo y el formato del archivo. Por ejemplo, utiliza ".por" para archivos portátiles de SPSS, ".xls" o ".xlsx" para archivos de Excel y ".txt" para archivos de texto.
  • Si es necesario, nombrar los archivos siguiendo un orden cronológico, utilizando el formato AAAA-MM-DD o AAAA-MM para mantener una secuencia temporal lógica.

Siguiendo estas recomendaciones, se puede crear una estructura de carpetas y nombres de archivos consistentes y organizados que faciliten la gestión y el uso de los datos de investigación.

Por último, se recomienda establecer un método para identificar y distinguir claramente las diferentes versiones de los archivos de datos, lo que facilita su gestión y evita confusiones. Para ello, se sugiere seguir estas recomendaciones:

  • Usar números ordinales (1, 2, 3, etc.) para cambios importantes de versión y decimales para cambios menores, por ejemplo: v1, v1.1, v2.6.
  • Evitar etiquetas confusas como "revisión", "final", "final2", o "copia_definitiva".
  • Registrar cada cambio por pequeño que sea.
  • Eliminar o ocultar versiones obsoletas para mantener la organización y evitar la confusión.
  • Utilizar una función de copia de seguridad automática (si está disponible) en lugar de guardar o archivar varias versiones.
  • Activar el control de versiones o seguimiento en documentos de colaboración o en utilidades de almacenamiento como Google Docs.

El Plan de Gestión de Datos (PGD) es un documento que describe cómo se tratarán los datos recolectados o generados durante un proyecto de investigación. El PGD incluye detalles sobre los datos que se obtendrán, la metodología y las normas que se utilizarán para organizarlos, cómo se compartirán o se pondrán en acceso abierto, y cómo se preservarán a largo plazo.

Aunque los componentes del PGD pueden variar según la disciplina o área de investigación, existen elementos básicos que se deben incluir en su elaboración.

Para la elaboración del PGD, existen diferentes modelos disponibles como DMP Online del Digital Curation Center y DMP Tool de la Universidad de California. Además, la Universidad de Chile proporciona a sus académicos e investigadores una plataforma en línea que les permite crear fácilmente sus planes de gestión de datos.

La plataforma PGD de la Universidad de Chile es una herramienta disponible para los académicos e investigadores de la Universidad, que facilita la elaboración de planes de gestión de datos. Estos planes incluyen aspectos clave y preguntas necesarias para una correcta gestión de los datos recopilados en un proyecto de investigación, tales como:

  • Recopilación de datos: ¿Qué datos se recopilarán y cómo se obtendrán?
  • Documentación y metadatos: ¿Qué metadatos se utilizarán para describir los datos? ¿Qué documentación se ofrecerá para facilitar el uso y comprensión de los datos?
  • Aspectos éticos: ¿Cómo se manejarán los derechos de propiedad intelectual? ¿Cómo se abordarán posibles conflictos éticos en los datos generados?
  • Almacenamiento: ¿Cómo se almacenarán y respaldarán los datos durante la investigación? ¿Cómo se accederá a los datos depositados?
  • Selección y conservación: ¿Cuál es el plan de conservación de los datos generados?
  • Compartir datos: ¿Cómo se compartirán los datos? ¿Se aplicarán restricciones a los conjuntos de datos?
  • Responsabilidades y recursos: ¿Quién será el responsable de la gestión de datos? ¿Qué recursos serán necesarios para desarrollar el plan?
Recursos de información