PERGUNTAS FREQUENTES
Navegue nas questões abaixo para esclarecer as suas dúvidas.
GESTÃO DE DADOS DE INVESTIGAÇÃO
Os princípios FAIR constituem um conjunto de quatro princípios orientadores, que abordam práticas relevantes na gestão e partilha de dados de investigação, contribuindo para a sua localização, acesso, interoperabilidade e reutilização.
Os princípios são úteis, uma vez que:
- Apoiam a descoberta do conhecimento e da inovação;
- Promovem a partilha e reutilização dos dados de investigação;
- Aumentam a visibilidade da investigação;
- São aplicáveis aos vários domínios científicos;
- Apoiam os dados e metadados a serem “machine readable”, apoiando novas descobertas através da recolha e análise de múltiplos conjuntos de dados.
Inclui a atribuição de um identificador persistente (como um DOI ou Handle), tendo metadados ricos para descrever os dados e certificando-se de que estes podem ser localizados através de portais de pesquisa disciplinar.
Poderá incluir tornar os dados abertos utilizando um protocolo de comunicação standard. No entanto, os dados não têm necessariamente de ser abertos. Existem por vezes boas razões pelas quais os dados não podem ser abertos, por exemplo, preocupações de privacidade, segurança nacional ou interesses comerciais. Se não forem abertos, deve haver clareza e transparência em torno das condições de acesso e reutilização.
Para serem interoperáveis, os dados terão de utilizar formatos, linguagem e vocabulários aceites pela comunidade. Os metadados terão também de utilizar normas e vocabulários aceites, e conter ligações a informação relacionada via utilização de identificadores.
Os dados e metadados deverão ter descrições detalhadas usando atributos múltiplos e relevantes. Devem ser também acompanhados de uma licença de utilização de dados clara e acessível, bem como de informação detalhada sobre a proveniência. Deverão ser cumpridas as normas relevantes no que respeita ao domínio científico específico.
O ciclo de vida dos dados de investigação abrange as múltiplas fases decorrentes de um projeto de investigação. Podem-se destacar sete fases importantes:
- Planeamento;
- Recolha;
- Processamento;
- Análise;
- Preservação;
- Disseminação;
- Reutilização.
PLANOS DE GESTÃO DE DADOS
O Plano de Gestão de Dados é considerado um elemento chave para uma adequada gestão de dados de investigação. Trata-se de um documento formal, que descreve todo o ciclo de vida da gestão dos dados, desde:
- Processo de criação e/ou recolha;
- Processamento;
- Armazenamento;
- Preservação;
- Partilha e reutilização.
Esta prática apoia também o cumprimento dos princípios FAIR (dados localizáveis, acessíveis, interoperáveis e reutilizáveis).
O modelo de PGD da FCT integra os seguintes tópicos relevantes na gestão de dados de investigação:
- Informação sobre os dados de investigação.
- Documentação e metadados.
- Armazenamento e segurança dos dados e metadados.
- Dados pessoais, direitos e propriedade intelectual.
- Partilha e preservação dos dados a longo prazo.
- Responsabilidades e recursos.
Criação e/ou reutilização de dados de investigação:
- No caso de virem a ser reutilizados dados, deverão ser identificados quais os dados e declarar quaisquer restrições à reutilização dos mesmos, caso existam.
- Se forem gerados novos dados, deverão ser descritas as metodologias ou software que serão utilizados.
Tipos de dados:
- Deverá ser descrito o tipo de dados, por exemplo, se são dados numéricos, dados textuais, dados de imagem, dados áudio e/ou suportes mistos.
Formato dos dados:
- Referir o formato dos dados, nomeadamente, a forma como os dados irão ser codificados para armazenamento, muitas vezes refletida pela extensão do nome do ficheiro (por exemplo, pdf, xls, doc, txt, rdf).
- Justificar a utilização de certos formatos.
- Detalhar a forma como os dados serão codificados para armazenamento.
Volume de dados;
- Estimar o volume de dados do projeto.
Documentação:
- Avaliar qual a documentação necessária para permitir a reutilização dos dados (por exemplo, informação sobre a metodologia utilizada para recolha de dados, informação analítica e processual, definições de variáveis, unidades de medida, etc).
- Descrever como a informação será capturada e onde será registada.
- Indicar como os dados serão organizados durante o projeto (por exemplo, convenções adotadas, controlo de versões e estrutura de pastas).
Metadados:
- Acompanhar os dados com informação descritiva, sob a forma de metadados, de modo a cumprir com os princípios FAIR.
- De modo a uniformizar os metadados disponibilizados, aconselha-se a utilização de standards de metadados.
Armazenamento:
- Dar preferência à utilização de um armazenamento robusto e gerido, com apoio de backup automático, tal como fornecido pelos serviços de apoio informático da sua instituição de origem.
Proteção e segurança de dados sensíveis:
- Descrever os principais riscos e a forma como estes serão geridos.
- Explicar como os dados serão recuperados no caso de um incidente.
- Explicar quem terá acesso aos dados durante a investigação e como é que será controlado esse acesso, nomeadamente em situações de colaboração e parcerias.
- Explicar quais são as políticas institucionais de proteção de dados em vigor.
Processamento e/ou armazenamento de dados pessoais durante o projeto:
- Se gerir dados pessoais deverá assegurar-se que é cumprida a legislação e regulamentos relacionados, designadamente o regulamento geral de proteção de dados (RGPD) e que são cumpridos os seguintes requisitos:
- Obter o consentimento informado para a preservação e/ou partilha dos dados pessoais;
- Ponderar a anonimização de dados pessoais para preservação e/ou partilha;
- Ponderar a pseudo-anonimização de dados pessoais;
- Ponderar a encriptação, caso opte pela pseudo-anonimização;
- Informar se existe um procedimento de acesso aos dados pessoais em vigor, para utilizadores autorizados.
Propriedade e direitos de propriedade intelectual sobre os dados:
- Explicar quem será o proprietário dos dados, ou seja, quem terá o direito de controlar o acesso aos mesmos.
- Garantir que estão asseguradas todas as questões relativas ao direito de controlo do acesso aos dados, nomeadamente em projetos com vários parceiros e múltiplos proprietários de dados.
- Indicar se os direitos de propriedade intelectual (por exemplo, base de dados e/ou direitos) são afetados. Em caso afirmativo, explicar quais e como serão tratados.
- Indicar se existe alguma restrição à reutilização de dados de terceiros.
Seleção de dados para preservação a longo prazo:
- Indicar que dados devem ser retidos ou destruídos por questões contratuais, legais ou regulamentares.
- Indicar como será tomada a decisão de quais os dados a preservar.
Disponibilização de dados para reutilização:
- Indicar que dados serão disponibilizados para reutilização.
- Ter em consideração que a seleção pode diferir dos dados que são preservados, quando os dados são tão grandes que é inviável depositar os dados num repositório na sua totalidade, ou se existirem razões que proíbam a disponibilização dos dados para reutilização.
- Se houver alguma restrição à reutilização dos dados, ou se for necessário restringir o acesso a certas partes dos dados, ou aplicar um acordo de partilha de dados, explicar como será feito e o porquê para essa restrição.
- Explicar que ações serão tomadas para ultrapassar ou minimizar as restrições.
- Indicar quando é que os dados serão disponibilizados.
- Explicar a razão e a duração de quaisquer períodos de embargo.
- Indicar se a partilha de dados será adiada ou restringida, por exemplo, para publicar, proteger a propriedade intelectual, ou procurar patentes.
Depósito de dados:
- Indicar onde os dados serão depositados e disponibilizados para reutilização.
- Indicar se será utilizado um identificador persistente.
- Referir sob que licença os dados poderão ser reutilizados.
- Indicar se o repositório é confiável.
Ferramentas e/ou softwares necessários para o acesso, uso e reutilização de dados:
- Indicar se os potenciais utilizadores necessitam de ferramentas e/ou softwares específicos (por eemplo, scripts, códigos ou algoritmos específicos desenvolvidos durante o projeto) para aceder, interpretar e reutilizar os dados.
Responsabilidades:
- Descrever as funções e responsabilidades das actividades relativas à gestão dos dados, tais como:
– recolha dos dados;
– produção de metadados;
– qualidade dos dados;
– armazenamento e cópia de segurança;
– arquivo dos dados;
– partilha dos dados.
Recursos:
- Avaliar os recursos essenciais para a gestão e partilha dos dados inerentes ao projeto de investigação.
Existem várias ferramentas disponíveis para a elaboração do seu PGD. Grande parte destas ferramentas facilitam o processo de escrita do seu PGD, dando orientações em relação aos pontos a incluir no plano. Existem também ferramentas que permitem trabalhar em colaboração.
De forma a apoiar a sua política de gestão e partilha de dados, a FCT disponibiliza um serviço de registo de PGDs, através da ferramenta Argos, da infraestrutura OpenAIRE. Poderá aceder a esta ferramenta aqui.
ARGOS – FERRAMENTA DE ELABORAÇÃO DE PGDs
O Argos é uma plataforma aberta e colaborativa desenvolvida pelo OpenAIRE (https://www.openaire.eu/), que procura facilitar atividades de gestão de dados de investigação relativas à implementação de PGDs. Esta plataforma utiliza os serviços e fontes de informação inferida do OpenAIRE para facilitar o processo de criação e publicação de PGDs.
O Argos é baseado na ferramenta open source OpenDMP (https://gitlab.eudat.eu/dmp/OpenAIRE-EUDAT-DMP-service-pilot/tree/master) e está disponível tanto através do catálogo de serviços OpenAIRE (http://catalogue.openaire.eu/), como da European Open Science Cloud (EOSC) (https://marketplace.eosc-portal.eu/services/argos?fromc=data-management).
O Argos é uma plataforma fácil de usar e navegar. Familiariza os utilizadores com o processo de criação de PGD e os conceitos básicos de GDI, de forma que estes possam aprender sem terem que sair do ambiente Argos. Os utilizadores podem convidar colaboradores e trabalhar de forma paralela na criação de um PGD. O Argos integra outros serviços do ecossistema para permitir a contextualização da informação, o que é particularmente útil em situações em que se torna necessário compreender como (e se) os dados podem ser reutilizados.
O Argos possui duas funcionalidades principais: PGDs e Datasets.
O Argos pode ser utilizado para:
- Visualização / Consulta de PGD disponíveis publicamente, e Datasets ou projetos correspondentes a PGDs. O Argos permite a publicação de PGD em dois modos: privado ou público. Para ver PGDs e Datasets públicos, não existe a necessidade de iniciar sessão na plataforma.
- Criação e publicação de um PGD. O Argos auxilia os investigadores no cumprimento das políticas associadas aos processos de candidatura a financiamento. É possível escolher o template Dataset que melhor se adequa ao contexto específico de cada utilizador, e proceder à sua criação. Uma vez criado, é possível associar um DOI ao seu PGD, publicá-lo e permitir a sua citação por terceiros.
- Formação na criação de PGD e Datasets. O Argos pode ser utilizado para efeitos de formação. O processo de planeamento de atividades de gestão de dados está intimamente ligado com o ciclo de vida dos dados, e consequentemente a ferramenta pode ser utilizada no contexto da formação em GDI. Exemplos de uso do Argos neste contexto, podem passar pela formação na criação de PGD, ou pela formação na execução de atividades GDI num contexto institucional.
Consulte o guia de utilizador do Argos aqui.
REPOSITÓRIO DE DADOS DE INVESTIGAÇÃO
Create a library of help resources so your site viewers can help themselves. Consider adding documentation that gets updated regularly so your visitors have the latest information.
Create a library of help resources so your site viewers can help themselves. Consider adding documentation that gets updated regularly so your visitors have the latest information.
No âmbito do plano de atividades de Dados de Investigação, a FCT, através da Unidade FCCN, irá disponibilizar um Serviço de Repositório de Dados de Investigação designado Polen.
Este repositório baseia-se no software Dataverse e pretende responder às seguintes necessidades da comunidade:
- Possibilitar o depósito, a preservação e a disseminação dos dados de investigação, resultantes de projetos financiados, quando a não exista um repositório institucional ou temático para o efeito.
- Enfoque na comunidade de ensino e de investigação nacional.
- Âmbito multidisciplinar.
- Suporte à “Política de gestão e partilha de dados resultantes de investigação financiada pela FCT”.
- Integração com o RCAAP.
- Cumprimento com o normativo PTCRIS.
- Integração com a European Open Science Cloud (EOSC).
- Cumprimento dos Princípios FAIR.