Sarek er et analyseværktøj til svenske forskere i genetik

9 august, 2021 af
Sarek er et analyseværktøj til svenske forskere i genetik
OS2 – Offentligt digitaliseringsfællesskab, Rasmus Frey

National Genomics Infrastructure (NGI) i Sverige har udviklet et værktøj til at analysere genetiske data og sekvenser. SciLifeLab, som NGI er en del af, har en open source politik, hvor de ønsker at bidrage til eksisterende projekter og udvikle deres egne til genbrug.

 

NGI Stockholm er en forskningsinstitution inden for genetisk forskning. Den er del af SciLifeLab (Science for Life Laboratory, Sweden), der har en stringent open source politik. En af deres projekter er Sarek, et analyseworkflow værktøj, som kan finde genvariationer i alle arter. De identificerede gener bliver udgivet som åbne data.

 

Genteknologi

NGI Stockholm blev etableret i 2013, som del af den national resource SciLifeLab i det adademiske områder som biomedicine, økologi og evolution. NGI arbejder med teknologier for parallel sekvensering og gentyper og institutionen understøtter forskere i Sverige i forhold til bioinformatik.

Genomics is the study of all of a person's genes (the genome), including interactions of those genes with each other and with the person's environment.

- National Human Genome Research Institute, Bethesda, Maryland, US

 

Ifølge SciLifeLabs open source politik kører serverne på open source og software skal udgives under en licens, der giver gennemsigtighed og samarbejde i de akademisk kredse. Sarak projektet var tidligere kendt som ‘Cancer Analysis Workflow’ (CAW).

 

Sarek processen

Sarek projektet bygger på NextFlow, der muliggør videnskabelige workflows igennem software containers. Sarak angiver varianter på hele gensamlinger eller anden samling af data; bl.a. i sperm og befrugtet æg i somatiske celler. Workflowet består i at lave de første processer baseret på 'Genome Analysis Toolkit' (GATK) best practices og det derefter identificerer det ændringer og samler informationen i en MultiQC rapport. MultiQC er et visualiseringsværktøj (se detalierne).

Forskningsresulaterne lavet af Sarek skal behandles som åbne data.

In the era of FAIR (Findable, Accessible, Interoperable and Reusable) and Open science, datasets should be made available to the public, for example by submitting your data to a public repository.

- Nf-core, Data Management

 

 

 

Tag med videre

  • Sarek er lavet ud fra og brugt under SciLifeLabs open source politik. Formålet er at bidrage til og skabe åbenhed og samarbejde i det akademiske miljø.
  • Tidligere kendt som Cancer Analysis Workflow, finder Sarek varianter i gener på tværs i alle arter.

 

Læs flere artikler som denne på OSOR

Vores blogs