Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf ·...

Preview:

Citation preview

Introdução à

Bioinformática

Danillo Oliveira de Alvarenga

Departamento de TecnologiaUniversidade Estadual Paulista

Jaboticabal-SP

● Área interdisciplinar

– Biologia Molecular

– Bioquímica

– Tecnologia da Informação

– Ciência da Computação

● Desenvolvimento

– escrita de algoritmos

– implementação de métodos

● Análise

– utilização de programas para análise

– interpretação de informação

Bioinformática

● Outros nomes

– biologia computacional

– computação biológica

● Controvérsia

– várias definições

– várias discussões

● Diferenças sutis

– análise

– desenvolvimento

Bioinformática

No nascimento da biologia molecular, reconheceu-se que um tema de pesquisa central deveria ser como os organismos vivos reúnem, processam, armazenam e

utilizam informação. No início dos anos 1970, definimos bioinformática como o estudo dos processos informáticos em sistemas bióticos em múltiplos níveis.

Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou a significar, a partir dos anos 1980, o desenvolvimento e o

uso de métodos computacionais para gerenciamento e análise de dados de sequências, determinação de estrutura proteica, predição funcional

baseada em homologia e filogenia.

Paulien Hogeweg

The Roots of Bioinformatics in Theoretical BiologyPLOS Comp Biol 7: e1002021, 2011

Bioinformática

● Mágica

– solução para alguns problemas

– dados ruins resultados ruins→– tão ampla quanto a própria biologia

● Totalmente inacessível

– prática

– diferentes níveis

● Uma disciplina completamente distinta

– necessária em praticamente todas as áreas

– biologia do século XXI

Bioinformática Não É

Margaret Oakley Dayhoff(1925-1983)

Atlas of Protein Sequence and Structure (1985)

Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences (1966)

Histórico

Histórico

Histórico

Histórico

● Avanços tecnológicos e científico

– computação

– biologia molecular

– sequenciamento

● Volume de dados

– larga escala

– alta velocidade

– grande complexidade

● Bioinformática

– ferramenta mais viável

Relevância

Sequências Disponíveis

GenBank

● Dezembro 1982– 680.338 bases– 606 sequências

● Junho 2017– 234.997.362.623 bases– 201.663.568 sequências

WGS

● Abril 2002– 692.266.338 bases– 172.768 sequências

● Junho 2017– 2.164.683.993.369 bases– 487.891.767 sequências

Genomas Disponíveis

Distribuição de Genomas por Domínio

Ômicas

DNA

RNA

proteínas

metabólitos

diversos

← Genômica, Metagenômica

← Transcritômica, Metatranscritômica

← Proteômica, Metaproteômica

← Metabolômica, Metametabolômica

● Estudo do DNA total em uma célula ou cápsula

● Etapas

– extração de DNA do organismo desejado

– fragmentação do DNA extraído

– sequenciamento do genoma-alvo

– reconstituição a partir dos fragmentos sequenciados

– predição de genes e anotação

Genômica

Genômica

● Estudo do RNA mensageiro total em uma célula

● Etapas

– caracterização do genoma-alvo

– extração de RNA do organismo desejado

– eliminação de RNA ribossômico e transportador

– transcrição reversa e sequenciamento

– mapeamento dos transcritos contra referência

– avaliação de diferenças em relação às condições

Transcritômica

Transcritômica

● Estudo de moléculas em amostras mistas

– metagenômica

– metatranscritômica

– metaproteômica

– metametabolômica

● Etapas

– extração das moléculas da amostra

– tratamento das moléculas extraídas

– sequenciamento e reconstituição

– identificação e separação de sequências

– predição e anotação de táxons e funções

Meta*ômicas

● Genômica

– um organismo

– linhagem cultivada

– ambiente estranho

● Metagenômica

– vários organismos

– não cultivados ou em cocultivo

– genômica de comunidades

Metagenômica

Metagenômica

● Recursos computacionais

– capacidade de processamento

– espaço para armazenamento

● Fonte de dados

– organismos

– alvos

● Recursos humanos

– analistas

– programadores

Estrutura

● Composição biológica

– sequências

● Informação biológica

– anotação

– comparação

– predição

● Bancos

– públicos

– privados

Dados

● Biomoléculas

– ácidos nucleicos

– proteínas

● Conjuntos de caracteres alfabéticos

– 5 + 12 bases

– 20 + 13 aminoácidos

Sequências Biológicas

Nucleotídeos

Bases Nitrogenadas

Mutações

Nucleotídeos

Ácido Desoxirribonucleico (DNA)

Ácido Ribonucleico (RNA)

Gene

Operon

Agrupamento Gênico

● Homologia

– Caractere compartilhado presente no ancestral comum

– Mesma origem, não necessariamente a mesma função

– Revela relação evolutiva

● Homoplasia

– Caractere compartilhado não presente no ancestral comum

– Origem diferente, função semelhante

– Não revela relação evolutiva

Origem de Genes

● Ortólogos

– Transferência vertical

● Xenólogos

– Transferência horizontal

● Parálogos

– Duplicação gênica

Homólogos

Aminoácidos

Aminoácidos

Proteínas

Estrutura Primária de Proteínas

Estrutura Secundária de Proteínas

Estrutura Secundária de Proteínas

Estrutura Secundária de Proteínas

Estrutura Terciária de Proteínas

Estrutura Terciária de Proteínas

Estrutura Terciária de Proteínas

Estrutura Quaternária de Proteínas

Bases Nitrogenadas

Base 1 letra Base 1 letra

adenina A guanina ou citosina S

citosina C adenina ou timina W

guanina G guanina ou timina K

timina / uracila T / U adenina ou citosina M

desconhecida Nadenina ou guanina ou timina D

lacuna – adenina ou citosina ou timina

H

purina R adenina ou guanina ou citosina V

pirimidina Yguanina ou timina ou citosina B

Aminoácidos

Aminoácido 3 letras 1 letra Aminoácido 3 letras 1 letra

alanina Ala A metionina Met M

cisteína Cys C asparagina Asn N

aspartato Asp D prolina Pro P

glutamato Glu E glutamina Gln Q

fenilalanina Phe F arginina Arg R

glicina Gly G serina Ser S

histidina His H treonina Thr T

isoleucina Ile I valina Val V

lisina Lys K triptofano Trp W

leucina Leu L tirosina Tyr Y

Aminoácidos

Outros 3 letras 1 letra

desconhecido Xaa X

selenocisteína Sec U

pirrolisina Pyl O

asparagina ou aspartato Asx B

glutamina ou glutamato Glx Z

leucina ou isoleucina Xle J

hidrofóbico inexistente Φ

aromático inexistente Ω

alifático inexistente Ψ

pequeno inexistente π

hidrofílico inexistente ζ

positivo inexistente +

negativo inexistente –

Código Genético

● Códon de início

– Aqui Tem um Gene

● Códons de terminação

– Termine AgorA

– Termine AGora

– Termine aGorA

Código Genético

5’- ATG TGA CTA GCT ACT ACG TAC TAG CGA TCG ATG CAT CGT ACA TGA -3’

5’- ATG AGC TAC GTA CGT ACG ATC CGT AGT CTG ACT GAG AGT AGC TAG -3’

5’- ATG CTA GTC GTA CTG AGT CAT GCG ATC TAA CGA TCA GTT GGG TGA -3’

● Bases/Aminoácidos

– Fasta

● Qualidades

– Qual

– Fastq

● Anotações

– GenBank

– GFF

– EMBL

Formatos de Sequências

● Fasta (.fasta, .fas, .fa, .fna)

>Sequência 1ATCGAGTCAGTCGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGTCATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCAGTCGTATCGAT

>Sequência 2AGTCGTAGTCAGTCGATCGTAGTCGATCGTAGTCCCAGCGATTCGATCGTAGTCGATCGTAGTCGATCGTCAGTCTGATGCAGTCGTAGTCAGTCGATGCTGATA

>Sequência 3GACGTACGTAGCTAGTCGATCGTAGTCGATCGTAGCGTATCAGTCGTAGTCAGTCGTAGTCAGTCGTAGTCGAGTCTGACGTAGTCGATCGTAGTCGATCGTACG

Formatos de Sequências

● Fasta (.fasta, .fas, .fa, .faa)

>Sequência 1KLLAKKCACJALCJALKKLVLKEKLFLKEICIIOSKALKJFSDJOFJEHVEUCIAWKLCKJSVUIEFIALHFEYFHADJASJFOSDUSDUFJAOPKFSKAUOAAC

>Sequência 2AUFGEWYFWEJOKAMVJASDTRSRSUYIEKFKFMVAUDTWTYHVMVKSVISYGAJSJKAMAOIVHDSYWUAOIWYYEEUHGJLKOAIVTAGGBVKDVIWEIEJEI

>Sequência 3OIEIWUTIOEJGIEKGLMJHFUIHSFJAOFJAJGHIWEJUHERUIGSKDFMKSDMFIOSJDIJSDIGOJSAIOJDSGEHGUIEHUWIURGOSOJWUWQIJJISJS

Formatos de Sequências

● Grau de confiança

– probabilidade de erro

– escala logarítmica

● Phred

– 10: 1 em 10 (90 %)

– 20: 1 em 100 (99 %)

– 30: 1 em 1000 (99,9 %)

– 40: 1 em 10.000 (99,99%)

Qualidade de Sequenciamento de DNA

● Qual (.qual)

>Sequência 110 20 30 40 50 50 50 50 50 20 25 2530 30 20 15 20 35 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 20 30 20 10 10

Formatos de Sequências

● Fastq (.fastq)

@Sequência 1TTGCCTGCCTATCATTTTAGTGCCTGTGAGGTGGAGATGTGAGGATCAGT+Sequência 1hhhhhhhhhhghhghhhhhfhhhhhfffffe`ee[`X]b[d[ed`[Y[^Y

@Sequência 2GATTTGTATGAAAGTATACAACTAAAACTGCAGGTGGATCAGAGTAAGTC+Sequência 2hhhhgfhhcghghggfcffdhfehhhhcehdchhdhahehffffde`bVd

@Sequência 3TGCATGATCTTCAGTGCCAGGACCTTATCAAGCGGTTTGGTCCCTTTGTT+Sequência 3dhhhgchhhghhhfhhhhhdhhhhehhghfhhhchfddffcffafhfghe

Formatos de Sequências

● GenBank (.gb, .gbk)

LOCUS BX571963 240 bp DNA linear DEFINITION Rhodopseudomonas palustris CGA009 DnaA.ACCESSION BX571963VERSION BX571963.1

FEATURES Location/Qualifiers source 1..480 /organism="Rhodopseudomonas palustris CGA009" /strain="CGA009" gene 101..340 /gene="dnaA" /locus_tag="RPA0001" CDS 101..340 /gene="dnaA" /locus_tag="RPA0001" /product="chromosomal replication protein DnaA"

Formatos de Sequências

● EMBL (.embl)

ID BX571963 standard; DNA; 240 BP.XXAC BX571963;XXDE Rhodopseudomomnas palustris CGA009 chromosomalDE replication protein DnaA, complete cds.XXSQ Sequence 240 BP; acaagatgcc attgtccccc ggcctcctgc tgctgctgct 40 ctgccctgcc cctggagggt ggccccaccg gccgagacag 80 caggaataag gaaaagcagc ctcctgactt tcctcgcttg 120 aggccagtgc cgggcccctc ataggagagg aagctcggga 160 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc 200 agaccttctc ctcctgcaaa taaaacctca cccatgaatg 240//

Formatos de Sequências

● GFF (.gff)

##gff-version 3##sequence-region BX571963 1 240seq1 gene 1 240 ID=C114_00001;product=DnaA##FASTA>BX571963 BX571963 Rhodopseudomomnas palustris CGA009 chromosomal replication protein DnaA, complete cds.acaagatgccattgtcccccggcctcctgctgctgctgctctgccctgcccctggagggtggccccaccggccgagacagcaggaataaggaaaagcagcctcctgactttcctcgcttgaggccagtgccgggcccctcataggagaggaagctcgggagcgcacccccccagcaatccgcgcgccgggacagaatgccagaccttctcctcctgcaaataaaacctcacccatgaatg

Formatos de Sequências

● Alinhamentos

– verificar similaridades

– apontar dissimilaridades

● Identificação de sítios homólogos

– regiões conservadas

– regiões variáveis

● Tipos

– emparelhado/múltiplo

– local/global/semiglobal

Comparação entre Sequências

● Alinhamento de regiões

– subsequências

– maximização de correspondência

– eliminação de colunas

● Matriz de substituição

– tempo de divergência

– penalização

– pontuação

Alinhamento Local

● Stephen Altschul et al.

– Basic Local Alignment Search Tool (1990)

● Alinhamento local

– nucleotídeos × nucleotídeos

– aminoácidos × aminoácidos

– nucleotídeos × aminoácidos

– aminoácidos × nucleotídeos

● Banco de dados diversos

– remoto

– local

BLAST

● BLASTn

Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_2 86.1 1e-9

> Sequência_2Length=1103

Score = 86.1 bits (40), Expect = 1e-9 Identities = 35/40 (88%), Gaps = 0/46 (0%) Strand=Plus/Minus

Query 1213 TTTTTTGTCTGAATCAGGATGTCCAGGATTTAAGGATTTT 1253 |||||||||| |||||| |||||||||||||||||||Sbjct 779 TTTTTTGTCTGCATCAGGTACTCCAGGATTTAAGGATTTT 819

BLAST

● BLASTx

Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_3 45.1 9e-7

> Sequência_3Length=309

Score = 45.1 bits (105), Expect = 9e-7 Identities = 23/57 (40%), Positives = 36/57 (63%), Gaps = 1/57 (2%) Frame = +3

Query 807 IRLKGTRVGIETILFDYLFHAKSPEEIAKTYTSLTLEQVYATILYYLHNQQSVDEYI 977 + ++ +RV ++TI+ + + EEIA Y SL L VYA I +YLH+Q+ VD Y+Sbjct 28 VVIRNSRVTLDTIVAVF-NQGVTAEEIAYRYPSLMLADVYAAIAFYLHHQEEVDSYL 83

BLAST

● Alinhamento de ponta a ponta

– sequências completas

– utilização de todos os sítios

● Sequências utilizadas

– homólogas

– tamanho semelhante

– mesmo sentido

Alinhamento Global

● Fasta (.fasta, .fas, .fa, .fna)

>Seq_1ATCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT

>Seq_2ATCGAGCTAGCGGTAGATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGTCGATCACGTAGTAGCAGTAGTTGCAACGTTATCGAT

>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT

Formatos de Alinhamento

● Fasta (.fasta, .fas, .fa, .fna)

>Seq_1ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT

>Seq_2ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTGCAACGTTATCGAT

>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT

Formatos de Alinhamento

● Clustal (.aln)

Seq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAG **** *** **************************

Seq_1 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTASeq_2 TCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTASeq_3 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTA ****** ********* ************ ** * ****

Seq_1 GTTGCA----TATCGATSeq_2 GTTGCAACGTTATCGATSeq_3 GTTGCA----TATCGAT ****** *******

Formatos de Alinhamento

● Phylip (.phy)

3 105Seq_1 ATCG------ --GTAGTCGA TCGTAGTCTG ACGTACGATGSeq_2 ATCGAGCTAG CGGTA---GA TCGTAGTCTG ACGTACGATGSeq_3 ATCGAGCTAG CGGTAGTCGA TCGTAGTCTG ACGTACGATG

TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG TCAGTCGATG AGATGCGATG T----CGATC ACGTAGT-AG TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG

TCGTAGTAGT TGCA----TA TCGAT -C--AGTAGT TGCAACGTTA TCGAT TCGTAGTAGT TGCA----TA TCGAT

Formatos de Alinhamento

● Nexus (.nex)

#NEXUSBEGIN DATA;dimensions ntax=3 nchar=105;format missing=? interleave=yes datatype=DNA gap=- match=.;

matrixSeq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG

Seq_1 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTSeq_2 AGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTSeq_3 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTT;end;

Formatos de Alinhamento

Montagem

ATGCGGCATCGCATGAGTGC

ATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATG

TCGCATGAGTGCACGCAGCTGAGTC

Montagem

ATGCGGCATCGCATGAGTGC

ATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATG

TCGCATGAGTGCACGCAGCTGAGTC

Montagem

ATGCGGCATCGCATGAGTGCATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATGTCGCATGAGTGCACGCAGCTGAGTC

ATGCGGCATCGCATGAGTGCATGCTAGCTGAGTCTAATATG

Conhecendo o (GNU/)Linux

● Físicas (hardware)

– processador

– memória

– disco rígido

– placas e controladores

– dispositivos de entrada/saída

● Lógicas (software)

– sistema operacional

– interface

– bibliotecas

– aplicativos

– documentação

Componentes de um Computador

● Gerenciador de recursos

– controla dispositivos

– coordena tarefas

– administra pedidos

– regula processos

– manipula dados

● Coração da máquina

– inicialização

– execução

– processamento

Sistema Operacional

Microsoft Windows

Apple macOS

GNU/Linux

Sistemas Operacionais

Microsoft Windows

Apple macOS

GNU/Linux

Sistemas Operacionais

● Ken Thompson & Denis Ritchie (1969)

– AT&T

● Inovações

– multitarefa

– multiusuário

● Variantes proprietárias

– código fechado

– licença restritiva

UNIX

● “Clones”

– GNU/Linux

– BSD

– Solaris

– Xenix

● Padronização

– Portable Operating System Interface (POSIX)

– Executable and Linkable Format (ELF)

UNIX

UNIX

● Richard Matthew Stallman (1983)

– GNU’s Not Unix

– Free Software Foundation

● Linha de comando

– utilitários

– aplicativos

– compiladores

● GNU Public License

GNU

● Linus Benedict Torvalds (1991)

– Linus’ Unix

– Linux Foundation

● Núcleo operacional

– física lógica←→– entrada saída←→– gerenciamento

● GNU Public License

Linux

Linux

Linux

Distribuições

● Coleções coerentes de projetos

– GNU

– Linux

– SystemD/Upstart/SysV

– Deb/RPM/tar.gz

– X/Wayland

– Gnome/KDE/XFCE/LXDE

– aplicativos

– customizações

● Slackware e Debian (1993)

– mais antigas na ativa

Distribuições

Distribuições

● Baseadas no Debian

– Debian

– Ubuntu

– Mint

● Baseadas no Red Hat

– Red Hat

– CentOS

– Fedora

● Outras bases

– Slackware

– Gentoo

– OpenSUSE

– Arch

Distribuições

Distribuições

Por Quê?

● Sistema dominante

– servidores

– computação científica

– supercomputadores

– dispositivos móveis

● Muitas vantagens

– gratuito

– livre e com código aberto

– alterações são compartilhadas

● Grande estabilidade

– segurança

– suporte

Linux na Bioinformática

● Flexibilidade

– gratuito

– customizável

● Diversidade

– programas otimizados

– programas exclusivos

● Colaborativo

– desenvolvido em comunidades

– aberto e reproduzível

Bio-Linux

● UK National Environmental Research Council (2006)

– Open Software for Biologists: From Famine to Feat

● Voltada para bioinformática

– sistema operacional

– conjunto de pacotes

– mais de 250 programas

● Várias formas

– SO independente (baseado no Ubuntu)

– adicionar a um sistema pré-instalado

Preciso Mudar de SO?

● Não

– trabalho remoto

– servidores disponíveis na Internet

– programas comerciais

● Sim

– compatível com todas as configurações

– sem limitações

– toda a capacidade disponível

– melhor forma de aprender

Preciso Mudar de SO?

● Sem alterações

– virtualização

– mídia externa

● Execução direta

– substituir o sistema atual

– instalar ao lado do sistema atual

Subsistema Windows para Linux

Terminais para Android

Servidores

● Fornecem serviços

– “nuvem”

– atendem clientes

– maior capacidade de processamento

– maior espaço para armazenamento

● Plataforma-padrão

– mesmas ferramentas

– favorece comparações entre a equipe

– facilita acesso às últimas versões

– reduz o número de especialistas

Servidores

● Secure Shell (SSH)

– terminal

– PuTTY

– Cygwin

● Virtual Network Computing (VNC)

– gráfico

– VNC Viewer

● WinSCP

Interfaces de Programas

● Gráfica

– Galaxy

– CLCBio

– Geneious

● Linha de comando

– maior parte dos programas

Linha de Comando

● Interface de texto

– instruções comandos→

● Mais eficiente

– mais leve

– mais rápida

– mais objetiva

● Permite automação

Programação

● Conjunto de instruções para algum processo

– comandos em sequência lógica

● Linguagens distintas

– compiladas

– interpretadas

● Bioprojetos

– Open Bioinformatics Foundation

Programas Compilados

● Linguagens de menor abstração

– mais complexas

– mais rápidas

● Compilador

– tradução em código binário

– maior número de detalhes

● Principais linguagens

– C

– C++

● Instalação mais trabalhosa

Programas Interpretados

● Linguagens de maior abstração

– mais simples

– mais lentas

● Interpretador

– maior abstração

– instruções legíveis

● Principais linguagens

– Perl

– Python

– R

● Instalação simples

Licenças

● Questões legais

– direitos autorais

– patentes

● Permissão

– o que fazer

– como fazer

– distribuição

Licenças

● Proprietária

– variável

● Livre/permissiva

– domínio público

– BSD

– MIT

– Apache

● Livre/viral

– GPL

Prática

1) https://cygwin.com/;

2) mover instalador para a Área de Trabalho;

3) Prompt de Comando;

4) cd Desktop;

5) setup-x86.exe --no-admin.

Cygwin

Recommended