51
3 April 2018 Version 1 1 FACT SHEET Genetic sequence data and databases Background Genetic sequence data (GSD) Organisms are built, and their functions are determined, by their genetic code. This code is contained in DNA molecules, which are found in human, animal and plant cells, as well as in microorganisms like bacteria and viruses. DNA has four components, or building blocks, called C (cytosine), G (guanine), A (adenine), or T (thymine). The nucleotides line up in an order particular to each organism, comprising the genetic code. The code can be “read” by the cell to produce RNA – which is also a type of genetic information, encoded by the nucleotides A (adenine), C (cytosine), G (guanine) and U (uracil) – and in turn, proteins that are responsible for all of the structure and function of a living organism. The order of the nucleotides in DNA and RNA – that is, the sequence – is critical because genetic sequences contain information about the structure and specific properties of an organism. In the case of viruses, this includes characteristics such as pathogenicity, transmissibility and antiviral susceptibility. Laboratories can determine the genetic sequence of a particular organism, using sequencing technologies. The data generated through this process is called genetic sequence data (GSD), which is represented by listing the nucleotides in order (e.g., an RNA sequence might look like AGAAAUGAAAUGGCUCCUGUCAA). Providers and users of influenza GSD The main providers of GSD from influenza viruses are GISRS laboratories. Other providers include national public health laboratories and public and private laboratories that may sequence influenza viruses. GSD can be uploaded to one or more databases by the sequencing laboratory. 1 GISRS laboratories, academia and industry are the main influenza GSD users. They generally use the data to conduct risk assessment and monitor the emergence and evolution of influenza viruses; develop diagnostics; generate candidate vaccine viruses; and produce new types of vaccines such as recombinant vaccine and vaccines using synthetic candidate vaccine viruses. GSD databases GSD databases are databases that receive, host and provide access to GSD that has been submitted to them. Most databases also provide important additional, contextual information related to the sequences, to enrich the sequence data with information about the patient/animal/other source from which the sample was extracted. This additional information is known as “metadata”. Principal databases that host influenza GSD There are more than 1700 molecular biology databases 2 , at least six of which contain influenza GSD. These are: GISAID Epiflu TM : https://www.gisaid.org/ Influenza Research Database: https://www.fludb.org/brc/home.spg?decorat or=influenza Openflu database: http://openflu.vital- it.ch/browse.php The three databases are part of the International Nucleotide Sequence Database Collaboration (INSDC) 3 : o GenBank: https://www.ncbi.nlm.nih.gov/genban k/ o European Nucleotide Archive: https://www.ebi.ac.uk/ena o DNA Data Bank of Japan: http://www.ddbj.nig.ac.jp/ GSD and databases in the PIP Framework Although GSD is not included in the definition of PIP Biological Materials, genetic sequences are defined in section 4.2: “‘Genetic sequences’ means the order of nucleotides found in a molecule of DNA or RNA. They contain the genetic information that determines the biological characteristics of an organism or a virus”. Additionally, the PIP Framework has several references to GSD and databases: 5.2.1 Genetic sequence data, and analyses arising from that data, relating to H5N1 and other influenza viruses with human pandemic potential should be shared in a rapid, timely and systematic manner with the originating laboratory and among WHO GISRS laboratories.

FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

3 April 2018

Version 1

1

FACT SHEET

Genetic sequence data and databases

Background Genetic sequence data (GSD)

Organisms are built, and their functions are

determined, by their genetic code. This code is

contained in DNA molecules, which are found in

human, animal and plant cells, as well as in

microorganisms like bacteria and viruses. DNA has

four components, or building blocks, called C

(cytosine), G (guanine), A (adenine), or T (thymine).

The nucleotides line up in an order particular to each

organism, comprising the genetic code. The code can

be “read” by the cell to produce RNA – which is also a

type of genetic information, encoded by the

nucleotides A (adenine), C (cytosine), G (guanine) and

U (uracil) – and in turn, proteins that are responsible

for all of the structure and function of a living

organism.

The order of the nucleotides in DNA and RNA – that is,

the sequence – is critical because genetic sequences

contain information about the structure and specific

properties of an organism. In the case of viruses, this

includes characteristics such as pathogenicity,

transmissibility and antiviral susceptibility.

Laboratories can determine the genetic sequence of a

particular organism, using sequencing technologies.

The data generated through this process is called

genetic sequence data (GSD), which is represented by

listing the nucleotides in order (e.g., an RNA sequence

might look like AGAAAUGAAAUGGCUCCUGUCAA).

Providers and users of influenza GSD The main providers of GSD from influenza viruses are

GISRS laboratories. Other providers include national

public health laboratories and public and private

laboratories that may sequence influenza viruses. GSD

can be uploaded to one or more databases by the

sequencing laboratory.1

GISRS laboratories, academia and industry are the

main influenza GSD users. They generally use the data

to conduct risk assessment and monitor the

emergence and evolution of influenza viruses; develop

diagnostics; generate candidate vaccine viruses; and

produce new types of vaccines such as recombinant

vaccine and vaccines using synthetic candidate

vaccine viruses.

GSD databases GSD databases are databases that receive, host and

provide access to GSD that has been submitted to

them. Most databases also provide important

additional, contextual information related to the

sequences, to enrich the sequence data with

information about the patient/animal/other source

from which the sample was extracted. This additional

information is known as “metadata”.

Principal databases that host influenza GSD

There are more than 1700 molecular biology

databases2, at least six of which contain influenza GSD.

These are:

• GISAID EpifluTM: https://www.gisaid.org/

• Influenza Research Database:

https://www.fludb.org/brc/home.spg?decorat

or=influenza

• Openflu database: http://openflu.vital-

it.ch/browse.php

• The three databases are part of the

International Nucleotide Sequence Database

Collaboration (INSDC) 3:

o GenBank:

https://www.ncbi.nlm.nih.gov/genban

k/

o European Nucleotide Archive:

https://www.ebi.ac.uk/ena

o DNA Data Bank of Japan:

http://www.ddbj.nig.ac.jp/

GSD and databases in the PIP Framework Although GSD is not included in the definition of PIP

Biological Materials, genetic sequences are defined in

section 4.2: “‘Genetic sequences’ means the order of

nucleotides found in a molecule of DNA or RNA. They

contain the genetic information that determines the

biological characteristics of an organism or a virus”.

Additionally, the PIP Framework has several

references to GSD and databases:

• 5.2.1 Genetic sequence data, and analyses

arising from that data, relating to H5N1 and

other influenza viruses with human pandemic

potential should be shared in a rapid, timely

and systematic manner with the originating

laboratory and among WHO GISRS

laboratories.

Page 2: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2

• 5.2.2 Recognizing that greater transparency

and access concerning influenza virus genetic

sequence data is important to public health and

there is a movement towards the use of public-

domain or public-access databases such as

Genbank and GISAID respectively; and

• 5.2.3 Recognizing that in some instances the

publication of genetic sequence data has been

considered sensitive by the country providing

the virus;

• 5.2.4 Member States request the Director-

General to consult the Advisory Group on the

best process for further discussion and

resolution of issues relating to the handling of

genetic sequence data from H5N1 and other

influenza viruses with pandemic potential as

part of the Pandemic Influenza Preparedness

Framework.4

The PIP Framework also sets out certain expectations

regarding GSD:

• Annex 5: WHO Collaborating Center Terms of

Reference, section B.5: WHO CC “upload

available haemagglutinin, neuraminidase and

other gene sequences of A(H5) and other

influenza viruses with pandemic potential to a

publicly accessible database in a timely manner

but no later than three months after

sequencing is completed, unless otherwise

instructed by the laboratory or country

providing the clinical specimens and/or viruses

(Guiding Principle 9)”.5

• Annex 4, Guiding Principle 9: “WHO GISRS

laboratories will submit genetic sequences data

to GISAID and Genbank or similar databases in

a timely manner consistent with the Standard

Material Transfer Agreement”.6

Main features of GSD databases As elaborated in the table below, GSD databases vary

according to several factors, including

• Scope of data coverage

• Level of data curation and analysis

• Database access

• Terms and conditions of access to, and use of,

data

• Intellectual property (IP) and other legal

rights over the data

Databases address these factors, depending on their

purpose and the community of data providers and

data users they serve. The table below provides an

overview of the main approaches taken by existing

databases.

Page 3: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

3

Page 4: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 5: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

5

Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It does not

purport to be comprehensive as new terms come into use and definitions evolve. The definitions provided in the

Glossary are commonly used but not necessarily universally agreed. Therefore, some terms may be used differently

in different contexts.

Data access

agreement (also

referred to as ‘database

access agreement’ or

‘data use agreement’)

A Data access agreement is a contract between a database user (this includes data providers

and data users) on the one hand and the database (custodian of the data) on the other. It

generally contains terms and conditions for accessing and using data hosted by the database.

These terms and conditions can include: conditions of access, use and re-use of data; further

distribution of data; attribution and collaboration with the data provider; intellectual property

rights, commercialization and licensing rights over data; suspension and termination of access.

Open access23

The concept of ‘Open access’ arose in response to the growing demand for unrestricted, free

access to scholarly research.24 According to the Berlin Declaration on Open Access to Knowledge

in the Sciences and Humanities and the Bethesda Statement on Open Access Publishing, open

access contributions must satisfy two conditions. The Berlin Declaration states:

1. The author(s) and right holder(s) of such contributions grant(s) to all users a free,

irrevocable, worldwide, right of access to, and a license to copy, use, distribute, transmit

and display the work publicly and to make and distribute derivative works, in any digital

medium for any responsible purpose, subject to proper attribution of authorship

(community standards, will continue to provide the mechanism for enforcement of proper

attribution and responsible use of the published work, as they do now), as well as the right

to make small numbers of printed copies for their personal use.

2. A complete version of the work and all supplemental materials, including a copy of the

permission as stated above, in an appropriate standard electronic format is deposited (and

thus published) in at least one online repository using suitable technical standards (such as

the Open Archive definitions) that is supported and maintained by an academic institution,

scholarly society, government agency, or other well-established organization that seeks to

enable open access, unrestricted distribution, interoperability, and long-term archiving.25

Open data ‘Open data’ is a relatively recent term. The concept behind “open data” however predates the

invention of the Internet and has arisen from the belief that knowledge is a common good26 and

“that the enormous amount of information routinely collected by government entities should be

available to all citizens.”27

According to Open Knowledge International, ‘open data’ is data that can be “freely used,

modified, and shared by anyone for any purpose”28. For example, the European Data Portal,

which gives access to “metadata of Public Sector Information available on public data portals

across European countries”29, states that: “[open data] should have no limitations that prevent it

from being used in any particular way”, “[it] must be free to use, but this does not mean that it

must be free to access”, and “once the user has the data, they are free to use, reuse and

redistribute it – even commercially.”30 The World Bank states that open data has two dimension:

“1. The data must be legally open, which means they must be placed in the public domain or

under liberal terms of use with minimal restrictions. 2. The data must be technically open, which

means they must be published in electronic formats that are machine readable and preferably

non-proprietary, so that anyone can access and use the data using common, freely available

software tools. Data must also be publicly available and accessible on a public server, without

password or firewall restrictions.”31

Open source

The concept of open source arose from the field of computer programming.32 Open source

licenses allow a community of users to access source materials, tools and platforms under terms

that are meant to encourage free flow of information, collaboration and innovation. Open

source licenses usually require that no intellectual property rights be asserted on the materials,

tools or platforms. Some licences also require that innovations arising from their use be shared

with the community.33

Page 6: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

6

Public access In the context of scientific publication, public access refers to the publication of scientific results,

notably scientific manuscripts, in repositories that are accessible to the public. This access is

often at low or no cost and is generally subject to copyright (under the principle of Fair Use). For

example, the US National Institutes of Health’s Public Access Policy requires that “all

investigators funded by the NIH submit or have submitted for them to the National Library of

Medicine’s PubMed Central an electronic version of their final peer-reviewed manuscripts upon

acceptance for publication, to be made publicly available no later than 12 months after the

official date of publication: Provided, That the NIH shall implement the public access policy in a

manner consistent with copyright law.”34

Public access

database35

A public access database can be described as a publicly-accessible database “where access to

the data is provided to a user after registration and explicit acceptance of a data access and use

agreement. After registration, access requires using a log-in procedure”36; database with a data

access agreement “extending a number of key “protections” and assurances to data

contributors.”37; database with “identification of contributors and users”38.

Public domain In the context of intellectual property rights, public domain is understood to mean “intangible

materials that are not subject to exclusive IP rights and which are, therefore, freely available to

be used or exploited by any person”39.

Public domain

database40

A public domain database can be described as a publicly-accessible database that allows “free

and unencumbered access to digital sequence information”41; database that “do not require a

data access or use agreement, nor registration or log-in”42; “anonymous access”43 database.

While some sequences in “public domain databases” are in the public domain (free from

exclusive IP rights), many are claimed as part of granted patent or published patent applications

and are not in the public domain.44

Publicly accessible Accessible to all; not private, not limited to an institution and not restricted to a category or

group of users.

Publicly accessible

database

Database that is accessible to all, including the scientific community, policymakers and the

general public.

Publicly accessible databases may have access mechanisms, registration and authorization

procedures or terms and conditions, but are not private, not limited to an institution and not

restricted to a category or group of users.

1 PIP Framework Advisory Group Technical Expert Working Group (TEWG) on genetic sequence data. Final Report to the PIP

Advisory Group. Geneva: World Health Organization; 2014, p.10-11

(http://www.who.int/influenza/pip/advisory_group/PIP_AG_Rev_Final_TEWG_Report_10_Oct_2014.pdf 2 Rigden DJ and Fernandez XM, The 2018 Nucleic Acids Research database issue and the online molecular biology database collection, Nucleic Acids Research,

available at https://academic.oup.com/nar/article/46/D1/D1/4781210 3 The INSDC website can be found at http://www.insdc.org/. 4 PIP Framework Section 5 Pandemic influenza preparedness Framework for sharing of H5N1 and other influenza viruses with human pandemic potential. Text

available at http://www.who.int/influenza/resources/pip_framework/en/ 5 PIP Framework Annex 5 Terms of Reference for WHO Collaborating Centres, Core Term of Reference B 5 6 PIP Framework Annex 4, Guiding Principles for the development of Terms of Reference for current and potential future WHO global influenza surveillance and

response system (GISRS) laboratories for H5N1 and other human pandemic influenza viruses, Principle 9 7 Zou et al., Biological Databases for Human Research, Genomics, Proteomics and Bioinformatics, available at

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/#b0005 8 Ibid. 9 See for examples of Terms and Conditions, PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal

Characteristics of an influenza genetic sequence data sharing system under the PIP Framework, 22 June 2016, Annex 4, available at

http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 10 Other legal rights over data will depend on international obligations, national legislation and other pre-existing contractual rights. 11Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on

Biological Diversity and the Nagoya Protocol, par. 38 and 191, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-

01-03-en.pdf 12 From Scoping Paper on approaches to seasonal influenza and genetic sequence data under the PIP Framework, p. 19: “In most jurisdictions, naturally-

occurring influenza GSD would not be considered patentable subject matter. However, innovations from the development of influenza-related products could be

protected if patentability requirements are met (these are generally: novelty; patentability of the subject-matter; and an inventive step). There are therefore a

number of sequences in publicly-accessible databases that are claimed as part of patents.” However, “the early, open publication of the gene sequence of a

Page 7: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

7

newly-isolated strain of an influenza virus (before IP protection is granted) would directly preclude obtaining patent protection for the genes as published

because the gene sequence would be considered non-novel.” (at http://www.who.int/influenza/pip/scopingpaper.pdf); See also: WIPO Patent issues related to

influenza viruses and their genes: working paper. World Intellectual Property Organization. Geneva: WIPO; 2007, p.19-20, available at

http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf ; WIPO Patent search report on pandemic influenza preparedness (PIP) –related patents

and patent applications. World Intellectual Property Organization. Geneva: WIPO; 2011, available at

http://www.wipo.int/export/sites/www/policy/en/global_health/pdf/report_influenza_2011.pdf , accessed 15 October 2017; [PIP Framework Advisory Group

Technical Expert Working Group (TEWG) on genetic sequence data. Final Report to the PIP Advisory Group. Geneva: World Health Organization; 2014, p.8-10

available at http://www.who.int/influenza/pip/advisory_group/PIP_AG_Rev_Final_TEWG_Report_10_Oct_2014.pdf . 13 See for example : “The GenBank database is designed to provide and encourage access within the scientific community to the most up-to-date and

comprehensive DNA sequence information. Therefore, NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters

may claim patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the

validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information

contained in GenBank.” (GenBank overview, GenBank Data Usage, available at https://www.ncbi.nlm.nih.gov/genbank/) 14 See endnote 11 above. 15 See endnote 11 above 16 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on

Biological Diversity and the Nagoya Protocol, par. 29, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-

en.pdf ; See for example GISAID Database Access Agreement: “2. License Terms. You are hereby granted a non-exclusive, worldwide, royalty-free, non-

transferable and revocable license to access and use the GISAID EpiFlu™ Database and Data solely in accordance with this Agreement in all its terms. Without

limiting the foregoing, your access to and use of the GISAID EpiFlu™ Database and Data is subject to the following terms and conditions:

a. Use of Any Data Provided by You. You hereby grant (i) GISAID and (ii) all users and Data providers that have agreed to be bound by the GISAID EpiFlu™

Database Access Agreement and that continue to abide by its terms (collectively "Authorized Users") a non-exclusive, worldwide, royalty-free, and irrevocable

license to collect, store, reproduce, access, modify, display, distribute, coordinate, arrange, and otherwise use the Data submitted by You as contemplated by

this Agreement. This Agreement does not transfer any other rights or ownership interests in the Data.” (GISAID EpiFlu™ Database Access Agreement, Effective:

March 16, 2011, available at https://www.gisaid.org/registration/terms-of-use/);

See also for example in the field human genomics, UK Biobank Material Transfer Agreement for data and/or samples, 20 August 2012, section 3, available at

http://www.ukbiobank ac.uk/wp-content/uploads/2012/09/Material-Transfer-Agreement.pdf. 16 Division G, Title II, Section 218 of PL 110-161 (Consolidated Appropriations Act, 2008), sec. 218 17Ibid. GISAID Database Access Agreement, section 2, para. g. 18 Ibid. 19 See for example GISAID EpiFlu™ Database Access Agreement: “g. Intellectual Property. “You acknowledge and agree that: (i) It is your sole responsibility to

obtain any additional authorization or license as may be necessary for your use of the Data.” (GISAID EpiFlu™ Database Access Agreement, Effective: March 16,

2011, available at https://www.gisaid.org/registration/terms-of-use/) 20 Authorized users are generally those who have agreed to the DAA and have not had their rights suspended or terminated. 21 “Generally speaking, genetic information that is published without confidentiality constraints on access would be considered non-novel. This does not mean

that the information must be available free of charge – genetic information available only on a paid-subscription database would still be considered sufficiently

public to preclude novelty and hence patentability – provided those accessing the data were not bound by confidentiality obligations regarding the data.” (see

WIPO Patent issues related to influenza viruses and their genes: working paper. World Intellectual Property Organization. Geneva: WIPO; 2007, p.19, available at

http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf) 22 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources, 1 December 2017, available at

https://www.cbd.int/abs/DSI-peer/USA.pdf.; see also WHO, Options to monitor the use of genetic sequence data from influenza viruses with human pandemic

potential, 6 May 2016, p.8, available at http://www.who.int/influenza/pip/advisory group/gsdoptionspaper revised.pdf?ua=1 23 See WHO policy on open access at http://www.who.int/about/policy/en/ and Dye C et al., Data sharing in public health emergencies: a call to researchers,

Bulletin of the World Health Organization 2016;94:158. doi: http://dx.doi.org/10.2471/BLT.16.170860; 24 Budapest Open Access Initiative [website] at http://www.budapestopenaccessinitiative.org/. 25 See Max Plank Society, Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 22 October 2013, available at

https://openaccess.mpg.de/Berlin-Declaration and Howard Hughes Medical Institute, Bethesda Statement on Open Access Publishing, 20 June 2003, available at

http://legacy.earlham.edu/~peters/fos/bethesda.htm; See also Chan L et al., Budapest Open Access Initiative, 14 February 2002, available at

http://www.budapestopenaccessinitiative.org/boai-10-recommendations. 26Chignard, S., A brief history of Open Data, Paris Innovation Review, 23 March 2013, available at http://parisinnovationreview.com/articles-en/a-brief-history-

of-open-data. 27 The World Bank, Open Data in 60 seconds [website] at http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html. 28 Open Knowledge International, The Open Definition, http://opendefinition.org/. The full definition is available at http://opendefinition.org/od/2.1/en/. 29 European Data Portal, Our activities [website] at https://www.europeandataportal.eu/en/what-we-do/our-activities 30 European Data Portal, What is Open data? [website] at https://www.europeandataportal.eu/elearning/en/module1/#/id/co-01 31 The World Bank, Open Data defined [website] at http://opendatatoolkit.worldbank.org/en/essentials.html . 32 The Open Source Definition (1998) is a series of criteria established by the Open Source Initiative (OSI) for determining what is an open source license. The

definition can be found at https://opensource.org/osd. 33 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on

Biological Diversity and the Nagoya Protocol, par. 28, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-

en.pdf 34 Division G, Title II, Section 218 of PL 110-161 (Consolidated Appropriations Act, 2008), sec. 218 35 As referred to in PIP Framework, section 5.2. 36 PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal Characteristics of an influenza genetic sequence data

sharing system under the PIP Framework, 22 June 2016, available at http://www.who.int/influenza/pip/advisory group/twg doc.pdf 37 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's innovative contribution to global health” Global Challenges, 10 January 2017, available

at http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full.

Page 8: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

8

38 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on

Biological Diversity and the Nagoya Protocol, par. 193, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-

en.pdf 39 World Intellectual Property Organization (WIPO), Intergovernmental Committee on Intellectual Property and Genetic Resources, Traditional Knowledge and

Folklore, Note on the Meanings of the Term “Public Domain” in the Intellectual Property System with special reference to the Protection of Traditional

Knowledge and Traditional Cultural Expressions/Expressions of Folklore, 24 November 2010, WIPO/GRTKF/IC/17/INF/8, available at

http://www.wipo.int/edocs/mdocs/tk/en/wipo grtkf ic 17/wipo grtkf ic 17 inf 8.doc 40 As referred to in PIP Framework, section 5.2. 41 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on

Biological Diversity and the Nagoya Protocol, par.38-191 , available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-

03-en.pdf 42 PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal Characteristics of an influenza genetic sequence data

sharing system under the PIP Framework, 22 June 2016, available at http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 43 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's innovative contribution to global health” Global Challenges, 10 January 2017, available

at http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full 44 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources, 1 December 2017, available at

https://www.cbd.int/abs/DSI-peer/USA.pdf.

Page 9: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2018 أبريل/نيسان 3 1النسخة

صحيفة وقائع

وقواعدها بيانات المتواليات الجينية

معلومات أساسية

بيانات المتواليات الجينية

لراموزها تُبنى الكائنات الحية وُتحدد وظائفها تبعًا ضمن جزيئات الدنا محفوظ الجيني. وهذا الراموز

الموجودة في خاليا اإلنسان، والحيوان، والنبات، الكائنات المجهرية مثل الجراثيم وكذلك في

نات، أو ل Cِبنات، تسمى والفيروسات. وللدنا أربعة مكوِّ T أدينين(، و) A )غوانين(، و Gو)سيتوزين(،

في ترتيب خاص بكل وتنتظم النوكليوتيدات )ثيمين(.يمكن للخلية كائن حي، بما يشكل الراموز الجيني. و

"قراءة" الراموز إلنتاج الرنا، وهي أيضًا نوع من A بالنوكليوتيدات المعلومات الجينية، المرمَّزة

و )غوانين(، Gو )سيتوزين(، C )أدينين(، و

U)وبالتالي البروتينات المسؤولة عن كل )يوراسيل ، فة الكائن الحي.بنيان ووظي

ويتسم ترتيب النوكليوتيدات في الدنا والرنا، أيالمتوالية، بأهمية حاسمة ألن المتواليات الجينية تحتوي

النوعية للكائن والخواصعلى معلومات عن البنيان سمات الحي. وفي حالة الفيروسات فإن ذلك يشمل

والحساسية المضادة اإلمراضية، وقابلية السراية، مثل للفيروسات. وبمقدور المختبرات تحديد المتوالية الجينية

وُيطلق لكائن حي معين باستخدام تكنولوجيات التتالي.على البيانات المستخلصة عبر هذه العملية اسم

بإيراد ، والتي ُتمثَّل(GSD)بيانات المتواليات الجينية النوكليوتيدات حسب ترتيبها )على سبيل المثال فإن

لرنا يمكن أن تكون على الشكل التالي: متوالية اAGAAAUGAAAUGGCUCCUGUCAA.)

مقدمو ومستخدمو بيانات المتواليات الجينية لألنفلونزا

لبيانات المتواليات الجينية الجهات المقدمة الرئيسيةإن شبكة المنظمة مختبرات هيلفيروسات األنفلونزا

وتشمل. العالمية لترصد األنفلونزا والتصدي لهاالمختبرات الوطنية للصحة الجهات المقدمة األخرى

قد تقوم العمومية والمختبرات العامة والخاصة التي بتحديد متواليات فيروسات األنفلونزا. وبمقدور

بيانات المتواليات بتحميل أن تقوم مختبرات المتواليات 1أو أكثر. واحدة قاعدة بياناتالجينية في

المنظمة العالمية لترصد شبكة وتتصدر مختبرات ، واألوساط األكاديمية، ودوائر األنفلونزا والتصدي لها

الصناعة صفوف مستخدمي بيانات المتواليات الجينية. وبصفة عامة فإن هذه الجهات تستخدم البيانات إلجراء تقديرات المخاطر ورصد نشوء وتطور فيروسات األنفلونزا؛ وتطوير عمليات التشخيص؛

نتاج أنواع جديدة وتوليد في روسات لقاحية مرشَّحة؛ وا من اللقاحات مثل اللقاحات المأشوبة واللقاحات التي

تستخدم الفيروسات اللقاحية المرشَّحة التخليقية.

Page 10: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

قواعد بيانات المتواليات الجينية

هي قواعد بيانات قواعد بيانات المتواليات الجينيةإن تتلقى، وتستضيف، وتتيح الوصول إلى بيانات المتواليات الجينية المقدمة إليها. كما توفر معظم قواعد البيانات معلومات سياقية إضافية مهمة عن المتواليات، وذلك إلثراء بيانات المتواليات بمعلومات عن المريض/الحيوان/ المصدر اآلخر الذي

ة. وُتعرف هذه المعلومات اسُتخلصت منه العين اإلضافية باسم "واصفات البيانات".

قواعد البيانات الرئيسية التي تستضيف بيانات المتواليات الجينية لألنفلونزا

قاعدة بيانات للبيولوجيا 1700هناك أكثر من بيانات وتحتوي ست منها على األقل 2الجزيئية،

د هي التالية:لألنفلونزا. وهذه القواع المتواليات الجينية

GISAID EpifluTM:

https://www.gisaid.org/

:قاعدة بيانات بحوث األنفلونزا

https://www.fludb.org/brc/home.spg?decor

ator=influenza

Openflu database :-http://openflu.vital

it.ch/browse.php

قواعد البيانات الثالث التي تشكل جزءًا منمبادرة التعاون الدولي لقواعد بيانات متواليات

3:(INSDC)النوكليوتيدات

o GenBank :https://www.ncbi.nlm.nih.gov/genb

ank/.

o :األرشيف األوروبي للنوكليوتيداتhttps://www.ebi.ac.uk/ena.

o :بنك بيانات الدنا في اليابانhttp://www.ddbj.nig.ac.jp/.

اإلطار وقواعدها ضمن بيانات المتواليات الجينية الخاص بالتأهب لألنفلونزا الجائحة

غير بيانات المتواليات الجينيةعلى الرغم من أن اإلطار مدرجة في تعريف المواد البيولوجية الوارد في

2-4، فإن الفرع الخاص بالتأهب لألنفلونزا الجائحةمن هذا اإلطار ُيعرِّف المتواليات الجينية على أنها " ترتيب النوكليوتيدات الموجودة في جزيء الدنا أو الرنا. وهي تحتوي المعلومات التي تحدد الخصائص

". وفضاًل عن ذلك فإن البيولوجية ألي كائن أو فيروسبيانات اإلطار المذكور يتضمن إشارات عديدة إلى

وقواعدها: تواليات الجينيةالم

5-2-1 ينبغي تبادل بيانات التسلسل الجينيوالتحاليل الناجمة عن تلك البيانات فيما

وسائر فيروسات H5N1يتعلق بالفيروس األنفلونزا التي قد تسبب جائحة بشرية، تباداًل سريعًا ومنهجيًا وموقوتًا مع مختبر المنشأ

؛وفيما بين مختبرات شبكة المنظمة

5-2-2 مع االعتراف بأهمية زيادة الشفافيةوفرص التوصل فيما يخص بيانات المتوالية الجينية لفيروسات األنفلونزا بالنسبة إلى الصحة العمومية وبوجود توجه نحو استخدام

أو Genbankقواعد البيانات المشاع مثل

Page 11: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

قواعد البيانات التي يمكن للجمهور االطالع ؛GISAIDعليها مثل

5-2-3 مع االعتراف بأن نشر بياناتالمتواليات الجينية قد اعتبر أحيانًا أمرًا

حساسًا من ِقب ل البلد الذي يوفر الفيروس؛

5-2-4 تطلب الدول األعضاء إلى المديرالعام أن يتشاور مع الفريق االستشاري حول أفضل اإلجراءات فيما يخص مناقشة وحل

المتواليات القضايا المتعلقة بمعالجة بياناتوسائر H5N1الجينية المتأتية من الفيروس

فيروسات األنفلونزا التي قد تسبب جائحة بشرية، وذلك في اإلطار الخاص بالتأهب

4لألنفلونزا الجائحة.

اإلطار الخاص بالتأهب لألنفلونزا الجائحةكما أن بيانات المتواليات يطرح بعض التطلعات بشأن

:الجينية

اختصاصات المراكز المتعاونة : 5الملحقباء: تقوم المراكز -5مع المنظمة، الفرع

تحميل معلومات المتعاونة مع المنظمة ب"عن المتاح من متواليات جينات الراصات نزيم النورمينيداز وغيرها من الدموية وا المتواليات ومن فيروسات األنفلونزا التي قد تسبب جائحة، على قاعدة بيانات متاحة

لجمهور في التوقيت المناسب على أال ليتجاوز ذلك ثالثة أشهر بعد اكتمال تحديد المتوالية الجينية، وما لم يصدر المختبر أو البلد الذي قدم العينات السريرية و/ أو

الفيروسات تعليمات خالف ذلك )المبدأ 5".(9التوجيهي

تقدم : "9، المبدأ التوجيهي 4الملحقظمة في التوقيت المناسب مختبرات شبكة المن

بيانات المتواليات الجينية بما يتسق مع االتفاق الموحد لنقل المواد إلى المبادرة لى العالمية لتبادل بيانات أنفلونزا الطيور، وا بنك الجينات، أو إلى أي قواعد بيانات

6".شبيهة

بيانات المتواليات الجينيةالمعالم الرئيسية لقواعد

، على نحو ما يانات المتواليات الجينيةبتتباين قواعد يوضحه الجدول الوارد أدناه، تبعًا لعوامل عديدة من

بينها ما يلي:

نطاق تغطية البيانات

مستوى العناية بالبيانات والتحليل

الوصول إلى قاعدة البيانات

شروط وأحكام الوصول إلى البيانات واستخدامها

حقوق الملكية الفكرية(IP) والحقوق القانونية األخرى المتعلقة بالبيانات

وُتعنى قواعد البيانات بهذه العوامل، رهنًا بالغرض منها وبمجتمع مقدمي البيانات ومستخدمي البينات الذين تخدمهم. ويوفر الجدول أدناه عرضًا عامًا للُنهج

عد البيانات القائمة.الرئيسية التي تعتمدها قوا

Page 12: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 13: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 14: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

وثيقة عمل 2018 أبريل/نيسان 3

مسرد المصطلحات

في سياق الوصول إلى البيانات وقواعدها. وال يدعي يوفر هذا المسرد تعاريف للمصطلحات الشائعة االستخدام المسرد أنه شامل حيث أن هناك مصطلحات جديدة ُتطرح لالستخدام بينما تتطور التعاريف. والتعاريف المدرجة في المسرد شائعة االستعمال ولكنها ليست مقبولة بالضرورة من الجميع. ولذلك فإن بعض المصطلحات قد ُتستخدم

ينة في السياقات المختلفة.بطريقة متبا

اتفاق الوصول إلى البياناتاتفاق ’)ُيشار إليه أيضًا على أنه

الوصول إلى قاعدة اتفاق استخدام ’أو ‘ البيانات ‘البيانات

هو عقد مبرم بين مستخدم لقاعدة بيانات )يشمل ذلك مقدمي البيانات ومستخدمي "اتفاق الوصول إلى البياناتإن "جهة وقاعدة البيانات )القيِّم على البيانات( من جهة أخرى. ويتضمن االتفاق عمومًا شروطًا وأحكامًا البيانات( من

بشأن الوصول إلى البيانات التي تستضيفها قاعدة البيانات واستخدامها. ويمكن أن تشمل هذه الشروط واألحكام ما عادة استخدام البيانات؛ والمزي اإلسناد والتعاون مع مقدم د من التوزيع للبيانات؛ ويلي: أحكام الوصول، واستخدام وا

يقاف الوصول. البيانات؛ وحقوق الملكية الفكرية؛ والتسويق التجاري وحقوق الترخيص المتعلقة بالبيانات؛ وتعليق وا

23االنتفاع الحر

ووفقًا 24من البحوث العلمية.استجابة للطلب المتزايد من أجل االنتفاع الحر وغير المقيد ‘ االنتفاع الحر’ نشأ مفهوم " و "بيان بيتيسدا حول منشورات إعالن برلين بشأن االنتفاع الحر بالمعارف في ميداني العلوم الطبيعية واإلنسانيةلـ "

االنتفاع الحر" فإن على مساهمات االنتفاع الحر أن تلبي شرطين اثنين. وينص إعالن برلين على ما يلي:

وصاحب )أصحاب( حقوق المؤلف لجميع المستخدمين من جميع أنحاء العالم حقًا منح المؤلف )المؤلفون( .1تاحتها دائمًا وال عودة عنه للوصول المجاني إلى أعمالهم ونسخها واستخدامها وتوزيعها ونقلها وعرضها وا للجميع وكذلك الحق في توزيع األعمال المشتقة بأي طريقة رقمية ألي غرض معقول مع مراعاة عزو

عمال إلى المؤلف الفعلي، فضاًل عن الحق في إصدار عدد من النسخ المطبوعة لالستخدام الشخصي.األ

اإليداع الفوري لنسخة كاملة من األعمال وجميع المواد التكميلية، بما في ذلك نسخة من اإلذن كما هو مبين .2ني واحد على األقل مدعومًا من أعاله، في صيغة إلكترونية ومناسبة عند الطباعة األولية، في مستودع إلكترو

مؤسسة تعليمية أو مجتمع تعلمي أو وكالة حكومية أو أي منظمة مرموقة تسعى إلى دعم سياسة االنتفاع مكانية العمل البيني واألرشفة طويلة المدى. 25الحر والتوزيع غير المقيد وا

أن المفهوم الكامن وراء هذا المصطلح سابق الختراع إن البيانات المفتوحة هي مصطلح حديث نسبيا. على البيانات المفتوحةوأن "المقدار الهائل من المعلومات التي تقوم 26اإلنترنت وقد نشأ نتيجة االعتقاد بأن المعرفة هي من الصالح العام

27الكيانات الحكومية بجمعها روتينيًا ينبغي أن تكون متاحة لكل المواطنين".

هي البيانات التي يمكن ‘ البيانات المفتوحة’ فإن ""Open Knowledge International"وطبقًا لمنظمة وعلى سبيل المثال فإن بوابة البيانات 28"استخدامها، وتعديلها، واقتسامها من جانب أي شخص وألي غرض".

العامة األوروبية، التي تمنح الوصول إلى "البيِّنات الوصفية لمعلومات القطاع العام المتاحة في بوابات البياناتتنص على أنه "ينبغي أن تكون ]البيانات المفتوحة[ بدون أي قيود تحول دون 29على امتداد البلدان األوروبية"،

استخدامها بأي طريقة معينة، "ويجب أن تكون حرة لالستخدام، ولكن ذلك ال يعني أن تكون حرة للوصول إليها"، عادة توزيعها، حتى و"حال حصول المستخدمين على البيانات فإن لهم الحري عادة استخدامها، وا ة في استخدامها، وا

يجب أن تكون البيانات مفتوحة بصورة -1ويقول البنك الدولي أن للبيانات المفتوحة بعدين اثنين: "30بشكل تجاري".يا. قانونية، مما يعين أن من الواجب إدراجها ضمن الملكية العامة أو تحت شروط متساهلة لالستخدام مع قيود دن

Page 15: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

يجب أن تكون البيانات مفتوحة تقنيًا، وهو ما يعني أنها يجب أن تكون منشورة بصيغ إلكترونية يمكن أن تقرأها -2اآلالت، ومن األفضل أال تكون خاضعة لحقوق الملكية، بحيث يستطيع أي شخص الوصول إليها واستخدامها

تكون البيانات متاحة للعامة على مخدِّم عام دون باستعمال أدوات برمجية شائعة ومتاحة بحرية. ومن الواجب أن 31قيود كلمات المرور أو جدران الحماية".

وتتيح تراخيص المصدر المفتوح لمجتمع من 32نشأ مفهوم المصدر المفتوح من ميدان البرمجة الحاسوبية. المصدر المفتوحتهدف إلى تشجيع التدفق الحر المستخدمين الوصول إلى مواد، وأدوات، ومنصات المصدر في ظل شروط

للمعلومات، والتعاون، واالبتكار. كما أن بعض التراخيص تتطلب اقتسام االبتكارات الناجمة عن استخدامها مع 33المجتمع.

في سياق المنشورات العلمية فإن الوصول العام يشير إلى نشر النتائج العلمية، والسيما المخطوطات العلمية، في الوصول العامستودعات يمكن للعامة الوصول إليها. وغالبًا ما يكون هذا الوصول مجانيًا أو بتكلفة زهيدة ويخضع عمومًا لحقوق م

النشر )في ظل مبدأ االستخدام العادل(. وعلى سبيل المثال فإن سياسة الوصول العام المعتمدة في المؤسسات لون من المؤسسة الصحية الوطنية، أو من ينوب عنهم، الصحية الوطنية األمريكية تشترط "أن يقوم المحققون الممو

بتقديم نسخة إلكترونية من مخطوطاتهم المراجعة من األقران حال قبولها للنشر، على أن تُتاح للعامة في موعد شهرًا بعد التاريخ الرسمي للنشر: شريطة أن تقوم المؤسسة الصحية الوطنية بتنفيذ سياسة الوصول العام 12أقصاه

34يقة تتسق مع قانون حقوق النشر".بطر

يمكن وصف "قاعدة بيانات الوصول العام" على أنها قاعدة بيانات متاحة للعامة "حيث يمكن للمستخدم الوصول 35قواعد بيانات الوصول العامالوصول إلى البيانات بعد التسجيل والقبول الصريح باتفاق للوصول إلى البيانات واستخدامها. وبعد التسجيل يتطلب

وقاعدة بيانات ذات اتفاق للوصول إلى البيانات "توفر عددًا من "تدابير الحماية" األساسية 36إجراء طلب الدخول؛ 38وقاعدة بيانات ذات "تحديد لهوية المساهمين والمستخدمين".37والضمانات للمساهمين بالبيانات"؛

المفهوم أن "الملكية العامة" تعني "المواد المعنوية غير الخاضعة لحقوق في سياق حقوق الملكية الفكرية فإن من الملكية العامة 39الملكية الفكرية الخالصة والمتاحة، لذلك، بحرية لالستخدام أو االنتفاع من جانب أي شخص".

قاعدة البيانات ذات الملكية 40العامة

متاحة للعموم وتسمح "بالوصول الحر يمكن وصف "قاعدة البيانات ذات الملكية العامة" على أنها قاعدة بياناتوقاعدة بيانات "ال تتطلب اتفاقًا للوصول إلى البيانات أو 41وغير المعاق إلى معلومات المتواليات الرقمية"؛

43وقاعدة بيانات "ذات وصول ُمغف ل".42استخدامها، وال تسجياًل أو طلبًا للدخول"؛

ت الملكية العامة" هي ملكية عامة )غير خاضعة لحقوق وفي حين أن بعض المتواليات في "قواعد البيانات ذاالملكية الفكرية الخالصة(، فإن الكثير منها ُيدعَّى أنه جزء من براءة اختراع ممنوحة أو تطبيقات براءة اختراع

44منشورة وهي ليست ضمن الملكية العامة.

على مؤسسة وليست محصورة بفئة أو مجموعة من المستخدمين. تقتصروال متاحة للجميع: ليست خاصة، متاحة للعامة

.قاعدة بيانات متاحة للجميع، بما في ذلك المجتمع العلمي، وصنَّاع السياسات، والجمهور العام قاعدة بيانات متاحة للعامة

جراءات للتسجيل والتفويض، أو شروط وأحكام، ولكنها وقد يكون لقواعد البيانات المتاحة للعامة آليات للوصول، وا وال تقتصر على مؤسسة وليست محصورة بفئة أو مجموعة من المستخدمين. ليست خاصة،

Page 16: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

1 PIP Framework Advisory Group Technical Expert Working Group (TEWG) on genetic sequence data. Final Report to the PIP

Advisory Group. Geneva: World Health Organization; 2014, p.10-11 (http://www.who.int/influenza/pip/advisory group/PIP AG Rev Final TEWG Report 10 Oct 2014.pdf 2 Rigden DJ and Fernandez XM, The 2018 Nucleic Acids Research database issue and the online molecular biology database

collection, Nucleic Acids Research, available at https://academic.oup.com/nar/article/46/D1/D1/4781210 3

يمكن الوصول إلى الموقع الشبكي لهذه المبادرة على العنوان التالي: http://www.insdc.org/. 4

نظام التأهب لألنفلونزا الجائحة من أجل تبادل فيروسات األنفلونزا من النمط " 5، الفرع اإلطار الخاص بالتأهب لألنفلونزا الجائحة H5N1 وفيروسات األنفلونزا

". النص متاح في العنوان الشبكي: األخرى التي قد تسبب جائحة بشرية http://www.who.int/influenza/resources/pip_framework/en/ . 5

.5-، االختصاص األساسي باءالمراكز المتعاونة مع منظمة الصحة العالميةاختصاصات " 5، الملحق اإلطار الخاص بالتأهب لألنفلونزا الجائحة 6

المبادئ التوجيهية لوضع اختصاصات المختبرات الراهنة والمستقبلية المحتملة التابعة لشبكة المنظمة المعنية " 4، الملحق الجائحةاإلطار الخاص بالتأهب لألنفلونزا

H5N1بالفيروس .9"، المبدأ وسائر فيروسات األنفلونزا الجائحة البشرية 7 Zou et al., Biological Databases for Human Research, Genomics, Proteomics and Bioinformatics, available at

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/#b0005 8

المرجع السابق. 9

لالطالع على أمثلة عن الشروط واألحكام انظر: PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal Characteristics of an influenza genetic sequence data sharing system under the PIP Framework, 22 June 2016, Annex 4, available at http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 10

ستعتمد الحقوق القانونية األخرى بشأن البيانات على االلتزامات الدولية، والتشريعات الوطنية، والحقوق التعاقدية المسبقة األخرى. 11

Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on Biological Diversity and the Nagoya Protocol, par. 38 and 191, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 12

From Scoping Paper on approaches to seasonal influenza and genetic sequence data under the PIP Framework, p. 19: “In most jurisdictions, naturally-occurring influenza GSD would not be considered patentable subject matter. However, innovations from the development of influenza-related products could be protected if patentability requirements are met (these are generally: novelty; patentability of the subject-matter; and an inventive step). There are therefore a number of sequences in publicly-accessible databases that are claimed as part of patents.” However, “the early, open publication of the gene sequence of a newly-isolated strain of an influenza virus (before IP protection is granted) would directly preclude obtaining patent protection for the genes as published because the gene sequence would be considered non-novel.” (at http://www.who.int/influenza/pip/scopingpaper.pdf); See also: WIPO Patent issues related to influenza viruses and their genes: working paper. World Intellectual Property Organization. Geneva: WIPO; 2007, p.19-20, available at http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf ; WIPO Patent search report on pandemic influenza preparedness (PIP) –related patents and patent applications. World Intellectual Property Organization. Geneva: WIPO; 2011, available at http://www.wipo.int/export/sites/www/policy/en/global health/pdf/report influenza 2011.pdf , accessed 15 October 2017; [PIP Framework Advisory Group Technical Expert Working Group (TEWG) on genetic sequence data. Final Report to the PIP Advisory Group. Geneva: World Health Organization; 2014, p.8-10 available at http://www.who.int/influenza/pip/advisory group/PIP AG Rev Final TEWG Report 10 Oct 2014.pdf . 13

انظر مثالً: : “The GenBank database is designed to provide and encourage access within the scientific community to the most up-to-date and comprehensive DNA sequence information. Therefore, NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank.” (GenBank overview, GenBank Data Usage, available at https://www.ncbi.nlm.nih.gov/genbank/) 14

أعاله. 11انظر الحاشية 15

أعاله. 11انظر الحاشية 16

Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on Biological Diversity and the Nagoya Protocol, par. 29, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf ; See for example GISAID Database Access Agreement: “2. License Terms. You are hereby granted a non-exclusive, worldwide, royalty-free, non-transferable and revocable license to access and use the GISAID EpiFlu™ Database and Data solely in accordance with this Agreement in all its terms. Without limiting the foregoing, your access to and use of the GISAID EpiFlu™ Database and Data is subject to the following terms and conditions: a. Use of Any Data Provided by You. You hereby grant (i) GISAID and (ii) all users and Data providers that have agreed to be bound by the GISAID EpiFlu™ Database Access Agreement and that continue to abide by its terms (collectively "Authorized Users") a non-exclusive, worldwide, royalty-free, and irrevocable license to collect, store, reproduce, access, modify, display,

Page 17: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

distribute, coordinate, arrange, and otherwise use the Data submitted by You as contemplated by this Agreement. This Agreement does not transfer any other rights or ownership interests in the Data.” (GISAID EpiFlu™ Database Access Agreement, Effective: March 16, 2011, available at https://www.gisaid.org/registration/terms-of-use/); See also for example in the field human genomics, UK Biobank Material Transfer Agreement for data and/or samples, 20 August 2012, section 3, available at http://www.ukbiobank.ac.uk/wp-content/uploads/2012/09/Material-Transfer-Agreement.pdf. 17

المرجع السابق GISAID Database Access Agreement, section 2, para. G. 18

المرجع السابق 19

انظر مثالً: GISAID EpiFlu™ Database Access Agreement: “g. Intellectual Property. “You acknowledge and agree that: (i) It is your sole responsibility to obtain any additional authorization or license as may be necessary for your use of the Data.” (GISAID EpiFlu™ Database Access Agreement, Effective: March 16, 2011, available at https://www.gisaid.org/registration/terms-of-use/) 20

الوصول إلى البيانات ولم يتم تعليق حقوقهم أو إنهاؤها.المستخدمون المرخص لهم هم عادة أولئك الذين وافقوا على اتفاق 21

“Generally speaking, genetic information that is published without confidentiality constraints on access would be considered non-novel. This does not mean that the information must be available free of charge – genetic information available only on a paid-subscription database would still be considered sufficiently public to preclude novelty and hence patentability – provided those accessing the data were not bound by confidentiality obligations regarding the data.” (see WIPO Patent issues related to influenza viruses and their genes: working paper. World Intellectual Property Organization. Geneva: WIPO; 2007, p.19, available at http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf) 22

U.S. Submission on Peer Review of Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources, 1 December 2017, available at https://www.cbd.int/abs/DSI-peer/USA.pdf.; see also WHO, Options to monitor the use of genetic sequence data from influenza viruses with human pandemic potential, 6 May 2016, p.8, available at http://www.who.int/influenza/pip/advisory group/gsdoptionspaper revised.pdf?ua=1 23

انظر: WHO policy on open access at http://www.who.int/about/policy/en/ and Dye C et al., Data sharing in public health emergencies: a call to researchers, Bulletin of the World Health Organization 2016;94:158. doi: http://dx.doi.org/10.2471/BLT.16.170860 24

مبادرة بودابست لالنتفاع الحر ]موقع شبكي[ في العنوان التالي: http://www.budapestopenaccessinitiative.org/.. 25

انظر: Max Plank Society, Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 22 October 2013, available at https://openaccess.mpg.de/Berlin-Declaration and Howard Hughes Medical Institute, Bethesda Statement on Open Access Publishing, 20 June 2003, available at http://legacy.earlham.edu/~peters/fos/bethesda.htm; See also Chan L et al., Budapest Open Access Initiative, 14 February 2002, available at http://www.budapestopenaccessinitiative.org/boai-10-recommendations. 26

Chignard, S., A brief history of Open Data, Paris Innovation Review, 23 March 2013, available at http://parisinnovationreview.com/articles-en/a-brief-history-of-open-data. 27

The World Bank, Open Data in 60 seconds [website] at http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html. 28

Open Knowledge International, The Open Definition, http://opendefinition.org/. The full definition is available at http://opendefinition.org/od/2.1/en/. 29

European Data Portal, Our activities [website] at https://www.europeandataportal.eu/en/what-we-do/our-activities 30

European Data Portal, What is Open data? [website] at https://www.europeandataportal.eu/elearning/en/module1/#/id/co-01 31

The World Bank, Open Data defined [website] at http://opendatatoolkit.worldbank.org/en/essentials.html 32

( هو سلسلة من المعايير التي أرستها مبادرة المصدر المفتوح 1998إن تعريف المصدر المفتوح ) (OSI) لتحديد ماهية ترخيص المصدر المفتوح. ويمكن االطالع

. https://opensource.org/osdعلى التعريف في العنوان الشبكي التالي: 33

Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on Biological Diversity and the Nagoya Protocol, par. 28, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 34

Division G, Title II, Section 218 of PL 110-161 (Consolidated Appropriations Act, 2008), sec. 218 35

.اإلطار الخاص بالتأهب لألنفلونزا الجائحةمن 2-5لنحو المشار إليه في الفرع على ا 36

PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal Characteristics of an influenza genetic sequence data sharing system under the PIP Framework, 22 June 2016, available at http://www.who.int/influenza/pip/advisory group/twg doc.pdf 37

Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's innovative contribution to global health” Global Challenges, 10 January 2017, available at http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full.

Page 18: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

38

Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on Biological Diversity and the Nagoya Protocol, par. 193, available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 39

World Intellectual Property Organization (WIPO), Intergovernmental Committee on Intellectual Property and Genetic Resources, Traditional Knowledge and Folklore, Note on the Meanings of the Term “Public Domain” in the Intellectual Property System with special reference to the Protection of Traditional Knowledge and Traditional Cultural Expressions/Expressions of Folklore, 24 November 2010, WIPO/GRTKF/IC/17/INF/8, available at http://www.wipo.int/edocs/mdocs/tk/en/wipo grtkf ic 17/wipo grtkf ic 17 inf 8.doc 40

من اإلطار الخاص بالتأهب لألنفلونزا الجائحة. 2-5في الفرع على النحو المشار إليه 41

Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources in the Context of the Convention on Biological Diversity and the Nagoya Protocol, par.38-191 , available at https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 42

PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data, Optimal Characteristics of an influenza genetic sequence data sharing system under the PIP Framework, 22 June 2016, available at http://www.who.int/influenza/pip/advisory group/twg doc.pdf 43

Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's innovative contribution to global health” Global Challenges, 10 January 2017, available at http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full 44

U.S. Submission on Peer Review of Fact-Finding and Scoping Study on Digital Sequence Information on Genetic Resources, 1 December 2017, available at https://www.cbd.int/abs/DSI-peer/USA.pdf.

Page 19: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2018 年 4 月 3 日

第 1 版

第1 页

实况报道——基因序列数据和数据库

背景

基因序列数据

有机体的构成和功能都由遗传密码决

定。密码包含在人、动物和植物细胞以及

细菌和病毒等微生物的脱氧核糖核酸分子

中。脱氧核糖核酸有四个基本组成单位:C

(胞嘧啶)、G(鸟嘌呤)、A(腺嘌呤)

和 T(胸腺嘧啶)。每种生物体的核苷酸均

按特定顺序排列,构成其遗传密码。细胞

“读取”密码之后产生核糖核酸—也是一种由

核苷酸 A(腺嘌呤)、C(胞嘧啶)、G

(鸟嘌呤)和 U(尿嘧啶)编码的遗传信

息,然后产生负责活生物体所有结构和功

能的蛋白质。

脱氧核糖核酸和核糖核酸中核苷酸的

排列顺序(即序列)至关重要,因为基因

序列中包含有关生物体结构和具体特性的

信息。以病毒为例,这就包括有关致病

性、可传播性以及对抗病毒药物易感性的

信息。实验室可以利用测序技术确定特定

生物体的基因序列。这一过程产生的数据

被称为基因序列数据,其表现形式是核苷

酸排列的顺序(例如一个核糖核酸序列可

能 看 起 来 是 这 个 样 子 的 :

AGAAAUGAAAUGGCUCCUGUCAA)。

流感基因序列数据的提供者和使用者

流感病毒基因序列数据的主要提供者

是全球流感监测和应对系统实验室。其它

提供者还包括国家公共卫生实验室及可能

开展流感病毒基因排序的公立和私营实验

室。测序实验室可以把基因序列数据上传

到一个或多个数据库1。

全球流感监测和应对实验室、学术界

和企业是流感基因序列数据的主要使用

者。他们一般利用该数据:进行风险评估

和监测流感病毒的出现和演变;开发诊断

制剂;产生候选疫苗病毒;生产新型疫

苗,例如重组疫苗和使用合成候选疫苗病

毒的疫苗。

基因序列数据库

基因序列数据库接收和代管提供给他

们的基因序列数据并提供访问权限。大部

分数据库还提供与序列有关的重要额外上

下文信息,增补有关提取标本的患者/动物

/其它来源信息,从而丰富序列数据。该额

外信息即所谓的“元数据”。

托管流感基因序列数据的主要数据库

全世界有 1700 多个分子生物学数据库2,其中包含流感基因序列数据的至少有六

个。它们是:

• 全球共享禽流感数据倡议组织数

据 库 ( GISAID EpifluTM ) :

https://www.gisaid.org/

• 流 感 研 究 数 据 库 :

https://www.fludb.org/brc/home.spg

?decorator=influenza

• 开 放 流 感 数 据 库 ( Openflu

database ) : http://openflu.vital-

it.ch/browse.php

• 还有三个构成国际核苷酸序列数

据库合作组织的数据库3:

o 基因库(GenBank):

https://www.ncbi.nlm.nih.

gov/genbank/

o 欧 洲 核 苷 酸 档 案 :

https://www.ebi.ac.uk/ena

o 日本脱氧核糖核酸数据

库 :

http://www.ddbj.nig.ac.jp/

Page 20: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2018 年 4 月 3 日

第 1 版

第2 页

大流行性流感防范框架下的基因序列数

据和数据库

大流行性流感防范生物材料定义中不

包括基因序列数据。基因序列的定义在第

4.2 节:“‘基因序列’系指在脱氧核糖核

酸或核糖核酸分子中存在的核苷酸序列。

它们含有确定生物或病毒的生物学特性的

基因信息。”此外,大流行性流感防范框

架还数次提及基因序列数据和数据库:

• 5.2.1 应迅速、及时和系统地与来

源实验室并在世卫组织全球流感

监测和应对系统实验室之间分享

与 H5N1 病毒及其它可能引起人

间大流行的流感病毒有关的基因

序列数据和源于此数据的分析结

果。

• 5.2.2 认识到加强流感病毒基因序

列数据的透明度和可及性对于公

共卫生至关重要,并且目前正努

力使用诸如基因库等公共领域数

据库,或全球共享禽流感数据倡

议组织数据库等公共获取数据库。

• 5.2.3 认识到在某些情况下,提供

病毒的国家认为公布基因序列数

据是个敏感问题。

• 5.2.4 会员国要求总干事与咨询小

组协商,确定进一步讨论和解决

与处理 H5N1 病毒及其它可能引

起人间大流行的流感病毒基因序

列数据有关问题的最佳程序,作

为大流行性流感防范框架的一部

分4。

大流行性流感防范框架也列出与基

因序列数据有关的一些预期:

• 附件 5:世卫组织合作中心职权范

围,第 B.5 节:世卫组织合作中

心“及时在一个可公开进入的数

据库上载现有的血凝素、神经氨

酸酶以及甲型 H5 和可能引起大流

行的其它流感病毒的其它基因序

列,不得迟于序列分析完成后三

个月,除非提供临床标本和/或病

毒的实验室或国家另有指示(指

导原则 9)”5。

• 附件 4:指导原则 9:“世卫组织

全球流感监测和应对系统实验室

将根据标准材料转让协议及时将

基因序列数据提交全球共享禽流

感数据倡议组织数据库和基因库

或类似数据库” 6。

基因序列数据库的主要特征

如下表所示,基因序列数据库各不相

同,主要差别因素包括:

• 数据涵盖范围

• 数据管护和分析水平

• 数据库访问

• 访问和使用数据的条款和条件

• 知识产权及其它对数据的法律权

数据库根据自身宗旨以及数据提供者

和所服务的数据用户需求处理这些因素。

下表从总体上介绍现有数据库采取的主要

方法。

Page 21: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 22: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

工作文件

2018 年 4 月 3 日

第4页

词汇表

本词汇表提供数据访问和数据库语境下常用术语的定义。本表内容不求全面,因为新术语总会

出现,而定义也会演变。词汇表中提供的定义均为常用定义,但不一定已得到普遍接受。因此,有

些术语在不同语境下的用法可能有所不同。

数据访问协议 (又称“数据库访问

协议”或“数据使用

协议”)

数据访问协议是是数据库用户(包括数据提供者和数据使用者)与数据库(数据保

管者)之间的合同,内容一般是访问和使用数据库所代管数据的条款和条件。这些

条款和条件可能包括:访问、使用和再次使用数据的条件;数据的进一步分发;署

名及与数据提供者的合作;数据的知识产权、商业化和许可权;访问的暂停和终

止。

开放获取23 随着越来越多的人要求不受限制地免费访问学术研究数据,“开放获取”概念应运

而生24。根据《关于自然科学与人文科学知识开放获取的柏林宣言》和《贝塞斯达开

放存取出版声明》,供开放获取的材料应满足两个条件。《柏林宣言》指出:

1. 作者和版权持有人给所有用户免费、不可撤销、全球范围的访问权,并授权其在

恰当署名(将继续以社区标准为执行适当署名和负责任使用出版作品的机制)的

情况下在任何数字媒体上为负责任目的复制、使用、分发、传播和公开展该作品

及创作和发布衍生作品以及制作少量供个人使用的印刷副本。

2. 以适当标准电子格式存储的作品和所有补充材料的完整版本(包括上述被许可的

副本)应存储(从而发表)在至少一种采用适当技术标准(例如开放档案定义)

的在线资源库。该在线资源库由努力促进开放获取、不受限制发布,互操作性和

长期存档的学术机构、学术团体、政府机构或其他成熟组织支持和维护25。

开放数据 “开放数据”是一个相对较新的术语。但“开放数据”背后的概念在互联网发明出

来之前就已经存在,它来自知识是一种共同利益26以及“政府实体惯常收集的大量信

息应提供给所有公民”27的信念。

“开放知识国际”组织认为,“开放数据”是指可以“由任何人为任何目的使用、

修改和分享”的数据28。例如,欧洲数据门户网站用户可以获取“欧洲各国公共数据

门户网站上可以获得的公共部门信息元数据” 29,该门户网站认为,“[开放数据]不

限制以任何特定方式使用数据”,“[它]必须是自由使用的,但这并不意味着自由

访问”,“一旦用户有了数据,他们就可以自由地使用、重复使用和再次分发,甚

至包括从商业上这样做”30。世界银行认为,开放数据有两个维度,“1.数据必须在

法律上是开放的,也就是说,数据必须置于公共领域之中或是遵循只有最少限制的

自由使用条款。2.数据必须从技术上是开放的,也就是说,其发表方式必须是机器可

读的电子格式,且最好是非专有的,使所有人都能使用常见的免费软件工具访问和

利用该数据。数据还必须可公开获得,能够在公共服务器上访问到,而且无需密

码,没有防火墙限制”31。

开源 开源的概念来自计算机编程领域32。开源许可协议允许使用者根据旨在鼓励信息自由

流动、协作和创新的条款访问源材料、工具和平台。开源许可协议通常要求不对相

关材料、工具或平台主张知识产权。一些许可协议还要求源于利用开源材料、工具

或平台的创新也与社群共享33。

公共获取 在科学出版语境中,公共获取是指将科学研究结果(特别是科学手稿)发表在公众

可以访问的存档处。这种获取通常费用很低或是没有费用,但一般(根据公平使用

原则)受版权规限。例如,美国国立卫生研究院的公共获取政策要求“所有由国立

卫生研究院资助的研究人员向美国国家医学图书馆公共医学中心提交其经同行评议

即将发表的最终手稿的电子版,并且在不晚于正式发表日期之后 12 个月内向公众提

供;条件是,国立卫生研究院将以与版权法一致的方式实施公共获取政策”34。

Page 23: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

工作文件

2018 年 4 月 3 日

第5页

公共获取数据库35 公共获取数据库可以描述为“在用户注册并明示接受数据访问和使用协议后即提供数

据访问权限”的可公开访问的数据库。“注册后,需要通过登录程序访问数据”36;

有数据访问协议的数据库“向数据提供者提供一系列关键‘保护’和‘保证’”37;

属于“知道贡献者和使用者是谁”的数据库38。

公共领域 在知识产权语境下,公共领域意味着“不受排他性知识产权权利规限因而可以被任

何人自由获得、使用或利用的无形材料”39。

公共领域数据库40 公共领域数据库可以描述为允许“不受妨碍地自由访问数字序列信息”的可公开访

问的数据库41;这种数据库“不要求签署数据访问或使用协议,也不需要注册或登

录” 42;属于“匿名访问”43的数据库。

虽然一些“公共领域数据库”的数据序列属于公共领域(不受排他性知识产权权利

规限),但也有许多属于已批准专利或已发表专利应用的一部分,因而不属于公共

领域44。

可公开访问 所有人均可访问;不是私有的,不受限于一个机构,也不受限于一类或一组使用

者。

可公开访问的数据库 所有人包括(科学界、决策者和一般公众)均可访问的数据库。

可公开访问的数据库可能有自己的访问机制、注册和授权程序或是条款和条件,但

不是私有的,不受限于一个机构,也不受限于一类或一组使用者。

1 大流行性流感防范框架咨询小组基因序列数据问题技术专家工作小组。提交大流行性流感防范框架咨询小组的最后报告。日内瓦:世

界卫生组织;2014年,第 10-11 页(http://www.who.int/influenza/pip/advisory group/PIP AG Rev Final TEWG Report 10 Oct 2014.pdf)。 2 Rigden DJ 和 Fernandez XM,2018 年核酸研究数据库问题和在线分子生物学数据库集锦,《核酸研究》,可由 https://academic.oup.com/

nar/article/46/D1/D1/4781210 获取。 3 国际核苷酸序列数据库合作组织网站地址如下:http://www.insdc.org/。 4 大流行性流感防范框架第 5 节“促进共享 H5N1 和其它可能引起人间大流行的流感病毒的大流行性流感防范框架”。文本可由 http://www.

who.int/influenza/resources/pip framework/en/获取。 5 大流行性流感防范框架附件 5“世卫组织合作中心的职权范围”,核心职权范围 8.5。 6 大流行性流感防范框架附件 4“为确定现有的和今后可能设立的 H5N1 以及其它人间大流行性流感病毒世卫组织全球流感监测和应对系

统实验室的职权范围而制定的指导原则”,第 9条原则。 7 Zou 等,供人类研究用的生物数据库,《基因组蛋白质组与生物信息学报》,可由 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/

#b0005获取。 8 同上。 9 见大流行性流感防范框架咨询小组基因序列数据问题技术专家工作小组条款和条件示例,大流行性流感防范框架下流感基因序列数据

共享系统的优化特征,2016 年 6月 22 日,附件 4,可由 http://www.who.int/influenza/pip/advisory group/twg doc.pdf 获取。 10 其它对数据的法律权利将取决于国际义务、国家立法和其它在先合同权利。 11 Laid SA和 Wynberg RP,《生物多样性公约》和《名古屋议定书》语境下遗传资源相关数字序列信息事实发现与范围界定研究,第 38

和 191 段,可由 https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 获取。 12 来自“关于大流行性流感防范框架下季节性流感和基因序列数据处理方法的范围界定论文”,第 19 页:“在大多数管辖区,天然发生

的流感基因序列数据不被认为属于可以取得专利权的主题事项。但是,如果开发流感相关产品领域的创新满足可授予专利权的要求(一

般是:新颖性;属于可专利性主题事项;发明性步骤),那么这些创新就可以得到保护。因此,可公开访问数据库中存有一些被主张为

专利一部分的序列。”但是,“(在授予知识产权保护之前)流感病毒新分离株的基因序列的公开发表将直接排除为所发表基因获得专

利保护,因为基因序列被认为不具有新颖性。”(http://www.who.int/influenza/pip/scopingpaper.pdf);另见世界知识产权组织与流感病毒

及其基因有关的专利问题:工作文件。世界知识产权组织。日内瓦:世界知识产权组织;2007,第 19-20 页,可由 http://apps.who.int/me

dicinedocs/documents/s21417en/s21417en.pdf 获取;世界知识产权组织有关大流行性流感防范的专利检索报告—相关专利和专利应用。世

界知识产权组织。日内瓦:世界知识产权组织;2011 年,可由 http://www.wipo.int/export/sites/www/policy/en/global health/pdf/report influ

enza_2011.pdf 获取,2017 年 10 月 15 日访问;大流行性流感防范框架咨询小组基因序列数据问题技术专家工作小组。提交大流行性流感

防范框架咨询小组的最后报告。日内瓦:世界卫生组织;2014 年,第 8-10 页,可由 http://www.who.int/influenza/pip/advisory group/PIP AG

Rev Final TEWG Report 10 Oct 2014.pdf获取。 13 例如:“基因库旨在提供和鼓励科学界内部访问最新和最全面脱氧核糖核酸序列信息。因此,美国国家生物技术信息中心(NCBI)不

限制基因库数据的使用或分发。但是,一些提交者可能对自己提交的全部或部分数据声索专利权、版权或其他知识产权权利。美国国家

生物技术信息中心不适合评估此类声索的有效性,因此不能评论或不受限制地许可基因库所含信息的使用、版权或分发提供。”(基因

库概述,基因库数据的使用,可由 https://www.ncbi.nlm.nih.gov/genbank/获取。) 14 见上文尾注 11。 15 见上文尾注 11。

Page 24: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

工作文件

2018 年 4 月 3 日

第6页

16 Laid SA和 Wynberg RP,《生物多样性公约》和《名古屋议定书》语境下遗传资源相关数字序列信息事实发现与范围界定研究,第 29

段,可由 https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 获取;另见全球共享禽流感数据倡议

组织数据库访问协议:“2.许可条件。根据本协议及其全部条款,您被授予非排他性的在世界范围内不可转让、可撤销的访问和使用全

球共享禽流感数据倡议组织数据库和数据的许可”。在不限制前述内容的情况下,您对全球共享禽流感数据倡议组织数据库和数据的访

问和使用受以下条款和条件的规限:

a. 使用任何您提供的数据。您在此授予全球共享禽流感数据倡议组织及其所有已经同意受本组织数据库访问协议约束且继续遵守其条款

用户和数据提供者(统称“授权用户”)按本协议设想收集、存储、复制、访问、修改、展示、分发、协调、安排和以其它方式使用 您

提交数据在全世界范围内非排他性和免版税的不可撤销许可。本协议不涉及转让数据中任何其它权利或所有者利益。(全球共享禽流感

数据倡议组织数据库《数据库访问协议》,自 2011 年 3月 16 日起生效,可由 https://www.gisaid.org/registration/terms-of-use/获取)。

另见英国生物库材料转让协议数据和样本部分野外人类基因组学的例子,2012 年 8 月 20 日,第 3 节,可由 http://www.ukbiobank.ac.uk/

wp-content/uploads/2012/09/Material-Transfer-Agreement.pdf 获取。 16 G部分,主题 2,PL 110-161 第 218 节(2008 年综合拨款法案),第 218 节。 17 同上。全球共享禽流感数据倡议组织第 2部分 g段。 18 同上。 19 例如全球共享禽流感数据倡议组织数据库《数据库访问协议》:“g. 知识产权。“你承认并同意:(1)你单独承担获得使用数据可能需

要的任何其它授权或许可的责任。”(全球共享禽流感数据倡议组织数据库《数据库访问协议》,自 2011 年 3 月 16 日期生效,可由

https://www.gisaid.org/registration/terms-of-use/获取)。 20 授权用户一般是那些已同意《数据库访问协议》且其权利未被暂停或终止的用户。 21 “一般而言,发表时对访问未设保密限制的基因信息会被认为不具有新颖性。这并不意味着该信息必须免费提供,仅可在付费订阅数

据库获得的基因信息仍被认为具备足够公共性,因而排除新颖性和可专利性,只要访问数据不被有关数据的保密义务所约束。”(见世

界知识产权组织与流感病毒及其基因有关的专利问题工作文件。世界知识产权组织。日内瓦:世界知识产权组织;2007 年,第 19 页,

可由 http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf 获取。) 22 美国关于遗传资源相关数字序列信息事实发现与范围界定研究同行评议的意见,2017 年 12 月 1 日,可由 https://www.cbd.int/abs/DSI-

peer/USA.pdf 获取;另见世卫组织,来自可能导致人间大流行的流感病毒的基因序列数据之使用进行监测的方案,2016 年 5 月 6 日,第

8 页,可由 http://www.who.int/influenza/pip/advisory group/gsdoptionspaper revised.pdf?ua=1 获取。 23 见世卫组织的开放获取政策,http://www.who.int/about/policy/en/以及 Dye C 等,突发公共卫生事件中的数据共享:对研究人员的呼吁,

世界卫生组织 2016 年简报;94:158. doi: http://dx.doi.org/10.2471/BLT.16.170860。 24 布达佩斯开放获取倡议[网站]:http://www.budapestopenaccessinitiative.org/。 25 见马克斯·普朗克学会,《关于自然科学与人文科学知识开放获取的柏林宣言》,2013 年 10 月 22 日,可由 https://openaccess.mpg.de/

Berlin-Declaration 获取,以及霍华德·休斯医学研究所《贝塞斯达开放存取出版声明》,2003 年 6 月 20日,可由 http://legacy.earlham.edu/

~peters/fos/bethesda.htm获取;另见 Chan L等,《布达佩斯开放获取倡议》,2002年 2月 14 日,可由 http://www.budapestopenaccessinitia

tive.org/boai-10-recommendations 获取。 26 Chignard, S.,开放数据简史,《巴黎创新评论》,2013 年 3 月 23 日,可由 http://parisinnovationreview.com/articles-en/a-brief-history-of-

open-data 获取。 27 世界银行,60 秒了解开放数据 [网站]:http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds html。 28 “开放知识国际”组织,开放的定义, http://opendefinition.org/。全部定义可由 http://opendefinition.org/od/2.1/en/获取。 29 欧洲数据门户网站,我们的活动 [网站]:https://www.europeandataportal.eu/en/what-we-do/our-activities。 30 欧洲数据门户网站,什么是开放数据?[网站]:https://www.europeandataportal.eu/elearning/en/module1/#/id/co-01。 31 世界银行,定义开放数据[网站]: http://opendatatoolkit.worldbank.org/en/essentials.html。 32 《开源定义》(1998 年)是开源倡议(OSI)建立的用于确定什么是开源许可的一系列标准。定义可在如下网站找到: https://opensource.

org/osd。 33 Laid SA和 Wynberg RP,《生物多样性公约》和《名古屋议定书》语境下遗传资源相关数字序列信息事实发现与范围界定研究,第 29

段,可由 https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 获取。 34 G部分,主题 2, PL 110-161 第 218 节(2008 年综合拨款法案),第 218 节。 35 如大流行性流感防范框架第 5.2 节所及。 36 大流行性流感防范框架咨询小组基因序列数据问题技术专家工作小组,大流行性流感防范框架下流感基因序列数据共享系统的最佳特

征,2016年 6月 22 日,可由 http://www.who.int/influenza/pip/advisory group/twg doc.pdf 获取。 37 Elbe S 和 Buckland-Merrett G,“数据、疾病和外交:全球共享禽流感数据倡议组织对全球卫生的创新共享”,《全球挑战》,2017 年

1 月 20 日,可由 http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full 获取。 38 Laid SA 和 Wynberg RP,《生物多样性公约》和《名古屋议定书》语境下遗传资源相关数字序列信息事实发现与范围界定研究,第

193 段,可由 https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 获取。 39 世界知识产权组织,知识产权和基因资源及传统知识和民间创作问题政府间委员会,关于知识产权体系中“公共领域”一词的意义的

说明,其中特别关注保护传统知识和传统文化表达,2010 年 11 月 24日,WIPO/GRTKF/IC/17/INF/8,可由 http://www.wipo.int/edocs/mdocs/

tk/en/wipo_grtkf_ic_17/wipo_grtkf_ic_17_inf_8.doc获取。 40 如大流行性流感防范框架第 5.2 节所及。 41 Laid SA和 Wynberg RP,《生物多样性公约》和《名古屋议定书》语境下遗传资源相关数字序列信息事实发现与范围界定研究,第 38-

191 段,可由 https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf 获取。 42 大流行性流感防范框架咨询小组基因序列数据问题技术专家工作小组,大流行性流感防范框架下流感基因序列数据共享系统的最佳特

征,2016年 6月 22 日,可由 http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 获取。 43 Elbe S 和 Buckland-Merrett G,“数据、疾病和外交:全球共享禽流感数据倡议组织对全球卫生的创新共享”,《全球挑战》,2017 年

1 月 20 日,可由 http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full 获取。 44 美国关于遗传资源相关数字序列信息事实发现与范围界定研究同行评议的意见,2017 年 12 月 1 日,可由 https://www.cbd.int/abs/DSI-

peer/USA.pdf 获取。

Page 25: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

3 April 2018 Version 1

1

Aide-mémoire

Données et bases de données de séquences génétiques

Considérations générales Données de séquences génétiques (DSG) Le code génétique détermine la construction et les fonctions des organismes. Ce code est contenu dans les molécules d’ADN présentes dans les cellules humaines, animales et végétales, ainsi que dans les micro-organismes comme les bactéries et les virus. L’ADN comprend quatre composants, ou blocs de construction, appelés C (pour cytosine), G (pour guanine), A (pour adénine) et T (pour thymine). Ces nucléotides s’alignent dans un ordre particulier pour chaque organisme, composant ainsi le code génétique. Ce code peut être « lu » par la cellule pour produire de l’ARN – qui constitue également un type d’information génétique, encodé par les nucléotides A (adénine), C (cytosine), G (guanine) et U (uracile) – et qui, à son tour, produit des protéines responsables de l’ensemble de la structure et du fonctionnement d’un organisme vivant.

L’ordre de présentation des nucléotides dans l’ADN et l’ARN – c’est-à-dire, la séquence – est déterminant car les séquences génétiques contiennent l’information relative à la structure et aux propriétés spécifiques d’un organisme. Dans le cas des virus, ces caractéristiques incluent la pathogénicité, la transmissibilité et la sensibilité aux médicaments antiviraux. Les laboratoires sont capables de déterminer la séquence génétique d’un organisme particulier au moyen de technologies de séquençage. Les données générées par ce processus sont appelées données de séquences génétiques (DSG) et sont représentées par la liste des nucléotides dans leur ordre d’apparition (par exemple, une séquence d’ARN peut se présenter sous la forme AGAAAUGAAAUGGCUCCUGUCAA).

Fournisseurs et utilisateurs de DSG grippales Les principaux fournisseurs de DSG émanant de virus grippaux sont les laboratoires du GISRS. Parmi les fournisseurs, on compte aussi des laboratoires de santé publique nationaux et des laboratoires publics ou privés susceptibles de séquencer des virus grippaux. Les DSG peuvent être téléchargées dans une ou plusieurs bases de données par le laboratoire effectuant le séquençage.1

Les laboratoires du GISRS, l’enseignement supérieur et l’industrie sont les principaux utilisateurs de DSG

grippales. Ils font généralement appel à ces données pour réaliser des évaluations des risques et pour suivre l’émergence et l’évolution de virus grippaux, mettre au point des outils diagnostiques, générer des virus vaccinaux candidats et produire de nouveaux types de vaccins tels que des vaccins recombinants ou des vaccins utilisant des virus vaccinaux candidats synthétiques.

Base de DSG Il s’agit de bases de données qui reçoivent et hébergent des DSG qui leur ont été soumises et fournissent l’accès à ces données. La plupart d’entre elles apportent aussi d’importantes informations contextuelles supplémentaires, en lien avec les séquences, en vue d’enrichir les données de séquences par des éléments concernant le patient, l’animal ou autre source dont l’échantillon est extrait. Ces informations supplémentaires sont désignées par le terme « métadonnées ».

Principales bases de données hébergeant des DSG grippales Il existe plus de 1700 bases de données de biologie moléculaire,2 dont au moins six contiennent des DSG grippales. Il s’agit des bases :

• GISAID EpifluTM: https://www.gisaid.org/ ;• base de données de recherche sur la grippe :

https://www.fludb.org/brc/home.spg? decorator=influenza ;

• Openflu : http://openflu.vital-it.ch/browse.php ;

• ces trois bases de données font partie del’International Nucleotide Sequence Database Collaboration (INSDC) :3

o GenBank :https://www.ncbi.nlm.nih.gov/genbank/ ;

o European Nucleotide Archive : https://www.ebi.ac.uk/ena ;

o base de données d’ADN du Japon :http://www.ddbj.nig.ac.jp/.

DSG et bases de données dans le Cadre PIP Bien que les DSG n’apparaissent pas dans la définition des matériels biologiques spécifiée dans le Cadre PIP,

Page 26: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2

les séquences génétiques sont définies dans la section 4.2 : « Séquences génétiques » désigne l’ordre des nucléotides présents dans une molécule d’ADN ou d’ARN. Elles contiennent l’information génétique qui détermine les caractéristiques biologiques d’un organisme ou d’un virus ». En outre, le Cadre PIP fait plusieurs fois référence aux DSG et aux bases de données.

• 5.2.1 Les données sur les séquences génétiques et les analyses issues de ces données concernant le virus H5N1 et d’autres virus grippaux susceptibles de donner lieu à une pandémie humaine devraient être échangées de façon rapide, systématique et dans les meilleurs délais avec le laboratoire d’origine et entre laboratoires du GISRS de l’OMS.

• 5.2.2 Compte tenu de l’importance pour la santé publique d’une transparence accrue et d’un meilleur accès aux données sur les séquences génétiques virales et de la tendance à utiliser des bases de données du domaine public ou d’accès public telles que Genbank et GISAID, respectivement ; et

• 5.2.3 Reconnaissant que, dans certains cas, la publication des données sur les séquences génétiques a été jugée délicate par le pays ayant fourni le virus ;

• 5.2.4 Les États Membres prient le Directeur général de consulter le Groupe consultatif sur la meilleure procédure à suivre pour examiner plus avant et résoudre les questions liées à l’utilisation des données sur les séquences génétiques du virus H5N1 et d’autres virus grippaux susceptibles de donner lieu à une pandémie dans le contexte du Cadre de préparation en cas de grippe pandémique.4

Le Cadre PIP définit aussi certaines attentes concernant les DSG :

• annexe 5 : Mandat des Centres collaborateurs de l’OMS, section B.5 : Les Centres collaborateurs de l’OMS doivent « Introduire les séquences disponibles des gènes de l’hémagglutinine, de la neuraminidase et autres séquences géniques des virus A(H5) et des autres virus grippaux susceptibles de donner lieu à une pandémie dans une base de données accessible au public, dans les meilleurs délais et pas plus de trois mois après avoir terminé le séquençage, à moins que le laboratoire ou le pays ayant fourni les échantillons cliniques

et/ou les virus n’ait donné d’autres instructions (Principe directeur 9) » ;5

• annexe 4, Principe directeur 9 : « Les laboratoires du GISRS de l’OMS soumettront les données relatives au séquençage génétique à la Global Initiative on Sharing Avian Influenza Data (GISAID) et à la Genbank ou à des bases de données du même type en temps voulu conformément à l’Accord type sur le transfert de Matériels ».6

Principales caractéristiques des bases de DSG Comme il apparaît dans le tableau ci-après, les caractéristiques des bases de données diffèrent en fonction de plusieurs facteurs, dont :

• ampleur de la couverture des données ; • niveau de curation et d’analyse des données ; • accès à la base de données ; • termes et conditions pour accéder aux

données et les utiliser ; • droits de propriété intellectuelle (PI) et autres

droits légaux s’exerçant sur les données.

Les bases de données s’adaptent à ces facteurs en fonction de leur finalité et de la communauté des fournisseurs et des utilisateurs de données qu’elles desservent. Le tableau ci-dessous fournit une présentation générale des principales approches régissant les bases de données existantes.

Page 27: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 28: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 29: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

5

Glossaire Le présent glossaire définit les termes fréquemment utilisés dans le contexte de l’accès aux données et des bases de données. Il ne prétend pas à l’exhaustivité, car de nouveaux termes entrent régulièrement en usage et les définitions évoluent. Les définitions qu’il renferme sont d’un usage courant, mais ne font pas nécessairement l’objet d’un accord universel. Par conséquent, certains termes peuvent être utilisés dans un sens différent dans des contextes distincts.

Accord sur l’accès aux données (également appelé « accord sur l’accès à une base de données » ou « accord sur l’utilisation des données »)

Un accord sur l’accès aux données est un contrat entre un utilisateur de bases de données (ce terme englobe les fournisseurs et les utilisateurs de données) d’une part et la base de données (hébergeur des données), d’autre part. Il contient généralement les termes et les conditions pour accéder et utiliser les données hébergées par la base de données. Ces termes et ces conditions couvrent notamment : les conditions d’accès, l’utilisation et la réutilisation des données, leur diffusion ultérieure, l’attribution et la collaboration avec le fournisseur de données, les droits de propriété intellectuelle, les droits de commercialisation et de licence sur les données ; la suspension et le retrait de l’accès.

Libre accès23 Le concept de libre accès est apparu en réponse à la demande grandissante d’un accès gratuit et sans restriction à la recherche universitaire.24 Conformément à la Déclaration de Berlin sur le Libre Accès à la Connaissance en

Sciences exactes, Sciences de la vie, Sciences humaines et sociales et à la Déclaration de Bethesda pour l’édition en libre accès, les contributions en libre accès doivent satisfaire deux conditions. La Déclaration de Berlin stipule :

1. Leurs auteurs et les propriétaires des droits afférents concèdent à tous les utilisateurs un droit gratuit, irrévocable et mondial d’accéder à l’œuvre en question, ainsi qu’une licence les autorisant à la copier, l’utiliser, la distribuer, la transmettre et la montrer en public, et de réaliser et de diffuser des œuvres dérivées, sur quelque support numérique que ce soit et dans quelque but responsable que ce soit, sous réserve de mentionner comme il se doit son auteur (les règles usuelles de la collectivité continueront à disposer des modalités d’attribution légitime à l’auteur et d’utilisation responsable de l’œuvre publiée, comme à présent), tout comme le droit d’en faire des copies imprimées en petit nombre pour un usage personnel.

2. Une version complète de cette œuvre, ainsi que de tous ses documents annexes, y compris une copie de la permission définie dans ce qui précède, est déposée (et, de fait, publiée) sous un format électronique approprié auprès d’au moins une archive en ligne, utilisant les normes techniques appropriées (comme les définitions des Archives Ouvertes [Open Archives]), archive gérée et entretenue par une institution académique, une société savante, une administration publique, ou un organisme établi ayant pour but d’assurer le libre accès, la distribution non restrictive, l’interopérabilité et l’archivage à long terme.25

Donnée ouverte Le terme « donnée ouverte »est relativement récent. Le concept correspondant est néanmoins antérieur à l’invention de l’Internet. Son apparition résulte de la croyance que la connaissance est un « bien commun »26

et « que les quantités énormes d’informations collectées en routine par des entités gouvernementales devraient être disponibles pour tous les citoyens. »27

Selon Open Knowledge International, une donnée ouverte est une donnée qui « peut être librement utilisée, modifiée et partagée quelle que fin que ce

Page 30: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

6

soit. »28Par exemple, le Portail européen de données qui donne accès à des « métadonnées des informations du secteur public disponibles sur les portails de données publics ‒ dit Portails ‘Open Data’ – des différents pays européens »29déclare que les « [données ouvertes] ne devront être soumises à aucune restriction en termes d’utilisation, que leur usage doit être libre, ce qui ne signifie pas que leur accès doit l’être et qu’une fois que l’utilisateur dispose des données, il peut en user, les réutiliser ou les redistribuer librement – même à des fins commerciales. »30 La Banque mondiale déclare que les données ouvertes ont deux dimensions : « 1. Les données doivent être légalement ouvertes ; en d’autres termes, elles doivent relever du domaine public ou n’être assujetties qu’à des conditions d’utilisation très souples et un nombre minimal de restrictions. 2. Les données doivent être techniquement ouvertes, c’est-à-dire publiées dans des formats électroniques exploitables par une machine, et de préférence non propriétaires, afin que chacun puisse accéder à ces données et les utiliser au moyen d’outils logiciels standard et libres. Celles-ci doivent être également disponibles et accessibles sur un serveur public, sans mot de passe ou restrictions engendrées par des pare-feu. »31

Source ouverte Le concept de source ouverte émane du domaine de la programmation informatique.32 Les licences ouvertes permettent à une communauté d’utilisateurs d’accéder à des matériels sources, des outils et des plateformes selon des conditions destinées à encourager la libre circulation des informations, la collaboration et l’innovation. Les licences ouvertes imposent généralement de ne pas faire valoir des droits de propriété intellectuelle sur ces matériels, ces outils ou ces plateformes. Certaines de ces licences exigent aussi que les innovations résultant de leur utilisation soient partagées avec la communauté.33

Accès public Dans le contexte de la publication scientifique, l’accès public désigne la publication de résultats scientifiques, notamment de manuscrits scientifiques, dans des catalogues de données accessibles au public. Cet accès est souvent gratuit ou peu onéreux et fait généralement l’objet de droits d’auteur (selon le principe de l’usage loyal). Par exemple, la politique en matière d’accès public des National Institutes of Health des États-Unis d’Amérique impose que tous les chercheurs financés par les NIH soumettent ou fassent soumettre une version électronique de leur manuscrit final examiné par des pairs à National Library of Medicine’s PubMed Central après l’acceptation pour publication afin qu’elle soit publiquement disponible moins de 12 mois après la date officielle de publication : moyennant cette précaution, les NIH devraient appliquer la politique d’accès public d’une manière compatible avec la loi sur les droits d’auteur.34

Base de données en accès public35

Une base de données en accès public peut être décrite comme une base de données accessible au public à laquelle un utilisateur peut accéder après enregistrement et acceptation explicite d’un accord relatif à l’accès et à l’utilisation des données. Une fois l’utilisateur enregistré, il doit, pour accéder à la base, suivre une procédure de login ;36base de données avec accord sur l’accès aux données, étendant un certain nombre de protections essentielles et d’assurances aux contributeurs en données ;37base de données avec identification des contributeurs et des utilisateurs.38

Domaine public Dans le contexte des droits de propriété intellectuelle, l’expression de « dans le

domaine public » s’applique à des biens immatériels non soumis à des droits de

Page 31: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

7

PI exclusifs et, par conséquent, librement disponibles pour être utilisés ou exploités par une personne quelconque.39

Base de données dans le domaine public40

Une base de données dans le domaine public peut être décrite comme une base de données accessible au public permettant un accès gratuit et sans contrainte à des informations numériques sur des séquences génétiques ;41base de données qui ne nécessite pas d’accord sur l’accès ou sur l’utilisation des données, d’enregistrement ou de login ;42base de données en accès anonyme.43

Si certaines des séquences enregistrées dans les bases de données dans le domaine public sont effectivement dans le domaine public (exemptées de droits de PI exclusifs), de nombreuses autres font l’objet de revendications dans le cadre de demandes de brevet accordées ou publiées et ne relèvent pas du domaine public.44

Accessible au public Accessible à tous, non privée, non limitée à une institution et non retreinte à une catégorie ou à un groupe d’utilisateurs.

Base de données accessible au public

Base de données accessible à tous, et notamment à la communauté scientifique, aux décideurs politiques et au grand public.

Les bases de données accessibles au public peuvent imposer des mécanismes d’accès, un enregistrement et des procédures d’autorisation ou des termes et des conditions, mais elles ne sont pas privées et ne sont pas limitées à une institution ou restreintes à une catégorie ou à un groupe d’utilisateurs.

Page 32: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

8

1 PIP Framework Advisory Group Technical Expert Working Group (TEWG)

on genetic sequence data. Final Report to the PIP Advisory Group. Genève,

Organisation mondiale de la Santé, 2014, p 10-11.

(http://www.who.int/influenza/pip/advisory group/PIP AG Rev Final TE

WG_

Report_10_Oct_2014.pdf. 2 Rigden DJ and Fernandez XM, The 2018 Nucleic Acids Research database

issue and the online molecular biology database collection, Nucleic Acids

Research, disponible à l’adresse :

https://academic.oup.com/nar/article/46/D1/D1/4781210. 3 Le site Web INSDC est consultable à l’adresse : http://www.insdc.org/. 4 Cadre PIP, section 5 Pandemic influenza preparedness Framework for

sharing of H5N1 and other influenza viruses with human pandemic potential.

Texte disponible à l’adresse :

http://www.who.int/influenza/resources/pip framework/fr/. 5 Cadre PIP, annexe 5 Mandat des centres collaborateurs de l’OMS, Mandat

de base B.5. 6 Cadre PIP, annexe 4, Principes directeurs pour l’élaboration du mandat

des laboratoires actuels et futurs du Système mondial OMS de surveillance

de la grippe et de riposte (GISRS de l’OMS) pour le virus H5N1 et d’autres

virus grippaux susceptibles de donner lieu à une pandémie humaine 1,

Principe 9. 7 Zou et al., Biological Databases for Human Research, Genomics,

Proteomics and Bioinformatics, disponible à l’adresse:

https://www.ncbi.nlm.nih

.gov/pmc/articles/PMC4411498/#b0005. 8 Ibidem 9 Pour des exemples de termes et de conditions, voir : PIP Advisory Group

Technical Working Group on the sharing of influenza genetic sequence data,

Optimal Characteristics of an influenza genetic sequence data sharing

system under the PIP Framework, 22 June 2016, Annex 4, disponible à

l’adresse : http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf. 10 Les autres droits légaux s’appliquant aux données dépendront des

obligations internationales, de la législation nationale et des droits

contractuels préexistants. 11 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 38 and

191, disponible à l’adresse https://www.cbd.int/doc/c/e95a/4ddd/4baea

2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf. 12 D’après le document Scoping Paper on approaches to seasonal influenza

and genetic sequence data under the PIP Framework (en anglais), p. 19, “In

most jurisdictions, naturally-occurring influenza GSD would not be

considered patentable subject matter. However, innovations from the

development of influenza-related products could be protected if

patentability requirements are met (these are generally: novelty;

patentability of the subject-matter; and an inventive step). There are

therefore a number of sequences in publicly-accessible databases that are

claimed as part of patents.” However, “the early, open publication of the

gene sequence of a newly-isolated strain of an influenza virus (before IP

protection is granted) would directly preclude obtaining patent protection

for the genes as published because the gene sequence would be considered

non-novel.” (à l’adresse :

http://www.who.int/influenza/pip/scopingpaper.pdf); voir également :

Questions relatives aux brevets pour les virus de la grippe et leurs gènes :

document de travail (en anglais). Organisation mondiale de la propriété

intellectuelle, Genève, 2007, p. 19-20, disponible à l’adresse

http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf.

Rapport de recherche de l’OMPI sur les brevets et les demandes de brevet

relatifs à la préparation en cas de grippe pandémique (en anglais).

Organisation mondiale de la propriété intellectuelle. Genève, OMPI ; 2011,

disponible à l’adresse :

http://www.wipo.int/export/sites/www/policy/en/global health/pdf/repor

t influenza 2011.pdf , consulté le 15 octobre 2017 ; [PIP Framework

Groupe consultatif technique d’experts (TEWG) sur les données de

séquences génétiques. Rapport final au Groupe consultatif PIP. Genève :

Organisation mondiale de la Santé ; 2014, p. 8-10, disponible à l’adresse :

http://www.who.int/influenza

/pip/advisory_group/PIP_AG_Rev_Final_TEWG_Report_10_Oct_2014.pdf . 13 Voir par exemple (traduit de l’anglais) : « La base de données GenBank

est conçue pour fournir et encourager l’accès au sein de la communauté

scientifique aux informations sur les séquences d’ADN les plus récentes et

les plus complètes. Par conséquent, le NCBI n’impose aucune restriction à

l’utilisation ou à la distribution des données de cette base. Néanmoins,

certains fournisseurs de données peuvent faire valoir des brevets, des

droits d’auteur ou d’autres droits de propriété intellectuelle sur l’ensemble

ou une partie des données qu’ils soumettent. Le NCBI n’est pas en mesure

d’évaluer la validité de ces recommandations et ne peut donc formuler

d’observation ou délivrer d’autorisation sans restriction concernant

l’utilisation, la copie ou la distribution des informations contenues dans

Genbank/ The GenBank database is designed to provide and encourage

access within the scientific community to the most up-to-date and

comprehensive DNA sequence information. Therefore, NCBI places no

restrictions on the use or distribution of the GenBank data. However, some

submitters may claim patent, copyright, or other intellectual property rights

in all or a portion of the data they have submitted. NCBI is not in a position

to assess the validity of such claims, and therefore cannot provide comment

or unrestricted permission concerning the use, copying, or distribution of

the information contained in GenBank.» (GenBank overview, GenBank Data

Usage, disponible à l’adresse : https://www.ncbi.nlm.nih.gov/genbank/). 14 Voir note finale 11 ci-dessus. 15 Voir note finale 11 ci-dessus. 16 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 29,

disponible à l’adresse : https://www.cbd.int/doc/c/e95a/4ddd/4baea

2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf ; voir par

exemple l’accord sur l’accès à la base de données GISAID : “2. License Terms.

You are hereby granted a non-exclusive, worldwide, royalty-free, non-

transferable and revocable license to access and use the GISAID EpiFlu™

Database and Data solely in accordance with this Agreement in all its terms.

Without limiting the foregoing, your access to and use of the GISAID

EpiFlu™ Database and Data is subject to the following terms and conditions:

a. Use of Any Data Provided by You. You hereby grant (i) GISAID and (ii) all

users and Data providers that have agreed to be bound by the GISAID

EpiFlu™ Database Access Agreement and that continue to abide by its terms

(collectively "Authorized Users") a non-exclusive, worldwide, royalty-free,

and irrevocable license to collect, store, reproduce, access, modify, display,

distribute, coordinate, arrange, and otherwise use the Data submitted by

You as contemplated by this Agreement. This Agreement does not transfer

any other rights or ownership interests in the Data.” (GISAID EpiFlu™

Database Access Agreement, Effective: March 16, 2011, disponible à

l’adressse : https://www.gisaid.org/registration/terms-of-use/) ; Voir, par

exemple, dans le domaine de la génomique humaine, UK Biobank Material

Transfer Agreement for data and/or samples, 20 August 2012, section 3,

disponible à l’adresse : http://www.ukbiobank.ac.uk/wp-

content/uploads/2012/09/Material-Transfer-Agreement.pdf. 17 Ibid. GISAID Database Access Agreement, section 2, para. g. 18 Ibid 19 Voir par exemple GISAID EpiFlu™ Database Access Agreement: “g.

Intellectual Property. “You acknowledge and agree that: (i) It is your sole

responsibility to obtain any additional authorization or license as may be

necessary for your use of the Data.” (GISAID EpiFlu™ Accord sur l’accès la

base de données, effectif le 16 mars 2011, disponible à l’adresse :

https://www.gisaid.org/registration/terms-of-use/). 20 Les utilisateurs autorisés sont généralement ceux ayant accepté l’accord

sur l’accès à la base de données et dont les droits ne sont ni suspendus, ni

abrogés. 21 “Generally speaking, genetic information that is published without

confidentiality constraints on access would be considered non-novel. This

does not mean that the information must be available free of charge –

genetic information available only on a paid-subscription database would

still be considered sufficiently public to preclude novelty and hence

patentability – provided those accessing the data were not bound by

confidentiality obligations regarding the data.” (voir WIPO Patent issues

related to influenza viruses and their genes: working paper. Organisation

mondiale de la propriété intellectuelle. Genève, OMPI, 2007, p.19,

Page 33: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

9

disponible à l’adresse : http://apps.who.int/medicinedocs/documents/

s21417en/s21417en.pdf. 22 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources, 1 December 2017,

disponible à l’adresse : https://www.cbd.int/abs/DSI-peer/USA.pdf. ; voir

aussi OMS, Options to monitor the use of genetic sequence data from

influenza viruses with human pandemic potential, 6 May 2016, p.8,

disponible à l’adresse : http://www.who.int/influenza/pip

/advisory group/gsdoptionspaper revised.pdf?ua=1. 23 Consulter la politique de l’OMS en matière de libre accès à l’adresse :

http://www.who.int/about/policy/fr/ et Dye C et al., Data sharing in public

health emergencies: a call to researchers, Bulletin de l’Organisation

mondiale de la Santé 2016;94:158. doi: http://dx.doi.org/10.2471/

BLT.16.170860; 24 Initiative de Budapest pour l’Accès Ouvert [site Web] à l’adresse :

http://www.budapestopenaccessinitiative.org/. 25 Voir Max Plank Society, Déclaration de Berlin sur le Libre Accès à la

Connaissance en Sciences exactes, Sciences de la vie, Sciences humaines et

sociales, 22 octobre 2013, consultable à l’adresse :

https://openaccess.mpg.de/Berlin-Declaration et Howard Hughes Medical

Institute, Déclaration de Bethesda pour la publication en accès libre, 20 juin

2003, consultable à l’adresse :

http://legacy.earlham.edu/~peters/fos/bethesda

.htm ; voir aussi Chan L et al., Budapest Open Access Initiative, 14 février

2002, disponible à l’adresse : http://www.budapestopenaccessinitiati

ve.org/boai-10-recommendations. 26 Chignard, S., Une brève histoire de l’Open Data, Paris Innovation Review,

23 mars 2013, disponible à l’adresse : http://parisinnovationreview

.com/articles-fr/.Une brève histoire de l’Open Data. 27 Banque mondiale, Open Data in 60 seconds [site Web], à l’adresse :

http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html. 28 Open Knowledge International, La Définition du Savoir Libre,

http://opendefinition.org/. La définition complète est consultable à

l’adresse : https://opendefinition.org/od/1.1/fr/. 29 Portail européen de données, Nos activités [site Web], consultable à l’adresse :

https//www.eu opeandataportal.eu/en/what-we-do/our-activities. 30 Portail européen de données, L’open data, c’est quoi ? [site Web ],

consultable à l’adresse : https://www.europeandataportal.eu/elearning/fr/

module1/#/id/co-01. 31 Banque mondiale, Open Data defined [site Web] consultable à l’adresse :

https//opendatatoolkit.worldbank.org/en/essentials.html. 32 Le texte Open Source Definition (1998) est une série de critères établis

par l’Open Source Initiative (OSI) pour définir ce qu’est une licence libre.

Cette définition est consultable à l’adresse : https://opensource.org/osd. 33 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 28,

disponible à l’adresse :

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf. 34 Division G, Title II, Section 218 of PL 110-161 (Consolidated

Appropriations Act, 2008), sec. 218. 35 Comme mentionné dans le Cadre PIP, section 5 2. 36 PIP Advisory Group Technical Working Group on the sharing of influenza

genetic sequence data, Optimal Characteristics of an influenza genetic

sequence data sharing system under the PIP Framework, 22 June 2016,

disponible à l’adresse : http://www.who.int/influenza/pip/advisory

group/twg doc.pdf. 37 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID’s

innovative contribution to global health” Global Challenges, 10 January

2017, disponible à l’adresse :

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full. 38 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 193,

disponible à l’adresse : https://www.cbd.int/doc/c/e95a/4ddd/4bae

a2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf.

39 Organisation mondiale de la propriété intellectuelle (OMPI), Comité

intergouvernemental de la propriété intellectuelle relative aux ressources

génétiques, aux savoirs traditionnels et au folklore , Note sur les

significations du terme « domaine public » dans le système de la propriété

intellectuelle, traitant en particulier de la protection des savoirs

traditionnels et des expressions culturelles traditionnelles ou expressions

du folklore, 24 novembre 2010, WIPO/GRTKF/IC/17/INF/8, disponible à

l’adresse : http://www.wipo.int/edocs/mdocs/tk/en/wipo grtkf ic 17/

wipo grtkf ic 17 inf 8.doc. 40 Comme mentionné dans le Cadre PIP, section 5.2. 41 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par.38-191,

disponible à l’adresse : https://www.cbd.int/doc/c/e95a/4ddd

/4baea2ec772be28edcd10358/dsi-ahteg-2018-01-03-en.pdf. 42 PIP Advisory Group Technical Working Group on the sharing of influenza genetic sequence data,

Optimal Characteristics of an influenza genetic sequence data sharing system under the PIP

Framework, 22 June 2016, avalable at

http//www.who.int/influenza/pip/advisory group/twg doc.pdf. 43 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID’s

innovative contribution to global health” Global Challenges, 10 January

2017, available at

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full. 44 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources, 1 December 2017,

available at https://www.cbd.int/abs/DSI-peer/USA.pdf.

Page 34: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

3 April 2018

Version 1

1

Информационный бюллетень

Данные и базы данных о генетических последовательностях

Справочная информация Данные о генетических последовательностях (ДГП)

Строение организмов и их функции определяются

генетическим кодом. Этот код хранится в молекулах

ДНК, обнаруживаемых в клетках людей, животных

и растений, а также в микроорганизмах, таких как

бактерии и вирусы. ДНК состоит из четырех

компонентов, или структурных блоков, которые

называются Ц (цитозин), Г (гуанин), А (аденин) и Т

(тимин). Нуклеотиды выстраиваются в

определенном для каждого организма порядке,

составляя генетический код. Код может быть

«прочтен» клеткой для синтеза РНК, – которая

также представляет собой тип генетической

информации, закодированной нуклеотидами

А (аденин), Ц (цитозин), Г (гуанин) и У (урацил) – и, в

свою очередь, белков, отвечающих за все строение

и функционирование живого организма.

Порядок расположения нуклеотидов в ДНК и РНК,

то есть последовательность, имеет решающее

значение, поскольку генетические

последовательности содержат информацию о

строении и особых свойствах организма. В случае

вирусов эта информация включает также данные о

патогенности, трансмиссивности и

чувствительности к противовирусным препаратам.

Лаборатории могут определять генетические

последовательности конкретных организмов с

помощью технологий определения

последовательностей. Данные, полученные в

результате такого процесса, называются данными о

генетических последовательностях (ДГП), которые

представлены в виде последовательного

перечисления нуклеотидов (например,

последовательность РНК может выглядеть так:

АГАААУГАААУГГЦУЦЦУГУЦАА).

Провайдеры и пользователи ДГП вирусов гриппа Основными провайдерами ДГП вирусов гриппа

являются лаборатории ГСЭГО. В число других

провайдеров входят национальные лаборатории

общественного здравоохранения и лаборатории

государственного и частного секторов, которые

могут определять последовательности вирусов

гриппа. ДГП могут загружаться в одну или

несколько баз данных лабораториями,

определяющими последовательности1.

Лаборатории ГСЭГО, научные институты и

промышленность являются основными

пользователями ДГП. Они используют данные, в

основном, для проведения оценки риска и

мониторинга возникновения и эволюции вирусов

гриппа; разработки диагностических средств;

синтеза вирусов-кандидатов для производства

вакцин; и создания новых типов вакцин, таких как

рекомбинантные вакцины и вакцины на основе

использования синтетических вирусов-кандидатов.

Базы данных с ДГП Базы данных с ДГП – это базы данных, которые

получают, хранят и предоставляют ДГП.

Большинство баз данных предоставляют также

важную дополнительную контекстуальную

информацию в отношении последовательностей, с

тем чтобы дополнить данные о

последовательностях информацией о пациенте/

животном/ другом источнике взятого образца.

Такая дополнительная информация называется

«метаданными».

Основные базы данных, хранящие ДГП вирусов

гриппа

Существует более 1700 баз данных по

молекулярной биологии2, из которых, по меньшей

мере, шесть содержат ДГП вирусов гриппа. Это

следующие базы данных:

• ГИСАИД EpifluTM: https://www.gisaid.org/

• База данных о научных исследованиях в

области гриппа:

https://www.fludb.org/brc/home.spg?decorat

or=influenza

• База данных Openflu: http://openflu.vital-

it.ch/browse.php

• Три базы данных в рамках Международного

сотрудничества баз данных о нуклеотидных

последовательностях (INSDC) 3:

o Генбанк:

https://www.ncbi.nlm.nih.gov/genban

k/

o Европейский архив нуклеотидов:

https://www.ebi.ac.uk/ena

o Банк данных о ДНК Японии:

http://www.ddbj.nig.ac.jp/

Page 35: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2

ДГП и базы данных в рамках Механизма ГПГ Несмотря на то, что ДГП не включены в

определение биологических материалов ГПГ,

определение генетических последовательностей

приведено в разделе 4.2: ««Генетические

последовательности» означают порядок

нуклеотидов в молекуле ДНК или РНК. Они

содержат генетическую информацию,

определяющую биологические характеристики

организма или вируса». Кроме того, в Механизме

ГПГ несколько раз упоминаются ДГП и базы данных:

• 5.2.1 Данными о генетических

последовательностях и результатами

анализа на основе этих данных, которые

относятся к H5N1 и другим вирусам гриппа с

пандемическим потенциалом для человека,

следует быстро, своевременно и

систематически обмениваться с

лабораторией происхождения и между

лабораториями ГСЭГО ВОЗ.

• 5.2.2 Признавая, что увеличение

прозрачности и расширение доступа к

данным о генетических последовательностях

вирусов гриппа имеют важное значение для

общественного здравоохранения, и что в

настоящее время имеет место тенденция к

использованию таких баз данных общего

пользования или открытого доступа, как

"Генбанк" и ГИСАИД, соответственно; и

• 5.2.3 Признавая, что в некоторых случаях

публикация данных о генетических

последовательностях рассматривается

страной, предоставившей вирус, в качестве

конфиденциальной;

• 5.2.4 Государства-члены предлагают

Генеральному директору

проконсультироваться с Консультативной

группой по наиболее оптимальному

процессу дальнейшего обсуждения и

решения вопросов, относящихся к

обращению с данными о генетических

последовательностях вируса H5N1 и других

вирусов гриппа с пандемическим

потенциалом для человека, в рамках

Механизма обеспечения готовности к

пандемическому гриппу4.

В Механизме ГПГ сформулированы также

некоторые ожидаемые результаты в отношении

ДГП:

• Приложение 5: Круги ведения

сотрудничающих центров ВОЗ, раздел B.5:

СЦ ВОЗ должны «своевременно, но не

позднее чем через три месяца после

секвенирования загружать в общедоступные

базы данных имеющиеся

последовательности гемагглютининовых,

нейраминидазных и других генов вируса

A(H5) и других вирусов гриппа с

пандемическим потенциалом, если только

не были получены иные инструкции от

лаборатории или страны, предоставивших

клинические образцы и/или вирусы

(Руководящий принцип 9)»5.

• Приложение 4, Руководящий принцип 9:

«Лаборатории ГСЭГО ВОЗ будут

своевременно предоставлять данные о

генетических последовательностях ГИСАИД и

"Генбанк" или аналогичным базам данных в

соответствии со Стандартным соглашением о

передаче материалов»6.

Основные свойства баз данных с ДГП Как показано в таблице ниже, базы данных с ДГП

бывают разными в зависимости от ряда факторов,

включая следующие:

• Сфера охвата данных

• Уровень курирования и анализа данных

• Доступ к базе данных

• Условия доступа к данным и их использования

• Интеллектуальная собственность (ИС) и другие юридические права в отношении данных

Базы данных имеют отношение к этим факторам в

зависимости от их цели и обслуживаемых ими

сообществ провайдеров данных и их пользователей.

В таблице ниже представлен обзор основных

подходов, применяемых существующими базами

данных.

Page 36: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 37: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 38: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

5

Глоссарий Настоящий глоссарий содержит определения терминов, часто используемых в контексте доступа к данным и

баз данных. Он не является всеобъемлющим, поскольку вводятся новые термины и определения изменяются.

Несмотря на широкое использование определений, содержащихся в Глоссарии, они необязательно

согласованы на международном уровне. Поэтому в разных контекстах некоторые термины могут

использоваться по-разному.

Соглашение о доступе к данным (называемое также

«Соглашение о

доступе к базе

данных» или

«Соглашение об

использовании

данных»)

Соглашение о доступе к данным – это контракт между пользователем базы

данных (сюда входят провайдеры данных и пользователи данных), с одной

стороны, и базой данных (хранителем данных), с другой стороны.

Соглашение, как правило, содержит условия доступа и использования

данных, хранимых в базе данных. Такие условия могут включать: условия

доступа, использования и повторного использования данных; дальнейшее

распространение данных; указание авторства и сотрудничество с

провайдером данных; права интеллектуальной собственности,

коммерциализацию и лицензионные права в отношении данных;

приостановку и прекращение доступа.

Открытый доступ23

Понятие «открытый доступ» появилось в связи с возрастающим спросом на

неограниченный, свободный доступ к результатам научных исследований24.

В соответствии с Берлинской декларацией об открытом доступе к научному

и гуманитарному знанию и Заявлением об открытом доступе к

публикациям, принятым в г. Бетесда, публикации, отвечающие принципу

открытого доступа, должны отвечать двум основным требованиям:

1. Авторы и владельцы прав на такие публикации гарантируют всем

пользователям неотъемлемое право на свободный, всемирный доступ к

данным публикациям и дают им свое разрешение на их копирование,

распространение, передачу и публичное воспроизведение, а также на

создание и распространение производных от них работ с помощью

любого цифрового медиа-средства и в любых учитывающих

ответственность целях, при условии корректного указания авторства.

(Научное сообщество, как и ранее, может определять правила в

отношении корректного указания авторства и ответственного

использования публикаций). Кроме того, для личного пользования

разрешается изготавливать небольшое количество распечаток этих

опубликованных работ.

2. Одна полная версия публикации со всеми предусмотренными

дополнительными материалами, включая копию с описанием названных

выше прав, сохраняется в электронном формате подходящего стандарта

не менее чем в одном онлайн-архиве (и тем самым публикуется),

который соответствует техническим стандартам (например, Правилам

для открытых архивов) и который содержится и обслуживается научно-

исследовательским учреждением, научным обществом, общественным

учреждением или другой зарегистрированной организацией,

стремящейся обеспечить открытый доступ, неограниченное

распространение, операционную совместимость и долговременное

архивирование25.

Открытые данные «Открытые данные» – относительно новый термин. Вместе с тем, концепция

«открытых данных» сформировалась до изобретения Интернета на основе

убеждения в том, что знания являются общим благом26 и «что огромный

объем информации, регулярно собираемой государственными

Page 39: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

6

учреждениями, должен быть доступен всем гражданам»27.

Согласно Международному определению открытой информации,

«открытые данные» – это данные, которые можно свободно использовать и

изменять и которыми можно обмениваться со всеми в любых целях»28.

Например, на веб-сайте Европейского портала открытых данных,

предоставляющего доступ к «метаданным в отношении информации

государственного сектора, размещенной на порталах общедоступных данных

европейских стран»29, указано, что «не должно быть никаких ограничений,

препятствующих использованию [открытых данных] каким-либо способом»,

«[они] должны быть открыты для использования, но это не означает, что они

должны быть открыты для доступа», и «Как только пользователь получает

данные, они становятся открытыми для использования, повторного

использования и перераспределения, даже в коммерческих целях»30.

Всемирный банк отмечает два параметра открытых данных: «1. Данные

должны быть юридически открытыми, то есть они должны быть

общественным достоянием или регулироваться либеральными условиями с

минимальными ограничениями. 2. Данные должны быть технически

открытыми, то есть они должны быть опубликованы в машиночитаемых и

желательно непатентованных электронных форматах, с тем чтобы каждый

мог получить и использовать данные с помощью обычных, имеющихся в

свободном доступе средств программного обеспечения. Данные должны

быть также открыты для всех и доступны на сервере общего пользования без

пароля и других ограничений доступа»31.

Открытое программное обеспечение

Понятие «открытое программное обеспечение» возникло в области

компьютерного программирования32. Лицензии на программное

обеспечение с открытым исходным кодом позволяют сообществу

потребителей получать доступ к исходным материалам, инструментам и

платформам на условиях, благоприятствующих свободному потоку

информации, сотрудничеству и инновациям. Лицензии с открытым исходным

кодом обычно не требуют предъявления прав интеллектуальной

собственности в отношении материалов, инструментов или платформ.

Некоторые лицензии также требуют, чтобы инновации, появляющиеся в

результате их использования, предоставлялись сообществу33.

Общественный доступ

В контексте научных публикаций общественный доступ относится к

опубликованию научных результатов, в частности научных рукописей, в

хранилищах, доступных для общественности. Такой доступ предоставляется

по низкой стоимости или бесплатно и, как правило, охраняется нормами

авторского права (в соответствии с принципом справедливого

использования). Например, в соответствии с политикой Национальных

институтов здоровья США по обеспечению общественного доступа, «все

исследователи, финансируемые НИЗ, предоставляют сами или через третьи

стороны электронную версию своих окончательных рецензированных

рукописей в момент их принятия для публикации в Национальную

библиотеку “Medicine’s PubMed Central”, с тем чтобы они стали

общедоступными не позднее чем через 12 месяцев после официальной даты

публикации, при условии что НИЗ будет проводить политику по обеспечению

общественного доступа в соответствии с законом об авторском праве»34.

База данных общего пользования35

База данных общего пользования может быть определена как

общедоступная база данных, «к которым пользователи получают доступ

после регистрации или принятия в явной форме соглашения о доступе к

данным и их использовании. После регистрации для получения доступа

Page 40: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

7

требуется процедура введения логина»36; база данных с соглашением о

доступе к данным, согласно которому «ряд ключевых «мер защиты» и

гарантий распространяется на провайдеров данных»37; база данных с

«идентификацией провайдеров и пользователей данных»38.

Общественное достояние

В контексте интеллектуальной собственности общественное достояние

понимается как «состоящее из нематериальных объектов, которые не

охраняются исключительными правами ИС и которые поэтому свободно

доступны для использования или эксплуатации любым лицом»39.

База данных, являющаяся объектом общественного достояния40

База данных, являющаяся объектом общественного достояния, может

быть определена как общедоступная база данных с «бесплатным и

беспрепятственным доступом к информации о цифровых

последовательностях»41; база данных, для доступа в которую «не требуется

ни соглашения о доступе к данным и их использовании, ни регистрации или

введения логина»42; «база данных с «анонимным доступом»43.

И хотя некоторые последовательности из «баз данных, являющихся объектом

общественного достояния», являются общественным достоянием (то есть на

них не распространяются исключительные права ИС), многие из них заявлены

в рамках выданного патента или опубликованных патентных заявок и не

являются общественным достоянием44.

Общедоступный Доступный для всех; не частный, не ограниченный рамками какого-либо

института и не ограниченный какой-либо категорией или группой

пользователей.

Общедоступная база данных

База данных, доступная для всех, включая научное сообщество, лиц,

формирующих политику, и общее население.

Общедоступные базы данных могут иметь механизмы обеспечения доступа,

процедуры регистрации и авторизации или условия использования, но они

не являются частными и не ограничены рамками какого-либо института и

какой-либо категорией или группой пользователей.

Page 41: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

8

1 PIP Framework Advisory Group Technical Expert Working Group (TEWG)

on genetic sequence data. Final Report to the PIP

Advisory Group. Geneva: World Health Organization; 2014, p.10-11

(http://www.who.int/influenza/pip/advisory_group/PIP_AG_Rev_Final_TE

WG_Report_10_Oct_2014.pdf 2 Rigden DJ and Fernandez XM, The 2018 Nucleic Acids Research database

issue and the online molecular biology database collection, Nucleic Acids

Research, см. https://academic.oup.com/nar/article/46/D1/D1/4781210 3 Веб-сайт INSDC: http://www.insdc.org/. 4 Механизм ГПГ, Раздел 5 Система обеспечения готовности к

пандемическому гриппу для обмена H5N1 и другими вирусами гриппа,

обладающими пандемическим потенциалом для человека. Текст

размещен на http://www.who.int/influenza/resources/pip framework/en/ 5 Механизм ГПГ, Приложение 5. Круги ведения сотрудничающих

центров ВОЗ, Основной круг ведения B.5 6 Механизм ГПГ, Приложение 4. Руководящие принципы разработки

круга ведения существующих и потенциальных будущих лабораторий

Глобальной системы ВОЗ эпиднадзора за гриппом (ГСЭГО) по H5N1 и

другим вирусам пандемического гриппа человека, Принцип 9 7 Zou et al., Biological Databases for Human Research, Genomics,

Proteomics and Bioinformatics, документ размещен на

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/#b0005 8 Там же. 9 Примеры условий см. в документе PIP Advisory Group Technical

Working Group on the sharing of influenza genetic sequence data, Optimal

Characteristics of an influenza genetic sequence data sharing system under

the PIP Framework, 22 June 2016, Annex 4, размещен на

http://www.who.int/influenza/pip/advisory group/twg doc.pdf 10 Другие юридические права в отношении данных зависят от

международных обязательств, национального законодательства и

других уже существующих договорных прав. 11 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 38 and

191, документ размещен на

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf 12 Из документа Scoping Paper on approaches to seasonal influenza and

genetic sequence data under the PIP Framework, p. 19: “In most

jurisdictions, naturally-occurring influenza GSD would not be considered

patentable subject matter. However, innovations from the development of

influenza-related products could be protected if patentability requirements

are met (these are generally: novelty; patentability of the subject-matter;

and an inventive step). There are therefore a number of sequences in

publicly-accessible databases that are claimed as part of patents.” However,

“the early, open publication of the gene sequence of a newly-isolated strain

of an influenza virus (before IP protection is granted) would directly

preclude obtaining patent protection for the genes as published because

the gene sequence would be considered non-novel.” (размещен на

http://www.who.int/influenza/pip/scopingpaper.pdf); см. также

документы: WIPO Patent issues related to influenza viruses and their genes:

working paper. World Intellectual Property Organization. Geneva: WIPO;

2007, p.19-20, размещен на

http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf;

WIPO Patent search report on pandemic influenza preparedness (PIP) –

related patents and patent applications. World Intellectual Property

Organization. Geneva: WIPO; 2011, размещен на

http://www.wipo.int/export/sites/www/policy/en/global_health/pdf/repor

t_influenza_2011.pdf, по состоянию на 15 октября 2017 г.;

PIP Framework Advisory Group Technical Expert Working Group (TEWG) on

genetic sequence data. Final Report to the PIP Advisory Group. Geneva:

World Health Organization; 2014, p.8-10 размещен на

http://www.who.int/influenza/pip/advisory group/PIP AG Rev Final TEW

G_Report_10_Oct_2014.pdf . 13 См. пример: “The GenBank database is designed to provide and

encourage access within the scientific community to the most up-to-date

and comprehensive DNA sequence information. Therefore, NCBI places no

restrictions on the use or distribution of the GenBank data. However, some

submitters may claim patent, copyright, or other intellectual property rights

in all or a portion of the data they have submitted. NCBI is not in a position

to assess the validity of such claims, and therefore cannot provide comment

or unrestricted permission concerning the use, copying, or distribution of

the information contained in GenBank.” (GenBank overview, GenBank Data

Usage, размещен на https://www.ncbi.nlm.nih.gov/genbank/) 14 См. сноску 11 выше. 15 См. сноску 11 выше 16 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 29,

документ размещен на

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf ; См. пример: Соглашение о доступе к базе

данных ГИСАИД: “2. License Terms. You are hereby granted a non-

exclusive, worldwide, royalty-free, non-transferable and revocable license

to access and use the GISAID EpiFlu™ Database and Data solely in

accordance with this Agreement in all its terms. Without limiting the

foregoing, your access to and use of the GISAID EpiFlu™ Database and Data

is subject to the following terms and conditions: a. Use of Any Data

Provided by You. You hereby grant (i) GISAID and (ii) all users and Data

providers that have agreed to be bound by the GISAID EpiFlu™ Database

Access Agreement and that continue to abide by its terms (collectively

"Authorized Users") a non-exclusive, worldwide, royalty-free, and

irrevocable license to collect, store, reproduce, access, modify, display,

distribute, coordinate, arrange, and otherwise use the Data submitted by

You as contemplated by this Agreement. This Agreement does not transfer

any other rights or ownership interests in the Data.” (GISAID EpiFlu™

Database Access Agreement, Effective: March 16, 2011, размещено на

https://www.gisaid.org/registration/terms-of-use/);

См. также пример в области геномики человека: Соглашение о

передаче материалов в отношении данных и/или образцов Биобанка

Соединенного Королевства, 20 августа 2012 г., раздел 3, размещено на

http://www.ukbiobank.ac.uk/wp-content/uploads/2012/09/Material-

Transfer-Agreement.pdf. 16 Division G, Title II, Section 218 of PL 110-161 (Consolidated

Appropriations Act, 2008), sec. 218 17 Там же. Соглашение о доступе к базе данных ГИСАИД, раздел 2,

пункт g. 18 Там же. 19 См., например, Соглашение о доступе к базе данных ГИСАИД EpiFlu™: “g. Intellectual Property. “You acknowledge and agree that:

(i) It is your sole responsibility to obtain any additional authorization or

license as may be necessary for your use of the Data.” (GISAID EpiFlu™

Database Access Agreement, Effective: March 16, 2011, размещено на

https://www.gisaid.org/registration/terms-of-use/) 20 Пользователями с санкционированным доступом, как правило,

являются лица, подписавшие СДД и не имеющие прав, которые

приостановлены или действие которых прекращено. 21 “Generally speaking, genetic information that is published without

confidentiality constraints on access would be considered non-novel. This

does not mean that the information must be available free of charge –

genetic information available only on a paid-subscription database would

still be considered sufficiently public to preclude novelty and hence

patentability – provided those accessing the data were not bound by

confidentiality obligations regarding the data.” (см. документ WIPO Patent

issues related to influenza viruses and their genes: working paper. World

Intellectual Property Organization. Geneva: WIPO; 2007, p.19, размещен

на http://apps.who.int/medicinedocs/documents/s21417en/s21417en.pdf) 22 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources, 1 December 2017,

документ размещен на https://www.cbd.int/abs/DSI-peer/USA.pdf.; см.

также документ WHO, Options to monitor the use of genetic sequence

data from influenza viruses with human pandemic potential, 6 May 2016,

p. 8, размещен на

http://www.who.int/influenza/pip/advisory group/gsdoptionspaper revise

d.pdf?ua=1 23 См. политику ВОЗ в отношении открытого доступа на

http://www.who.int/about/policy/ru/ и Dye C et al., Data sharing in public

health emergencies: a call to researchers, Bulletin of the World Health

Organization 2016;94:158. doi: http://dx.doi.org/10.2471/BLT.16.170860; 24 Будапештская инициатива открытого доступа [веб-сайт] на

http://www.budapestopenaccessinitiative.org/.

Page 42: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

9

25 См. Max Plank Society, Berlin Declaration on Open Access to Knowledge

in the Sciences and Humanities, 22 October 2013, документ размещен на

https://openaccess.mpg.de/Berlin-Declaration и Howard Hughes Medical

Institute, Bethesda Statement on Open Access Publishing, 20 June 2003,

размещен на http://legacy.earlham.edu/~peters/fos/bethesda.htm; См.

также Chan L et al., Budapest Open Access Initiative, 14 February 2002,

размещен на http://www.budapestopenaccessinitiative.org/boai-10-

recommendations. 26 Chignard, S., A brief history of Open Data, Paris Innovation Review, 23

March 2013, документ размещен на

http://parisinnovationreview.com/articles-en/a-brief-history-of-open-data. 27 The World Bank, Open Data in 60 seconds [веб-сайт] на

http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html. 28 Open Knowledge International, The Open Definition,

http://opendefinition.org/. Полное определение размещено на

http://opendefinition.org/od/2.1/en/. 29 European Data Portal, Our activities [веб-сайт] на

https://www.europeandataportal.eu/en/what-we-do/our-activities 30 European Data Portal, What is Open data? [веб-сайт] на

https://www.europeandataportal.eu/elearning/en/module1/#/id/co-01 31 The World Bank, Open Data defined [веб-сайт] на

http://opendatatoolkit.worldbank.org/en/essentials.html. 32 Определение открытого программного обеспечения (1998 г.) - это

ряд критериев, установленных Инициативой открытого программного

обеспечения (OSI) для определения того, что является лицензией на

программное обеспечение с открытым исходным кодом. Определение

можно найти на https://opensource.org/osd. 33 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 28,

документ размещен на

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf 34 Division G, Title II, Section 218 of PL 110-161 (Consolidated

Appropriations Act, 2008), sec. 218 35 В соответствии с Механизмом ГПГ, раздел 5.2. 36 PIP Advisory Group Technical Working Group on the sharing of influenza

genetic sequence data, Optimal Characteristics of an influenza genetic

sequence data sharing system under the PIP Framework, 22 June 2016,

документ размещен на

http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 37 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's

innovative contribution to global health” Global Challenges, 10 January

2017, документ размещен на

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full. 38 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par. 193,

документ размещен на

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf 39 World Intellectual Property Organization (WIPO), Intergovernmental

Committee on Intellectual Property and Genetic Resources, Traditional

Knowledge and Folklore, Note on the Meanings of the Term “Public Domain”

in the Intellectual Property System with special reference to the Protection

of Traditional Knowledge and Traditional Cultural Expressions/Expressions

of Folklore, 24 November 2010, WIPO/GRTKF/IC/17/INF/8, документ

размещен на

http://www.wipo.int/edocs/mdocs/tk/en/wipo_grtkf_ic_17/wipo_grtkf_ic_

17_inf_8.doc 40 В соответствии с Механизмом ГПГ, раздел 5.2. 41 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on Digital

Sequence Information on Genetic Resources in the Context of the

Convention on Biological Diversity and the Nagoya Protocol, par.38-191,

документ размещен на

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd10358/dsi-

ahteg-2018-01-03-en.pdf 42 PIP Advisory Group Technical Working Group on the sharing of influenza

genetic sequence data, Optimal Characteristics of an influenza genetic

sequence data sharing system under the PIP Framework, 22 June 2016,

документ размещен на

http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf 43 Elbe S and Buckland-Merrett G, “Data, disease and diplomacy: GISAID's

innovative contribution to global health” Global Challenges, 10 January

2017, available at

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full 44 U.S. Submission on Peer Review of Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources, 1 December 2017,

документ размещен на https://www.cbd.int/abs/DSI-peer/USA.pdf.

Page 43: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

3 April 2018

Version 1

1

Nota descriptiva

Datos y bases de datos sobre secuenciación genética

Consideraciones generales

Datos de secuenciación genética (DSG)

El código genético determina el modo en que se

construyen y funcionan los organismos vivos. Este

código está contenido en las moléculas de ADN

presentes en células humanas, animales y vegetales,

así como en microorganismos como las bacterias y los

virus. El ADN consta de cuatro componentes o bloques

de construcción: A (adenina), G (guanina), C (citosina)

y T (timina). Estos nucleótidos se alinean en un orden

específico en cada organismo, formando su código

genético. Las células pueden «leer» este código para

formar ARN, que es también un tipo de información

genética codificada por los nucleótidos A (adenina), G

(guanina), C (citosina) y U (uracilo), y, a su vez, del

ARN se forman proteínas responsables de toda la

estructura y el funcionamiento de los organismos

vivos.

El orden en que se ordenan los nucleótidos en el ADN

y ARN es esencial porque estas secuencias genéticas

contienen información sobre la estructura y las

propiedades específicas de cada organismo. En el caso

de los virus, se trata de características como su

patogenicidad, su transmisibilidad y su sensibilidad a

los fármacos antivíricos. Los laboratorios pueden

utilizar tecnologías de secuenciación para conocer la

secuencia genética de un organismo. En este proceso

se generan los denominados datos de secuenciación

genética (DSG), que se representan enumerando los

nucleótidos en el orden en que aparecen (por ejemplo,

una secuencia de ARN puede ser:

AGAAAUGAAAUGGCUCCUGUCAA).

Proveedores y usuarios de DSG de virus gripales Los principales proveedores de DSG de virus gripales

son los laboratorios del SMVRG, aunque también

proporcionan estos datos los laboratorios nacionales

de salud pública y laboratorios públicos o privados que

pueden realizar esa secuenciación. El laboratorio que

ha secuenciado el virus se encarga a subir los DSG en

una o más bases de datos.1

Los principales usuarios de DSG de virus gripales son

los laboratorios del SMVRG, las universidades y la

industria. Por lo general, los emplean para realizar

evaluaciones de riesgos y hacer un seguimiento de la

aparición y evolución de los virus gripales; elaborar

herramientas de diagnóstico; obtener vacunas

candidatas, y desarrollar nuevos virus candidatos para

vacunas, como las vacunas recombinantes o las que

utilizan nuevos virus generados sintéticamente que

pueden utilizarse para fabricar nuevas vacunas.

Bases de DSG Las bases de DSG reciben y almacenan los DSG que se

les han enviado y brindan acceso a ellos. La mayoría

de estas bases de datos facilitan también información

contextual importante que complementa las

secuencias con información sobre el paciente, el

animal o la fuente de que se extrajo la muestra. Esta

información adicional se denomina «metadatos».

Principales bases de datos que almacenan DSG de

virus gripales

Hay más de 1700 bases de datos en biología

molecular,2 de las cuales al menos seis contienen DSG

de virus gripales. Son las siguientes:

• EpifluTM de la GISAID: https://www.gisaid.org/

• Influenza Research Database:

https://www.fludb.org/brc/home.spg?decorat

or=influenza

• Openflu: http://openflu.vital-it.ch/browse.php

• Las tres bases de datos siguientes forman

parte de la Colaboración Internacional de Base

de Datos de Secuencias de Nucleótidos

(INSDC):3

o GenBank:

https://www.ncbi.nlm.nih.gov/genban

k/

o Archivo Europeo de Nucleótidos:

https://www.ebi.ac.uk/ena

o Base de datos sobre ADN del Banco

del Japón: http://www.ddbj.nig.ac.jp/

DSG y bases de datos en el Marco de PIP Aunque los DSG no figuran en la definición de

materiales biológicos especificados en el Marco de PIP,

las secuencias genéticas se definen en el apartado 4.2,

donde se afirma que son el «orden en que aparecen los

nucleótidos en una molécula de ADN o ARN» y que

«contienen la información genética que determina las

características biológicas de un organismo o virus». El

Page 44: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

2

Marco de PIP hace también varias referencias a DSG y

a bases de datos:

• 5.2.1 Los datos sobre secuencias genéticas, y

los análisis realizados a partir de esos datos, de

los virus H5N1 y otros virus gripales

potencialmente pandémicos para el hombre

deberán ser compartidos de forma rápida,

sistemática y oportuna con el laboratorio de

origen y entre los laboratorios del SMVRG de la

OMS;

• 5.2.2 Reconociendo que la mayor transparencia

y acceso a los datos sobre la secuencia genética

de los virus gripales reviste importancia para la

salud pública, y que existe una tendencia a

utilizar bases de datos de dominio público o

acceso público como Genbank y la base de

datos de la GISAID, respectivamente; y

• 5.2.3 Reconociendo que en algunos casos la

publicación de datos de secuencias genéticas

ha sido una cuestión delicada para el país

suministrador del virus;

• 5.2.4 Los Estados Miembros piden a la

Directora General que consulte con el Grupo

Asesor para determinar la mejor manera de

seguir examinando y resolviendo los problemas

relacionados con el manejo de los datos de

secuencias genéticas del virus H5N1 y de otros

virus gripales potencialmente pandémicos

como Parte del Marco de Preparación para una

Gripe Pandémica.4

Además, el Marco de PIP especifica algunas

expectativas con respecto a los DSG:

• Anexo 5: en el apartado B.5 del mandato de

Centros Colaboradores de la OMS se establece

que estos centros deben «incorporar de forma

puntual a una base de datos pública las

secuencias disponibles de los genes de la

hemaglutinina y la neuraminidasa, así como de

otros genes de los virus A(H5) y otros virus

gripales con potencial pandémico, nunca más

de tres meses después de que se haya

completado la secuenciación, a menos que el

laboratorio o país que haya proporcionado las

muestras clínicas y/o los virus ordene lo

contrario (principio rector 9)».5

• Principio rector 9 del anexo 4: «Los laboratorios

del SMVRG de la OMS enviarán datos sobre

secuencias genéticas a la base de datos de la

GISAID y a Genbank o a bases de datos

semejantes en forma oportuna y en coherencia

con el Acuerdo Modelo de Transferencia de

Material».6

Características principales de las bases de DSG Como se indica en el siguiente cuadro, las

características de las bases de datos difieren en

función de varios factores:

• el alcance de la cobertura de los datos • el nivel de custodia y de análisis de los datos • el acceso a la base de datos • las condiciones de acceso a los datos y de su

utilización • los derechos de propiedad intelectual (PI) y

otros derechos jurídicos sobre los datos

El modo en que cada base de datos enfoca estos

factores depende de su propósito y de los proveedores

y los usuarios de dichos datos. En el siguiente cuadro

se resumen los principales enfoques adoptados por las

bases de datos existentes.

Page 45: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 46: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It
Page 47: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

5

Glosario Este glosario consta de definiciones de términos utilizados frecuentemente en el contexto del acceso a datos y

bases de datos. No pretende ser exhaustivo, ya que las definiciones van variando y continuamente van apareciendo

nuevos términos. Aunque las definiciones son de uso común, no todas ellas están aceptadas universalmente. Por

esta razón, algunos términos se pueden utilizar con sentidos distintos en función del contexto.

Acuerdo de acceso a datos («acuerdo de

acceso a la

base de

datos» o

«acuerdo para

la utilización

de datos»)

Un acuerdo de acceso a datos es un contrato entre una base de datos (que es depositaria de los

mismos) y sus usuarios (tanto proveedores y como los usuarios de los datos). Por lo general,

incluye condiciones para acceder y utilizar los datos alojados. Estas condiciones abarcan, entre

otras cuestiones: las condiciones de acceso, utilización y reutilización de los datos; su difusión

posterior; las atribuciones de los proveedores de los datos y la colaboración con ellos; los

derechos de propiedad intelectual; los derechos de comercialización y licencia de los datos, y la

suspensión y la interrupción del acceso.

Acceso abierto23

El concepto de «acceso abierto» surgió en respuesta a la creciente demanda de acceso libre y

sin restricciones a la investigación académica.24 De acuerdo con la Declaración de Berlín sobre

Acceso Abierto al Conocimiento en Ciencias y Humanidades y la Declaración de Bethesda sobre

Publicación de Acceso Abierto, las contribuciones de acceso abierto deben cumplir dos

condiciones. Según establece la Declaración de Berlín:

1. El (los) autor(es) y depositario(s) de la propiedad intelectual de tales contribuciones deben

garantizar a todos los usuarios por igual, el derecho gratuito, irrevocable y mundial de

acceder a un trabajo erudito, lo mismo que licencia para copiarlo, usarlo, distribuirlo,

transmitirlo y exhibirlo públicamente, y para hacer y distribuir trabajos derivativos, en

cualquier medio digital para cualquier propósito responsable, todo sujeto al

reconocimiento apropiado de autoría (los estándares de la comunidad continuarán

proveyendo los mecanismos para hacer cumplir el reconocimiento apropiado y uso

responsable de las obras publicadas, como ahora se hace), lo mismo que el derecho de

efectuar copias impresas en pequeño número para su uso personal.

2. Una versión completa del trabajo y todos sus materiales complementarios, que incluya una

copia del permiso del que se habla arriba, en un conveniente formato electrónico estándar,

se deposita (y así es publicado) en por lo menos un repositorio online, que utilice

estándares técnicos aceptables (tales como las definiciones del Acceso Abierto), que sea

apoyado y mantenido por una institución académica, sociedad erudita, agencia

gubernamental, o una bien establecida organización que busque implementar el acceso

abierto, distribución irrestricta, interoperabilidad y capacidad archivística a largo plazo.25

Datos abiertos

La expresión «datos abiertos» es relativamente reciente. Sin embargo, el concepto es anterior

a la invención de Internet y deriva de la idea de que el conocimiento es un bien común26 y de la

convicción de que «existe una enorme cantidad de información que es recolectada por el

gobierno periódicamente, y que estos datos deberían de estar disponibles para todos los

ciudadanos».27

Según Open Knowledge International, los datos abiertos son los que se pueden usar, modificar

y compartir libremente para cualquier fin.28 Por ejemplo, el Portal Europeo de Datos, que

facilita acceso a «metadatos de información del sector público disponible en portales de datos

públicos, denominados Open Data Portals, en diferentes países europeos»,29 establece que los

datos abiertos no deben estar sujetos a restricciones de uso, que su utilización debe ser

gratuita —lo cual no significa que el acceso a los mismos también deba ser gratuito— y que,

una vez que el usuario ha obtenido los datos, puede usarlos, reutilizarlos o redistribuirlos

libremente, incluso con fines comerciales.30 De acuerdo con el Banco Mundial, los datos

Page 48: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

6

abiertos tienen dos dimensiones: «1. Deben de ser abiertos en términos jurídicos, lo que

significa que deben ponerse en un sitio de acceso público u ofrecerse en condiciones liberales

de uso y con mínimas restricciones. 2. Deben ser técnicamente abiertos, lo que significa que

deben publicarse en formatos electrónicos que puedan leerse con máquinas y que

preferentemente no sean exclusivos, de modo que cualquier persona puede acceder a ellos y

usarlos mediante herramientas de software comunes y gratuitas. Los datos también deben de

estar disponibles en un servidor público sin contraseñas ni restricciones de firewalls».31

Código abierto

El concepto de código abierto proviene del campo de la programación informática.32 Las

licencias abiertas permiten que la comunidad de usuarios acceda a materiales, herramientas y

plataformas en condiciones que fomentan el libre flujo de información, la colaboración y la

innovación. Por lo general, las licencias abiertas exigen que no haya derechos de propiedad

intelectual sobre estos materiales, herramientas y plataformas. Además, algunas de estas

licencias requieren que las innovaciones resultantes se compartan con la comunidad.33

Acceso público

En el contexto de la publicación científica, el acceso público se refiere a la publicación de los

resultados científicos, incluidos los originales, en catálogos de datos de libre acceso. Este

acceso suele ser gratuito o de costo reducido y estar sujeto a derechos de autor (de acuerdo

con el principio de uso leal). Por ejemplo, la política de acceso público de los Institutos

Nacionales de Salud de los Estados Unidos de América exige que todos los investigadores

financiados por estos Institutos envíen o hayan enviado una versión electrónica de su original

final revisado por expertos externos a la Biblioteca Nacional de Medicina de PubMed Central

una vez aceptada su publicación, para que esté disponible para el público dentro de los 12

meses posteriores a la fecha de publicación oficial, siempre que los Institutos Nacionales de

Salud apliquen su política de acceso público de conformidad con la legislación vigente relativa

a los derechos de autor.34

Base de datos de acceso público35

Los usuarios de las bases de datos de acceso público acceden a la misma tras registrarse y

aceptar explícitamente un acuerdo sobre acceso y utilización de los datos. Una vez registrado,

el usuario accede a la base de datos iniciando sesión.36 Estas bases establecen una serie de

protecciones y garantías críticas a quienes aportan datos37 e identifican a los contribuidores y a

los usuarios.38

Dominio público

En el contexto de los derechos de propiedad intelectual, la expresión dominio público se aplica a

los materiales intangibles que no están sujetos a derechos de propiedad intelectual exclusivos;

por tanto, cualquier persona puede disponer de ellos y explotarlos.39

Base de datos de dominio público40

Una base de datos de dominio público ofrece acceso público y sin restricciones a información

digital sobre secuencias genéticas,41 sin acuerdos sobre el acceso a los datos ni sobre su uso,

sin necesidad de registrarse42 o de iniciar sesión, y mediante acceso anónimo.43

Si bien algunas de las secuencias registradas en estas bases de datos son realmente de

dominio público (y, por tanto, no están sujetas a derechos de propiedad intelectual exclusivos),

en muchos otros casos se ha reclamado que forman parte de patentes concedidas o publicadas

y que no pertenecen al dominio público.44

Accesible para el público

Que puede ser consultado por cualquier persona, no es privado y no es de acceso limitado a

una sola institución ni a una categoría o un grupo de usuarios.

Base de datos accesible para el público

Base de datos a la que puede acceder cualquier persona, incluidos la comunidad científica, las

instancias normativas y el público en general.

Las bases de datos accesibles para el público pueden imponer mecanismos de acceso,

procedimientos de registro y autorización o condiciones, pero no son privadas y no se limita el

acceso a ellas a una sola institución ni a una categoría o un grupo de usuarios.

Page 49: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

7

1 Informe Final del Grupo de Trabajo de Expertos Técnicos relativo

a datos sobre secuencias génicas presentado al Grupo Asesor del

Marco de PIP. Ginebra (Organización Mundial de la Salud), 2014,

págs. 10-11

(http://www.who.int/influenza/pip/advisory_group/PIP_AG_Rev_F

inal TEWG Report 10 Oct 2014.pdf.

2 Rigden DJ and Fernandez XM, The 2018 Nucleic Acids Research

database issue and the online molecular biology database

collection, Nucleic Acids Research, disponible en

https://academic.oup.com/nar/article/46/D1/D1/4781210.

3 El sitio web de la INSDC está disponible en http://www.insdc.org/.

4 Marco de PIP, apartado 5. Sistema de intercambio de H5N1 y

otros virus gripales potencialmente pandémicos para el hombre en

el contexto de la preparación para una gripe pandémica. Texto

disponible en

http://www.who.int/influenza/resources/pip framework/es/.

5 Anexo 5 del Marco de PIP. Principios rectores de los Centros

Colaboradores de la OMS, Mandato básico B.5.

6 Anexo 4 del Marco de PIP, Principios rectores para la elaboración

del mandato de los laboratorios ya existentes o futuros del sistema

mundial OMS de vigilancia y respuesta a la gripe (SMVRG) para el

H5N1 y otros virus gripales humanos pandémico, Principio 9.

7 Zou et al., Biological Databases for Human Research, Genomics,

Proteomics and Bioinformatics, disponible en

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4411498/#b0005.

8 Ibidem.

9 Pueden encontrarse ejemplos de estas condiciones en: Grupo de

Trabajo Técnico sobre intercambio de datos de secuencias

genéticas de virus de la gripe. Características óptimas de un

sistema de intercambio de datos de secuencias genéticas gripales

en virtud del Marco de PIP. 22 de junio de 2016, anexo 4,

disponible en

http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf.

10 Los demás derechos jurídicos sobre los datos dependen de las

obligaciones internacionales, la legislación nacional y los derechos

contractuales preexistentes.

11 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources in the Context

of the Convention on Biological Diversity and the Nagoya Protocol,

párrafos 38 y 191, disponible en

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd103

58/dsi-ahteg-2018-01-03-en.pdf.

12 En el documento Scoping Paper on approaches to seasonal

influenza and genetic sequence data under the PIP Framework, pág.

19, se indica: «In most jurisdictions, naturally-occurring influenza

GSD would not be considered patentable subject matter. However,

innovations from the development of influenza-related products

could be protected if patentability requirements are met (these are

generally: novelty; patentability of the subject-matter; and an

inventive step). There are therefore a number of sequences in

publicly-accessible databases that are claimed as part of patents».

No obstante, se indica también: «The early, open publication of the

gene sequence of a newly-isolated strain of an influenza virus

(before IP protection is granted) would directly preclude obtaining

patent protection for the genes as published because the gene

sequence would be considered non-novel»

(en http://www.who.int/influenza/pip/scopingpaper.pdf); véase

también: Problemas de patentes para los virus gripales y sus genes:

documento de debate. Organización Mundial de la Propiedad

Intelectual, Ginebra, 2007, págs. 19-20, disponible en

http://apps.who.int/medicinedocs/documents/s21417en/s21417e

n.pdf. Informe de la OMPI sobre búsqueda de patentes y

solicitudes de patente relacionadas con la preparación para una

gripe pandémica (en inglés). Organización Mundial de la Propiedad

Intelectual. Ginebra, OMPI, 2011, disponible en

http://www.wipo.int/export/sites/www/policy/en/global_health/p

df/report_influenza_2011.pdf, consultado el

15 de octubre de 2017; Grupo de Trabajo de Expertos Técnicos

sobre datos de secuencias génicas. Informe final para el Grupo

Asesor del Marco de PIP. Ginebra, Organización Mundial de la

Salud, 2014, págs. 8-10, disponible en

http://www.who.int/influenza/pip/advisory_group/PIP_AG_Rev_Fi

nal_TEWG_Report_10_Oct_2014.pdf.

13 Por ejemplo, en la Visión general de GenBank (disponible en

https://www.ncbi.nlm.nih.gov/genbank/) se establece que la base

de datos de GenBank proporciona y fomenta el acceso de la

comunidad científica a la información de secuencia de ADN más

actualizada y completa. Por tanto, el NCBI no impone restricciones

al uso o la distribución de datos de esta base de datos. Sin embargo,

algunos proveedores de datos pueden reclamar derechos de

patente, de autor u otros derechos de propiedad intelectual sobre

parte o la totalidad de los datos que envían. El NCBI no está en

condiciones de evaluar la validez de tales reclamaciones y, por

tanto, no puede realizar ninguna observación ni conceder

Page 50: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

8

autorización sin restricciones para utilizar, copiar o distribuir

información contenida en la base de datos de Genbank.

14 Véase la nota 11 de pie de página supra.

15 Véase la nota 11 de pie de página supra.

16 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources in the Context

of the Convention on Biological Diversity and the Nagoya Protocol,

párrafo 29, disponible en

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd103

58/dsi-ahteg-2018-01-03-en.pdf. Por ejemplo, en el apartado 2 del

acuerdo para el acceso a la base de datos de la GISAID se indica

que el acuerdo concede una licencia no exclusiva, mundial, libre del

pago de cánones, no transferible y revocable para acceder a la base

de datos EpiFlu™ de la GISAID y a los datos que contiene, así como

para utilizarlos. Sin limitar estos requisitos, se establecen además

determinadas condiciones al acceso a los datos y a su utilización.

En el punto a) se indica que los proveedores de información

conceden a la GISAID y a todos los usuarios y proveedores de datos

que acuerden regirse por el Acuerdo para el acceso a la base de

datos Access EpiFlu™ de la GISAID y que cumplan sus condiciones

(es decir, los «usuarios autorizados») una licencia no exclusiva,

mundial, libre del pago de cánones, no transferible e irrevocable de

recopilación, almacenamiento, reproducción, acceso, modificación,

exposición, distribución, coordinación, organización y utilización en

relación con los datos enviados según lo previsto en el Acuerdo.

Por otra parte, el acuerdo no transfiere otros derechos ni intereses

relacionados con la autoría de los datos. La base de datos EpiFlu™

de la GISAID entró en vigor el 16 de marzo de 2011, y sus

condiciones están disponibles en

https://www.gisaid.org/registration/terms-of-use/. En la esfera de

la genómica humana se puede consultar, por ejemplo, el acuerdo

para la transferencia de material del Biobanco del Reino Unido, que

se refiere a datos y/o muestras, de 20 de agosto de 2012 (apartado

3). Está disponible en http://www.ukbiobank.ac.uk/wp-

content/uploads/2012/09/Material-Transfer-Agreement.pdf.

16 PL 110-161 (Consolidated Appropriations Act, 2008), Division G,

Title II, Section 218.

17 Ibidem. Acuerdo para el acceso a la base de datos de la GISAID,

apartado 2, párrafo g.

18 Ibidem.

19 Por ejemplo, en el acuerdo para el acceso a la base de datos

EpiFlu™ de la GISAID (punto 2. g: Propiedad intelectual) se

establece que los usuarios son los únicos responsables de la

obtención de las licencias o autorizaciones adicionales necesarias

para utilizar los datos. El acuerdo entró en vigor el 16 de marzo de

2011, y sus condiciones están disponibles en

https://www.gisaid.org/registration/terms-of-use/.

20 Por lo general, los usuarios autorizados son los que aceptan el

acuerdo para el acceso a la base de datos, siempre que no se hayan

suspendido o revocado sus derechos.

21 En el documento de la OMPI Patent issues related to influenza

viruses and their genes: working paper (Organización Mundial de la

Propiedad Intelectual. Ginebra: OMPI; 2007, pág. 19) se establece

que, en general, la información genética que se publica sin

limitaciones de confidencialidad relativas al acceso se considera no

novedosa, pero que ello no significa que esté disponible para el

público de forma gratuita, sino que la información genética

disponible solamente en una base de datos accesible mediante

suscripción paga se considera suficientemente pública como para

descartar que sea novedosa y, por tanto, que se pueda patentar,

siempre que quienes accedan a ella no estén sujetos a obligaciones

de confidencialidad con respecto a los datos. Disponible en

http://apps.who.int/medicinedocs/documents/s21417en/s21417e

n.pdf).

22 Presentación de los Estados Unidos de América sobre el examen

por expertos externos del estudio exploratorio y de investigación

acerca de la información relativa a secuencias digitales de recursos

genéticos, 1 de diciembre de 2017, disponible en

https://www.cbd.int/abs/DSI-peer/USA.pdf.; véase también OMS,

Options to monitor the use of genetic sequence data from influenza

viruses with human pandemic potential, 6 de mayo de 2016, pág. 8,

disponible en

http://www.who.int/influenza/pip/advisory_group/gsdoptionspap

er_revised.pdf?ua=1.

23 Véase la política de la OMS sobre el acceso libre, en

http://www.who.int/about/policy/en/ y Dye C et al., Data sharing

in public health emergencies: a call to researchers, Boletín de la

Organización Mundial de la Salud 2016;94:158. doi:

http://dx.doi.org/10.2471/BLT.16.170860.

24 Iniciativa de Acceso Abierto de Budapest [sitio web] en

http://www.budapestopenaccessinitiative.org/.

25 Véase: Sociedad Max Planck, Declaración de Berlín sobre Acceso

Abierto al conocimiento en Ciencias y Humanidades, 22 de octubre

de 2013, disponible en https://openaccess.mpg.de/Berlin-

Declaration e Instituto Médico Howard Hughes, Declaración de

Bethesda sobre las publicaciones de Acceso Abierto, 20 de junio de

Page 51: FACT SHEET Genetic sequence data and databases - who.int · 5 Glossary This glossary provides definitions of terms frequently used in the context of data access and databases. It

9

2003, disponible en

http://legacy.earlham.edu/~peters/fos/bethesda.htm; véase

también Chan L et al., Iniciativa de Acceso Abierto de Budapest, 14

de febrero de 2002, disponible en

http://www.budapestopenaccessinitiative.org/boai-10-

recommendations.

26 Chignard, S., A brief history of Open Data, Paris Innovation

Review, 23 de marzo de 2013, disponible en

http://parisinnovationreview.com/articles-en/a-brief-history-of-

open-data.

27 Banco Mundial, Datos Abiertos en 60 segundos [sitio web] en

http://opendatatoolkit.worldbank.org/en/open-data-in-60-

seconds.html.

28 Open Knowledge International, The Open Definition,

http://opendefinition.org/. La definición completa está disponible

en http://opendefinition.org/od/2.1/en/.

29 Portal Europeo de Datos, Misión [sitio web] en,

https://www.europeandataportal.eu/en/what-we-do/our-activities.

30 Portal Europeo de Datos, What is Open data? [sitio web], en

https://www.europeandataportal.eu/elearning/en/

module1/#/id/co-01.

31 Banco Mundial, Definición de Datos Abiertos [sitio web] en

http://opendatatoolkit.worldbank.org/es/essentials.html.

32 The Open Source Definition (1998) (Definición de código abierto)

es una serie de criterios establecidos por la Open Source Initiative

(OSI) para definir las licencias de código abierto. Está disponible en

https://opensource.org/osd.

33 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources in the Context

of the Convention on Biological Diversity and the Nagoya Protocol,

párrafo 28, disponible en

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd103

58/dsi-ahteg-2018-01-03-en.pdf.

34 PL 110-161 (Consolidated Appropriations Act, 2008), Division G,

Title II, Section 218.

35 Tal y como se indica en el punto 5.2 del Marco de PIP.

36 Grupo de Trabajo Técnico sobre intercambio de datos de

secuencias genéticas de virus de la gripe. Características óptimas

de un sistema de intercambio de datos de secuencias genéticas

gripales en virtud del Marco de PIP. 22 de junio de 2016, disponible

en http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf.

37 Elbe S and Buckland-Merrett G, Data, disease and diplomacy:

GISAID's innovative contribution to global health. Global Challenges,

10 de enero de 2017, disponible en

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full.

38 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources in the Context

of the Convention on Biological Diversity and the Nagoya Protocol,

párrafo 193, disponible en

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd103

58/dsi-ahteg-2018-01-03-en.pdf.

39 Comité Intergubernamental de la Organización Mundial de la

Propiedad Intelectual (OMPI) sobre Propiedad

Intelectual y Recursos Genéticos, Conocimientos

Tradicionales y Folclore, Nota sobre los significados de la expresión

«dominio público» en el sistema de propiedad intelectual, con

referencia especial a la protección de los conocimientos

tradicionales y las expresiones culturales tradicionales/expresiones

del folclore, 24 de noviembre de 2010, WIPO/GRTKF/IC/17/INF/8,

disponible en

http://www.wipo.int/meetings/es/doc_details.jsp?doc_id=149213.

40 Tal y como se indica en el punto 5.2 del Marco de PIP.

41 Laid SA and Wynberg RP, A Fact-Finding and Scoping Study on

Digital Sequence Information on Genetic Resources in the Context

of the Convention on Biological Diversity and the Nagoya Protocol,

párrafos 38-191, disponible en

https://www.cbd.int/doc/c/e95a/4ddd/4baea2ec772be28edcd103

58/dsi-ahteg-2018-01-03-en.pdf.

42 Grupo de Trabajo Técnico sobre intercambio de datos de

secuencias genéticas de virus de la gripe. Características óptimas

de un sistema de intercambio de datos de secuencias genéticas

gripales en virtud del Marco de PIP. 22 de junio de 2016, disponible

en http://www.who.int/influenza/pip/advisory_group/twg_doc.pdf.

43 Elbe S and Buckland-Merrett G, Data, disease and diplomacy:

GISAID's innovative contribution to global health. Global Challenges,

10 de enero de 2017, disponible en

http://onlinelibrary.wiley.com/doi/10.1002/gch2.1018/full.

44 Presentación de los Estados Unidos de América sobre el examen

por expertos externos del estudio exploratorio y de investigación

acerca de la información relativa a secuencias digitales de recursos

genéticos, 1 de diciembre de 2017, disponible en

https://www.cbd.int/abs/DSI-peer/USA.pdf.