Nasionale Sentrum vir Biotegnologie-inligting
Die National Center for Biotechnology Information ( NCBI ) [1] [2] is deel van die United States National Library of Medicine (NLM), 'n tak van die National Institutes of Health (NIH). Dit word goedgekeur en befonds deur die regering van die Verenigde State . Die NCBI is in Bethesda, Maryland, en is in 1988 gestig deur wetgewing geborg deur senator Claude Pepper .
![]() | |
Afkorting | NCBI |
---|---|
Gestig | 1988 |
Hoofkwartier | Bethesda, Maryland , VS. |
Koördinate | 38 ° 59′45 ″ N 77 ° 05′56 ″ W / 38.9959 ° N 77.0989 ° WKoördinate : 38 ° 59′45 ″ N 77 ° 05′56 ″ W / 38.9959 ° N 77.0989 ° W |
Webwerf | www |
Die NCBI bevat 'n reeks databasisse wat relevant is vir biotegnologie en biogeneeskunde en is 'n belangrike bron vir instrumente en dienste vir bioinformatika. Belangrike databasisse sluit in GenBank vir DNA-reekse en PubMed , 'n bibliografiese databasis vir biomediese literatuur. Ander databasisse sluit die NCBI Epigenomics- databasis in. Al hierdie databasisse is aanlyn beskikbaar via die Entrez- soekenjin. NCBI is gelei deur David Lipman , [2] een van die oorspronklike outeurs van die BLAST- volgorde-belyningsprogram [3] en 'n wyd gerespekteerde figuur in bioinformatika . Hy het ook 'n binnemuurse navorsingsprogram gelei, waaronder groepe onder leiding van Stephen Altschul ('n ander mede-outeur van BLAST ), David Landsman, Eugene Koonin , John Wilbur, Teresa Przytycka en Zhiyong Lu. David Lipman het in Mei 2017 uit sy pos gestaan. [4]
GenBank
NCBI het die verantwoordelikheid gehad om die GenBank DNA- volgorde-databasis sedert 1992 beskikbaar te stel. [5] GenBank koördineer met individuele laboratoriums en ander volgorde-databasisse, soos dié van die European Molecular Biology Laboratory (EMBL) en die DNA Data Bank of Japan (DDBJ). [5]
Sedert 1992 het NCBI gegroei om naas GenBank ook ander databasisse te verskaf. NCBI bied genetiese , aanlyn-mendelse erfenis in die mens , die databasis vir molekulêre modellering (3D-proteïenstrukture), dbSNP ('n databasis van enkel-nukleotied polimorfismes ), die verwysingsvolgordeversameling, 'n kaart van die menslike genoom en 'n taksonomie- blaaier, en koördinate met die Nasionale Kankerinstituut om die Cancer Genome Anatomy Project aan te bied. Die NCBI ken 'n unieke identifikasie (taksonomie-ID-nommer) toe aan elke spesie organisme. [6]
Die NCBI het sagteware-instrumente wat beskikbaar is via internetblaaiers of deur FTP. BLAST is byvoorbeeld 'n program vir die soek van reekseenhede. BLAST kan volgordevergelykings met die GenBank DNA-databasis in minder as 15 sekondes doen.
NCBI-boekrak
Die NCBI Bookshelf [7] is 'n versameling van gratis toeganklike, aanlyn-aflaaibare weergawes van geselekteerde biomediese boeke. Die boekrak dek 'n wye verskeidenheid onderwerpe, waaronder molekulêre biologie , biochemie , selbiologie , genetika , mikrobiologie , siektetoestande vanuit 'n molekulêre en sellulêre oogpunt, navorsingsmetodes en virologie . Sommige boeke is aanlynweergawes van boeke wat voorheen gepubliseer is, terwyl ander, soos Coffee Break , deur NCBI-personeel geskryf en geredigeer word. Die boekrak is 'n aanvulling op die Entrez PubMed- bewaarplek van portuurbeoordeelde publikasie- abstrakte deurdat die inhoud van die boekrak gevestigde perspektiewe bied op ontwikkelende studierigtings en 'n konteks waarin baie uiteenlopende stukke gerapporteerde navorsing georganiseer kan word. [ aanhaling nodig ]
Basiese soekinstrument vir plaaslike belyning (BLAST)
BLAST is 'n algoritme wat gebruik word vir die berekening van reekseenheid tussen biologiese reekse soos nukleotiedreekse van DNA en aminosuurreekse van proteïene. [8] BLAST is 'n kragtige instrument om reekse te vind wat soortgelyk is aan die navraagvolgorde binne dieselfde organisme of in verskillende organismes. Dit soek die navraagvolgorde op NCBI-databasisse en bedieners en plaas die resultate in die gekose formaat na die persoon se blaaier. Invoerreekse vir die BLAST is meestal in FASTA- of Genbank-formaat, terwyl die uitvoer in verskillende formate gelewer kan word, soos HTML, XML-opmaak en gewone teks. HTML is die standaard uitvoerformaat vir NCBI se webblad. Resultate vir Ncbi-BLAST word in grafiese formaat met al die treffers gevind, 'n tafel met volgorde identifiseerders vir die treffers met scoring verwante data, saam met die roetes vir die volgorde van belang en die treffers ontvang met analoog BLAST tellings vir hierdie [9 ]
Entrez
Die Entrez Global Query Cross-Database Search System word by NCBI gebruik vir al die belangrikste databasisse soos Nucleotide en Protein Sequences, Protein Structures, PubMed, Taxonomy, Complete Genomes, OMIM, en verskeie ander. [10] Entrez is 'n indekserings- en herwinningsisteem met data uit verskillende bronne vir biomediese navorsing. NCBI versprei die eerste weergawe van Entrez in 1991, bestaande uit nukleotiedreekse van PDB en GenBank , proteïenreekse van SWISS-PROT, vertaalde GenBank, PIR, PRF, PDB, en gepaardgaande abstrakte en aanhalings uit PubMed. Entrez is spesiaal ontwerp om die data uit verskillende bronne, databasisse en formate te integreer in 'n eenvormige inligtingsmodel en herwinningstelsel wat die relevante verwysings, rye en strukture doeltreffend kan ophaal. [11]
Gen
Gen is by NCBI geïmplementeer om die inligting oor gene te karakteriseer en organiseer. Dit dien as 'n belangrike knoop in die verband van die genomiese kaart, uitdrukking, volgorde, proteïenfunksie, struktuur en homologiedata. 'N Unieke GeneID word toegeken aan elke genrekord wat gevolg kan word deur hersieningsiklusse. Genrekords vir bekende of voorspelde gene word hier opgestel en word afgebaken deur kaartposisies of nukleotiedreekse. Gene het verskeie voordele bo sy voorganger, LocusLink, insluitend beter integrasie met ander databasisse in NCBI, 'n breër taksonomiese omvang en verbeterde opsies vir navraag en herwinning deur die Entrez-stelsel. [12]
Proteïene
Proteïen databasis hou die teksrekord vir individuele proteïenreekse, afgelei van baie verskillende bronne, soos die NCBI Reference Sequence (RefSeq) -projek, GenBank, PDB en UniProtKB / SWISS-Prot. Proteïenrekords is beskikbaar in verskillende formate, insluitend FASTA en XML, en word gekoppel aan ander NCBI-bronne. Proteïen verskaf die toepaslike data aan die gebruikers, soos gene, DNA / RNA-reekse, biologiese weë, uitdrukkings- en variasiedata en literatuur. Dit bied ook die voorafbepaalde stelle soortgelyke en identiese proteïene vir elke ry soos bereken deur die BLAST. Die struktuurdatabasis van NCBI bevat 3D-koördinaatstelle vir eksperimenteel bepaalde strukture in VBB wat deur NCBI ingevoer word. Die Conserved Domain-databasis ( CDD ) van proteïene bevat ryprofiele wat hoogs behoue domeine binne proteïenreekse kenmerk. Dit het ook rekords van eksterne bronne soos SMART en Pfam . Daar is 'n ander databasis in 'n proteïen wat bekend staan as Protein Clusters-databasis, wat stelle proteïenreekse bevat wat volgens die maksimum belyning tussen die individuele rye soos bereken deur BLAST gekluster is. [13]
Pubchem databasis
PubChem- databasis van NCBI is 'n openbare bron vir molekules en hul aktiwiteite teen biologiese toetse. PubChem is deursoekbaar en toeganklik deur die inligtingstelsel van Entrez . [14]
Sien ook
- DNA- databank van Japan (DDBJ)
- Europese Bioinformatika Instituut (EBI)
Verwysings
- ^ "Die menslike genoomprojek" . The New York Times .
- ^ a b "Navorsingsinstituut plaas genetiese gegewens op die internet" . The New York Times . 26 Junie 1997.
- ^ "Sense from Sequences: Stephen F. Altschul on Bettering BLAST" . 2000. Argief van die oorspronklike op 2007-10-07.
- ^ "National Library of Medicine kondig aan dat NCBI-direkteur Dr. David Lipman vertrek ." www.nlm.nih.gov . Besoek op 06/05/2017 .
- ^ a b Mizrachi, Ilene (22 Augustus 2007). GenBank: Die Nucleotide Sequence Database . Nasionale Sentrum vir Biotegnologie-inligting (VS) - via www.ncbi.nlm.nih.gov.
- ^ "Tuis - taksonomie - NCBI" . www.ncbi.nlm.nih.gov .
- ^ VSA (2019-05-06). "Tuis - Boeke - NCBI" . Ncbi.nlm.nih.gov . Besoek 12-06-2019 .
- ^ Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). Msgstr "Basiese soekinstrument vir plaaslike belyning". Tydskrif vir Molekulêre Biologie . 215 (3): 403–410. doi : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 .
- ^ Madden T. (2002). Die NCBI-handboek, 2de uitgawe, hoofstuk 16, The BLAST Sequence Analysis Tool
- ^ NCBI Hulpbronkoördineerders (2012). "Databasisbronne van die Nasionale Sentrum vir Biotegnologie-inligting". Nucleic Acids Research 41 (Databasisuitgawe): D8 – D20.
- ^ Ostell J. (2002). Die NCBI-handboek, 2de uitgawe, hoofstuk 15, The Entrez Search and Retrieval System
- ^ Maglott D. Pruitt K. & Tatusova T. (2005). Die NCBI Handboek, 2de uitgawe, hoofstuk 19, Gene: A Directory of Genes
- ^ Sayers E. (2013). Die NCBI Handboek, 2de uitgawe, NCBI Protein Resources
- ^ Wang Y. & Bryant S H. (2014). Die NCBI Handboek, 2de uitgawe, NCBI PubChem BioAssay Database
Eksterne skakels
- Amptelike webwerf
- Nasionale Biblioteek vir Geneeskunde
- Nasionale Instituut vir Gesondheid