EBI Dbfetch

ID   ABBA01017891; SV 1; linear; genomic DNA; WGS; HUM; 2432 BP.
AC   ABBA01017891;
PR   Project:PRJNA19621;
DT   05-JUN-2007 (Rel. 92, Created)
DT   23-AUG-2014 (Rel. 121, Last updated, Version 4)
DE   Homo sapiens CTG_1103276997343, whole genome shotgun sequence.
OS   Homo sapiens (human)
OC   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia;
OC   Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae;
OC   Homo.
RN   [1]
RC   Publication Status: Online-Only
RP   1-2432
RX   PUBMED; 17803354.
RA   Levy S., Sutton G., Ng P.C., Feuk L., Halpern A.L., Walenz B.P.,
RA   Axelrod N., Huang J., Kirkness E.F., Denisov G., Lin Y., Macdonald J.R.,
RA   Pang A.W., Shago M., Stockwell T.B., Tsiamouri A., Bafna V., Bansal V.,
RA   Kravitz S.A., Busam D.A., Beeson K.Y., McIntosh T.C., Remington K.A.,
RA   Abril J.F., Gill J., Borman J., Rogers Y.H., Frazier M.E., Scherer S.W.,
RA   Strausberg R.L., Venter J.C.;
RT   "The Diploid Genome Sequence of an Individual Human";
RL   PLoS Biol. 5(10):E254-E254(2007).
RN   [2]
RP   1-2432
RA   Levy S., Sutton G., Ng P., Feuk L., Halpern A.L., Walenz B., Axelrod N.,
RA   Huang J., Kirkness E.F., Denisov G., Lin Y., MacDonald J.R., Wing A.,
RA   Pang C., Shago M., Stockwell T.B., Tsiamouri A., Bafna V., Bansal V.,
RA   Kravitz S.A., Busam D., Beeson K.Y., McIntosh T.C., Remington K., Gill J.,
RA   Borman J., Johnson J., Resnick A., Rogers Y.-H., Frazier M., Scherer S.W.,
RA   Strausberg R.L., Venter J.C.;
RT   ;
RL   Submitted (18-MAY-2007) to the INSDC.
RL   J Craig Venter Institute, 9704 Medical Center Drive, Rockville, MD 20850,
DR   MD5; 2d3ab2a1c9f5f40be525bbb921d5cfc7.
DR   ENA; ABBA010000000; SET.
DR   ENA; ABBA000000000; SET.
DR   ENA-CON; KI270729.
DR   ENA-CON; DS486483.
DR   BioSample; SAMN02981236.
CC   DNA Donor Name: J. Craig Venter | Date of Birth: October 14, 1946 |
CC   Sex: Male | Ethnicity: Caucasian | Descent: European - England
CC   This WGS project represents a composite haploid version of the
CC   genome where the highest scoring allele contained is represented in
CC   the consensus sequence.  The number of contigs may differ from
CC   those in the PLoS Biol. paper (PloS Biology 2007 5: e254) because
CC   some short sequences were found to be foreign and thus were
CC   suppressed. Scaffolds DS486015-DS490530 represent the 4528
CC   scaffolds that are discussed in the paper.  There are fewer than
CC   listed in the paper because 12 of the original were determined to
CC   be foreign, so were omitted here.  Scaffolds DS490531-DS490620 are
CC   the remaining multi-component scaffolds, not in the set of 4528.
CC   The chromosomes are records CM000462-CM000485, assembled from the
CC   scaffolds.
FH   Key             Location/Qualifiers
FT   source          1..2432
FT                   /organism="Homo sapiens"
FT                   /mol_type="genomic DNA"
FT                   /sex="male"
FT                   /dev_stage="adult"
FT                   /db_xref="taxon:9606"
SQ   Sequence 2432 BP; 937 A; 169 C; 793 G; 533 T; 0 other;
     aatcgaatgg tatgtaatgg aatggaatgg actctaatgg aatggagtag aatgaactcg        60
     agtagaatgg aatggactcg aaggaatgga atggaatgga atggaaccaa attgtttgga       120
     gagaatggag tggaatggaa tggagaggaa tggaatagaa tgaaatggag tggactcaaa       180
     aggaatggta tggtattgaa tggaaagcaa aggaatggaa tggattgcaa tgggatggaa       240
     ttgaatggac ttgaatacaa tgaatggaat cgaaagtgat ggaatggacc tgaaaggaat       300
     agaatggaat ggagtggaat ggaatagaat ggaatggtat agactcgaag ggaatgtaat       360
     gaaatggact cgaaaagaga ggaattgaat ggaatggaat ggaatggact tggttggaat       420
     agcatggaat ttaatggaat gaacttgaat gaaatggaat ggaatggact caaatggaat       480
     tgaatggact cgaatggaat ggaatggaat ggaatggaat ggactagaat gatatgcaaa       540
     ggaatggact cgaatgaatt ggaatggact ctagttgagt ggactggaat agaatggact       600
     ccaaaggaaa ggagtggaaa ggattcgaat gcaattgaat ggaatggaat tgatttgaat       660
     agaatggaat gaaatggtat ggaattgaca cgaattgaat ggaatgtaat ggaatgaaat       720
     cgactcgaat ggaatggaat ggactcgaat agaatggact cgaacggaat ggaatggaat       780
     ggaatagaat ttactcgatt tgaatggaaa gtaaaagaat ggacttgaaa ggaaaggagt       840
     cgaatggaat ataatcgaat ggaatggagt ggaatggaat ggaatggaat ggactggaat       900
     agaatggaat gcattggaaa ggacttgaat ggaatggaat ggaatagaat ggcctcgaat       960
     gggatggaat ggaatggaat ggacgcgaat tgaatggaat gtaatggaac cgaaaggaat      1020
     ggaatgtaat ggtcccgaat ggaatggaat gggatggaat gcaatggaat tgaattgaat      1080
     ggaatggaat atattggaat ggactcgaac ggaatggata ggaatggaca cgaatggagt      1140
     ggaatggaat ggaatggtct caagtggaat ggaatggaat ggaatggaat ggactcgaat      1200
     ggaatggaat ggactcgaat ggaatggaaa gctatggaca ccaatggaat ggaatggaat      1260
     ggaatggaat ggaatggaat ggaatggaat ggtatggtat ggaatggaat ggatttgaat      1320
     ggagttgaat taacagaatg gaatggaatc aaaagtattg gaatggaatg aagtcgaatg      1380
     gaatggaatg gacatgaatg gaacggaatg gaatggaaag aacacgaaag gaatacaagg      1440
     gaatttaatg gaatggactc taatggaatg aaatggaatg gacttgaatg gaatataatg      1500
     gaagatatta gaatggaata gaatgcaatg gaatggactc aaatggaagg gaatggaatt      1560
     gactcaaatg gaatggaatg gaattgaatg gactcgacat cattaggatg gaatacagtg      1620
     gaatggactc gaatggaatg gtatggaatg gactcgaatg caatggaatg tactcaaatg      1680
     gaatgctatg gaattgactc gagtggaatg gaatagaatg gaatggacac gaatggtatg      1740
     gaatggaatg gtctggaatg gaatggaatg gaatggaatg ggctaaaatg gaatggaatg      1800
     gaacggaaaa ggatggaatg gaatggaatg tactggaatg aaataagttt ggaatggaat      1860
     ggaatggaat ggaatggact caaatggaaa agcatggaat ggaatgaact caaatgaaat      1920
     ggaatggaat ggacgcgaat ggaatggaat ggaatggaat ggatttgaat ggtctcttaa      1980
     ggaatggaac ggcattgaat cgactcgaag ggaatagaat gtaacggaat ggaatgaacc      2040
     ggaatggaat ggaatggaat gcaatggaat ggaatggaat gcaatggaat ggaatggaat      2100
     gcaatggaat ggaatggaat gcaatggatt ggaacggaat gcaatggatt ggaacttaat      2160
     ataatgtaat ggaatggaat ggaatatact cgaatgggat ggaatggaat ggaatttact      2220
     cgaagtgaat ggattggaat ggactgtaat ggaatagcat ggaatggaat ggactcgaat      2280
     gcaatagaat ggaatggact cgaatggaat ggaatggact cgaatggagt ggagtagaat      2340
     ggactcgtat ggaatgcaat gaaatgaacc gaatggaatg cactcgaatg gaatggaagg      2400
     gaatggaatg gaacggaatg gacttgaatg ga                                    2432