Dbfetch < EMBL-EBI

Dbfetch

ID   JQ975066; SV 1; linear; genomic RNA; STD; VRL; 2280 BP.
XX
AC   JQ975066;
XX
DT   08-OCT-2012 (Rel. 114, Created)
DT   08-OCT-2012 (Rel. 114, Last updated, Version 1)
XX
DE   Sugarcane streak mosaic virus isolate M117 polyprotein gene, partial cds.
XX
KW   .
XX
OS   Sugarcane streak mosaic virus
OC   Viruses; Riboviria; Potyviridae; Poacevirus.
XX
RN   [1]
RP   1-2280
RA   He Z., Li W., Ma W., Ge B., Huang Y., Wang X., Li S.;
RT   "Genetic variability and population structure of Sugarcane streak mosaic
RT   virus (SCSMV)";
RL   Unpublished.
XX
RN   [2]
RP   1-2280
RA   He Z., Li W., Ma W., Ge B., Huang Y., Wang X., Li S.;
RT   ;
RL   Submitted (20-APR-2012) to the INSDC.
RL   State Key Laboratory for Biology of Plant Diseases and Insect Pests,
RL   Institute of Plant Protection, Chinese Academy of Agricultural Sciences,
RL   West 2 Yuanmingyuan Road, Haidian, Beijing 100193, China
XX
DR   MD5; e4bca934f285c93ea12f2bb2c3063438.
XX
FH   Key             Location/Qualifiers
FH
FT   source          1..2280
FT                   /organism="Sugarcane streak mosaic virus"
FT                   /host="sugarcane"
FT                   /isolate="M117"
FT                   /mol_type="genomic RNA"
FT                   /country="China"
FT                   /collected_by="Wenfeng Li and Zhen He"
FT                   /collection_date="03-Jun-2011"
FT                   /db_xref="taxon:53954"
FT   5'UTR           1..199
FT   CDS             200..>2280
FT                   /codon_start=1
FT                   /product="polyprotein"
FT                   /db_xref="InterPro:IPR025910"
FT                   /db_xref="UniProtKB/TrEMBL:K0III9"
FT                   /protein_id="AFU50437.1"
FT                   /translation="MATITKKQVWKPKEKVVSEPPKAEIQESRTTLMFNDYAEVEDFIQ
FT                   RFPAGSVFWTTKGKPKTIVNNLFKATQYGLAYDIAAEVYVCPICMTCARNKVYFTTNHQ
FT                   NCGELFRNKQAYISTSLRLEVVDTFDVFPRYATVEQEKLVGDWMADMEAYAHAEDDSID
FT                   IPYQIFNDNTGEVEERIKQVDLSVHGEIVEEERTYKVKIARSNATMLPHQRRANRVIMR
FT                   TNEIKELIDSTLEICHNRNIRVCFVDHERKKKLFPRIPLQHTVEPQALCDPRHDIIPAT
FT                   EKFITQWKDVGEPTMHINEQWVQKGWSGVVLHREDLDAHPNLQEKCVDNLFVVLGRCKH
FT                   GDLQNALKPDCCEELVFYTDGHKAKSHLFWDAIMKCHPDDHKFVDTTWNDEAYANMGYW
FT                   LAATYPFRVACKECSSIKSVREWVQNMRASKAYQLLRGGTSKHSRDLFRWLAAIQSELM
FT                   TFNIRDAQNTQEDLNRNFLGTIPIGPIFDVANQMNQAVVDIQRGLQQMHKLITDAELTH
FT                   QSRDEQILNEIARLRGLEFMQTERLMTNMKHVAMTYRNLINTASQPLSIHTMRQLLLDA
FT                   RSDEAYEFDIMRGKGAIAIVAPGVFRKFDNIYSKPGVYNPEWTHLTPGGEIRTDFDYLR
FT                   TDLKISQLHDKIHKWPENPLVDETCIVSEGEMSYHLCERVYECFVPIPHILRVGNPQNP
FT                   "
FT   mat_peptide     200..1273
FT                   /product="P1 protein"
FT   mat_peptide     1274..>2280
FT                   /product="Hc-Pro protein"
XX
SQ   Sequence 2280 BP; 719 A; 460 C; 523 G; 578 T; 0 other;
     aaatgtaatt tcaaattgac tacaatcaac tctcttccaa tcgctcaagc tctcacaagc        60
     cttcaaaagc gacctcaaga gcacagtagc caaactcggg tggagacacg ccgggtgcta       120
     ctgtttcgtg cgattttaag agatcttagc tttggccaga gacagtttaa cgataagttc       180
     acgagtcgtc tgggaagcta tggcaaccat caccaagaag caggtgtgga aaccgaagga       240
     gaaggtggtt agcgaaccac caaaggctga aattcaggag tcgcgcacga ctctaatgtt       300
     caacgattat gcggaagttg aggatttcat ccaacgcttc ccagctggaa gcgtcttctg       360
     gacaacaaaa ggaaagccaa aaacgattgt aaacaattta tttaaggcta cacaatatgg       420
     gctggcttat gatattgctg cagaagtata tgtgtgccct atatgtatga cttgtgcacg       480
     caacaaagtg tacttcacta caaatcatca gaattgtggt gagctattta ggaacaagca       540
     agcatacatc tcaacttctc tcagactcga ggttgtcgat acttttgacg tgtttccacg       600
     ttatgcaact gttgagcaag agaagcttgt tggagattgg atggcggaca tggaggctta       660
     tgctcacgct gaagatgatt caattgacat tccctaccag atcttcaacg ataacactgg       720
     cgaagtcgaa gaaagaatca aacaagttga cttgtcagtt catggtgaaa ttgtggagga       780
     agaacgcacc tacaaagtta aaatcgctcg ctccaacgcc acaatgttgc cacatcagcg       840
     tcgtgcgaat cgcgtgataa tgcgaacaaa cgaaatcaaa gaattaatag attctacgct       900
     tgaaatatgt cacaacagaa acataagagt gtgttttgtt gaccatgagc gaaagaagaa       960
     attatttcca agaattccgc tacaacacac tgttgaacct caagcattat gtgaccctcg      1020
     tcatgacatc attccagcta ccgaaaagtt cataactcaa tggaaggatg ttggggaacc      1080
     tacgatgcac atcaacgagc aatgggttca aaaaggatgg agtggtgtag ttctacacag      1140
     agaagattta gacgctcacc ccaatttaca agagaaatgt gtcgacaatc tttttgttgt      1200
     acttgggagg tgtaagcatg gagatttaca aaatgcctta aaaccagatt gttgtgagga      1260
     actggtgttt tacacagatg gacataaagc aaaatcacat ctattctggg atgcaattat      1320
     gaagtgtcat cctgatgacc acaagtttgt tgacacgaca tggaacgatg aggcttatgc      1380
     aaacatgggc tattggttag ctgcgacata cccatttagg gttgcttgca aagaatgctc      1440
     gagcattaaa tctgttcgtg aatgggtgca aaacatgcga gcatcaaagg cttatcaact      1500
     cttgcgaggt ggtacgtcga agcactcgcg agatttgttt cgatggctgg cggcgattca      1560
     atctgagcta atgactttta atattagaga tgcgcaaaac acacaggagg accttaatag      1620
     gaactttctt ggaacgatac ctattggtcc aattttcgac gtggcgaatc aaatgaatca      1680
     ggcggtggtc gacattcaaa ggggtctaca acagatgcat aagctaatca cggacgcgga      1740
     gttgacgcat caatcacgag atgagcaaat tttaaatgaa attgcacgac ttcgagggtt      1800
     agaatttatg caaacggaga ggcttatgac gaatatgaag catgttgcta tgacctacag      1860
     aaatctgata aacaccgcga gccaaccact gtcgatacac acaatgcgac aacttctact      1920
     tgatgctcgc agtgacgagg catatgaatt cgatattatg cgaggaaagg gtgcaattgc      1980
     aatagtcgca cctggcgttt ttcggaaatt tgataacata tactcaaaac caggtgtcta      2040
     caatccagaa tggactcatt taacgccagg aggggagata cgaactgatt tcgattatct      2100
     gcgcacagac cttaaaattt cgcaactgca tgacaaaatc cacaaatggc ctgagaatcc      2160
     acttgttgac gaaacttgca ttgtatctga aggggagatg tcatatcatt tgtgtgaacg      2220
     agtttatgag tgctttgttc ctataccaca cattttacgg gttggcaatc cacagaatcc      2280
//