ID   JF909106; SV 1; circular; genomic DNA; STD; VRL; 2801 BP.
XX
AC   JF909106;
XX
DT   21-JUN-2012 (Rel. 113, Created)
DT   05-DEC-2012 (Rel. 115, Last updated, Version 3)
XX
DE   East African cassava mosaic virus-Kenya isolate
DE   Comoros:Grande-Comore:GC30BP1:2009 segment DNA-A, complete sequence.
XX
KW   .
XX
OS   East African cassava mosaic virus-Kenya
OC   Viruses; Geminiviridae; Begomovirus.
XX
RN   [1]
RC   Publication Status: Online-Only
RP   1-2801
RX   DOI; 10.1186/1471-2148-12-228.
RX   PUBMED; 23186303.
RA   De Bruyn A., Villemot J., Lefeuvre P., Villar E., Hoareau M.,
RA   Harimalala M., Abdoul-Karime A.L., Abdou-Chakour C., Reynaud B.,
RA   Harkins G.W., Varsani A., Martin D.P., Lett J.M.;
RT   "East African cassava mosaic-like viruses from Africa to Indian ocean
RT   islands: molecular diversity, evolutionary history and geographical
RT   dissemination of a bipartite begomovirus";
RL   BMC Evol. Biol. 12(1):228-228(2012).
XX
RN   [2]
RP   1-2801
RA   Villemot J., Lefeuvre P., Villar E., Hoareau M., Harimalala M.,
RA   Abdoul-Karime A.L., Abdou-Chakour C., Reynaud B., Varsani A., Martin D.P.,
RA   Lett J.-M.;
RT   ;
RL   Submitted (24-MAR-2011) to the INSDC.
RL   UMR PVBMT, CIRAD, 7, chemin de l'IRAT, Saint-Pierre, Reunion 97410, France
XX
DR   MD5; 8e88c14342f6a0d0eb5b905bc259e040.
XX
FH   Key             Location/Qualifiers
FH
FT   source          1..2801
FT                   /organism="East African cassava mosaic virus-Kenya"
FT                   /segment="DNA-A"
FT                   /host="Manihot esculenta (cassava)"
FT                   /isolate="Comoros:Grande-Comore:GC30BP1:2009"
FT                   /mol_type="genomic DNA"
FT                   /country="Comoros:Grande-Comore"
FT                   /lat_lon="11.5 S 43.33 E"
FT                   /collection_date="2009"
FT                   /db_xref="taxon:1229189"
FT   gene            174..530
FT                   /gene="AV2"
FT   CDS             174..530
FT                   /codon_start=1
FT                   /gene="AV2"
FT                   /product="movement protein"
FT                   /db_xref="GOA:I6LXD1"
FT                   /db_xref="InterPro:IPR002511"
FT                   /db_xref="InterPro:IPR005159"
FT                   /db_xref="UniProtKB/TrEMBL:I6LXD1"
FT                   /protein_id="AEG89970.1"
FT                   /translation="MWDPLLNDFPETVHGFRSMLAVKYLLHLEQQYDRGTVGAEYIRDL
FT                   IGVLRCKSYVEATRRYNNLNTRIQGAEEAELRQPIHEPCCCPHCPRHQKQNMGQQAHVS
FT                   EAQDVQNVSKPRCP"
FT   gene            334..1107
FT                   /gene="AV1"
FT   CDS             334..1107
FT                   /codon_start=1
FT                   /gene="AV1"
FT                   /product="coat protein"
FT                   /db_xref="GOA:I6LYX6"
FT                   /db_xref="InterPro:IPR000263"
FT                   /db_xref="InterPro:IPR000650"
FT                   /db_xref="UniProtKB/TrEMBL:I6LYX6"
FT                   /protein_id="AEG89969.1"
FT                   /translation="MSKRPGDIIISTPVSKVRRRLNFDSPYTNRVVAPTVRVTRSKIWA
FT                   NRPMYRKPKMYRMYRSPDVPKGCEGPCKVQSYEQRDDVKHTGMVRCVSDVTRGSGITHR
FT                   VGKRFCVKSIYILGKIWMDENIKKQNHTNHVMFFLVRDRRPYGPSPQEFGQVFNMFDNE
FT                   PTTATVKNDLRDRYQVLRKFYATVVGGPSGMKEQALVKRFFRINNHVVYNHQEQAKYEN
FT                   HTENALLLYMACTHASNPVYATLKIRIYFYDAVTN"
FT   gene            complement(1104..1508)
FT                   /gene="AC3"
FT   CDS             complement(1104..1508)
FT                   /codon_start=1
FT                   /gene="AC3"
FT                   /product="replication enhancer"
FT                   /db_xref="GOA:I6LXR6"
FT                   /db_xref="InterPro:IPR000657"
FT                   /db_xref="UniProtKB/TrEMBL:I6LXR6"
FT                   /protein_id="AEG89973.1"
FT                   /translation="MDSRTGELITAPQATNGVFTWEITNPLYFEITNHDKRPGNMNHDI
FT                   ITLQIRFNHNLRKALGIHKCFLNFKVWTTLRPQTGRFLKVFRYQVLKYLDMIGVISINI
FT                   VLQAVDHVLYDVLLNTLQVTEQHAIKFNLY"
FT   gene            complement(1249..1656)
FT                   /gene="AC2"
FT   CDS             complement(1249..1656)
FT                   /codon_start=1
FT                   /gene="AC2"
FT                   /product="transcription activator protein"
FT                   /db_xref="GOA:I6LXD3"
FT                   /db_xref="InterPro:IPR000942"
FT                   /db_xref="UniProtKB/TrEMBL:I6LXD3"
FT                   /protein_id="AEG89972.1"
FT                   /translation="MPPSSPSTSHCSLVPIKVQHRTAKTRAVRRRRVDLECGCSFYLHI
FT                   DCINHGFSHRGTHHCASSNEWRFYLGNNKSPLFRNHQPRQAAREHEPRHHHTPDTVQPQ
FT                   PPEGIGDSQVFSQLQGLDDLTASDWSFLKSI"
FT   gene            complement(1565..2644)
FT                   /gene="AC1"
FT   CDS             complement(1565..2644)
FT                   /codon_start=1
FT                   /gene="AC1"
FT                   /product="replication associated protein"
FT                   /db_xref="GOA:I6LXR4"
FT                   /db_xref="InterPro:IPR001191"
FT                   /db_xref="InterPro:IPR001301"
FT                   /db_xref="InterPro:IPR022690"
FT                   /db_xref="InterPro:IPR022692"
FT                   /db_xref="UniProtKB/TrEMBL:I6LXR4"
FT                   /protein_id="AEG89971.1"
FT                   /translation="MPRAGRFQINARNYFITYPRCSLTKEEALSQLKALSYPSNIKFIR
FT                   VCRELHQDGVPHLHVLIQFEGKFQCTNPRFFDLISTSRSTHFHPNIQGAKSSSDVKAYI
FT                   EKGGEFLDDGIFQVDARSARGEGQHLAQVYADALNASSKTEALQIIKEKDPKSFFLQFH
FT                   NISANADRIFQAPPQTYVSPFLSSSFTQVPEDIEVWVSENICSPAARPWRPVSIVLEGD
FT                   SRTGKTMWARSLGPHNYLCGHLDLSPKVYSNDAWYNVIDDVDPHYLKHFKEFMGAQRDW
FT                   QSNTKYGKPIQIKGGIPTIFLCNPGPTSSYKEFLEEEKNQSLKAWALKNATFITLHEPL
FT                   FSSAHQSPTPHSENQGRQT"
FT   gene            complement(2254..2487)
FT                   /gene="AC4"
FT   CDS             complement(2254..2487)
FT                   /codon_start=1
FT                   /gene="AC4"
FT                   /product="C4 protein"
FT                   /db_xref="InterPro:IPR002488"
FT                   /db_xref="UniProtKB/TrEMBL:I6LXR7"
FT                   /protein_id="AEG89974.1"
FT                   /translation="MGCLISMFSSSSKGSSNVPTHDSSISFPHPDPHISIRTFRELNHR
FT                   PMSKLILKREGNFLTMAFSRSMPEVQGGRASI"
XX
SQ   Sequence 2801 BP; 730 A; 560 C; 714 G; 797 T; 0 other;
     accggatggc cgcgcccgaa aaagcaggtg gaccccacag gatggccgcg cccgtaaaag        60
     aaagtggtcc ccgcgcacgt gttttggtcg gccagtcata ttcgcgcgtg aaagtctaga       120
     tatttgttgt tggtctttat agacttcgtc gcgaagtagt ggagcgcgtc aacatgtggg       180
     atccattgtt gaacgatttc cccgaaaccg ttcacggttt ccgttctatg cttgctgtta       240
     aatacctgtt acatctggaa cagcaatacg atcgcggtac tgttggggct gagtatatac       300
     gggatctaat aggggttcta cggtgtaaga gttatgtcga agcgaccagg agatataata       360
     atctcaacac ccgtatccaa ggtgcggagg aggctgaact tcgacagccc atacacgaac       420
     cgtgttgttg cccccactgt ccgcgtcacc agaagcaaaa tatgggccaa caggcccatg       480
     tatcggaagc ccaagatgta cagaatgtat cgaagcccag atgtccctaa gggctgtgaa       540
     ggcccatgta aggttcagtc ctatgaacag agggatgatg ttaagcacac gggtatggtt       600
     cgatgtgtca gtgatgttac gcgtgggtca ggtattacgc atagagtcgg gaagaggttt       660
     tgtgttaagt ccatatatat attgggcaag atctggatgg atgagaatat caagaagcaa       720
     aatcatacga accatgttat gttcttcctt gttcgagata gaaggcctta tggtccgagt       780
     cctcaagagt ttggacaagt gttcaacatg tttgataatg aacctactac tgcaactgtg       840
     aaaaatgatc ttagggaccg gtatcaggtg ttacgtaaat tctatgcgac tgttgttggt       900
     ggaccctctg ggatgaagga acaagctctg gttaagaggt tttttaggat caataatcat       960
     gtagtgtata atcatcagga acaggccaag tatgagaatc atactgagaa tgcgttgtta      1020
     ttgtatatgg catgtacaca tgcctcgaat cctgtgtacg ctacgctgaa aatacgcatc      1080
     tatttctatg atgcagtgac aaattaataa aggttgaatt ttattgcatg ttgctccgta      1140
     acttggagcg tgtttagtaa tacatcgtac agaacatgat caacagcctg aagtacaatg      1200
     ttaatggaaa taacgcctat catatccaaa tacttgagca cttgatatct aaatactttt      1260
     aagaaacgac cagtctgagg ccgtaaggtc gtccagacct tgaagttgag aaaacacttg      1320
     tgaatcccca atgccttccg gaggttgtgg ttgaaccgta tctggagtgt gatgatgtcg      1380
     tggttcatgt tccctggccg cttgtcgtgg ttggtgattt cgaaatagag gggatttgtt      1440
     atttcccagg taaaaacgcc attcgttgct tgaggcgcag tgatgagttc ccctgtgcga      1500
     gaatccatgg ttgatgcagt cgatatggag atagaacgag cagccgcatt cgaggtctac      1560
     ccgcctacgt ctgacggccc tggttttcgc tgtgcggtgt tggactttga tgggcactag      1620
     agaacaatgg ctcgtggagg gtgatgaagg tggcattctt taaagcccag gctttaaggg      1680
     actggttctt ttcctcttcc agaaactctt tatatgatga tgttggtcca ggattgcaga      1740
     ggaagatagt gggaatgccg cctttaattt gaattggctt cccgtacttt gtattgcttt      1800
     gccagtctct ttgggccccc atgaattctt tgaaatgctt tagatagtgc gggtctacgt      1860
     cgtcaatgac gttgtaccat gcgtcgtttg aatatacctt tggagacaga tccaggtgtc      1920
     cacatagata attatggggt cccagtgaac gagcccacat ggttttccct gttcggctat      1980
     caccttcgag aacaatactg accggtctcc atggccgcgc agcgggactg catatatttt      2040
     ctgataccca tacttctatg tcttcgggga cttgtgtaaa tgatgatgat aagaacggac      2100
     taacataagt ttggggcgga gcctggaaga ttctatccgc gttagcagat atgttatgga      2160
     actgtaaaaa aaaggacttt ggatcttttt ctttaataat ctgaagagct tctgttttag      2220
     aagaagcatt caacgcgtct gcatatacct gagctaaatg ctggccctcc ccccttgcac      2280
     ttctggcatc gacctggaaa atgccatcgt caagaaattc ccctcccttt tcaatataag      2340
     ctttgacatc ggacgatgat ttagctccct gaatgttcgg atggaaatgt gtggatctgg      2400
     atgtggaaat gagatcgaag aatcgtgggt tggtacattg gaacttccct tcgaactgga      2460
     tgagaacatg gagatgaggc accccatcct gatgtagttc tcggcaaacc ctaatgaatt      2520
     tgatattcga cgggtaagaa agggctttta attgggaaag tgcctcttcc tttgttaatg      2580
     agcatcgggg ataggtaatg aaataatttc tggcatttat ttgaaaacga ccggctcttg      2640
     gcatatttgc tgtcgttttg tatcggtgga cactcaaaac tccaggggaa cggtggaatg      2700
     gtggacatta tataggatgt cccccaatgg cattcgtgta aataggtaga cttccatttc      2760
     aaatttgaat gtcgaatatt ggcggccatc cgattaatat t                          2801
//