CoVDB Coronavirus Database (v3)   
Strain
Porcine_NC_003436 (Region: Belgium;  Strain: Porcine epidemic diarrhea virus, complete genome.;  Date: 1977)
Gene
Pol1
Description
Annotated in NCBI,  Pol1
GenBank Accession
Full name
Replicase polyprotein 1ab      
Alternative Name
ORF1ab polyprotein
 

Sequence

CDS
ATGGCTAGCAACCATGTCACATTGGCGTTTGCCAATGATGCAGAAATTTCGGCTTTTGGCTTTTGCACTGCTAGTGAAGCCGTCTCATACTATTCTGAGGCCGCCGCTAGTGGATTTATGCAATGCCGTTTTGTGTCCCTCGATCTCGCTGACACTGTTGAGGGATTGCTTCCTGAAGACTATGTCATGGTGGTGATCGGCACTACCAAGCTTAGTGCGTATGTGGACACTTTTGGTAGCCGCCCCAGAAACATTTGTGGTTGGCTGTTATTTTCTAACTGTAATTACTTCCTCGAAGAGTTAGAGCTCACTTTTGGTCGTCGTGGTGGTAACATCGTGCCAGTTGACCAATACATGTGTGGCGCTGACGGGAAACCTGTTCTTCAGGAATCCGAGTGGGAGTATACAGATTTCTTCGCTGACTCCGAAGACGGTCAACTCAACATTGCTGGGATCACTTATGTGAAGGCCTGGATTGTAGAGCGATCGGACGTCTCTTATGCGAGTCAGAATTTAACATCTATTAAGTCTATTACTTACTGTTCAACCTATGAGCATACTTTTCTTGATGGTACTGCCATGAAGGTTGCACGTACTCCAAAGATCAAGAAGAATGTTGTTTTGTCTGAGCCACTTGCTACTATCTACAGGGAAATTGGTTCCCCTTTTGTGGATAATGGGAGCGATGCTCGTTCTATCATTAGGAGACCAGTGTTCCTCCACGCTTTTGTTAAGTGTAAGTGTGGTAGTTATCATTGGACTGTTGGTGATTGGACTTCCTATGTCTCCACTTGCTGTGGCTTTAAGTGCAAGCCAGTCCTTGTGGCCTCATGCTCTGCTATGCCTGGTTCTGTTGTGGTCACACGCGCTGGTGCTGGCACTGGTGTTAAGTACTACAACAACATGTTCCTGCGCCATGTGGCTGACATTGATGGATTGGCATTCTGGCGAATTCTTAAGGTGCAGTCCAAAGACGACCTCGCTTGCTCTGGTAAGTTCCTTGAACACCATGAGGAAGGTTTCACAGACCCTTGCTACTTTTTGAATGATTCGAGCCTTGCTACTAAGCTTAAGTTCGACATCCTTAGTGGCAAGTTTTCTGATGAAGTCAAACAAGCTATCATTGCTGGTCATGTTGTTGTTGGCAGTGCACTCGTTGACATTGTTGACGATGCACTGGGACAACCTTGGTTCATACGTAAGCTTGGTGACCTTGCAAGTGCACCTTGGGAGCAGCTTAAGGCTGTCGTTAGAGGCCTTGGCCTCTTGTCTGATGAGGTTGTGCTCTTTGGCAAAAGACTTAGCTGTGCCACTCTTAGTATCGTTAACGGCGTTTTTGAGTTTCTCGCCGATGTGCCAGAGAAGTTGGCTGCGGCTGTTACAGTTTTTGTCAACTTCTTGAATGAGTTCTTTGAGTCTGCCTGTGACTGCTTAAAGGTCGGAGGTAAGACATTCAACAAGGTTGGTTCCTATGTTCTTTTTGACAATGCATTGGTTAAGCTTGTCAAGGCAAAAGCTCGCGGCCCACGACAGGCAGGTATTTGTGAAGTTCGCTACACAAGCCTGGTTGTTGGGAGTACTACCAAGGTGGTTTCCAAGCGCGTTGAAAATGCCAATGTGAATCTCGTCGTCGTTGACGAGGATGTAACCCTCAACACCACTGGTCGTACAGTTGTCGTTGATGGACTTGCATTCTTCGAGAGTGACGGGTTTTACAGACATCTTGCTGATGCTGACGTTGTCATCGAACATCCTGTTTATAAGTCTGCTTGTGAGCTCAAGCCAGTTTTTGAGTGTGACCCAATACCTGATTTTCCTTTGCCTGTGGCCGCTAGTGTTGCAGAGCTCTGTGTGCAAACCGATCTGTTGCTTAAAAATTACAACACTCCTTATAAAACTTACAGCTGCGTAGTGAGAGGTGATAAGTGTTGCATCACTTGCACCTTACAGTTCAAAGCACCAAGTTATGTGGAGGATGCTGTTAATTTTGTAGACCTATGTACCAAGAACATTGGTACTGCTGGTTTTCATGAGTTTTACATAACGGCCCATGAACAACAGGATCTGCAAGGGTTTTTAACCACTTGTTGCACGATGTCAGGTTTTGAGTGTTTTATGCCTACAATCCCACAGTGTCCAGCAGTGCTTGAAGAGATTGATGGTGGTAGCATATGGCGGTCTTTTATCACTGGTCTTAATACAATGTGGGATTTTTGCAAGCGTCTTAAAGTCAGCTTTGGACTGGATGGCATTGTTGTCACTGTAGCACGCAAATTTAAACGACTTGGTGCTCTTTTGGCAGAAATGTATAACACTTATCTTTCAACTGTGGTGGAAAACTTGGTACTGGCCGGTGTTAGCTTCAAGTATTATGCCACCAGTGTCCCAAAAATTGTTTTGGGCGGTTGTTTTCACAGTGTTAAAAGTGTTTTTGCAAGTGTCTTCCAGATTCCTGTCCAGGCAGGCATTGAGAAGTTTAAAGTTTTCCTTAACTGTGTTCACCCTGTTGTACCACGTGTCATTGAAACTTCTTTTGTGGAATTAGAAGAGACGACATTTAAACCACCAGCACTCAATGGTGGTATTGCTATTGTTGATGGCTTCGCTTTCTATTATGATGGAACACTATACTATCCCACCGATGGTAATAGTGTTGTGCCTATCTGTTTTAAGAAGAAAGGTGGTGGTGATGTTAAATTCTCTGATGAAGTCTCTGTTAAAACCATTGATCCAGTTTATAAGGTCTCCCTTGAATTTGAGTTCGAGTCTGAGACTATTATGGCTGTGCTTAATAAGGCTGTTGGTAATCGTATCAAGGTTACAGGTGGTTGGGATGATGTCGTTGAGTATATTAACGTTGCCATTGAGGTTCTTAAAGATCACGTTGAAGTGCCTAAGTACTACATCTATGATGAGGAAGGTGGCACTGATCCTAATCTGCCCGTAATGGTTTCTCAGTGGCCGTTGAATGATGACACGATCTCACAGGACCTGCTTGATGTGGAAGTTGTTACGGATGCACCAATTGATTCCGAGGGTGATGAAGTAGACTCCTCTGCACCTGAGAAGGTGGCAGATGTGGCTAACTCTGAACCTGGGGATGATGGTCTTCCTGTGGCACCTGAAACAAATGTAGAGTCTGAAGTTGAGGAAGTTGCCGCAACCTTGTCCTTTATTAAAGATACACCTTCCACAGTTACTAAGGACCCTTTTGCTTTTGACTTTGTAAGCTACGGAGGACTTAAAGTTTTAAGACAATCTCATAACAATTGTTGGGTTACTTCTACCTTGGTGCAGCTACAATTGCTTGGCATCGTTGATGACCCTGCAATGGAACTTTTTAGTGCTGGTAGAGTTGGTCCAATGGTTCGCAAATGTTATGAGTCACAAAAGGCTATTTTGGGATCTTTGGGTGATGTGTCGGCTTGCCTAGAGTCTCTGACTAAGGACCTACACACACTTAAGATTACCTGTTCTGTAGTCTGCGGTTGTGGTACTGGTGAACGTATCTATGAGGGTTGTGCTTTTCGTATGACGCCAACTTTGGAACCGTTTCCATATGGTGCTTGTGCTCAGTGTGCTCAAGTTTTGATGCACACTTTTAAAAGTATTGTTGGCACCGGCATCTTTTGCCGAGATACTACTGCTCTCTCCTTGGATTCTTTGGTTGTAAAACCTCTTTGTGCGGCTGCTTTTATAGGCAAGGATAGTGGTCATTATGTCACCAATTTTTATGATGCTGCTATGGCTATTGATGGTTATGGTCGTCATCAGATAAAGTATGACACACTGAACACCATTTGTGTTAAAGACGTGAATTGGACAGCACCTCTTGTCCCTGCCGTTGATTCTGTAGTGGAGCCTGTTGTCAAACCATTCTATTCTTATAAGAATGTTGATTTTTACCAAGGAGATTTTAGTGACCTTGTTAAACTTCCATGTGACTTTGTTGTTAATGCTGCAAATGAGAAGTTGTCTCATGGTGGCGGCATAGCAAAGGCCATTGATGTTTATACCAAGGGCATGTTGCAGAAGTGTTCAAATGATTACATTAAAGCACACGGTCCCATTAAAGTTGGACGTGGTGTCATGTTGGAGGCATTAGGTCTTAAGGTCTTTAATGTTGTTGGTCCACGTAAGGGTAAGCATGCACCTGAGCTTCTTGTTAAGGCTTATAAGTCCGTTTTTGCTAACTCAGGTGTTGCTCTTACACCTTTGATTAGTGTTGGAATTTTTAGTGTTCCTTTGGAAGAATCTTTATCTGCTTTTCTTGCATGTGTTGGTGATCGCCACTGTAAGTGCTTTTGTTATGGTGACAAAGAGCGCGAGGCGATCATTAAGTACATGGATGGCTTGGTAGATGCTATTTTCAAAGAGGCGCTTGTTGACACTACTCCTGTCCAGGAAGATGTTCAACAAGTTTCACAAAAACCAGTTTTGCCTAATTTTGAACCTTTCAGGATTGAAGGTGCTCATGCTTTCTATGAGTGCAACCCTGAAGGTTTGATGTCCTTAGGTGCTGACAAGCTGGTGTTGTTTACAAATTCCAATTTGGATTTTTGTAGTGTTGGTAAGTGTCTTAACGATGTGACCAGCGGTGCATTGCTTGAAGCCATAAATGTATTTAAAAAGAGTAACAAAACAGTGCCTGCTGGCAACTGTGTTACTTTAGATTGTGCAAATATGATTTCTATTACTATGGTAGTATTGCCATTTGATGGTGATGCTAATTATGACAAAAATTATGCACGCGCCGTTGTCAAGGTATCTAAGCTTAAAGGCAAGTTAGTGCTTGCTGTTGATGATGCCACGTTGTATTCCAAGTTGTCCCACCTCAGCGTGTTAGGTTTCGTGTCCACACCTGACGATGTGGAGCGTTTCTACGCAAATAAGAGTGTGGTTATTAAAGTCACTGAGGATACACGTAGTGTCAAGGCTGTTAAAGTAGAATCCACTGCTACTTATGGACAACAAATTGGACCTTGTCTTGTTAATGACACCGTTGTCACAGACAACAAACCTGTTGTCGCTGACGTTGTAGCTAAGGTTGTACCAAATGCTAATTGGGATTCACATTATGGTTTTGATAAGGCTGGTGAGTTCCACATGCTAGACCATACTGGGTTTACCTTTCCTAGCGAAGTTGTTAACGGTAGGCGTGTGATTAAAACCACAGATAATAATTGTTGGGTTAATGTCACATGTTTACAATTACAGTTTGCTAGATTTAGGTTCAAGTCAGCAGGTCTACAGGCTATGTGGGAGTCCTATTGTACTGGTGATGTTGCTATGTTTGTGCATTGGTTGTACTGGCTTACTGGTGTTGACAAAGGTCAGCCTAGTGATTCAGAAAATGCACTTAACATGTTGTCCAAGTACATTGTTCCTGCTGGTTCTGTCACTATTGAACGTGTCACGCATGACGGCTGTTGTTGTAGTAAGCGTGTTGTTACTGCACCAGTTGTGAATGCTAGTGTGTTGAAGCTTGGCGTCGAGGATGGCCTTTGTCCACATGGTCTTAACTACATTGGCAAAGTTGTTGTAGTTAAAGGTACTACAATTGTTGTCAATGTAGGAAAACCTGTAGTGGCACCATCACACCTCTTTCTTAAGGGTGTATCCTACACAACATTCCTAGATAATGGTAACGGTGTTGTCGGCCATTATACTGTTTTTGATCATGGCACTGGTATGGTGCATGATGGCGATGCTTTTGTACCGGGTGATCTTAATGTATCTCCTGTTACAAATGTTGTTGTCTCAGAGCAGACGGCTGTTGTGATTAAAGACCCTGTGAAGAAAGCAGAGTTAGACGCTACTAAGCTGCTCGACACTATGAATTATGCATCGGAAAGATTTTTTTCCTTTGGTGATTTCATGTCACGTAATTTAATTACAGTGTTTTTGTACATCCTTAGCATTTTGGGTCTCTGTTTTAGAGCCTTTCGTAAGAGAGATGTTAAAGTTCTAGCTGGTGTACCCCAACGTACTGGTATTATATTGCGTAAAAGTATGCGCTATAATGCAAAGGCGTTGGGTGTCTTTTTCAAGCTAAAGCTTTATTGGTTCAAAGTTCTTGGTAAGTTTAGTCTGGGTATTTATGCATTGTATGCATTACTATTCATGACAATACGCTTTACACCTATAGGTAGCCCCGTCTGTGATGATGTTGTTGCTGGTTATGCTAATTCTAGTTTTGACAAGAATGAGTACTGCAACAGTGTTATTTGTAAGGTCTGTCTCTATGGGTACCAGGAACTCTCGGACTTCTCCCACACACAGGTTGTATGGCAACACCTTAGAGACCCATTAATTGGTAATGTGATGCCTTTCTTTTATTTGGCATTTTTGGCAATTTTTGGGGGTGTCTATGTAAAGGCTATTACTCTCTATTTTATTTTCCAGTACCTTAATAGTCTTGGTGTGTTTTTGGGCCTACAGCAGTCCATTTGGTTTTTGCAGCTCGTGCCTTTTGATGTCTTTGGTGATGAGATCGTCGTCTTTTTCATCGTTACACGCGTATTGATGTTCATTAAGCATGTTTGCCTTGGCTGCGATAAGGCATCTTGTGTGGCTTGCTCTAAGAGTGCTCGCCTTAAGCGCGTTCCTGTCCAGACTATCTTTCAGGGTACTAGTAAATCCTTCTACGTACATGCCAATGGTGGTTCTAAGTTCTGTAAGAAGCACAATTTCTTTTGTTTAAATTGTGATTCTTATGGTCCAGGCTGCACTTTTATTAACGACGTCATTGCAACTGAAGTTGGTAATGTTGTCAAACTTAATGTGCAACCGACAGGTCCTGCCACTATTCTTATTGACAAGGTTGAATTCAGTAATGGTTTCTACTATCTTTATAGTGGTGACACATTTTGGAAGTACAACTTTGACATAACAGATAGCAAATACACTTGCAAAGAGGCACTTAAAAATTGTAGCATAATCACAGACTTTATTGTTTTTAACAATAATGGTTCCAATGTAAATCAGGTTAAGAATGCATGTGTGTATTTTTCACAGATGCTTTGTAAACCTGTTAAGTTAGTGGACTCAGCGTTGTTGGCCAGTTTGTCTGTTGATTTTGGTGCAAGCTTACATAGTGCTTTTGTTAGTGTGTTGTCGAATAGTTTCGGCAAAGACCTGTCAAGTTGTAATGACATGCAGGATTGCAAGAGCACATTGGGTTTTGATGATGTACCATTGGATACCTTTAATGCTGCTGTTGCTGAGGCTCATCGCTATGATGTCCTCTTGACTGACATGTCATTCAACAATTTTACCACCAGTTATGCAAAACCAGAGGAAAAATTTCCCGTCCATGACATTGCCACGTGTATGCGTGTAGGTGCCAAGATTGTTAATCATAACGTTCTTGTCAAGGATAGTATACCTGTGGTGTGGCTTGTACGTGATTTCATTGCCCTTTCGGAAGAAACTAGGAAGTACATTATTCGTACGACTAAAGTTAAGGGTATAACATTTATGTTGACCTTTAATGATTGTCGTATGCATACTACCATACCTACTGTTTGCATTGCAAATAAGAAGGGTGCAGGTCTTCCTAGTTTTTCAAAGGTTAAGAAATTCTTTTGGTTTTTGTGTCTGTTCATAGTTGCTGCTTTCTTTGCACTAAGCTTTCTTGATTTTAGTACTCAGGTTAGCAGTGATAGCGATTATGATTTCAAGTATATTGAGAGTGGCCAGTTGAAGACTTTTGACAATCCACTTAGTTGTGTGCATAATGTCTTTATTAACTTCGACCAGTGGCATGATGCCAAGTTTGGTTTCACCCCCGTCAACAATCCTAGTTGTCCTATAGTTGTTGGTGTATCAGACGAAGCTCGCACTGTTCCAGGTATCCCAGCAGGTGTTTATTTAGCTGGTAAAACACTTGTGTTTGCTATTAACACCATTTTTGGTACATCTGGTTTGTGCTTCGATGCTAGTGGCGTTGCTGATAAGGGCGCTTGCATTTTTAATTCAGCTTGCACCACATTATCTGGTTTGGGTGGAACTGCTGTCTACTGTTACAAGAATGGGCTAGTTGAAGGTGCCAAACTTTATAGTGAGTTGGCACCTCATAGCTACTATAAAATGGTAGATGGTAATGCTGTGTCTTTACCTGAAATTATTTCACGCGGCTTTGGCATCCGTACTATCCGTACAAAGGCTATGACTTATTGCCGTGTTGGCCAGTGTGTGCAGTCTGCAGAAGGCGTTTGTTTTGGCGCCGATAGATTCTTTGTCTATAATGCAGAATCTGGTTCTGACTTTGTTTGTGGCACAGGGCTCTTCACATTGTTGATGAACGTTATTAGTGTTTTTTCCAAGACAGTACCAGTAACTGTGTTGTCTGGTCAAATACTTTTTAATTGCATTATTGCTTTTGTTGCTGTTGCGGTGTGTTTCTTATTTACAAAGTTTAAGCGCATGTTCGGTGATATGTCTGTTGGCGTTTTCACTGTCGGTGCTTGTACTTTGTTGAACAATGTTTCTTACATTGTAACACAGAACACACTTGGCATGTTGGGCTATGCAACTTTGTATTTCTTGTGCACTAAGGGTGTTAGATATATGTGGATTTGGCACTTGGGATTTTTGATCTCATATATTCTTATTGCACCATGGTGGGTTTTGATGGTTTATGCCTTTTCAGCCATTTTTGAGTTTATGCCTAACCTTTTTAAGCTTAAGGTTTCAACACAACTTTTTGAGGGCGACAAGTTCGTAGGCTCTTTTGAAAATGCTGCAGCAGGTACATTTGTGCTTGATATGCATGCCTATGAGAGACTTGCCAACTCTATCTCAACTGAAAAACTGCGTCAGTATGCTAGTACTTACAATAAGTACAAGTATTATTCAGGCAGTGCTTCAGAGGCTGATTACAGGCTTGCTTGTTTTGCCCATTTGGCCAAGGCTATGATGGATTATGCTTCTAATCATAACGATACGTTATACACACCACCCACTGTGAGTTACAATTCAACTCTACAGGCTGGCTTGCGTAAGATGGCACAACCTTCTGGTGTTGTTGAGAAGTGCATAGTCCGTGTTTGCTATGGTAATATGGCTCTTAATGGCCTATGGCTTGGCGATATTGTTATGTGCCCACGCCATGTTATAGCGTCTAGTACTACTAGCACTATAGATTATGATTATGCCCTTTCTGTTTTACGCCTCCACAACTTCTCCATTTCATCTGGGAATGTTTTCCTAGGTGTTGTGAGTGCAACTATGCGAGGTGCTTTGTTGCAGATAAAGGTTAATCAAAACAATGTCCACACGCCTAAGTACACCTATCGCACAGTTAGACCGGGTGAATCTTTTAATATTTTGGCGTGCTATGATGGTGCTGCAGCTGGTGTTTACGGCGTTAACATGCGCTCTAATTACACTATTAGAGGCTCGTTCATTAATGGCGCTTGTGGTTCACCTGGTTATAATATTAACAATGGTACCGTTGAGTTTTGCTATTTACACCAGCTTGAACTTGGTTCAGGCTGTCATGTTGGTAGCGACTTAGATGGTGTTATGTATGGTGGTTATGAGGACCAACCTACTTTGCAAGTTGAAGGCGCTAGTAGTCTGTTTACAGAGAATGTGTTGGCATTTCTTTATGCAGCACTCATTAATGGTTCTACCTGGTGGCTTAGTTCTTCTAGGATCGCTGTAGACAGGTTTAATGAGTGGGCTGTTCATAATGGTATGACAACAGTGGGCAATACTGATTGCTTTTCTATTCTTGCTGCTAAGACTGGAGTTGATGTACAACGTTTGTTGGCCTCAATCCAGTCTCTGCATAAGAATTTTGGTGGAAAGCAAATTCTTGGCCATACCTCGTTGACAGATGAGTTTACTACAGGTGAAGTTGTACGTCAAATGTATGGCGTTAATCTTCAGGGTGGCTATGTGTCACGCGCCTGCAGAAATGTCTTGCTGGTTGGTTCTTTTCTGACTTTCTTTTGGTCAGAATTAGTTTCCTACACTAAGTTCTTCTGGGTAAATCCTGGTTATGTTACACCTATGTTTGCGTGCTTGTCATTGCTATCCTCACTTTTGATGTTCACACTCAAGCATAAGACATTGTTTTTCCAGGTCTTCTTAATACCTGCTCTGATTGTTACATCTTGCATTAATTTGGCATTTGATGTTGAAGTCTACAACTATTTGGCAGAGCATTTTGATTACCATGTTTCTCTTATGGGTTTTAATGCACAAGGTCTTGTTAACATCTTTGTCTGCTTTGTTGTTACCATTTTACACGGCACATACACATGGCGCTTCTTTAATACACCTGCGAGTTCTGTCACTTATGTGGTAGCTTTGCTGACTGCGGCCTATAACTATTTTTACGCTAGTGACATTCTTAGTTGTGCTATGACACTATTTGCTAGTGTGACTGGCAACTGGTTCGTTGGTGCTGTTTGTTATAAAGTTGCTGTGTATATGGCCTTGAGATTTCCTACGTTCGTGGCTATTTTTGGTGATATTAAGAGTGTTATGTTCTGTTACCTTGTGTTGGGTTATTTTACCTGTTGCTTCTACGGTATTCTCTACTGGTTCAACAGGTTCTTTAAGGTTAGTGTAGGTGTCTATGACTATACTGTTAGTGCTGCTGAGTTTAAGTATATGGTTGCTAATGGCCTACGTGCACCAACTGGAACACTTGATTCACTACTGTTGTCCGCCAAATTGATTGGTATTGGTGGTGAGCGGAATATTAAGATTTCTTCCGTTCAGTCTAAACTGACTGATATTAAGTGTAGTAACGTTGTGCTTTTAGGCTGTCTTTCTAGCATGAATGTTTCAGCAAATTCAACAGAATGGGCTTATTGTGTTGACTTGCATAACAAGATCAACTTGTGTAATGACCCAGAAAAAGCGCAGGAAATGCTACTTGCTTTGTTGGCATTTTTCCTTAGTAAGAATAGTGCCTTTGGTTTAGACGACTTATTGGAATCTTATTTTAATGACAATAGTATGTTGCAGAGTGTTGCATCTACTTATGTAGGTTTGCCTTCCTATGTCATTTATGAAAATGCACGCCAACAGTATGAAGATGCTGTTAATAATGGTTCTCCACCTCAGTTGGTTAAGCAATTGCGCCATGCTATGAATGTAGCAAAGAGCGAATTTGACCGTGAGGCTTCTACTCAGCGTAAGCTTGATAGAATGGCGGAACAGGCTGCAGCACAGATGTATAAAGAGGCAAGGGCAGTTAATAGGAAGTCCAAAGTTGTAAGTGCTATGCATTCACTGCTTTTTGGTATGTTGAGACGTTTGGATATGTCTTCTGTAGACACCATTCTCAACTTGGCAAAGGATGGGGTGGTACCTCTGTCTGTCATACCGGCAGTCAGTGCTACTAAGCTTAACATTGTTACCTCTGATATCGATTCTTATAATCGTATCCAGCGTGAGGGATGTGTCCACTACGCTGGTACCATTTGGAATATAATTGATATCAAGGACAATGATGGCAAGGTGGTACACGTTAAGGAGGTAACCGCACAGAATGCTGAGTCCCTGTCATGGCCCCTGGTCCTTGGGTGTGAGCGTATTGTTAAGCTCCAGAATAATGAGATTATTCCTGGTAAGCTGAAGCAGCGCTCCATTAAGGCAGAAGGAGATGGCATAGTTGGAGAAGGTAAGGCACTTTACAATAATGAGGGTGGACGTACTTTTATGTATGCTTTCATTTCAGATAAACCGGACCTGCGTGTAGTTAAGTGGGAGTTCGATGGTGGTTGTAACACTATTGAGCTAGAACCACCACGTAAGTTCTTGGTGGATTCTCCTAATGGTGCACAGATCAAGTATCTCTACTTTGTTCGTAACCTTAACACGTTGCGTAGGGGTGCTGTTCTTGGCTACATAGGTGCCACTGTACGCTTGCAGGCTGGTAAACAAACAGAACAGGCTATTAACTCTTCATTGTTGACACTTTGCGCTTTCGCTGTGGATCCTGCTAAGACCTACATCGATGCTGTTAAAAGTGGTCACAAACCAGTAGGTAACTGTGTTAAGATGTTGGCCAATGGTTCTGGTAATGGACAAGCTGTTACTAATGGTGTGGAGGCTAGTACTAACCAGGATTCATATGGTGGTGCTTCCGTGTGTCTATATTGTAGAGCACATGTTGAGCATCCATCTATGGATGGTTTTTGCAGACTGAAAGGCAAGTATGTACAGGTGCCACTAGGTACAGTGGATCCTATACGTTTTGTACTTGAGAATGACGTTTGCAAGGTTTGTGGTTGTTGGCTGTCTAATGGCTGCACTTGTGACAGATCCATTATGCAAAGCACTGATATGGCTTATTTAAACGAGTACGGGGCTCTAGTGCAGCTCGACTAGAGCCCTGTAATGGTACTGATACACAACATGTGTATCGTGCTTTTGACATCTACAACAAGGATGTTGCTTGTCTAGGTAAATTCCTCAAGGTGAACTGTGTTCGCCTGAAGAATTTGGATAAGCATGATGCATTCTATGTTGTCAAAAGATGTACCAAGTCTGCGATGGAACACGAGCAATCCATCTATAGCAGACTTGAAAAGTGTGGGGCCATAGCCGAACACGATTTCTTCACTTGGAAGGATGGTCGTGCAATCTATGGTAACGTTTGTAGAAAGGATCTTACCGAGTATACTATGATGGATCTGTGTTACGCTTTACGTAACTTTGATGAAAACAATTGCGATGTTCTTAAGAGCATTTTGATTAAGGTAGGTGCTTGTGAGGAGTCCTACTTTAATAATAAAGTCTGGTTTGACCCTGTTGAAAATGAAGACATTCATCGTGTCTATGCATTGTTAGGTACCATTGTTGCACGTGCTATGCTTAAATGCGTTAAGTTCTGTGATGCAATGGTTGAACAAGGTATAGTTGGTGTTGTCACATTAGATAATCAGGATCTTAATGGTGATTTTTATGATTTTGGTGATTTTACTTGTAGTATCAAGGGAATGGGTGTACCCATTTGCACATCATATTACTCTTATATGATGCCTGTTATGGGTATGACTAATTGCCTTGCTAGTGAGTGTTTTGTTAAGAGTGATATATTTGGTGAGGATTTTAAGTCATATGACCTGCTGGAATATGATTTCACGGAGCATAAGACAGCACTCTTCAACAAGTATTTCAAGTATTGGGGACTGCAATACCACCCTAACTGTGTGGACTGCAGTGATGAGCAGTGCATAGTTCACTGTGCCAACTTCAATACGTTGTTTTCCACTACCATACCTATTACGGCATTTGGACCTTTGTGTCGCAAGTGCTGGATTGATGGTGTTCCACTGGTAACTACAGCTGGTTATCATTTTAAACAGTTAGGTATAGTTTGGAATAATGACCTCAACTTACACTCTAGCAGGCTCTCTATTAATGAATTACTCCAGTTTTGTAGTGATCCTGCACTGCTTATAGCATCATCACCAGCCCTTGTTGACCAGCGTACTGTTTGCTTTTCAGTTGCAGCGCTAGGTACAGGTATGACTAACCAGACTGTGAAACCTGGCCATTTCAATAAGGAGTTTTATGACTTCTTACTTGAGCAAGGTTTCTTCTCTGAGGGCTCTGAGCTTACTTTAAAGCACTTCTTCTTTGCACAGAAGGTTGATGCAGCTGTTAAGGATTTTGACTACTATAGGTATAATAGACCCACTGTTCTGGACATCTGCCAAGCTCGCGTCGTGTATCAAATAGTGCAACGCTATTTTGATATTTACGAGGGTGGTTGTATCACTGCTAAAGAAGTGGTTGTTACAAACCTTAACAAGAGCGCAGGCTATCCTTTGAACAAGTTTGGTAAAGCTGGTCTTTACTATGAGTCTTTATCCTATGAGGAACAGGATGAACTTTATGCTTATACTAAGCGTAACATCCTGCCCACTATGACACAGCTCAACCTTAAATACGCTATTAGTGGCAAAGAACGTGCACGCACAGTGGGTGGTGTCTCGCTTTTGTCAACCATGACCACTCGGCAGTATCATCAGAAACACCTTAAATCCATAGTTAATACTAGGGGCGCTTCGGTTGTTATTGGTACTACTAAGTTTTATGGTGGTTGGGACAATATGCTTAAGAACCTTATTGATGGTGTTGAAAATCCGTGTCTTATGGGTTGGGATTACCCAAAGTGCGATAGAGCACTGCCCAATATGATACGCATGATTTCAGCCATGATCTTAGGCTCTAAGCACACCACATGCTGCAGTTCTACTGACCGCTTTTTCAGGTTGTGCAATGAATTGGCTCAAGTCCTTACTGAGGTTGTTTATTCTAATGGAGGGTTTTATTTGAAGCCAGGTGGTACTACCTCTGGTGATGCAACCACCGCATATGCAAACTCAGTTTTCAATATCTTCCAAGCAGTAAGTGCCAATGTTAACAAACTTCTTAGTGTTGACAGCAATGTCTGTCATAACTTAGAAGTTAAGCAATTACAACGTAAGCTCTATGAGTGCTGTTATAGATCGACTATCGTCGATGACCAGTTCGTCGTTGAGTATTATGGTTACTTGCGTAAACATTTTTCAATGATGATTCTTTCTGATGATGGCGTTGTTTGTTATAACAATGACTATGCATCACTTGGTTATGTCGCGGATCTTAACGCATTCAAGGCTGTTTTGTATTACCAGAACAACGTCTTCATGAGCGCCTCTAAATGTTGGATCGAGCCTGACATTAATAAAGGTCCTCATGAATTTTGTTCGCAGCATACTATGCAGATTGTCGATAAGGAGGGTACTTATTACCTTCCTTACCCTGATCCTTCAAGAATCCTCTCTGCAGGTGTGTTTGTTGATGACGTTGTTAAAACTGATGCAGTTGTATTGCTTGAACGTTATGTGTCATTGGCTATAGATGCCTACCCGTTATCTAAGCATGAAAACCCTGAATATAAGAAGGTGTTTTATGTGCTTTTGGATTGGGTTAAGCATCTGTATAAAACTTTGAATGCTGGTGTGTTAGAGTCTTTTTCTGTCACACTTTTGGAAGATTCTACTGCTAAATTCTGGGATGAGAGCTTTTATGCCAACATGTATGAGAAATCTGCAGTTTTACAATCTGCAGGGCTTTGTGTTGTTTGTGGCTCTCAAACTGTTTTACGTTGTGGTGATTGTCTACGGCGTCCTATGCTTTGTACTAAGTGTGCTTATGATCATGTCATTGGAACAACTCACAAGTTCATTTTGGCCATCACTCCATATGTGTGTTGTGCTTCAGATTGTGGTGTCAATGATGTAACCAAGCTCTACTTAGGTGGTCTTAGTTACTGGTGTCATGAACACAAGCCACGTCTTGCATTCCCGTTGTGCTCTGCTGGTAATGTTTTTGGCTTATACAAAAATTCTGCTACCGGTTCACCCGATGTTGAAGACTTTAATCGCATTGCTACATCCGATTGGACTGATGTTTCTGACTACAGGTTGGCAAATGATGTCAAGGACTCATTGCGTCTATTTGCAGCGGAAACTATCAAGGCCAAGGAGGAGAGCGTTAAGTCATCCTATGCTTGTGCAACACTACATGAGGTTGTAGGACCTAAAGAGTTGTTGCTCAAATGGGAAGTCGGCAGACCCAAACCACCTCTTAATAGAAATTCGGTTTTCACTTGTTATCATATAACGAAGAACACCAAATTTCAAATCGGTGAGTTTGTGTTTGAGAAGGCAGAATATGATAATGACGCTGTAACATATAAAACTACCGCCACAACAAAACTTGTTCCTGGCATGGTTTTTGTGCTTACCTCACATAATGTTCAGCCATTGCGTGCACCAACCATTGCTAATCAAGAACGTTATTCCACTATACATAAGTTGCATCCTGCTTTTAACATACCTGAAGCTTATTCTAGCTTAGTGCCCTATTACCAATTGATTGGTAAGCAGAAGATTACAACTATCCAGGGACCCCCCGGTAGTGGTAAATCTCACTGTGTTATAGGGCTAGGTTTGTACTATCCAGGTGCACGTATTGTGTTTACAGCTTGTTCTCATGCAGCGGTCGATTCACTCTGTGTGAAGGCCTCCACTGCTTATAGCAATGACAAATGTTCACGCATCATACCACAGCGTGCTCGTGTTGAGTGTTATGATGGTTTCAAGTCTAATAATACTAGTGCTCAGTACCTTTTCTCCACTGTCAATGCTTTGCCAGAGTGTAATGCGGACATTGTTGTGGTGGATGAAGTTTCTATGTGCACTAATTATGACTTGTCTGTCATAAATCAGCGCATCAGCTATAGGCATGTAGTCTATGTTGGTGACCCTCAACAGCTGCCTGCACCACGTGTTATGATTTCACGTGGTACTTTGGAACCAAAGGACTACAATGTTGTCACTCAACGTATGTGTGCCCTTAAGCCTGATGTCTTCTTGCACAAGTGTTATCGCTGTCCTGCAGAGATAGTGCGCACTGTGTCTGAGATGGTCTATGAAAACCAATTCATTCCTGTGCACCCTGACAGCAAGCAGTGTTTTAAGATCTTTTGCAAGGGTAATGTGCAGGTTGATAACGGTTCAAGTATTAACCGCAGGCAATTGGATGTTGTGCGTATGTTTTTGGCTAAAAATCCTAGGTGGTCAAAGGCTGTTTTCATTTCCCCTTATAACAGCCAGAATTATGTTGCCAGCCGTTTGCTAGGTTTACAAATTCAGACAGTTGATTCATCCCAGGGTAGTGAGTATGACTATGTCATTTACGCACAAACCTCAGATACTGCCCATGCCAGTAATGTTAACAGGTTTAATGTTGCCATCACAAGGGCTAAGAAAGGCATATTATGTATAATGTGCGATAGGTCCCTTTTTGATCTGCTTAAATTTTTTGAGCTTAAATTGTCTGATTTGCAGGCTAATGAGGGTTGTGGTCTTTTTAAAGACTGTAGCAGAGGTGATGATTTGTTGCCACCGTCTCATGCTAATACCTTCATGTCTTTAGCGGACAATTTTAAGACTGATCAATATCTTGCTGTTCAAATAGGTGTTAATGGACCCATTAAATATGAGCATGTTATCTCGTTTATGGGTTTCCGTTTTGATATTAACATACCCAACCACCACACTCTCTTTTGCACACGCGACTTTGCCATGCGCAATGTTAGAGGTTGGTTGGGTTTTGACGTTGAAGGAGCACATGTTGTTGGCTCTAACGTCGGTACAAATGTCCCATTGCAATTAGGGTTTTCTAACGGTGTTGATTTTGTTGTCAGACCTGAAGGTTGCGTTGTAACTGAGTCTGGTGACTACATTAAACCCGTCAGAGCTCGTGCTCCACCAGGGGAACAATTCGCACACCTTTTGCCTTTACTTAAACGCGGCCAACCATGGGATGTGGTTCGCAAGCGTATAGTTCAAATGTGTAGTGACTACCTGGCTAACCTATCAGACATACTAATTTTTGTGTTGTGGGCTGGTGGTTTGGAGTTGACAACTATGCGTTACTTTGTCAAGATTGGACCAAGCAAGAGTTGTGATTGTGGTAAGGTTGCTACTTGTTACAATAGTGCGCTGCATACGTACTGTTGTTTCAAACATGCCCTTGGTTGTGATTATCTGTATAACCCATACTGTATTGATATACAGCAGTGGGGATACAAGGGATCACTTAGCCTTAACCACCATGAGCATTGTAATGTACATAGAAACGAGCATGTGGCTTCTGGTGATGCCATAATGACTCGCTGTCTGGCCATACATGATTGCTTTGTCAAGAACGTTGACTGGTCCATCACATACCCATTTATTGGTAATGAGGCTGTTATTAATAAGAGCGGCCGCATTGTGCAATCACACACTATGCGTTCAGTTCTTAAGTTATACAATCCAAAAGCCATATATGATATTGGCAATCCTAAGGGCATTAGATGCGCCGTAACGGATGCTAAGTGGTTCTGCTTTGACAAGAATCCTACTAATTCTAATGTCAAGACATTGGAGTATGACTATATAACACACGGCCAATTTGATGGGTTGTGCTTGTTTTGGAATTGCAATGTGGACATGTATCCAGAATTTTCTGTGGTCTGTCGTTTTGATACTCGCTGTAGGTCACCACTCAACTTGGAGGGTTGTAATGGTGGTTCACTGTATGTTAACAATCATGCATTCCACACACCGGCTTTTGACAAGCGTGCTTTTGCTAAGTTGAAGCCAATGCCATTTTTCTTCTATGATGATACTGAGTGTGACAAGTTACAGGACTCCATAAACTATGTTCCTCTTAGGGCTAGTAACTGCATTACTAAATGTAATGTTGGTGGAGCTGTTTGTAGTAAGCATTGTGCTATGTATCATAGCTATGTCAATGCTTACAACACCTTTACGTCAGCGGGCTTTACGATTTGGGTGCCCACTTCGTTTGACACCTATAATCTGTGGCAGACATTTAGTAACAATTTGCAAGGTCTTGAGAACATTGCTTTCAATGTTTTAAAGAAAGGATCTTTTGTTGGTGATGAAGGTGAGCTTCCTGTAGCTGTGGTCAATGACAAAGTGCTCGTTAGAGATGGTACTGTTGATACTCTTGTTTTTACAAACAAGACATCACTACCCACTAACGTAGCTTTTGAGTTGTATGCCAAGCGTAAGGTAGGACTCACCCCTCCCATTACGATCCTACGTAACTTGGGTGTTGTTTGTACATCTAAGTGTGTCATTTGGGACTATGAAGCCGAACGTCCACTTACTACTTTTACAAAGGATGTCTGTAAATATACCGACTTTGAGGGTGACGTTTGTACACTCTTTGATAACAGCATTGTTGGTTCATTAGAGCGATTCTCTATGACCCAGAATGCTGTGCTTATGTCACTTACAGCTGTTAAAAAGCTTACTGGCATAAAGTTAACTTATGGCTATCTTAATGGTGTCCCAGTTAACACACATGAAGATAAACCTTTTACTTGGTATATTTACACTAGGAAGAACGGCAAGTTCGAGGACTATCCTGATGGCTATTTTACCCAAGGTAGAACAACCGCTGATTTTAGCCCTCGTAGCGACATGGAAAAGGACTTCCTAAGTATGGATATGGGTTTGTTTATTAACAAGTACGGACTTGAAGATTACGGCTTTGAGCACGTTGTGTATGGTGATGTTTCAAAAACCACCCTTGGTGGTTTACATCTACTAATTTCGCAGGTGCGTCTGGCCTGTATGGGTGTGCTTAAAATAGACGAGTTTGTGTCTAGTAATGATAGCACGTTAAAGTCATGTACTGTTACATATGCTGACAACCCTAGTAGTAAGATGGTTTGCACGTATATGGATCTCCTGCTTGACGATTTTGTTAGCATTCTTAAATCTTTGGATTTGAGCGTTGTATCTAAGGTTCATGAAGTTATGGTTGATTGTAAAATGTGGAGGTGGATGTTGTGGTGTAAGGATCATAAACTCCAGACATTTTATCCACAACTTCAAGCCAGTGAATGGAAGTGTGGTTATTCCATGCCTTCTATTTACAAGATACAACGTATGTGCTTAGAACCTTGCAATCTCTATAACTATGGTGCTGGTGTTAAGTTACCTGATGGCATTATGTTTAACGTAGTTAAATACACACAGCTTTGTCAATATCTCAATAGCACCACAATGTGTGTACCCCATCACATGCGTGTGCTACATCTTGGTGCTGGCTCCGATAAGGGTGTTGCACCTGGCACGGCTGTCTTACGACGTTGGTTGCCACTGGATGCCATTATAGTTGACAATGATAGTGTGGATTACGTTAGCGATGCTGATTATAGTGTTACAGGAGATTGCTCTACCTTATACCTGTCAGATAAGTTTGACTTAGTTATATCTGATATGTATGATGGTAAGATTAAAAGTTGTGATGGGGAGAACGTGTCTAAAGAAGGCTTCTTTCCCTATATTAATGGTGTTATCACTGAAAAGTTGGCACTTGGTGGTACTGTAGCTATTAAGGTGACGGAGTTTAGTTGGAATAAGAAGTTGTATGAACTCATTCAGAAGTTTGAGTATTGGACAATGTTCTGTACCAGTGTTAACACGTCATCGTCAGAGGCATTTTTAATTGGTGTTCACTATTTAGGTGATTTTGCAAGTGGCGCTGTGATTGACGGCAACACCATGCATGCCAATTATATCTTCTGGCGTAATTCCACAATTATGACTATGTCTTACAACAGTGTGCTTGATTTAAGCAAGTTCAATTGTAAGCATAAGGCTACAGTTGTTGTTAATTTAAAAGACTCATCCATTAGTGATGTTGTGTTAGGCTTGTTGAAGAATGGTAAGTTGCTAGTGCGTAATAATGACGCCATTTGTGGCTTTTCTAATCATTTGGTCAACGTAAACAAATGA
Protein
MASNHVTLAFANDAEISAFGFCTASEAVSYYSEAAASGFMQCRFVSLDLADTVEGLLPEDYVMVVIGTTKLSAYVDTFGSRPRNICGWLLFSNCNYFLEELELTFGRRGGNIVPVDQYMCGADGKPVLQESEWEYTDFFADSEDGQLNIAGITYVKAWIVERSDVSYASQNLTSIKSITYCSTYEHTFLDGTAMKVARTPKIKKNVVLSEPLATIYREIGSPFVDNGSDARSIIRRPVFLHAFVKCKCGSYHWTVGDWTSYVSTCCGFKCKPVLVASCSAMPGSVVVTRAGAGTGVKYYNNMFLRHVADIDGLAFWRILKVQSKDDLACSGKFLEHHEEGFTDPCYFLNDSSLATKLKFDILSGKFSDEVKQAIIAGHVVVGSALVDIVDDALGQPWFIRKLGDLASAPWEQLKAVVRGLGLLSDEVVLFGKRLSCATLSIVNGVFEFLADVPEKLAAAVTVFVNFLNEFFESACDCLKVGGKTFNKVGSYVLFDNALVKLVKAKARGPRQAGICEVRYTSLVVGSTTKVVSKRVENANVNLVVVDEDVTLNTTGRTVVVDGLAFFESDGFYRHLADADVVIEHPVYKSACELKPVFECDPIPDFPLPVAASVAELCVQTDLLLKNYNTPYKTYSCVVRGDKCCITCTLQFKAPSYVEDAVNFVDLCTKNIGTAGFHEFYITAHEQQDLQGFLTTCCTMSGFECFMPTIPQCPAVLEEIDGGSIWRSFITGLNTMWDFCKRLKVSFGLDGIVVTVARKFKRLGALLAEMYNTYLSTVVENLVLAGVSFKYYATSVPKIVLGGCFHSVKSVFASVFQIPVQAGIEKFKVFLNCVHPVVPRVIETSFVELEETTFKPPALNGGIAIVDGFAFYYDGTLYYPTDGNSVVPICFKKKGGGDVKFSDEVSVKTIDPVYKVSLEFEFESETIMAVLNKAVGNRIKVTGGWDDVVEYINVAIEVLKDHVEVPKYYIYDEEGGTDPNLPVMVSQWPLNDDTISQDLLDVEVVTDAPIDSEGDEVDSSAPEKVADVANSEPGDDGLPVAPETNVESEVEEVAATLSFIKDTPSTVTKDPFAFDFVSYGGLKVLRQSHNNCWVTSTLVQLQLLGIVDDPAMELFSAGRVGPMVRKCYESQKAILGSLGDVSACLESLTKDLHTLKITCSVVCGCGTGERIYEGCAFRMTPTLEPFPYGACAQCAQVLMHTFKSIVGTGIFCRDTTALSLDSLVVKPLCAAAFIGKDSGHYVTNFYDAAMAIDGYGRHQIKYDTLNTICVKDVNWTAPLVPAVDSVVEPVVKPFYSYKNVDFYQGDFSDLVKLPCDFVVNAANEKLSHGGGIAKAIDVYTKGMLQKCSNDYIKAHGPIKVGRGVMLEALGLKVFNVVGPRKGKHAPELLVKAYKSVFANSGVALTPLISVGIFSVPLEESLSAFLACVGDRHCKCFCYGDKEREAIIKYMDGLVDAIFKEALVDTTPVQEDVQQVSQKPVLPNFEPFRIEGAHAFYECNPEGLMSLGADKLVLFTNSNLDFCSVGKCLNDVTSGALLEAINVFKKSNKTVPAGNCVTLDCANMISITMVVLPFDGDANYDKNYARAVVKVSKLKGKLVLAVDDATLYSKLSHLSVLGFVSTPDDVERFYANKSVVIKVTEDTRSVKAVKVESTATYGQQIGPCLVNDTVVTDNKPVVADVVAKVVPNANWDSHYGFDKAGEFHMLDHTGFTFPSEVVNGRRVIKTTDNNCWVNVTCLQLQFARFRFKSAGLQAMWESYCTGDVAMFVHWLYWLTGVDKGQPSDSENALNMLSKYIVPAGSVTIERVTHDGCCCSKRVVTAPVVNASVLKLGVEDGLCPHGLNYIGKVVVVKGTTIVVNVGKPVVAPSHLFLKGVSYTTFLDNGNGVVGHYTVFDHGTGMVHDGDAFVPGDLNVSPVTNVVVSEQTAVVIKDPVKKAELDATKLLDTMNYASERFFSFGDFMSRNLITVFLYILSILGLCFRAFRKRDVKVLAGVPQRTGIILRKSMRYNAKALGVFFKLKLYWFKVLGKFSLGIYALYALLFMTIRFTPIGSPVCDDVVAGYANSSFDKNEYCNSVICKVCLYGYQELSDFSHTQVVWQHLRDPLIGNVMPFFYLAFLAIFGGVYVKAITLYFIFQYLNSLGVFLGLQQSIWFLQLVPFDVFGDEIVVFFIVTRVLMFIKHVCLGCDKASCVACSKSARLKRVPVQTIFQGTSKSFYVHANGGSKFCKKHNFFCLNCDSYGPGCTFINDVIATEVGNVVKLNVQPTGPATILIDKVEFSNGFYYLYSGDTFWKYNFDITDSKYTCKEALKNCSIITDFIVFNNNGSNVNQVKNACVYFSQMLCKPVKLVDSALLASLSVDFGASLHSAFVSVLSNSFGKDLSSCNDMQDCKSTLGFDDVPLDTFNAAVAEAHRYDVLLTDMSFNNFTTSYAKPEEKFPVHDIATCMRVGAKIVNHNVLVKDSIPVVWLVRDFIALSEETRKYIIRTTKVKGITFMLTFNDCRMHTTIPTVCIANKKGAGLPSFSKVKKFFWFLCLFIVAAFFALSFLDFSTQVSSDSDYDFKYIESGQLKTFDNPLSCVHNVFINFDQWHDAKFGFTPVNNPSCPIVVGVSDEARTVPGIPAGVYLAGKTLVFAINTIFGTSGLCFDASGVADKGACIFNSACTTLSGLGGTAVYCYKNGLVEGAKLYSELAPHSYYKMVDGNAVSLPEIISRGFGIRTIRTKAMTYCRVGQCVQSAEGVCFGADRFFVYNAESGSDFVCGTGLFTLLMNVISVFSKTVPVTVLSGQILFNCIIAFVAVAVCFLFTKFKRMFGDMSVGVFTVGACTLLNNVSYIVTQNTLGMLGYATLYFLCTKGVRYMWIWHLGFLISYILIAPWWVLMVYAFSAIFEFMPNLFKLKVSTQLFEGDKFVGSFENAAAGTFVLDMHAYERLANSISTEKLRQYASTYNKYKYYSGSASEADYRLACFAHLAKAMMDYASNHNDTLYTPPTVSYNSTLQAGLRKMAQPSGVVEKCIVRVCYGNMALNGLWLGDIVMCPRHVIASSTTSTIDYDYALSVLRLHNFSISSGNVFLGVVSATMRGALLQIKVNQNNVHTPKYTYRTVRPGESFNILACYDGAAAGVYGVNMRSNYTIRGSFINGACGSPGYNINNGTVEFCYLHQLELGSGCHVGSDLDGVMYGGYEDQPTLQVEGASSLFTENVLAFLYAALINGSTWWLSSSRIAVDRFNEWAVHNGMTTVGNTDCFSILAAKTGVDVQRLLASIQSLHKNFGGKQILGHTSLTDEFTTGEVVRQMYGVNLQGGYVSRACRNVLLVGSFLTFFWSELVSYTKFFWVNPGYVTPMFACLSLLSSLLMFTLKHKTLFFQVFLIPALIVTSCINLAFDVEVYNYLAEHFDYHVSLMGFNAQGLVNIFVCFVVTILHGTYTWRFFNTPASSVTYVVALLTAAYNYFYASDILSCAMTLFASVTGNWFVGAVCYKVAVYMALRFPTFVAIFGDIKSVMFCYLVLGYFTCCFYGILYWFNRFFKVSVGVYDYTVSAAEFKYMVANGLRAPTGTLDSLLLSAKLIGIGGERNIKISSVQSKLTDIKCSNVVLLGCLSSMNVSANSTEWAYCVDLHNKINLCNDPEKAQEMLLALLAFFLSKNSAFGLDDLLESYFNDNSMLQSVASTYVGLPSYVIYENARQQYEDAVNNGSPPQLVKQLRHAMNVAKSEFDREASTQRKLDRMAEQAAAQMYKEARAVNRKSKVVSAMHSLLFGMLRRLDMSSVDTILNLAKDGVVPLSVIPAVSATKLNIVTSDIDSYNRIQREGCVHYAGTIWNIIDIKDNDGKVVHVKEVTAQNAESLSWPLVLGCERIVKLQNNEIIPGKLKQRSIKAEGDGIVGEGKALYNNEGGRTFMYAFISDKPDLRVVKWEFDGGCNTIELEPPRKFLVDSPNGAQIKYLYFVRNLNTLRRGAVLGYIGATVRLQAGKQTEQAINSSLLTLCAFAVDPAKTYIDAVKSGHKPVGNCVKMLANGSGNGQAVTNGVEASTNQDSYGGASVCLYCRAHVEHPSMDGFCRLKGKYVQVPLGTVDPIRFVLENDVCKVCGCWLSNGCTCDRSIMQSTDMAYLNRVRGSSAARLEPCNGTDTQHVYRAFDIYNKDVACLGKFLKVNCVRLKNLDKHDAFYVVKRCTKSAMEHEQSIYSRLEKCGAIAEHDFFTWKDGRAIYGNVCRKDLTEYTMMDLCYALRNFDENNCDVLKSILIKVGACEESYFNNKVWFDPVENEDIHRVYALLGTIVARAMLKCVKFCDAMVEQGIVGVVTLDNQDLNGDFYDFGDFTCSIKGMGVPICTSYYSYMMPVMGMTNCLASECFVKSDIFGEDFKSYDLLEYDFTEHKTALFNKYFKYWGLQYHPNCVDCSDEQCIVHCANFNTLFSTTIPITAFGPLCRKCWIDGVPLVTTAGYHFKQLGIVWNNDLNLHSSRLSINELLQFCSDPALLIASSPALVDQRTVCFSVAALGTGMTNQTVKPGHFNKEFYDFLLEQGFFSEGSELTLKHFFFAQKVDAAVKDFDYYRYNRPTVLDICQARVVYQIVQRYFDIYEGGCITAKEVVVTNLNKSAGYPLNKFGKAGLYYESLSYEEQDELYAYTKRNILPTMTQLNLKYAISGKERARTVGGVSLLSTMTTRQYHQKHLKSIVNTRGASVVIGTTKFYGGWDNMLKNLIDGVENPCLMGWDYPKCDRALPNMIRMISAMILGSKHTTCCSSTDRFFRLCNELAQVLTEVVYSNGGFYLKPGGTTSGDATTAYANSVFNIFQAVSANVNKLLSVDSNVCHNLEVKQLQRKLYECCYRSTIVDDQFVVEYYGYLRKHFSMMILSDDGVVCYNNDYASLGYVADLNAFKAVLYYQNNVFMSASKCWIEPDINKGPHEFCSQHTMQIVDKEGTYYLPYPDPSRILSAGVFVDDVVKTDAVVLLERYVSLAIDAYPLSKHENPEYKKVFYVLLDWVKHLYKTLNAGVLESFSVTLLEDSTAKFWDESFYANMYEKSAVLQSAGLCVVCGSQTVLRCGDCLRRPMLCTKCAYDHVIGTTHKFILAITPYVCCASDCGVNDVTKLYLGGLSYWCHEHKPRLAFPLCSAGNVFGLYKNSATGSPDVEDFNRIATSDWTDVSDYRLANDVKDSLRLFAAETIKAKEESVKSSYACATLHEVVGPKELLLKWEVGRPKPPLNRNSVFTCYHITKNTKFQIGEFVFEKAEYDNDAVTYKTTATTKLVPGMVFVLTSHNVQPLRAPTIANQERYSTIHKLHPAFNIPEAYSSLVPYYQLIGKQKITTIQGPPGSGKSHCVIGLGLYYPGARIVFTACSHAAVDSLCVKASTAYSNDKCSRIIPQRARVECYDGFKSNNTSAQYLFSTVNALPECNADIVVVDEVSMCTNYDLSVINQRISYRHVVYVGDPQQLPAPRVMISRGTLEPKDYNVVTQRMCALKPDVFLHKCYRCPAEIVRTVSEMVYENQFIPVHPDSKQCFKIFCKGNVQVDNGSSINRRQLDVVRMFLAKNPRWSKAVFISPYNSQNYVASRLLGLQIQTVDSSQGSEYDYVIYAQTSDTAHASNVNRFNVAITRAKKGILCIMCDRSLFDLLKFFELKLSDLQANEGCGLFKDCSRGDDLLPPSHANTFMSLADNFKTDQYLAVQIGVNGPIKYEHVISFMGFRFDINIPNHHTLFCTRDFAMRNVRGWLGFDVEGAHVVGSNVGTNVPLQLGFSNGVDFVVRPEGCVVTESGDYIKPVRARAPPGEQFAHLLPLLKRGQPWDVVRKRIVQMCSDYLANLSDILIFVLWAGGLELTTMRYFVKIGPSKSCDCGKVATCYNSALHTYCCFKHALGCDYLYNPYCIDIQQWGYKGSLSLNHHEHCNVHRNEHVASGDAIMTRCLAIHDCFVKNVDWSITYPFIGNEAVINKSGRIVQSHTMRSVLKLYNPKAIYDIGNPKGIRCAVTDAKWFCFDKNPTNSNVKTLEYDYITHGQFDGLCLFWNCNVDMYPEFSVVCRFDTRCRSPLNLEGCNGGSLYVNNHAFHTPAFDKRAFAKLKPMPFFFYDDTECDKLQDSINYVPLRASNCITKCNVGGAVCSKHCAMYHSYVNAYNTFTSAGFTIWVPTSFDTYNLWQTFSNNLQGLENIAFNVLKKGSFVGDEGELPVAVVNDKVLVRDGTVDTLVFTNKTSLPTNVAFELYAKRKVGLTPPITILRNLGVVCTSKCVIWDYEAERPLTTFTKDVCKYTDFEGDVCTLFDNSIVGSLERFSMTQNAVLMSLTAVKKLTGIKLTYGYLNGVPVNTHEDKPFTWYIYTRKNGKFEDYPDGYFTQGRTTADFSPRSDMEKDFLSMDMGLFINKYGLEDYGFEHVVYGDVSKTTLGGLHLLISQVRLACMGVLKIDEFVSSNDSTLKSCTVTYADNPSSKMVCTYMDLLLDDFVSILKSLDLSVVSKVHEVMVDCKMWRWMLWCKDHKLQTFYPQLQASEWKCGYSMPSIYKIQRMCLEPCNLYNYGAGVKLPDGIMFNVVKYTQLCQYLNSTTMCVPHHMRVLHLGAGSDKGVAPGTAVLRRWLPLDAIIVDNDSVDYVSDADYSVTGDCSTLYLSDKFDLVISDMYDGKIKSCDGENVSKEGFFPYINGVITEKLALGGTVAIKVTEFSWNKKLYELIQKFEYWTMFCTSVNTSSSEAFLIGVHYLGDFASGAVIDGNTMHANYIFWRNSTIMTMSYNSVLDLSKFNCKHKATVVVNLKDSSISDVVLGLLKNGKLLVRNNDAICGFSNHLVNVNK

Summary

Function
The non-structural protein 1 (nsp1) protein plays a role in the inhibition of host interferon and pro-inflammatory cytokines production. Suppresses host RELA/p65 activation by blocking NFKBIA phosphorylation (PubMed:28715653). Targets also the RLR pathway downstream of the IRF3 activation by targeting host CREBBP to proteasomal degradation (PubMed:26773386).
The papain-like proteinase 1 (PLP1) and papain-like proteinase 2 (PLP2) are responsible for the cleavages located at the N-terminus of the replicase polyprotein. In addition, PLP2 possesses a deubiquitinating/deISGylating activity and processes both 'Lys-48'- and 'Lys-63'-linked polyubiquitin chains from cellular substrates. PLP2 also antagonizes innate immune induction of type I interferon by blocking the nuclear translocation of host IRF-3 (By similarity).
The main proteinase 3CL-PRO is responsible for the majority of cleavages as it cleaves the C-terminus of replicase polyprotein at 11 sites. Recognizes substrates containing the core sequence [ILMVF]-Q-|-[SGACN]. Inhibited by the substrate-analog Cbz-Val-Asn-Ser-Thr-Leu-Gln-CMK. Also contains an ADP-ribose-1''-phosphate (ADRP)-binding function (By similarity).
The helicase which contains a zinc finger structure displays RNA and DNA duplex-unwinding activities with 5' to 3' polarity. ATPase activity is strongly stimulated by poly(U), poly(dT), poly(C), poly(dA), but not by poly(G) (By similarity).
The exoribonuclease acts on both ssRNA and dsRNA in a 3' to 5' direction.
Nsp7-nsp8 hexadecamer may possibly confer processivity to the polymerase, maybe by binding to dsRNA or by producing primers utilized by the latter.
Nsp9 is a ssRNA-binding protein.
NendoU is a Mn(2+)-dependent, uridylate-specific enzyme, which leaves 2'-3'-cyclic phosphates 5' to the cleaved bond.
Catalytic Activity
Thiol-dependent hydrolysis of ester, thioester, amide, peptide and isopeptide bonds formed by the C-terminal Gly of ubiquitin (a 76-residue protein attached to proteins as an intracellular targeting signal).
a ribonucleoside 5'-triphosphate + RNA(n) = diphosphate + RNA(n+1)
ATP + H2O = ADP + H(+) + phosphate
Subunit
3CL-PRO exists as monomer and homodimer. Eight copies of nsp7 and eight copies of nsp8 assemble to form a heterohexadecamer. Nsp9 is a dimer. Nsp10 forms a dodecamer (By similarity).
Miscellaneous
Produced by -1 ribosomal frameshifting at the 1a-1b genes boundary.
Similarity
Belongs to the coronaviruses polyprotein 1ab family.
Keywords
3D-structure   Activation of host autophagy by virus   ATP-binding   Endonuclease   Exonuclease   Helicase   Host cytoplasm   Host membrane   Host nucleus   Host-virus interaction   Hydrolase   Inhibition of host innate immune response by virus   Inhibition of host IRF3 by virus   Inhibition of host RLR pathway by virus   Membrane   Metal-binding   Methyltransferase   Modulation of host ubiquitin pathway by viral deubiquitinase   Modulation of host ubiquitin pathway by virus   Nuclease   Nucleotide-binding   Nucleotidyltransferase   Protease   Repeat   Ribosomal frameshifting   RNA-binding   RNA-directed RNA polymerase   Thiol protease   Transferase   Transmembrane   Transmembrane helix   Ubl conjugation pathway   Viral immunoevasion   Viral RNA replication   Zinc   Zinc-finger  
Feature
chain  Non-structural protein 1
Uniprot
Pfam
PF05409   Peptidase_C30
PF08715   Viral_protease
PF06460   NSP16
PF08710   nsp9
PF09401   NSP10
PF06478   Corona_RPol_N
PF16348   Corona_NSP4_C
PF08716   nsp7
PF08717   nsp8
PF01661   Macro
PF06471   NSP11
PF13087   AAA_12
Interpro
IPR014828   NSP7
IPR027352   CV_ZBD
IPR036333   NSP10_sf
IPR009469   RNA_pol_N_coronovir
IPR032505   Corona_NSP4_C
IPR009466   NSP11
IPR037204   NSP7_sf
IPR008740   Peptidase_C30
IPR029063   SAM-dependent_MTases
IPR027351   (+)RNA_virus_helicase_core_dom
IPR018995   RNA_synth_NSP10_coronavirus
IPR036499   NSP9_sf
IPR041679   DNA2/NAM7-like_AAA
IPR011050   Pectin_lyase_fold/virulence
IPR037227   EndoU-like
IPR014829   NSP8
IPR009003   Peptidase_S1_PA
IPR014822   NSP9
IPR013016   Peptidase_C30/C16
IPR014827   Viral_protease
IPR009461   Coronavirus_NSP16
IPR002589   Macro_dom
IPR027417   P-loop_NTPase
IPR038123   NSP4_C_sf
IPR037230   NSP8_sf
IPR042515   Nsp15_N
SUPFAM
SSF53335   SSF53335
SSF140367   SSF140367
SSF142877   SSF142877
SSF50494   SSF50494
SSF143076   SSF143076
SSF52540   SSF52540
SSF101816   SSF101816
SSF144246   SSF144246
SSF51126   SSF51126
ProteinModelPortal
PDB
6NUS     E-value=0.0     Score=1165     Identity=59.31%     Cov(Q)=13.77%     Cov(P)=97.80%

Ontologies

KEGG

Subcellular Location

From MSLVP
Capsid
From Uniprot
Host cytoplasm  
Host nucleus  
Host membrane  
   nsp7, nsp8, nsp9 and nsp10 are localized in cytoplasmic foci, largely perinuclear. Late in infection, they merge into confluent complexes (By similarity).   With evidence from 2 publications.
Host endoplasmic reticulum-Golgi intermediate compartment   The helicase interacts with the N protein in membranous complexes and colocalizes with sites of synthesis of new viral RNA.   With evidence from 2 publications.

Topology

Length:
6781
Number of predicted TMHs:
18
Exp number of AAs in TMHs:
413.998979999994
Exp number, first 60 AAs:
0.01219
Total prob of N-in:
0.00104
outside
1  -  1962
TMhelix
1963  -  1982
inside
1983  -  2019
TMhelix
2020  -  2042
outside
2043  -  2102
TMhelix
2103  -  2125
inside
2126  -  2131
TMhelix
2132  -  2151
outside
2152  -  2154
TMhelix
2155  -  2177
inside
2178  -  2527
TMhelix
2528  -  2550
outside
2551  -  2622
TMhelix
2623  -  2645
inside
2646  -  2656
TMhelix
2657  -  2676
outside
2677  -  2752
TMhelix
2753  -  2775
inside
2776  -  2781
TMhelix
2782  -  2804
outside
2805  -  2829
TMhelix
2830  -  2852
inside
2853  -  2864
TMhelix
2865  -  2887
outside
2888  -  3331
TMhelix
3332  -  3354
inside
3355  -  3360
TMhelix
3361  -  3383
outside
3384  -  3397
TMhelix
3398  -  3420
inside
3421  -  3426
TMhelix
3427  -  3449
outside
3450  -  3458
TMhelix
3459  -  3481
inside
3482  -  3500
TMhelix
3501  -  3520
outside
3521  -  6781
 
 
Copyright@ 2018-2023    Any Comments and suggestions mail to:  zhuzl@cqu.edu.cn, mg@cau.edu.cn   渝ICP备19006517号

渝公网安备 50010602502065号

In processing...
Login to ASFVdb
Email
Password
Please go to Regist if without an account.
If you have forgotten your password, you can once again Regist an account with a registed or new email.
Change my password
Enter new password
Reenter new password
Regist an account of ASFVdb
It is required that you provide your institutional e-mail address (with edu or org in the domain) as confirmation of your affiliation.
Enter email
Reenter email
First Name
Last Name
Institution
You can directly go to if with an account.
Registraion Success
Your password has been sent to your email.
Please check it and login later.
Welcome to use ASFVdb.