CoVDB Coronavirus Database (v3)   
Strain
Avian_MH021175 (Region: Netherlands;  Strain: Avian coronavirus strain D274, complete genome.;  Date: 1979)
Gene
ORF1ab
Description
Annotated in NCBI,  ORF1ab
GenBank Accession
Full name
Replicase polyprotein 1ab      
Alternative Name
ORF1ab polyprotein
 

Sequence

CDS
ATGGCTTCAAGCCTAAAACAGGGAGTATCTCCCAAACCAAGGGATGTCATTCTTGTTTCCAAAGACATTCCCGAACAACTCTGTGACGCTTTATTTTTCTATACGTCACACAATCCTAAGGATTACGCTGATGCTTTTGCATTTAAGCAAAAGTTTGACCGTAATCTGCGGACTGGGAAGCCGTTCAAATTTGAAACTGTGTGTGGTCTCTTCCTCTTAAAGGGAGTTGACAAAATAACACCTGGCATCCCAGAAAAAGTCTTAAAAGCCACTTCTAAGTTGGCTGATTTAGAAGATATCTTTGGTGTTTCTCCTTTTGCACGGAAATACCGTGAATTGTTGAAGACAGCATGTCAGTGGTCTATGACTGTAGAAACATTGGATGCTCGTGCACAAACTCTTGACGAAATTTTCTCACCAACTGAAATACTTTGGCTTCAGGTGGCTGCAAAAATTCAAGTTTCAGCTATGGCAATGCGCAGGCTTGTTGGAGAAGTAACTGCAAAAGTCATGGAAGCTCTTGGCTCAAATTTGAGTGTTCTCTTTCACATTGTTAAACAACAAATAGCCAGAATTTTTCAAAAGGCACTGGCTATTTTTGAAAATGTGAGTGAATTACCACAGCGTATTGCAGCACTTAAGATGGCCTTCGCCAAGTGTGCCAAGTCAATTACTGTTGTGGTTGTGGAAAGAACTCTAGTTATTAGAGAGTTTGCTGGAACTTGTCTTGCAAGCATCAATGGTGCTGTTGCAAAATTCTTTGAAGAACTTCCAAATGGCTTTATGGGTTCTAAAATCTTCACAACATTGGCCTTCTTTAAAGAAGCAGCTGTGAAAATTGTGGAAAATATACCAAATGCACCAAGAGGCACTAAGGGTTTTGAAGTTGTTGGCAATGCCAAAGGTACACAAGTTGTTGTGCGTGGCATGCGAAATGACTTAACACTGCTTGACCAAAAAGCTGACATCCCTGTGGAGAAAGAAGGTTGGTCTGCAATTCTTGAAGGACATCTGTGTTATGTCTTTAAGAGTGGTGATCGTTTTTATGCGGCACCTCTTTCTGGGAATTTTGCATTGCATGATGTGCATTGTTGTGAGCGTGTTGTCTGCCTGTCTGATGGTGTAACACCAGAGATAAATGATGGACTCATTCTAGTAGCAATCTATTCATCTTTTAGTGTCTCAGAACTCGTGGCAGCACTTAAAAAGGGTGAACCATTCAAATTCTTGGGTCATAAATTTGTGTATGCGAAGGATGCAGCAGTCTCTTTCACTCTTGCTAAAGCAGCCACTATTGCGGATGTACTGAAGCTGTTTCAATCAGCTCGTGTGCAAACGGAAGATGTGTGGTCTGCATTTACTGAAAAGTCTTTTAATTTCTGGAAATTTGCATATGGAAAAGTGCGTAATCTTGAAGAAGTTGTGAAGACTCATTTTTTTAAAGCTCAAATGTCAATTATCATTCTAGCAGCAGTGCTTGGCGAAGGCATTTGGCATCTCGTCTCACAGGTCATCTATAAAGTAGGTGGTCTTTTTACTAGAGTCGTTGACTTTTGTGAAAAACACTGGAAGGGTTTCTGTGTACAACTTAAAAAGGCTAAGCTCGTTGTCACAGAAACTCTTTGTGTTCTTAAGGGAGTTACACAGCATTGTTTTCAATTATTGCTGGATGCACTACATTCTCTGTATATGAGTTTTAAGAAGTGTGCACTTGGTAGAATCCATGGAGATTTATTCTTCTGGAAAGGAGGTGTGCATAAAATTGTTCAAGATGGCGATGAAATTTGGTTTGACGCCATTGACAGCATTGATGTTCAAGACCTAGGTGTTGTTCAAGAAAAACCGATTGATTTTGAGGTTTGTGAAGATGTAACACTTCCTGAAAACCAACCTGGTCATATGATTCAAATTGCAGATGAAGGAAAGAACTATATGTTCTTTCGCTTCAAGAAGGATGAGAATATTTACTACACACCAATGTCACAGCTTGGTGCGATTAATGTGGTTTGCAAAGCAGGCGGCAAGACTGTCACTTTTGGCGAAACTATTGTGAAAGAGATACCACCATCTGATGTTGTGCCTATTAAGGTTAGCATAGAGTGTTGTGGTGAACCATGGAATACAATTTTCAAGAAAGCTTATAAAGAGCCCATTGAAGTTGAAACAGACCTCACAGTTGAACAATTGCTCTCTGTGATTTATGAGAAAATGTGCGACGATCTTAAATTGTTTCCAGAGGCACCTGAACCTCCACCATTTGAGAATGTTGCACTTGTTGATAAGAACGGGAAAGATTTGGATTGCATAAAATCGTGCTATCTTATCTACCGTGATTATGAGAGCGATGATGACATCGAGGAAGAAGATGCTGAGGAGTGTGACACTACTTCAGAATGTGAAGAAGAGGATGAGGATACTAAAGTGTTGGCTCTTATACAAGACCCTGCAAGTAATAAATACCCTCTTCCTCTTGATGATGATTATAGCGTCTTTAATGGATGTATTGTGCATAAAGACGCTCTTGATGTTGTAAATTTACCGTCTGGTGAAGAGACTTTTGTTGTCAACAATTGCTTTGAGGGAGCTGTAAAACCACTGCCTCAGAAAGTTGTTGATGTTTTAGGTGACTGGGGTGAGGCTGTTGATGCGCAAGAGCAAATTGCACAAACTACTTTAAAGGAAACCCCTATCAGTAGTTTGGAGGCAACTGAGCAAGTTGTTGTTGAGGAACAGAAAATAATTTCTGTTGTTGAAGAAGAACAGCAGGTGGCGGTCTACACACTTGCAGACCTACAAGTTGTTGAAGAAACACCAGATGAGTTTATTCTTACTGCTGATGTTTCCATAGAAGAAATTGTGCCTCATGAAGAAAAGGAGTCACAGATTGAACAGGGGCCTATTCAAGTTGTTAAATTACAACGTGAAAAGAAGGCTAAAAAGTTTAAGGTTAAATCTACTACATGTGAGAAACCCAAATTTTTGGAGTACACAACATGTGTGGGTGACCTAACGATAGTGATTGCCAAAGCATTGGATGAGTTTAAAGAGTTCTGCATTGTAAATGCTGCTAATGAGCATATGTCTCATGGTGGCGGCGTTGCTAAGGCAATTGCGGACTTTTGTGGACCTGATTTTGTGGAGTATTGTGAGGACTATGTTAAGAAACATGGGCCTCAACAAAGACTTGTCACACCTTCATTTGTCAAAGGCATTCAATGTGTGAACAATGTTGTAGGACCTCGCCATGGAGACAGAGACTTGCATGATAAGCTTGTTGCTGCTTACAAGAATGTTCTTGTAGATGGTGTTGTCAATTATGTTGTGCCAGTCCTCTCATCAGGAATTTTTGGTGTTGATTTTAAGATGTCTATAGACGCTATGCGCAAGGCTTTTGAAGGTTGCAACATACGCGTTCTTCTTTTCTCCTTGTCTCAAGAACACATCGATTATTTCGATGTTACTTGTAAACAGAAGACAATTTATCTTACAGAGGACGGTGTTAAATACCGCTCTGCTATTGTGAAACCAGGTGACTCTTTGAGTCAATTTGGACCAGTCTTTGCTAGAAACAAGACAGTCTTTACAGCAGACGATGTTGAGGATAAAGAAATTCTCTTCATTCCTACTGCCGACAAGACTGTCCTTGAATATTATGGTTTTGATGCGCAAAAGTATGTAATATACTTGCAAACTCTTGCACAGAAGTGGAATGTCCAATATAGGGACAATTTTGTTATACTTGAGTGGCGTGATGGAAATTGCTGGATTAATGCAGCAATAGTGATTCTTCAAGCTGCTAAGATTAAATTTAAAGGCTTTCTTGCAGAAGCGTGGGCTAAACTGTTGGGTGGTGACCCTACAGATTTTGTAGCCTGGTGCTATGCAAGTTGTAATGCTAATGTTGGCGATTTTGCAGATGCTAATTGGCTCTTGGCTAATTTAGCAGAACATTTTGACGCAGATCACACGAATGCATTCCTTAAGAGGCGTGTGTCATGTAATTGTGGGGTTAAGGATTGTGAAGTTAGAGGCCTTGAAGCTTGTATTCAACCAGTACGGGCACCTAACCTTCTGCATTTTAAGACACAATACTCAAATTGTCCTGCTTGTGGTGCAAATAGTGTGGATGAGGTTGTAGAAGCCTCGTTACCATATCTACTGCTCCTTGCTACTGATGGTCCTGCTACAGTGGATTGTGATGAAAATGCTGTAGGAAACATTGTTTTCATTGGCTCTACTAATAGTGGCCATTGTTATACACAAGCCGTTGGTAAGGCTTTTGATAATCTTGCTAAGGAAAGAAAATTTTCAAAGAAGTCGCCATACATTACAGCAATGTATATGCGCTTCTCTCTTAAGAGTGAAAGTCCTCTGTCTTTTGTTAAGCAGAGCAAAGGTAAGTCTAAGGTAGTAAAAGAAGATGTTGCTAACCTTGCTACTAGTTCTAAAGTCAGTTTTGATGATCTTACTGACTTTGAACAGTGGTATGATAGTAACATCTACGAAAGTCTTAAAGTTCAGGAAACACCTGAAAATTTGGATGAATATGTGTCATTTACAACAAAGAATGATTCTAAGTTGCCACTGACACTTAAAGTTAGAGGTATCAAATCAGTTGTTGAATTTAAGTCAAAAGATGGTTTTACTTATAAGTTAACACCTGATATTGATGAAAATTCAAAAGCACCAGTTTACTACCCAGTCTTGGATTCTATTAGTCTTAAGGCAATATGGGTTGAAGGCAGTGCTAATTTTGTTGTTGGTCATCCAAATTATTATAGTAAGTCATTGCGCGTTCCCACTTTCTGGGAGTGTGCTGAGACCTTTGTTAAAATAGGAGAAAAAGTTGATGGTGTAACTACTGGTCTTTGGCGTGCAGAACACCTTAATAAACCTAACTTGGAGAGAATTTTCAACATTGCTAAGAAAGCAATTGTTGGGACTAGTGTTATTACTACACAATGTAGTAAATTAATTGGTAAAGCATCTGCGTTCGTTGCCGATAAAGTAGGCGGTGGTGTAGTGCGTAATATTACAGATAGAATTAAGGGTCTTTGTGGAATTACACGTGGGCATTTTGAAAATAAGATGTCGCCGCAATTTCTAAAGACAATTATGTTCTTTTTCTTTTACTTAATAAAGGCTAGCGGTAAGAGTTTAGTTGCTAGCTATAGGAGTGTACTATGTAAGGTGGTTTTTACTACTTTATTTATATTGTGGTTTATATACACAAGTAATCCTGTAATGTTTACTGGAATACGTGTGTTAGACATCCTATTTGAAGGTTCTTTATGTGGTTCTTATAATGACTATGGTAAAGATACTTTTGATGTACTACGCTATTGCGCAGATGATTTTACTTGTCGTGTTTGTTTACATGATAGGGATTCACTTCATCTGTATAAGCATGCTTATAGTGTAGAACAAGTTTATAAAGATGCTATTTCTGGCATTAGTTTTAATTGGAATTGGCTTTATTTGACCTTTCTAATATTGTTTGTTAAGCCAGTGGCAGGTTTTGTTATAATTTGCTATTGTGTTAAGTATTTGGTTTTGAGTTCAACTGTGCTGCAAACTGGTGTAGGTTTTCTAGATTGGTTTACCCAGACAGTTTTCACACACTTTAATTTTATGGGCGCAGGGTTTTATTTCTGGCTCTTTTATAAAATATATATACAGGTGCATCATATACTGTATTGTAAGGATATAACATGCGAGGTGTGCAATAGAGTTGCACGCAGCAATAGGTATGAAGTTAGCGTTGTTGTTGGTGGGCGTAAGCAATTAGTGCACGTTTACACAAATTCTGGCTATAAGTTCTGTAAGACACATAATTGGTATTGTAGGAATTGTGATGAGTATGGTCATCAAAATACATTTATGTCTCCTGAAGTTGCTGGCGAGCTTTCTGAAAAGCTCAAACGTTATGTTAAACCTACAGCACATGCTTACCACGTTGTGGATGATGCTTGCGTAGTTGATGATTTTGTTAATTTAAAATACAAGGCTGCAACTCCTGGTAAGGATAGTGCACCTCCTGCAGTTAAATGTTTCAGTGTTACAGACTTCTTAAAGAAGGCTGTTTTTCTCAAGGATGCACTGAAATGTGAACAAATATCTAATGATAGTTTTATAGTGTGTAATACTCAGAGTGCACATAGTTTAGAGGAAGCAAAGAATGCAGCCATCTACTATGCGCAATACCTGTGTAAACCGATACTTATACTTGACCAGGCACTTTACGAACGATTAGTAGTAGAACCTGTTTCGAAGAGTGTTGTGGATAAGGTTTGTAATATTTTGTCTAATATAATTTCTGTAGATACTGCAGCTTTAAATTATAAGGCGGGCACACTTCGTGATGCCCTTCTTTCTGTTACCAAAGACGAAGAGGCTGTTGATATGGCTATCTTTTGTCATAATCATGATGTGGAATATACTGGTGATGGTTTTACTAATGTAATATCATCATATGGTATAGACACTGGTAAATTAACACCTCGTGATAGAGGGTTTTTGATAAATGCTGATGCTTCTATTGCTAACTTGAGAGTAAGAAATGCTCCTCCGGTAGTATGGAAGTTTTCTGACCTCATTAAGTTGTCTGACAGTTGTCTTAAATACTTAATTTCAGCTACTGTTAAGTCAGGAAGTCGTTTCTTTGTAACAAAATCTGGTGTTAAGCAAGTTATTTCTTGTCACACTCAGAAGTTGTTAGTAGAGAAAAAAGCTGGTGGTATCATTAGTGGTACATTTAGTAAAGTTAAGAGTTGTTGTAAATGGCTCTTGATTTTTTATATTCTTTTTACAGCATGTTGTTTGGGCTATTATCATATGGAAATGAATAAAAGTTTTGTTCATCCCATGTATGATGTTAGCTCTACGATGCATGTCGAAGGTTTTAAGGTTATAGATAAAGGTGTTATTAGAGAAATTGTATCAGAAGATACATGTTTCTCTAATAAGTTTGCTAATTTCGATTCATTTTGGGGTAGACCATATGTGAATAGTAGAGACTGTCCAATTGTTACAGCAGTCATAGATGGTGCTGGAACAATAGCAGCTGGTGTTCCTGGTTATGTAGGTTGGGTTCTTGATGGTGTTATGTTTGTACACATGACACAAACAGAAAGAAAACCCTGGTATATTCCTACGTGGTTTAATAGAGAAATTGTTGGTTACACTCAAGACTCAATTATTACTGAAGGTAGTTTCTATACATCTATAGCACTTTTTTCGGCCAGGTGTTTATACTTAACAGCCAGCAATACACCACAATTGTATTGTTTTAATGGTGACAATGATGCTCCTGGAGCCTTACCATTTAGTAGTATTACTCCTCATAGAGTCTACTTTCAACCTAATGGTGTTAGGCTTATAGTTCCCCAGCAAATAATGCACATGCCTTACATAGTAAAGTTTTTGTCAGACAGCTATTGTAGAGGTAGTGTATGTGAGTATACTAAACCAGGTTATTGTGTGTCACTAAACTCCCAATGGGTTTTGTTTAATGATGAATACACAAGTAAACCAGGAGTGTTTTGTGGTTCTACTGTTAGAGAACTCATGTTTAATATGGTTAGTACATTCTTTACTGGTGTTAACCCTAATATCTATATGCAATTGGCAACTATGTTCTTAATACTAGTTGGTGTTGTATTAGTTTTTGCAATGGTTATAAAGTTTCAAGGTGTTTTTAAAGCTTATGCAACCATTGTGTTTACAATAATGTTAGTTTGGGTTATTAATGCATTTATTTTGTGTGTACATAGTTATAATAGTGTTGTAGCTGTTATATTACTAGTGTTTTATTGCTATGCATCATTGGTTACGAGTCGCAATACTTCTATAATAATGCATTGCTGGCTTGTTTTCACTTTTGGTCTTATAATACCCACCTGGTTGGCTTGTTGCTACCTAGGGTTTATTATCTATATGTATACACCATTGTTTTTCTGGTGTTATGGTACTACTAAAAATACTCGTAAGCTGTATGATGGTAATGAGTTTGTTGGTAATTATGATCTTGCGGCGAAAAGCACTTTTGTTATTCGTGGCAGTGAATTTGTTAAGCTTACGAATGAGATAGGTGATAAGTTTGAACATTACCTCTCAGCGTATGCTAGACTTAAATACTATTCCGGCACAGGCAGTGAACAAGATTACTTGCAAGCCTGTCGTGCCTGGTTAGCTTATGCTTTGGACCAATATAGAAGTAGTGGCGTGGAAATTGTTTATACTCCACCGCGTTACTCTATTGGTGTTAGTAGATTACAGGCTGGTTTTAAGAAACTAGCTGCTCCTAGTAGTGCTGTTGAAAAGTGCATTGTTAGTGTGTCTTATAGAGGCAATAATCTTAATGGACTGTGGTTAGGTGATTCTATCTACTGCCCACGCCATGTGTTAGGCAAGTTTTCAGGAGATCAATGGAGTGATGTACTTAATCTTGCTAATAATCATGAGTTTGAGATTGTAACTCGAAATAATGTTACTTTGAATGTTGTTAGTAGGCGGTTAAGAGGTGCAGTTTTGATTTTACAAACTGCTGTCGCCAATGCTGAAACACCAAAGTATAAGTTTGTTAAAGCTAATTGTGGAGACAGTTTCACGATTGCTTGTTCTTATGGTGGTACAGTTGTTGGACTCTACCCTGTTACTATGCGTTCTAATGGTACTATTAGAGCGTCTTTCTTAGCAGGAGCGTGTGGTTCTCCAGGTTTTAATATAGAAAAGGGTGTAGTTAACTTTTACTACATGCACCATCTTGAGTTGCCTAATGCATTACACACTGGAACAGACCTAACGGGAGAGTTCTATGGTGGTTATGTTGATGAAGAAGTAGCACAAAGAGTGCCACCAGATAATTTAGTTACTAATAATATTGTAGCATGGTTTTATGCTGCAATTATTAGTGTTAAGGAGAGTAGTTTCTCACTGCCCAAGTGGTTGGAGAGTACTACTGTTAGTGTTGATGATTATAACAAGTGGGCTGGTGACAATGGTTTCACACCATTTTCTACTAGTACCGCTATTACTAAATTAAGTGCTATAACGGGAGTAGATGTTTGTAAACTCCTTCGCACTATTATGGTAAAAAGTAGCCAATGGGGTAGTGAACCCATTTTAGGCCAATATAATTTTGAAGATGAATTAACACCAGAATCTGTTTTTAATCAGGTTGGTGGTGTTAAGTTACAATCTTCTTTTGTAAGAAAAGCTACATCTTGGTTTTGGAGTAGATGTGTGTTAGCTTGTTTCTTATTTGTTCTGTGTGCTGTTGTCTTGTTTACGGCAGTGCCACTTAGATATTATGTACATGCAGCTGTTATTTTGTTAATGGCTGTGCTTTTTATCTCTTTTACTGTTAAACATGTTATGGCATATATGGATACTTTTCTATTGCCAACATTGCTTACAGTTATTATTGGAGTTTGTGCTGAAGTACCTTTCATTTACAATACTCTAATTAGTCAAATTGTTATTTATGTTAGTCAATGGTATGATCCAGTAGTGTTTGACACTATGGTACCATGGATGTTCTTACCATTAGTCTTGTACACGGCAGTTAAGTGTGTGCAAGGTTGCTATAGTGTGAACTCTTTCAATACCTCTTTGTTAGTGCTGTACCAGTTTTTGAAGTTAGGCTTTGTTATCTATGCCTCTTCTAATACTCTGGCTGCATATTCAGAAGGTAATTGGGAGTTGTTCTTTGAATTAGTTCATACTACTGTGTTGGCTAATTGTAGTAGCAATTCTTTAATAGGTTTGCTTGTGTTTAAGCTAGCTAAATGGATGCTGTATTATTGTAATGCAACATACTTTAATAATTATGTGCTGATGGCGGTCATTATTAATGGCTTTGGTTGGCTCTTTACTTGTTACTTTGGAATTTATTGGTGGATTAATAAGGTTTTTGGTTTAACCTTAGGTAAATATGAATTTAAAGTTTCAGTAGATCAATATAGGTATATGTGTCTTCATAAGATAGTACCCCCTAAAACTGTGTGGGAAGTCTTCTCGACAAATATACTTATACAAGGAATAGGTGGTGATCGTGTGTTGCCTATTGCTACAGTTCAATCTAAATTGAGTGATGTAAAGTGTACAACTGTTGTTTTAATGCAGCTTTTGACTAAGCTTAATGTTGAAGCAAATTCAAAAATGCATGCTTATCTTGTTGAGTTACACAACAAAATTCTAGCATCTGATGATGTTGCAGAGTGCATGGATAATTTGTTGGGTATGCTTGTTACGCTATTTTGTGTTGATAGTAGTATTGATTTGAGCGAGTATTGTGATGATATACTAAAGAGGTCAACTGTTTTACAATCAGTTACTCAAGAGTTCTCGCACATACCCTCTTATGCTGAATATGAAAGAGCTAAGGACCTTTATGAAAAGGTTTTAGTCGATTCTAAAAATGGTGGTGTAACACAGCAAGAGCTTGCTGCTTACCGTAAGGCTGCCAATATAGCAAAGTCAGTCTTTGATAGGGATTTGGCTGTTCAGAAGAAGTTAGATAGTATGGCAGAGCGTGCTATGACAACAATGTATAAAGAAGCGCGTGTTACTGACAGAAGAGCAAAATTGGTCTCATCACTACATGCGCTGTTGTTTTCAATGCTTAAGAAAATAGATTCTGAAAAGCTTAATGTTTTATTTGATCAGGCGAGTAGTGGTGTTGTACCCTTAGTGACTGTTCCAATAGTTTGTAGTAATAAGCTTACACTTGTAATACCAGACCCAGAAACGTGGGCTAAGTGTGTAGAAGGTATGCATGTTACATATTCAACAGTTGTCTGGAATATAGATACTGTTATAGATGCCGATGGCACAGAATTACACCCAACTTCTATAAGTAGTGGGTTGACATACTGTGTAAGTGGTGACAACATAGCATGGCCTTTAAAGGTTTGCTTAACTAGAAATGGGCATAACAGAGTTGATGCTGCTTTGCAAAACAACGAGCTTATGCCCCATGGTGTTAAAACAAAGGCTTGCGTAGCAGGTGTAGATCAAGCACATTGTAGCGTAGAGTCTAAATGTTATTATACAAATATTAGTGGCAATTCAGTTGTAGCTGCTATTACTTCTTCAAACCCAAATCTGAAAGTAGCTTCGTTTTTGAACGAAGCAGGCAATCAGATTTATGTAGACTTAGACCCACCGTGTAAGTTTGGTATGAAAGTGGGTGACAAGGTTGAAGTTGTTTATTTGTATTTCATAAAAAATACAAGATCCATTGTTAGAGGTATGGTACTTGGTGCTATATCTAATGTTGTAGTTTTACAATCTAAAGGGCATGAGACAGAGGAAGTAGATGCTGTAGGCATACTTTCACTATGTTCTTTTGCAGTAGATCCTGCAGACACGTATTGTAAGTATGTAGCTGCAGGTAACCAACCTTTAGGTAACTGTGTTAAAATGTTGACAGTTCACAATGGTAGTGGTTTTGCTATAACATCAAAGCCCAGTCCAACTCCTGATCAGGATTCATATGGAGGCGCTTCTGTGTGTCTTTATTGTAGAGCGCATATAGCACATCCGGGCGGTGCAGGAAATTTAGATGGACGTTGTCAACTTAAAGGTTCCTTTGTGCAAATACCTACTACGGAGAGAGATCCCGTTGGCTTCTGTCTACGTAATAAGGTTTGCACTGTTTGTCAGTGTTGGGTTGGTTATGGATGTCAGTGTGATGCACTTAGACAAACAAAACCTTCTGTTCAAGTAGTGGCTGTTGCAGCTGATTATGATAAGAATTATTTAAACGGGTACGGGGTAGCAGTGAGGCTCGGCTGATACCCCTCTCTAATGGATGTGATCCTGATGTTGTAAAGCGAGCCTTTGATGTGTGTAATAAGGAATCAGCAGGTATGTTTAAAAATTTGAAGCGTAACTGTGCGCGATTCCAAGAAGTATGTGATACTGAAGGTGGAAATCTTGAGTATCTTGATTCATTTTTTGTGGTTAAACAAACCACTCCTAGTAATTATGAACATGAGAAAGCATGTTACGAAGACTTAAAGTCGGTAGTAACAGCTGATCATGATTTCTTTGTGTTCAATAAGAACATTTATAATATTAGTAGGCAACGGCTTACTAAGTATACTATGATGGATTTTTGCTACGCTTTGAGGCATTTTGACCCAAAGGACTGCGAAGTTCTTAAAGAAATACTTGTCACTTATGGTTGTGTAGAAGATTATCACCCTAAGTGGTTTGAAGAGAATAAGGATTGGTACGACCCAATAGAAAACCCTAAATATTATGCCATGTTGGCTAAGATGGGACCTATTGTAAGACGTGCCTTATTGAATGCTGTTGAGTTTGGGAACCTTATGGTTGAAAAAGGTTATGTTGGTGTTGTTACACTTGATAACCAAGATCTTAATGGCAAGTTTTATGACTTTGGCGATTTTCAGAAAACGGCACCTGGTGCTGGTGTTCCTGTTTTTGATACATATTATTCTTACATGATGCCCATCATAGCCATGACGGATGCTCTGGCACCTGAAAGGTATTTTGAATATGATGTGCATAAGGGTTATAAGTCTTATGATCTCCTCAAGTATGATTATACTGAGGAGAAACAAGAGTTGTTTCAGAAGTACTTTAAGTATTGGGACCAGGAGTACCATCCGAATTGCCGTGACTGTAGTGATGACAGGTGTTTGATACATTGTGCAAACTTCAACATCTTGTTTTCTACATTGATACCGCAGACTTCTTTTGGTAATTTGTGTAGAAAAGTGTTTGTTGATGGTGTACCTTTTGTAGCTACTTGTGGCTATCATTCTAAAGAACTTGGTGTTATTATGAATCAAGATAACACCATGTCGTTCTCAAAAATGGGTTTAAGTCAACTCATGCAGTTTGTTGGAGATCCTGCCTTGTTAGTTGGAACATCCAATAACTTAGTCGATCTTAGAACGTCTTGTTTTAGTGTTTGTGCATTAGCGTCTGGTATTACTCATCAAACGGTAAAACCAGGTCACTTTAACAAGGATTTCTATGATTTTGCAGAGAAGGCTGGTATGTTTAAAGAGGGTTCTTTTATACCACTTAAACATTTCTTCTACCCACAAACTGGTAATGCTGCTATAAACGATTATGATTACTATCGTTATAACAGGCCTACCATGTTTGATATACGTCAACTTCTATTTTGTTTAGAAGTGACTTCTAAATACTTTGACTGTTATGAAGGCGGCTGTATACCAGCAAGCCAAGTTGTAGTTAATAATTTAGATAAGAGTGCAGGCTATCCATTTAATAAGTTTGGAAAAGCCCGTCTCTATTATGAAATGAGTCTAGAGGAACAGGACCAACTCTTTGAAAGTACAAAGAAGAATGTCCTGCCTACTATAACTCAAATGAATTTAAAATATGCCATATCCGCGAAAAATAGGGCGCGTACAGTGGCAGGTGTTTCTATCCTTTCTACTATGACTAATAGGCAATTTCATCAGAAGATGCTCAAGTCTATAGTCAATACTAGAAATGCTCCTGTAGTTATTGGAACAACAAAATTTTATGGTGGTTGGGACAACATGTTGAGAAACCTGATCCAAGGTGTTGAGGACCCAATTCTTATGGGTTGGGATTATCCAAAGTGTGATAGAGCAATGCCTAATTTGTTGCGTATTGCAGCATCTTTAATACTTGCACGTAAACACACTAACTGTTGTACTTGGCCTGAGCGTATTTATAGGTTGTACAATGAGTGCGCTCAAGTTTTATCTGAAACTGTCTTAGCTACAGGTGGTATTTATGTGAAACCTGGTGGCACTAGCAGTGGTGATGCTACTACTGCTTATGCAAACAGTGTTTTTAACATAATACAAGCCACATCTGCCAATGTTGCGCGTCTTTTGAGTGTTATAACGCGCGATATTGTCTATGATGACATTAAAGACCTGCAATATGAATTGTACCATCAGGTTTATAGGCGAGTCAATTTTGACCCTGTCTTTGTTGAAAAGTTCTATTCTTACTTATGTAAGAATTTTTCATTAATGATCTTGTCTGATGATGGTGTTGTTTGTTACAACAACACATTAGCCAAACAAGGTCTTGTAGCAGATATTTCAGGTTTTAGAGAGATTCTCTACTACCAAAATAACGTGTATATGGCTGACTCCAAGTGTTGGGTTGAACCAGACTTAGAAAAAGGCCCTCATGAATTTTGTTCACAACACACAATGCTTGTGGAGGTAGATGGTGAGCCTAAGTATTTGCCGTACCCTGACCCTTCACGCATTTTGGGTGCATGTGTTTTTGTAGATGAAGTGGATAAGACAGAACCTGTGGCTGTTATGGAGCGTTATATAGCTCTTGCCATAGACGCTTACCCGCTAGTACATCATGAAAATGAGGAGTACAGGAAGGTTTTCTTTGTGCTTCTTTCTTATATCAGAAAACTCTATCAAGAGCTTTCTCAGAGTATGCTTATGGACTACTCTTTTGTAATGGATATAGACAAGGGTAGTAAATTTTGGGAGCAGGAGTTCTATGAAAATATGTATAGAGCTCCTACAACGTTACAGTCCTGTGGTGTTTGTGTAGTTTGTAATAGTCAAACTATACTACGCTGTGGTAATTGTATTCGTAAACCGTTTTTGTGTTGCAAGTGTTGCTATGACCATGTCATGCACACAGATCACAAAAATGTTTTGTCTATAAACCCTTACATTTGCTCACAACCTGGTTGTGGTGAAGCAGACGTTACTAAATTGTACCTCGGAGGTATGTCATACTTCTGTGGTAATCATAAACCTAAGTTGTCAATACCGTTAGTATCTAATGGTACAGTTTTTGGAATTTACAGGGCTAATTGTGTAGGTAGTGAAAATGTTGATGATTTTAATCAACTAGCTACCACTAATTGGTCTACTGTGGAGCCTTATATTTTGGCAAACCGTTGTAGTGACCCTTTGAGACGCTTTGCTGCAGAGACAGTAAAAGCCACAGAGGAGTTACACAAGCAACAATTTGCTAGTGCGGAAGTGAGAGAAGTTCTCTCAGATCGCGAGCTGATTCTATCATGGGAGCCAGGTAAAACAAGGCCTCCATTGAATAGAAATTATGTTTTCACAGGCTACCACTTTACAAGAACTAGTAAGGTTCAGCTTGGAGACTTTATATTTGAAAAAGGTGATGGTAAGGATGTTGTCTATTATAGGGCGACATCTACGGCTAAATTGTCTGTTGGAGACATTTTTGTTTTAACATCACACAATGTTGTTTCTCTTGTAGCACCAACATTGTGCCCACAACAAACCTTTTCTAGGTTTGTAAATTTGAGACCTAATGTAATGGTACCTGAATGTTTTGTAAATAACATTCCACTCTACCATTTAGTAGGTAAACAAAAGCGTACTACAGTACAAGGTCCTCCTGGCAGTGGTAAGTCGCATTTTGCTATAGGTCTAGCTGCGTACTTTAGTAATGCTCGTGTAGTCTTTACTGCTTGTTCGCATGCAGCTGTTGATGCTTTGTGTGAAAAAGCTTTTAAGTTTCTTAAAGTTGATGATTGCACTCGCATAGTACCTCAAAGGACTACTATCGACTGCTTCTCAAAATTTAAGGCTAATGACACAGGCAAAAAGTATATTTTTAGTACTATAAATGCCTTGCCAGAAGTTAGCTGTGACATTCTTTTGGTTGATGAGGTTAGTATGTTGACCAATTATGAATTGTCTTTTATTAATGGTAAGATAAATTACCAGTATGTTGTGTATGTAGGTGACCCAGCTCAATTGCCAGCACCTCGTACTTTACTTAATGGTTCACTTTCACCAAAGGATTATAATGTTGTAACAAACCTTATGGTTTGCGTTAAGCCTGATATTTTCCTTGCAAAGTGTTACCGTTGTCCTAAAGAAATTGTAGATACTGTGTCTACTCTTGTTTATGATGGAAAGTTTGTTGCAAATAACCCAGAGTCGCGTCAGTGTTTCAAGGTTATAGTTAATAATGGTAATTCTGATGTAGGACATGAAAGTGGTTCAGCCTACAACACAACTCAGTTAGAATTTGTGAAAGATTTTGTTTGTCGCAACAAAGAGTGGCGGGAAGCAACATTCATTTCACCTTACAATGCTATGAACCAGCGAGCCTACCGTATGCTCGGACTTAATGTTCAGACAGTAGACTCGTCCCAAGGTTCAGAGTATGATTATGTTATTTTTTGTGTTACTGCGGATTCGCAGCATGCACTGAATATTAACAGATTTAATGTGGCGCTTACAAGAGCTAAGCGTGGTATATTGGTTGTCATGCGTCAGCGTGATGAATTATATTCTGCTCTTAAGTTTACAGAGTTAGATAGTGAAACAAGTCTGCAAGGTACAGGTTTGTTTAAAATTTGCAATAAAGAGTTTAATGGTGTACATCCTGCTTATGCAGTTACAACTAAGGCTCTTGCTGCAACTTACAAAGTTAATGATGAACTTGCTGCGCTTGTTAATGTGGAAGCAGGTTCAGAAATAACATATAAACATCTTATTTCTCTTCTAGGATTTAAGATGAGTGTCAATGTTGAAGGTTGCCACAATATGTTTATAACACGTGATGAGGCAATCCGCAATGTAAGAGGTTGGGTAGGTTTTGATGTAGAGGCAACACATGCTTGTGGCACTAACATAGGTACTAACTTACCTTTCCAAGTCGGATTCTCTACTGGTGCGGACTTTGTTGTCACGCCCGAGGGTCTTATAGATACCTCAATAGGCAATAATTTTGAGCCTGTTAATTCTAAAGCACCTCCAGGTGAACAATTTAATCACTTGAGAGCTTTATTTAAGAGTGCTAAACCTTGGCATGTTATACGACCAAGGATAGTGCAAATGTTAGCAGATAATCTATGCAATGTTTCTGATTGTGTAGTGTTTGTTACTTGGTGTCATGGTCTAGAACTAACCACTTTGCGCTATTTTGTTAAGATAGGCAAGGAACAAGTTTGTTCGTGTGGTTCTAGAGCCACGACTTTTAATTCTCATACCCAAGCTTATGCTTGTTGGAAGCATTGTTTGGGTTTTGATTTTGTTTATAATCCACTTTTAGTGGACATTCAGCAGTGGGGTTACTCTGGCAACTTACAGTTTAATCATGGTTTGCATTGCAATGTACATGGACATGCTCATGTAGCCTCTGCGGATGCTATTATGACGCGTTGTCTTGCGATCAATAATGCATTTTGTCAAGATGTCAACTGGGATTTGACCTACCCTCATATAGCAAATGAGGATGAAGTCAACTCTAGTTGTCGATATTTACAGCGCATGTATCTTAATGCATGTGTTGATGCTCTTAGAGTTAATGTTGTCTATGACATAGGCAACCCTAAGGGTATAAAGTGTGTTAGACGTGGTGATGTCAATTTTAGATTCTATGATAAGAATCCAATTGTACCCAACGTCAAACAGTTTGAGTATGACTATAATCAGCACAAGGATAAGTTTGCTGATGGTCTTTGTATGTTTTGGAATTGTAATGTGGATTGTTATCCTGACAATTCTCTTGTTTGCAGGTATGACACAAGAAATTTGAGTGTGTTTAACCTACCTGGTTGTAATGGTGGTAGTTTGTATGTTAACAAACATGCATTCCATACACCTAAATTTGATCGCATTAGCTTCCGTAATTTGAAAGCTATGCCATTCTTTTTTTATGATTCATCTCCTTGCGAAACCATTCAAGTGGATGGAGTTGCACAGGATCTTGTATCATTAGCTACTAAAGATTGTATCACGAAATGCAACATTGGAGGCGCTGTTTGTAAGAAACATGCGCAAATGTATGCAGAATTTGTGACATCTTATAATGCAGCCGTTACAGCCGGTTTTACTTTTTGGGTTACTAATAATTTTAACCCATATAATTTGTGGAAAAGTTTTTCAGCTCTTCAGTCCATCGACAATATTGCTTATAATATGTATAAGGGTGGACATTATGATGCGGTTGCAGGAGAAATGCCCACTGTCGTGACTGGAGATAAAGTTTTTGTTATTGATCAAGGTGTAGAAAAGGCAGTCTTTGTTAACCAAACAGCACTGCCTACATCTGTGGCGTTTGAGCTTTATGCGAAGAGAAATATTCGCACACTGCCCAATAATCGCATCTTGAAAGGTCTAGGTGTAGACGTAACCAATGGGTTTGTAATCTGGGATTACGCGAACCAAACACCATTATATCGTAACACCGTTAAGGTGTGTGCGTATACAGATATTGAGCCAAATGGTTTAACTGTTTTGTATGATGATAGGTATGGTGATTTCCAATCCTTTCTTGCTGCAGATAATGCTGTGTTAGTTTCAACACAGTGCTATAAGCGGTATGCGTGTGTAGAAGTACCATCGAATCTTCTTGTTCAGAATGGTATTTCATTAACAGATGGAGCGAACCTGTATGTTTATAAGCGTGTTAAAGGAGTGTTTGTTACGCTGCCAAATACACTAAATACACAGGGCCGCAATTATGAAACTTTTGAACCTCGTAGTGACGTTGAAAGAGATTTCCTCAACATGTCGGAAGAGGATTTTGTAGAAAAGTATGGTAAAGACTTAGGTCTACAACACATACTGTATGGTGAAGTTGATAAACCTCAATTAGGTGGTTTACACACTGTTATAGGTATGTATAGACTGTTACGTGCGCATAAATTGAACGCAAAGTCTGTCACTAGTTCAGATTCTGATGTCATGCAAAATTATTTTGTGTTGGCAGAAAATGGTTCTTATAAGCAAGTGTGTACTGTAGTAGACTTATTGCTTGATGATTTCTTAGAACTTCTTAGGAACATACTCAAGGAGTATGGTACTAACAAGTCAAAAGTTGTAACAGTGTCAATTGATTACCACAGCATAAACTTTATGACGTGGTTTGATAATGGCAGTATTAAAACATGTTATCCACAGCTTCAGTCAGCGTGGACATGTGGTTATAATATGCCTGAACTCTATAAAGTCCAGAATTGTGTTATGGAACCTTGCAACATTCCTAATTATGGTGTTGGAATAACGTTGCCAAGTGGTATTATGATGAATGTGGCAAAGTATACACAACTTTGTCAATATCTTTCGAAAACAACAATGTGTGTACCGCATAATATGCGAGTAATGCATTTTGGAGCAGGAAGTGACAAAGGGGTGTCTCCCGGTAGCACTGTTCTTAAGCAGTGGCTCCCTGAAGGTACACTCCTTGTCGATAATGATATTGTAGATTATGTATCTGATGCACATGTCTCTGTGCTTTCAGATTGTAATAAATATAAAACAGAGCACAAGTTTGATCTTGTGATATCTGATATGTATACGGATAATGATTCAAAGAGAAAGCATGAAGGCGTGATAGCCAATAACGGCAATGATGACGTCTTCATATACCTTTCAAATTTTCTTCGCAACAACTTAGCTCTAGGTGGCAGTTTTGCTGTAAAAGTAACAGAGACAAGTTGGCACGAAAATTTGTATGACATTGCACAGGATTGTGCATGGTGGACAATGTTCTGTACAGCCGTGAATGCATCTTCTTCAGAAGCATTCATAGTTGGTGTTAATTACTTGGGTGCAAGTGCAAAGGTTAAAGTTAGTGGAAAAACACTGCACGCAAATTATATATTTTGGAGGAATTGTAATTATTTACAAACCTCAGCTTATAGTATATTTGACGTTGCTAAGTTTGATTTGAAATTAAAAGCAACACCAGTTGTAAATTTGAAAACTGAACAAAAGACCGACTTAGTAGTTAATTTACTAAGGAACGGTAAATTATTGGTTAGAGATGTTGGAGAGGTCACTGTTATTAGCGACTCTTTTGTCTGCACTATGTAG
Protein
MASSLKQGVSPKPRDVILVSKDIPEQLCDALFFYTSHNPKDYADAFAFKQKFDRNLRTGKPFKFETVCGLFLLKGVDKITPGIPEKVLKATSKLADLEDIFGVSPFARKYRELLKTACQWSMTVETLDARAQTLDEIFSPTEILWLQVAAKIQVSAMAMRRLVGEVTAKVMEALGSNLSVLFHIVKQQIARIFQKALAIFENVSELPQRIAALKMAFAKCAKSITVVVVERTLVIREFAGTCLASINGAVAKFFEELPNGFMGSKIFTTLAFFKEAAVKIVENIPNAPRGTKGFEVVGNAKGTQVVVRGMRNDLTLLDQKADIPVEKEGWSAILEGHLCYVFKSGDRFYAAPLSGNFALHDVHCCERVVCLSDGVTPEINDGLILVAIYSSFSVSELVAALKKGEPFKFLGHKFVYAKDAAVSFTLAKAATIADVLKLFQSARVQTEDVWSAFTEKSFNFWKFAYGKVRNLEEVVKTHFFKAQMSIIILAAVLGEGIWHLVSQVIYKVGGLFTRVVDFCEKHWKGFCVQLKKAKLVVTETLCVLKGVTQHCFQLLLDALHSLYMSFKKCALGRIHGDLFFWKGGVHKIVQDGDEIWFDAIDSIDVQDLGVVQEKPIDFEVCEDVTLPENQPGHMIQIADEGKNYMFFRFKKDENIYYTPMSQLGAINVVCKAGGKTVTFGETIVKEIPPSDVVPIKVSIECCGEPWNTIFKKAYKEPIEVETDLTVEQLLSVIYEKMCDDLKLFPEAPEPPPFENVALVDKNGKDLDCIKSCYLIYRDYESDDDIEEEDAEECDTTSECEEEDEDTKVLALIQDPASNKYPLPLDDDYSVFNGCIVHKDALDVVNLPSGEETFVVNNCFEGAVKPLPQKVVDVLGDWGEAVDAQEQIAQTTLKETPISSLEATEQVVVEEQKIISVVEEEQQVAVYTLADLQVVEETPDEFILTADVSIEEIVPHEEKESQIEQGPIQVVKLQREKKAKKFKVKSTTCEKPKFLEYTTCVGDLTIVIAKALDEFKEFCIVNAANEHMSHGGGVAKAIADFCGPDFVEYCEDYVKKHGPQQRLVTPSFVKGIQCVNNVVGPRHGDRDLHDKLVAAYKNVLVDGVVNYVVPVLSSGIFGVDFKMSIDAMRKAFEGCNIRVLLFSLSQEHIDYFDVTCKQKTIYLTEDGVKYRSAIVKPGDSLSQFGPVFARNKTVFTADDVEDKEILFIPTADKTVLEYYGFDAQKYVIYLQTLAQKWNVQYRDNFVILEWRDGNCWINAAIVILQAAKIKFKGFLAEAWAKLLGGDPTDFVAWCYASCNANVGDFADANWLLANLAEHFDADHTNAFLKRRVSCNCGVKDCEVRGLEACIQPVRAPNLLHFKTQYSNCPACGANSVDEVVEASLPYLLLLATDGPATVDCDENAVGNIVFIGSTNSGHCYTQAVGKAFDNLAKERKFSKKSPYITAMYMRFSLKSESPLSFVKQSKGKSKVVKEDVANLATSSKVSFDDLTDFEQWYDSNIYESLKVQETPENLDEYVSFTTKNDSKLPLTLKVRGIKSVVEFKSKDGFTYKLTPDIDENSKAPVYYPVLDSISLKAIWVEGSANFVVGHPNYYSKSLRVPTFWECAETFVKIGEKVDGVTTGLWRAEHLNKPNLERIFNIAKKAIVGTSVITTQCSKLIGKASAFVADKVGGGVVRNITDRIKGLCGITRGHFENKMSPQFLKTIMFFFFYLIKASGKSLVASYRSVLCKVVFTTLFILWFIYTSNPVMFTGIRVLDILFEGSLCGSYNDYGKDTFDVLRYCADDFTCRVCLHDRDSLHLYKHAYSVEQVYKDAISGISFNWNWLYLTFLILFVKPVAGFVIICYCVKYLVLSSTVLQTGVGFLDWFTQTVFTHFNFMGAGFYFWLFYKIYIQVHHILYCKDITCEVCNRVARSNRYEVSVVVGGRKQLVHVYTNSGYKFCKTHNWYCRNCDEYGHQNTFMSPEVAGELSEKLKRYVKPTAHAYHVVDDACVVDDFVNLKYKAATPGKDSAPPAVKCFSVTDFLKKAVFLKDALKCEQISNDSFIVCNTQSAHSLEEAKNAAIYYAQYLCKPILILDQALYERLVVEPVSKSVVDKVCNILSNIISVDTAALNYKAGTLRDALLSVTKDEEAVDMAIFCHNHDVEYTGDGFTNVISSYGIDTGKLTPRDRGFLINADASIANLRVRNAPPVVWKFSDLIKLSDSCLKYLISATVKSGSRFFVTKSGVKQVISCHTQKLLVEKKAGGIISGTFSKVKSCCKWLLIFYILFTACCLGYYHMEMNKSFVHPMYDVSSTMHVEGFKVIDKGVIREIVSEDTCFSNKFANFDSFWGRPYVNSRDCPIVTAVIDGAGTIAAGVPGYVGWVLDGVMFVHMTQTERKPWYIPTWFNREIVGYTQDSIITEGSFYTSIALFSARCLYLTASNTPQLYCFNGDNDAPGALPFSSITPHRVYFQPNGVRLIVPQQIMHMPYIVKFLSDSYCRGSVCEYTKPGYCVSLNSQWVLFNDEYTSKPGVFCGSTVRELMFNMVSTFFTGVNPNIYMQLATMFLILVGVVLVFAMVIKFQGVFKAYATIVFTIMLVWVINAFILCVHSYNSVVAVILLVFYCYASLVTSRNTSIIMHCWLVFTFGLIIPTWLACCYLGFIIYMYTPLFFWCYGTTKNTRKLYDGNEFVGNYDLAAKSTFVIRGSEFVKLTNEIGDKFEHYLSAYARLKYYSGTGSEQDYLQACRAWLAYALDQYRSSGVEIVYTPPRYSIGVSRLQAGFKKLAAPSSAVEKCIVSVSYRGNNLNGLWLGDSIYCPRHVLGKFSGDQWSDVLNLANNHEFEIVTRNNVTLNVVSRRLRGAVLILQTAVANAETPKYKFVKANCGDSFTIACSYGGTVVGLYPVTMRSNGTIRASFLAGACGSPGFNIEKGVVNFYYMHHLELPNALHTGTDLTGEFYGGYVDEEVAQRVPPDNLVTNNIVAWFYAAIISVKESSFSLPKWLESTTVSVDDYNKWAGDNGFTPFSTSTAITKLSAITGVDVCKLLRTIMVKSSQWGSEPILGQYNFEDELTPESVFNQVGGVKLQSSFVRKATSWFWSRCVLACFLFVLCAVVLFTAVPLRYYVHAAVILLMAVLFISFTVKHVMAYMDTFLLPTLLTVIIGVCAEVPFIYNTLISQIVIYVSQWYDPVVFDTMVPWMFLPLVLYTAVKCVQGCYSVNSFNTSLLVLYQFLKLGFVIYASSNTLAAYSEGNWELFFELVHTTVLANCSSNSLIGLLVFKLAKWMLYYCNATYFNNYVLMAVIINGFGWLFTCYFGIYWWINKVFGLTLGKYEFKVSVDQYRYMCLHKIVPPKTVWEVFSTNILIQGIGGDRVLPIATVQSKLSDVKCTTVVLMQLLTKLNVEANSKMHAYLVELHNKILASDDVAECMDNLLGMLVTLFCVDSSIDLSEYCDDILKRSTVLQSVTQEFSHIPSYAEYERAKDLYEKVLVDSKNGGVTQQELAAYRKAANIAKSVFDRDLAVQKKLDSMAERAMTTMYKEARVTDRRAKLVSSLHALLFSMLKKIDSEKLNVLFDQASSGVVPLVTVPIVCSNKLTLVIPDPETWAKCVEGMHVTYSTVVWNIDTVIDADGTELHPTSISSGLTYCVSGDNIAWPLKVCLTRNGHNRVDAALQNNELMPHGVKTKACVAGVDQAHCSVESKCYYTNISGNSVVAAITSSNPNLKVASFLNEAGNQIYVDLDPPCKFGMKVGDKVEVVYLYFIKNTRSIVRGMVLGAISNVVVLQSKGHETEEVDAVGILSLCSFAVDPADTYCKYVAAGNQPLGNCVKMLTVHNGSGFAITSKPSPTPDQDSYGGASVCLYCRAHIAHPGGAGNLDGRCQLKGSFVQIPTTERDPVGFCLRNKVCTVCQCWVGYGCQCDALRQTKPSVQVVAVAADYDKNYLNGVRGSSEARLIPLSNGCDPDVVKRAFDVCNKESAGMFKNLKRNCARFQEVCDTEGGNLEYLDSFFVVKQTTPSNYEHEKACYEDLKSVVTADHDFFVFNKNIYNISRQRLTKYTMMDFCYALRHFDPKDCEVLKEILVTYGCVEDYHPKWFEENKDWYDPIENPKYYAMLAKMGPIVRRALLNAVEFGNLMVEKGYVGVVTLDNQDLNGKFYDFGDFQKTAPGAGVPVFDTYYSYMMPIIAMTDALAPERYFEYDVHKGYKSYDLLKYDYTEEKQELFQKYFKYWDQEYHPNCRDCSDDRCLIHCANFNILFSTLIPQTSFGNLCRKVFVDGVPFVATCGYHSKELGVIMNQDNTMSFSKMGLSQLMQFVGDPALLVGTSNNLVDLRTSCFSVCALASGITHQTVKPGHFNKDFYDFAEKAGMFKEGSFIPLKHFFYPQTGNAAINDYDYYRYNRPTMFDIRQLLFCLEVTSKYFDCYEGGCIPASQVVVNNLDKSAGYPFNKFGKARLYYEMSLEEQDQLFESTKKNVLPTITQMNLKYAISAKNRARTVAGVSILSTMTNRQFHQKMLKSIVNTRNAPVVIGTTKFYGGWDNMLRNLIQGVEDPILMGWDYPKCDRAMPNLLRIAASLILARKHTNCCTWPERIYRLYNECAQVLSETVLATGGIYVKPGGTSSGDATTAYANSVFNIIQATSANVARLLSVITRDIVYDDIKDLQYELYHQVYRRVNFDPVFVEKFYSYLCKNFSLMILSDDGVVCYNNTLAKQGLVADISGFREILYYQNNVYMADSKCWVEPDLEKGPHEFCSQHTMLVEVDGEPKYLPYPDPSRILGACVFVDEVDKTEPVAVMERYIALAIDAYPLVHHENEEYRKVFFVLLSYIRKLYQELSQSMLMDYSFVMDIDKGSKFWEQEFYENMYRAPTTLQSCGVCVVCNSQTILRCGNCIRKPFLCCKCCYDHVMHTDHKNVLSINPYICSQPGCGEADVTKLYLGGMSYFCGNHKPKLSIPLVSNGTVFGIYRANCVGSENVDDFNQLATTNWSTVEPYILANRCSDPLRRFAAETVKATEELHKQQFASAEVREVLSDRELILSWEPGKTRPPLNRNYVFTGYHFTRTSKVQLGDFIFEKGDGKDVVYYRATSTAKLSVGDIFVLTSHNVVSLVAPTLCPQQTFSRFVNLRPNVMVPECFVNNIPLYHLVGKQKRTTVQGPPGSGKSHFAIGLAAYFSNARVVFTACSHAAVDALCEKAFKFLKVDDCTRIVPQRTTIDCFSKFKANDTGKKYIFSTINALPEVSCDILLVDEVSMLTNYELSFINGKINYQYVVYVGDPAQLPAPRTLLNGSLSPKDYNVVTNLMVCVKPDIFLAKCYRCPKEIVDTVSTLVYDGKFVANNPESRQCFKVIVNNGNSDVGHESGSAYNTTQLEFVKDFVCRNKEWREATFISPYNAMNQRAYRMLGLNVQTVDSSQGSEYDYVIFCVTADSQHALNINRFNVALTRAKRGILVVMRQRDELYSALKFTELDSETSLQGTGLFKICNKEFNGVHPAYAVTTKALAATYKVNDELAALVNVEAGSEITYKHLISLLGFKMSVNVEGCHNMFITRDEAIRNVRGWVGFDVEATHACGTNIGTNLPFQVGFSTGADFVVTPEGLIDTSIGNNFEPVNSKAPPGEQFNHLRALFKSAKPWHVIRPRIVQMLADNLCNVSDCVVFVTWCHGLELTTLRYFVKIGKEQVCSCGSRATTFNSHTQAYACWKHCLGFDFVYNPLLVDIQQWGYSGNLQFNHGLHCNVHGHAHVASADAIMTRCLAINNAFCQDVNWDLTYPHIANEDEVNSSCRYLQRMYLNACVDALRVNVVYDIGNPKGIKCVRRGDVNFRFYDKNPIVPNVKQFEYDYNQHKDKFADGLCMFWNCNVDCYPDNSLVCRYDTRNLSVFNLPGCNGGSLYVNKHAFHTPKFDRISFRNLKAMPFFFYDSSPCETIQVDGVAQDLVSLATKDCITKCNIGGAVCKKHAQMYAEFVTSYNAAVTAGFTFWVTNNFNPYNLWKSFSALQSIDNIAYNMYKGGHYDAVAGEMPTVVTGDKVFVIDQGVEKAVFVNQTALPTSVAFELYAKRNIRTLPNNRILKGLGVDVTNGFVIWDYANQTPLYRNTVKVCAYTDIEPNGLTVLYDDRYGDFQSFLAADNAVLVSTQCYKRYACVEVPSNLLVQNGISLTDGANLYVYKRVKGVFVTLPNTLNTQGRNYETFEPRSDVERDFLNMSEEDFVEKYGKDLGLQHILYGEVDKPQLGGLHTVIGMYRLLRAHKLNAKSVTSSDSDVMQNYFVLAENGSYKQVCTVVDLLLDDFLELLRNILKEYGTNKSKVVTVSIDYHSINFMTWFDNGSIKTCYPQLQSAWTCGYNMPELYKVQNCVMEPCNIPNYGVGITLPSGIMMNVAKYTQLCQYLSKTTMCVPHNMRVMHFGAGSDKGVSPGSTVLKQWLPEGTLLVDNDIVDYVSDAHVSVLSDCNKYKTEHKFDLVISDMYTDNDSKRKHEGVIANNGNDDVFIYLSNFLRNNLALGGSFAVKVTETSWHENLYDIAQDCAWWTMFCTAVNASSSEAFIVGVNYLGASAKVKVSGKTLHANYIFWRNCNYLQTSAYSIFDVAKFDLKLKATPVVNLKTEQKTDLVVNLLRNGKLLVRDVGEVTVISDSFVCTM

Summary

Function
The papain-like proteinase (PL-PRO) is responsible for the cleavages located at the N-terminus of replicase polyprotein. Activity of PL-PRO is dependent on zinc (By similarity).
The main proteinase 3CL-PRO is responsible for the majority of cleavages as it cleaves the C-terminus of replicase polyprotein at 11 sites. Recognizes substrates containing the core sequence [ILMVF]-Q-|-[SGACN]. Inhibited by the substrate-analog Cbz-Val-Asn-Ser-Thr-Leu-Gln-CMK.
The helicase which contains a zinc finger structure displays RNA and DNA duplex-unwinding activities with 5' to 3' polarity. Its ATPase activity is strongly stimulated by poly(U), poly(dT), poly(C), poly(dA), but not by poly(G) (By similarity).
The exoribonuclease acts on both ssRNA and dsRNA in a 3' to 5' direction.
Nsp7-nsp8 hexadecamer may possibly confer processivity to the polymerase, maybe by binding to dsRNA or by producing primers utilized by the latter.
Nsp9 is a ssRNA-binding protein.
NendoU is a Mn(2+)-dependent, uridylate-specific enzyme, which leaves 2'-3'-cyclic phosphates 5' to the cleaved bond.
Catalytic Activity
a ribonucleoside 5'-triphosphate + RNA(n) = diphosphate + RNA(n+1)
ATP + H2O = ADP + H(+) + phosphate
Subunit
3CL-PRO exists as monomer and homodimer. The three peptides nsp2, nsp3 and nsp4 may form a complex. Nsp9 is a dimer. Eight copies of nsp7 and eight copies of nsp8 assemble to form a heterohexadecamer. Nsp10 forms a dodecamer (By similarity). Interacts with DDX1 (via C-terminus).
Miscellaneous
Produced by -1 ribosomal frameshifting at the 1a-1b genes boundary.
Similarity
Belongs to the coronaviruses polyprotein 1ab family.
Keywords
3D-structure   Activation of host autophagy by virus   ATP-binding   Endonuclease   Exonuclease   Helicase   Host cytoplasm   Host membrane   Host-virus interaction   Hydrolase   Membrane   Metal-binding   Methyltransferase   Nuclease   Nucleotide-binding   Nucleotidyltransferase   Protease   Reference proteome   Repeat   Ribosomal frameshifting   RNA-binding   RNA-directed RNA polymerase   Thiol protease   Transferase   Transmembrane   Transmembrane helix   Viral RNA replication   Zinc   Zinc-finger  
Feature
chain  Non-structural protein 2
Uniprot
Pfam
PF09401   NSP10
PF00680   RdRP_1
PF01443   Viral_helicase1
PF06460   NSP16
PF08715   Viral_protease
PF06478   Corona_RPol_N
PF08716   nsp7
PF08717   nsp8
PF17896   Nsp2a_N
PF08710   nsp9
PF05409   Peptidase_C30
PF16348   Corona_NSP4_C
PF06471   NSP11
PF01661   Macro
Interpro
IPR018995   RNA_synth_NSP10_coronavirus
IPR029063   SAM-dependent_MTases
IPR009003   Peptidase_S1_PA
IPR014822   NSP9
IPR037227   EndoU-like
IPR027417   P-loop_NTPase
IPR038123   NSP4_C_sf
IPR037230   NSP8_sf
IPR013016   Peptidase_C30/C16
IPR003593   AAA+_ATPase
IPR040795   Nsp1a_N
IPR001205   RNA-dir_pol_C
IPR027352   CV_ZBD
IPR014828   NSP7
IPR036333   NSP10_sf
IPR032505   Corona_NSP4_C
IPR009469   RNA_pol_N_coronovir
IPR008740   Peptidase_C30
IPR037204   NSP7_sf
IPR007094   RNA-dir_pol_PSvirus
IPR027351   (+)RNA_virus_helicase_core_dom
IPR036499   NSP9_sf
IPR014829   NSP8
IPR042515   Nsp15_N
IPR009461   Coronavirus_NSP16
IPR002589   Macro_dom
IPR014827   Viral_protease
IPR009466   NSP11
SUPFAM
SSF143076   SSF143076
SSF140367   SSF140367
SSF101816   SSF101816
SSF53335   SSF53335
SSF50494   SSF50494
SSF142877   SSF142877
SSF52540   SSF52540
SSF144246   SSF144246
ProteinModelPortal
PDB
6NUS     E-value=0.0     Score=1142     Identity=61.52%     Cov(Q)=14.11%     Cov(P)=97.70%

Ontologies

Subcellular Location

From MSLVP
Capsid
From Uniprot
Host membrane  
   nsp7, nsp8, nsp9 and nsp10 are localized in cytoplasmic foci, largely perinuclear. Late in infection, they merge into confluent complexes (By similarity).   With evidence from 5 publications.
Host endoplasmic reticulum-Golgi intermediate compartment   The helicase interacts with the N protein in membranous complexes and colocalizes with sites of synthesis of new viral RNA.   With evidence from 5 publications.

Topology

Length:
6610
Number of predicted TMHs:
16
Exp number of AAs in TMHs:
387.565269999998
Exp number, first 60 AAs:
2e-05
Total prob of N-in:
0.00571
outside
1  -  1720
TMhelix
1721  -  1743
inside
1744  -  1828
TMhelix
1829  -  1851
outside
1852  -  1865
TMhelix
1866  -  1888
inside
1889  -  2260
TMhelix
2261  -  2279
outside
2280  -  2341
TMhelix
2342  -  2364
inside
2365  -  2537
TMhelix
2538  -  2560
outside
2561  -  2564
TMhelix
2565  -  2587
inside
2588  -  2593
TMhelix
2594  -  2611
outside
2612  -  2630
TMhelix
2631  -  2653
inside
2654  -  3075
TMhelix
3076  -  3098
outside
3099  -  3102
TMhelix
3103  -  3122
inside
3123  -  3133
TMhelix
3134  -  3156
outside
3157  -  3175
TMhelix
3176  -  3198
inside
3199  -  3204
TMhelix
3205  -  3227
outside
3228  -  3236
TMhelix
3237  -  3259
inside
3260  -  3278
TMhelix
3279  -  3301
outside
3302  -  6610
 
 
Copyright@ 2018-2023    Any Comments and suggestions mail to:  zhuzl@cqu.edu.cn, mg@cau.edu.cn   渝ICP备19006517号

渝公网安备 50010602502065号

In processing...
Login to ASFVdb
Email
Password
Please go to Regist if without an account.
If you have forgotten your password, you can once again Regist an account with a registed or new email.
Change my password
Enter new password
Reenter new password
Regist an account of ASFVdb
It is required that you provide your institutional e-mail address (with edu or org in the domain) as confirmation of your affiliation.
Enter email
Reenter email
First Name
Last Name
Institution
You can directly go to if with an account.
Registraion Success
Your password has been sent to your email.
Please check it and login later.
Welcome to use ASFVdb.