HERV35I
Basic information Differential Expression Stage analysis Survival analysis Correlation analysisDF ID | DF0000171 |
---|---|
TE superfamily | ERV1 |
TE class | LTR |
Species | Haplorrhini |
Length | 6918 |
Kimura value | 14.35 |
Tau index | 1.0000 |
Description | Internal region of an ERV1 endogenous retrovirus, HERV35I subfamily |
Comment | Internal sequence of an endogenous retrovirus with associated LTR35 LTRs. This is an ancient, non-autonomous LTR retrotransposon. The primer binding site is complementary to proline tRNA. |
Sequence |
ATTCTTTCGGGGCTCGTCCGGGATCACGGGACGTGGGGAGCATTTTCCTCCCCGGAGGGGGAGGCTTGTGAGCCAGCAGGACNGCCGGGCGTGACCCCTTCGCGGCTGACGGGCGGCCGCCTGAATCTTTGATTCAGCGTCGCCGCAACTGGTGAGTTTTCCTCCGGCCTCCCGGAGACTCCTCGCCANCCCCCCACAGACAATGCTTTTCCTCCCCTCCTGTCCCCNNTATTCGTTGTGTCTTTCTTTTTCCTTCTTCTTTCCGNCGCCCNNNNCGCTTTCCCTCTCTTCCTTCGCTTTTCATTAACTTCATCGGCTCNGCCTGAATAGACACCCNTGCGGGACGGATTGAAACGGCNNNNNNNNNNAGCTGGTTTTGGCTCAGCCTGAATAGACATCCGTGCAGGATGGATTGAAACGGNTGACTNNCCGGGNCTGATCGGTCCAGCTGGTAGGAAACTCTGTCTGGCGCCCTGCCTTTGACNTCCGTNNTCTNGCCTAAGTCGNCTNGGTATTGAGTNCCAAGAAAANNNNNTCTCTCTCTCCCTTTGTCACTCTCCCTNCCTGGCACCCTGGCCCTTGATCCTGTAACTATTCNAAACCCNTCATTACTTCACTTCCCTTCTNGTGGGGAAGGGAGGCCTGTNATNTTTCNGGGCGTCTGTCTGTCCGAACGTGTGGTCCTGTCAGNTNNGGGGNNNAGANTGCCTNAGACAGGGTGCTGGGGATGCCCGGCTGGCCTTCAGGAAGGCACCAGGNACACCTGGGTNCGAAGTTTGCANTATTGGTNTCCTGATCCGNTTTTCCTTTACAATAAGAAAAGTTNTGNGTTTAANTTGACAACTTNTTCCCCCATGCAGCCCGTTGGGCTGCATCTTGCAAAAANNNTTGAGAGGCTTTTGCCTATGGTTCCATGAAATGGAAAAGGATGATTTTCTTTNCGNNNNNNNNNCTNTTNNNNNTGTAACGCGGCTTGGCCCCCACAGCTATGGCGCAGCGAGCAGGGTCACCAAAAGCCGCTCCGCTCTTCCGGAAGCCGCAGNGAAAGGGAACCCAGAAACCTGGCANGCCGGCAAAAGGGTAAGAATTTCTTACCAGCCAGGCTTCTGGCCTCTCTCTCTCTGTGCAAACCGGTTGAGTGAACGGTAAAAATCACTGTTTGTCTCCTCTGCAAGGTTTTGATTAATGGGAAAAAGGATTTGTGAGACTAGTCTTAGGCTGTAGCGAATCTGGTGTACTTTGTGCTATGAATTTGTCTTTCTGTGTCGTTCTGTCATAAAGAGGGGTACCATAGGATAGAACGCGGGCCTAGGACCCCTATAAGCCCGCTGTTCGAGCCGGCCCTGCAGACTGGTCAGTTACAAACTTTGCTGCGGGTCCCTGAAACAAAAACCGGATGAGGTTTCCCTCTCGTCTTGTTTTATGTCCTTGAGAGCTTGACTTTGTGACCATGTGGGGGTACTCTCTCTTGGTCTCCGCCATCCGGAGGGCGGGAATTTTCGGGTTCATGTCAGGCGGCCGGTCTGAAAGGACCGGGAGTCCGAGACGCGTCAGCACACTCTTCGTCCGAATGTGTCAAGCCCTTGGGTGAGTTTTGTCTTAAAAGGTCCCATCCCTACGGGGCTTTTGTCGTCTTTTGCTATCTTAAGCCCATTTCTGAGAGTGAATTCTTGGGGATCATGGAGATGCCTCCTCTACCCCCTCTCTAGAAATACCTCTTGCTTATATGGTNNCCGNNAAAAACCTGGAAAATTACCATCTGGGCTTTAAAAGGCTTTTGGATTGAGTCGCTATTGGAACTAAGTACACCATTAAAAGAAAAAGGATTTTAGAGATCTCTTATTCTAAACAATTGATNAAAAAGGTTTAAATTAAAAGAAGGATACATAATAATGTCATGGCTAGCCTTAAAAATTCTCTTGAGCAGTTNAAAATCCTTTGCAAGCTCGAAANTGNCTGCTCTAGACTCCTTCTGGGAAGAGCAATGGCGACCGCCCCATGCTGTAGCTCAGTAGCTAAGGCTTTGCCCTTTCACGATGGCGGCCTGGGTTCAATTCCTGGCTTAGGGAATGAGTCCTTTCTGGTTTGATATTTGTGTGACTTTTGCCATTTATTGATTCTTTTCCCCTCCATGGACAGCTTCTGATTTCCTGTCTTGAATTTTCCTTTCTCTGAGCTACCTTTGGGGTGATTCTAGATCTTGTAAAAACCGCTTGCCATCTCTTTGGAGACACCTCGTGCGTCCGTGGTTAAGTCATAACCTTAGTTAAGGCTTATTGGTTTCACTTGGGAGGATACCTTTGGNNANAAAAAAANAAAAAAGGCTTAAAAGCCAGAGGTATCGGCTGTTTGTCCCGGCTAAAGTCTGGTAATAAGAGATTTAAAAGGNTTTTTNTTNNNNNAAAAGAGCTCTATGGTTAAAAGTCAGCTTAATTAAAAGCNGATATCCAAGCTATATATATATTTAAAAGGCCTTTATGCTTTTTTCTCTTCTTGGATCTTGTTTTTTGAGAAAACGNNNNNNNCGTTTGAGAAAAAAAGTTTTTTTTTCTTCTCAGTCGACTGAATTGTTTCTCCATTTACTTCTGTCTGTCTTCTTGCCACCCTCGATGCCCACATGAGAGGACCTAAGGTAATTTCTGACAGCCTGGGACTCCTTGGGAAAAACAGNNAAGGCGCCACAGACCCCGTTTTGGGAGAAACCTCTGTTTTCCTCATGGAACCCCAAGAACTGTAAGCGGACAGGTCCCTCTCAAAATCTAAGGCTCTGCTCTGTTTTGCNTTGCGTCGTNTTACCTGACCTTTTTGACTTTTGGGGGCATCAGAAATTACTTTGCATTATGAGAAAACTTTTAGCCTTGGTGTGTAATAGCTAGGTAAGAGATATACTTTTAGGGATGGCTAATGGCAGTTGCTTACAGTGAGTGGTTATTACTACAGGGCGATACTCCTTTCTTTGCGCGTTTAGATAAGAAAAGCGTGCTCTTGGGCACCTAGAAGGTATGGAATGGGGGGATGGGCTGATTACAGAGTGGGCTGATTGGCNTTGGGTTGCCCACCAGCCTCGGGGAAATGTCCTTGCAATGAAATGCACCGTGGAAGCATTGCACTGTCTCGTCCCGTAGCGTTTCCCTCTTTTNGGGGACCCAGGATTCGGTGTAAAAATGGGATCCTTGATTTTTGGGGATCTGTTTTGCCTTCCAGCTGTGCCTGCTTATTAGGCCCTAGAAACTGCATGCTTTCCTGGCCCTGTTCCTTAAAAGGCTCCACCCTAAAGCCAGTAATCCAATTNAGAAACTNACATCTTTAAGGAAATCTCCACGTGTAAGAGTGTCTGCTTTTCCTGGCCATCTTAACTGAACTTTTACTCACACCATTTTTCCTTGGTTTGAGTAAAATATAAATTCTCTACCTTGTTTCACCTAAGAGTCGTCCCTTTAGAAATGCAAATTTAGAGTTGCCTAGCTAACAATTGTTTAGGGCAGGGAACAGGTAATCAAGAGACTGATGGTCTAAAATGGGAAAGAGAAACTTAAAAACTGGCAAATGAAAAATCTTATAACTCTACNAGATCTGCTTCTGTCTGTNTATTTATGTNTTGTGTGTGTGATGTATATATAAAAGAGCTCTAATTAATTGGCTTAAAGAAAAATAAGCGCTTAAATNAAATATTTTGTCAGAAAAAATAGAAACTTNAATGCCTTTTAGTTCACGTGACTTTAGTAATCTTTGGTAAATAAAGACAGTTTTAAAGATTATTGGTAAAATAAAATAAAAACGTCTTCAAAATTTAGACATTTGGTCTAAATTAGGCAGGTCAGATACTGTCTTTGCTAGATGCTTTAAGGTCATAAACTGCTTCTNTGACTTTTGATAATTGTTCGACTTGCCTGCTTTAGAGCCATTAGATTCTAGGTAAGGCCTGGGGACATGTGGAGTTAGCCATGCCCCCTAGCTATGCTGGAAAGAGTCAGACNTTATCTGCAGTTCTGTCCTGTGTCCTAGGCTCTGCACCTGGTACATAATTAAAATTGCTTACACTAAAAATAAAAATTATGTGTTTTTGGTAAAAGGTTATAAAAAGGCATGGGAATGTGGTTTTTTAAGAGAAAGTAATTTTGTCTAGTTTAGAGGGTTTNAAGGATGTTTTAAGTTNNAAAGAAAGAAGAATAAAACTGAAGGTTTAAGCAAGTTGTAGAAGGTTTGTGAAAGATTAATCTTGTAAAAGAAATTCTGTGTGTGAGCAAGTTGGCTAAAATTTAAAGGGNATTATTTAGTTTTTCCGTAAATTGAACATTAAAATAAAAAGCACACTGATGCAGGGCCAGAATCTGGGCCCNTGTGTCNGAATAACAGGGTTTTCTTGGAGCATTGATCTGCTCTTTAACAGAAAATTGTAAAGGGTTATAAAAGGTTTATGAAAATCTTACCTTATGGTCAAACTGATTAAGATTGGATAGATTTGTTTATNNNAAGGTTTTATTAAAATTGGNTTTAGCATTAATACACTAATGCAAAGGTAAAATTTGGTTTTCTCTTTTGAACAAGATTTTCGTGTACCTGCAGAAAAAAGGGAGAGAGAAGAGACAGATTCAGTTGGCCTCATGCTGTCTTTATTGGGTCTTGTTGTTTGGAAAGCTGAGTCTCCCCTCTATCAANGAGTAAAGGTTTTTGNCTTTNTTAAAATNTTTGAAGTNATCATTTTGGCTAAATAAATGACTTATGGTGACCTGNGATTCTATTTTGTGATATCAAGTGTTTTAAACCTTTNGATATTTGACAAACTTTCCAAAATCAAATTTTTGACCTNATTAANCTTTTTAGATATTAGGTCCCCTGAAGTCCAAAAGAGACATATTCGGCTTATTTGGTATATTAAAATCATACAGGAAGCATTGTCAAATATAAAATGGTGTTTAACTTTCTTTGGGTTATATTTATATGTTATTAGTATGTGTTCCAAAATTGTATGAGATTCCTATAATTCTGATATGTCTCAGTATATGTTATCAGTAATAATTATGATTGTTATGTTAAATTATTGTGTGCCACAGAGATAACCAGATTTCCTTGTCGATTGTGTCTTTAACCGTGGCTGTCCTAAGACTTTTGTCATCCACAGACAATTGTTGTCTTGTTTTGATCCTTTTCAAAAGGCGGTTTATAATCAGCTATAGGACTCTGACAGGTGCTCTTGAATGCAGGTTTCTGATAACTTTGGAGATTGTGNCATTGGAATAGAGGGAAAAACTTCCAGGACTCTCATGGAGAGCTGATGTGTTCATGAATATCGAGCAGAACAGGAGTTAATTGCATGGACTGAACTAATAGAAGACTGAAATAATCTTTTTATGACTTTTTGCTTGAAACATTGCTGATTCTTTTTGNTTTGTTTTTCAGAGTCAAGAAAACTTTTTTTCCTTTTGAGCTATTTACAGCTTTTAACAATTGAGTAAAGTATACTCCTGTGAGCAAAATTTGGAGCATATTTCTTTCTCTCTACCTGATTTCTCCAGAATTTGGAAACTATTTGTGAGTATTCTTAATTTATGGCAATATAGTTATTTGCATAAGTTCAATAAGAATCTGTTTTCTTTTGTAACAGGACACAATTGGAGACACTGGTTATTTTACCAAGGCTTTGACTGGAATGGCATGCTTTCAGATATAAACAGACTGCTTTAAGGAATCGAAGTTGACTTATAGAGCCGATAAAAGCCCCTTGGGAAAACTGGCCTCATACCTTGTCTACGCAGTCCCTGTACAGGGTTCCTGACCTGTGGTAAGTAAAGAATGTCACTTTCTGACAGGCCCAGGAGCCCCAAGTTATCTTGGGACCTCGAGAGGAGAGGAATTCACCCAATTCATACAGGTATTTGCAGGCACAGATAAATCCGTGGCTGGGCTCAAGGCTTTAAAAAGTCTAATCTGAGATTCCTTATGGAACAAAGTTCCAGCAAAGCCAATTTAAAAAAGAGCCTATATGGCAAATAATTATTCTTGCTGCACTTTATGCAAATAATCAGGCCAAGTATAATAAGACTAAAACTTATTTTGCAAATAAATTNGTCCTACTATGATTTGTCTTTGGTAAAAATGGGAGACTGGAGAGAGAAAAATTATAGTACACCTGTTATTAGATTCTAGTCTTGTCCGTTGTTTNTTGAGTTTTTNNNNNNNNATTATTTTCTACAATTTGGACTGAATCCTGAATTCTTTCCGGGCTACAAGTCTCCAAACTAACGCTTTCAAATTTTTCTTCCATTTTTCTGACTTGGACTCAATGAAATTGCTACTACCTTTTTCCTGAGGCCCTGCAAGCTGAAGCTTATTCCTTGTGATACAGGCGAGAAAAACGTGTCAGATTGCCACCGCCTTCCTCCTCTGTAACTAAAGATGCTTTGAGTCTAACATCTGGATAAATTGTGCCCAACATTAACCTTTGTTTTTCTTCTGTTTCCATAGAAATGCCTCTTATTAAAAATCTGTTTGCCTTATATTTCAGACAACAGGAGACTGGTTTTCCAGCCTATTCACTTAGATTCCAAATGGCATCTGATCTCTTCTTATAAGCATTGTTAAACTGGGCTTAAGCATTTTATTAATTATCACTGGGTGCTATTTGATTTTTAAAATAATTATTTGTTATATTCAACAGGGGTGCAGACGGTTAAAGTTTATGTCTTCCAGGCTTCAACAGTTCCAAGTCAAGCTAATGATGGCCCAAGGATTCCAACCCGTACCATCCCAGGAGGANCCGAGTCCCTACAGGTCNTTAGANCAGTCAGTGAGAGATTTCCGCGCCCTCCAAGGTTAGGCAGGGACGACAACCCTGTTCAGCAGGAAGTAGCTTCAGAAGATGAGATCTTCGGCCCTTTCTCCTTAAGAATAAGGAGGGTGAAATCTCTCAGGGGGGAA
|
TF motifs of the concenus sequence
Use FIMO to detect transcription factor motifs in the concenus sequence of the TE family.
TE_family | TFBS | Start | End | Strand | Score | Matched sequence |
---|---|---|---|---|---|---|
HERV35I | tll | 2805 | 2814 | - | 17.07 | AAAAGTCAAA |
HERV35I | usp | 90 | 98 | - | 17.04 | GGGGTCACG |
HERV35I | IDD4 | 1624 | 1638 | - | 16.95 | AAAAGACGACAAAAG |
HERV35I | ZNF281 | 3011 | 3020 | + | 16.91 | GGGGGATGGG |
HERV35I | ZNF708 | 3204 | 3212 | + | 16.87 | GCTGTGCCT |
HERV35I | ZSCAN29 | 5746 | 5756 | + | 16.52 | TGTCTACGCAG |
HERV35I | nub | 5562 | 5572 | - | 16.49 | TATGCAAATAA |
HERV35I | nub | 6012 | 6022 | + | 16.49 | TATGCAAATAA |
HERV35I | WRKY50 | 2806 | 2814 | + | 16.45 | TTGACTTTT |
HERV35I | WRKY45 | 2805 | 2814 | - | 16.38 | AAAAGTCAAA |
TFBS enrichment in GRCh38
Use Fisher's exact test to perform enrichment analysis of transcription factor binding sites in the TE family of GRCh38.