HERV35I
Basic information Differential Expression Stage analysis Survival analysis Correlation analysisDF ID | DF0000171 |
---|---|
TE superfamily | ERV1 |
TE class | LTR |
Species | Haplorrhini |
Length | 6918 |
Kimura value | 14.35 |
Tau index | 1.0000 |
Description | Internal region of an ERV1 endogenous retrovirus, HERV35I subfamily |
Comment | Internal sequence of an endogenous retrovirus with associated LTR35 LTRs. This is an ancient, non-autonomous LTR retrotransposon. The primer binding site is complementary to proline tRNA. |
Sequence |
ATTCTTTCGGGGCTCGTCCGGGATCACGGGACGTGGGGAGCATTTTCCTCCCCGGAGGGGGAGGCTTGTGAGCCAGCAGGACNGCCGGGCGTGACCCCTTCGCGGCTGACGGGCGGCCGCCTGAATCTTTGATTCAGCGTCGCCGCAACTGGTGAGTTTTCCTCCGGCCTCCCGGAGACTCCTCGCCANCCCCCCACAGACAATGCTTTTCCTCCCCTCCTGTCCCCNNTATTCGTTGTGTCTTTCTTTTTCCTTCTTCTTTCCGNCGCCCNNNNCGCTTTCCCTCTCTTCCTTCGCTTTTCATTAACTTCATCGGCTCNGCCTGAATAGACACCCNTGCGGGACGGATTGAAACGGCNNNNNNNNNNAGCTGGTTTTGGCTCAGCCTGAATAGACATCCGTGCAGGATGGATTGAAACGGNTGACTNNCCGGGNCTGATCGGTCCAGCTGGTAGGAAACTCTGTCTGGCGCCCTGCCTTTGACNTCCGTNNTCTNGCCTAAGTCGNCTNGGTATTGAGTNCCAAGAAAANNNNNTCTCTCTCTCCCTTTGTCACTCTCCCTNCCTGGCACCCTGGCCCTTGATCCTGTAACTATTCNAAACCCNTCATTACTTCACTTCCCTTCTNGTGGGGAAGGGAGGCCTGTNATNTTTCNGGGCGTCTGTCTGTCCGAACGTGTGGTCCTGTCAGNTNNGGGGNNNAGANTGCCTNAGACAGGGTGCTGGGGATGCCCGGCTGGCCTTCAGGAAGGCACCAGGNACACCTGGGTNCGAAGTTTGCANTATTGGTNTCCTGATCCGNTTTTCCTTTACAATAAGAAAAGTTNTGNGTTTAANTTGACAACTTNTTCCCCCATGCAGCCCGTTGGGCTGCATCTTGCAAAAANNNTTGAGAGGCTTTTGCCTATGGTTCCATGAAATGGAAAAGGATGATTTTCTTTNCGNNNNNNNNNCTNTTNNNNNTGTAACGCGGCTTGGCCCCCACAGCTATGGCGCAGCGAGCAGGGTCACCAAAAGCCGCTCCGCTCTTCCGGAAGCCGCAGNGAAAGGGAACCCAGAAACCTGGCANGCCGGCAAAAGGGTAAGAATTTCTTACCAGCCAGGCTTCTGGCCTCTCTCTCTCTGTGCAAACCGGTTGAGTGAACGGTAAAAATCACTGTTTGTCTCCTCTGCAAGGTTTTGATTAATGGGAAAAAGGATTTGTGAGACTAGTCTTAGGCTGTAGCGAATCTGGTGTACTTTGTGCTATGAATTTGTCTTTCTGTGTCGTTCTGTCATAAAGAGGGGTACCATAGGATAGAACGCGGGCCTAGGACCCCTATAAGCCCGCTGTTCGAGCCGGCCCTGCAGACTGGTCAGTTACAAACTTTGCTGCGGGTCCCTGAAACAAAAACCGGATGAGGTTTCCCTCTCGTCTTGTTTTATGTCCTTGAGAGCTTGACTTTGTGACCATGTGGGGGTACTCTCTCTTGGTCTCCGCCATCCGGAGGGCGGGAATTTTCGGGTTCATGTCAGGCGGCCGGTCTGAAAGGACCGGGAGTCCGAGACGCGTCAGCACACTCTTCGTCCGAATGTGTCAAGCCCTTGGGTGAGTTTTGTCTTAAAAGGTCCCATCCCTACGGGGCTTTTGTCGTCTTTTGCTATCTTAAGCCCATTTCTGAGAGTGAATTCTTGGGGATCATGGAGATGCCTCCTCTACCCCCTCTCTAGAAATACCTCTTGCTTATATGGTNNCCGNNAAAAACCTGGAAAATTACCATCTGGGCTTTAAAAGGCTTTTGGATTGAGTCGCTATTGGAACTAAGTACACCATTAAAAGAAAAAGGATTTTAGAGATCTCTTATTCTAAACAATTGATNAAAAAGGTTTAAATTAAAAGAAGGATACATAATAATGTCATGGCTAGCCTTAAAAATTCTCTTGAGCAGTTNAAAATCCTTTGCAAGCTCGAAANTGNCTGCTCTAGACTCCTTCTGGGAAGAGCAATGGCGACCGCCCCATGCTGTAGCTCAGTAGCTAAGGCTTTGCCCTTTCACGATGGCGGCCTGGGTTCAATTCCTGGCTTAGGGAATGAGTCCTTTCTGGTTTGATATTTGTGTGACTTTTGCCATTTATTGATTCTTTTCCCCTCCATGGACAGCTTCTGATTTCCTGTCTTGAATTTTCCTTTCTCTGAGCTACCTTTGGGGTGATTCTAGATCTTGTAAAAACCGCTTGCCATCTCTTTGGAGACACCTCGTGCGTCCGTGGTTAAGTCATAACCTTAGTTAAGGCTTATTGGTTTCACTTGGGAGGATACCTTTGGNNANAAAAAAANAAAAAAGGCTTAAAAGCCAGAGGTATCGGCTGTTTGTCCCGGCTAAAGTCTGGTAATAAGAGATTTAAAAGGNTTTTTNTTNNNNNAAAAGAGCTCTATGGTTAAAAGTCAGCTTAATTAAAAGCNGATATCCAAGCTATATATATATTTAAAAGGCCTTTATGCTTTTTTCTCTTCTTGGATCTTGTTTTTTGAGAAAACGNNNNNNNCGTTTGAGAAAAAAAGTTTTTTTTTCTTCTCAGTCGACTGAATTGTTTCTCCATTTACTTCTGTCTGTCTTCTTGCCACCCTCGATGCCCACATGAGAGGACCTAAGGTAATTTCTGACAGCCTGGGACTCCTTGGGAAAAACAGNNAAGGCGCCACAGACCCCGTTTTGGGAGAAACCTCTGTTTTCCTCATGGAACCCCAAGAACTGTAAGCGGACAGGTCCCTCTCAAAATCTAAGGCTCTGCTCTGTTTTGCNTTGCGTCGTNTTACCTGACCTTTTTGACTTTTGGGGGCATCAGAAATTACTTTGCATTATGAGAAAACTTTTAGCCTTGGTGTGTAATAGCTAGGTAAGAGATATACTTTTAGGGATGGCTAATGGCAGTTGCTTACAGTGAGTGGTTATTACTACAGGGCGATACTCCTTTCTTTGCGCGTTTAGATAAGAAAAGCGTGCTCTTGGGCACCTAGAAGGTATGGAATGGGGGGATGGGCTGATTACAGAGTGGGCTGATTGGCNTTGGGTTGCCCACCAGCCTCGGGGAAATGTCCTTGCAATGAAATGCACCGTGGAAGCATTGCACTGTCTCGTCCCGTAGCGTTTCCCTCTTTTNGGGGACCCAGGATTCGGTGTAAAAATGGGATCCTTGATTTTTGGGGATCTGTTTTGCCTTCCAGCTGTGCCTGCTTATTAGGCCCTAGAAACTGCATGCTTTCCTGGCCCTGTTCCTTAAAAGGCTCCACCCTAAAGCCAGTAATCCAATTNAGAAACTNACATCTTTAAGGAAATCTCCACGTGTAAGAGTGTCTGCTTTTCCTGGCCATCTTAACTGAACTTTTACTCACACCATTTTTCCTTGGTTTGAGTAAAATATAAATTCTCTACCTTGTTTCACCTAAGAGTCGTCCCTTTAGAAATGCAAATTTAGAGTTGCCTAGCTAACAATTGTTTAGGGCAGGGAACAGGTAATCAAGAGACTGATGGTCTAAAATGGGAAAGAGAAACTTAAAAACTGGCAAATGAAAAATCTTATAACTCTACNAGATCTGCTTCTGTCTGTNTATTTATGTNTTGTGTGTGTGATGTATATATAAAAGAGCTCTAATTAATTGGCTTAAAGAAAAATAAGCGCTTAAATNAAATATTTTGTCAGAAAAAATAGAAACTTNAATGCCTTTTAGTTCACGTGACTTTAGTAATCTTTGGTAAATAAAGACAGTTTTAAAGATTATTGGTAAAATAAAATAAAAACGTCTTCAAAATTTAGACATTTGGTCTAAATTAGGCAGGTCAGATACTGTCTTTGCTAGATGCTTTAAGGTCATAAACTGCTTCTNTGACTTTTGATAATTGTTCGACTTGCCTGCTTTAGAGCCATTAGATTCTAGGTAAGGCCTGGGGACATGTGGAGTTAGCCATGCCCCCTAGCTATGCTGGAAAGAGTCAGACNTTATCTGCAGTTCTGTCCTGTGTCCTAGGCTCTGCACCTGGTACATAATTAAAATTGCTTACACTAAAAATAAAAATTATGTGTTTTTGGTAAAAGGTTATAAAAAGGCATGGGAATGTGGTTTTTTAAGAGAAAGTAATTTTGTCTAGTTTAGAGGGTTTNAAGGATGTTTTAAGTTNNAAAGAAAGAAGAATAAAACTGAAGGTTTAAGCAAGTTGTAGAAGGTTTGTGAAAGATTAATCTTGTAAAAGAAATTCTGTGTGTGAGCAAGTTGGCTAAAATTTAAAGGGNATTATTTAGTTTTTCCGTAAATTGAACATTAAAATAAAAAGCACACTGATGCAGGGCCAGAATCTGGGCCCNTGTGTCNGAATAACAGGGTTTTCTTGGAGCATTGATCTGCTCTTTAACAGAAAATTGTAAAGGGTTATAAAAGGTTTATGAAAATCTTACCTTATGGTCAAACTGATTAAGATTGGATAGATTTGTTTATNNNAAGGTTTTATTAAAATTGGNTTTAGCATTAATACACTAATGCAAAGGTAAAATTTGGTTTTCTCTTTTGAACAAGATTTTCGTGTACCTGCAGAAAAAAGGGAGAGAGAAGAGACAGATTCAGTTGGCCTCATGCTGTCTTTATTGGGTCTTGTTGTTTGGAAAGCTGAGTCTCCCCTCTATCAANGAGTAAAGGTTTTTGNCTTTNTTAAAATNTTTGAAGTNATCATTTTGGCTAAATAAATGACTTATGGTGACCTGNGATTCTATTTTGTGATATCAAGTGTTTTAAACCTTTNGATATTTGACAAACTTTCCAAAATCAAATTTTTGACCTNATTAANCTTTTTAGATATTAGGTCCCCTGAAGTCCAAAAGAGACATATTCGGCTTATTTGGTATATTAAAATCATACAGGAAGCATTGTCAAATATAAAATGGTGTTTAACTTTCTTTGGGTTATATTTATATGTTATTAGTATGTGTTCCAAAATTGTATGAGATTCCTATAATTCTGATATGTCTCAGTATATGTTATCAGTAATAATTATGATTGTTATGTTAAATTATTGTGTGCCACAGAGATAACCAGATTTCCTTGTCGATTGTGTCTTTAACCGTGGCTGTCCTAAGACTTTTGTCATCCACAGACAATTGTTGTCTTGTTTTGATCCTTTTCAAAAGGCGGTTTATAATCAGCTATAGGACTCTGACAGGTGCTCTTGAATGCAGGTTTCTGATAACTTTGGAGATTGTGNCATTGGAATAGAGGGAAAAACTTCCAGGACTCTCATGGAGAGCTGATGTGTTCATGAATATCGAGCAGAACAGGAGTTAATTGCATGGACTGAACTAATAGAAGACTGAAATAATCTTTTTATGACTTTTTGCTTGAAACATTGCTGATTCTTTTTGNTTTGTTTTTCAGAGTCAAGAAAACTTTTTTTCCTTTTGAGCTATTTACAGCTTTTAACAATTGAGTAAAGTATACTCCTGTGAGCAAAATTTGGAGCATATTTCTTTCTCTCTACCTGATTTCTCCAGAATTTGGAAACTATTTGTGAGTATTCTTAATTTATGGCAATATAGTTATTTGCATAAGTTCAATAAGAATCTGTTTTCTTTTGTAACAGGACACAATTGGAGACACTGGTTATTTTACCAAGGCTTTGACTGGAATGGCATGCTTTCAGATATAAACAGACTGCTTTAAGGAATCGAAGTTGACTTATAGAGCCGATAAAAGCCCCTTGGGAAAACTGGCCTCATACCTTGTCTACGCAGTCCCTGTACAGGGTTCCTGACCTGTGGTAAGTAAAGAATGTCACTTTCTGACAGGCCCAGGAGCCCCAAGTTATCTTGGGACCTCGAGAGGAGAGGAATTCACCCAATTCATACAGGTATTTGCAGGCACAGATAAATCCGTGGCTGGGCTCAAGGCTTTAAAAAGTCTAATCTGAGATTCCTTATGGAACAAAGTTCCAGCAAAGCCAATTTAAAAAAGAGCCTATATGGCAAATAATTATTCTTGCTGCACTTTATGCAAATAATCAGGCCAAGTATAATAAGACTAAAACTTATTTTGCAAATAAATTNGTCCTACTATGATTTGTCTTTGGTAAAAATGGGAGACTGGAGAGAGAAAAATTATAGTACACCTGTTATTAGATTCTAGTCTTGTCCGTTGTTTNTTGAGTTTTTNNNNNNNNATTATTTTCTACAATTTGGACTGAATCCTGAATTCTTTCCGGGCTACAAGTCTCCAAACTAACGCTTTCAAATTTTTCTTCCATTTTTCTGACTTGGACTCAATGAAATTGCTACTACCTTTTTCCTGAGGCCCTGCAAGCTGAAGCTTATTCCTTGTGATACAGGCGAGAAAAACGTGTCAGATTGCCACCGCCTTCCTCCTCTGTAACTAAAGATGCTTTGAGTCTAACATCTGGATAAATTGTGCCCAACATTAACCTTTGTTTTTCTTCTGTTTCCATAGAAATGCCTCTTATTAAAAATCTGTTTGCCTTATATTTCAGACAACAGGAGACTGGTTTTCCAGCCTATTCACTTAGATTCCAAATGGCATCTGATCTCTTCTTATAAGCATTGTTAAACTGGGCTTAAGCATTTTATTAATTATCACTGGGTGCTATTTGATTTTTAAAATAATTATTTGTTATATTCAACAGGGGTGCAGACGGTTAAAGTTTATGTCTTCCAGGCTTCAACAGTTCCAAGTCAAGCTAATGATGGCCCAAGGATTCCAACCCGTACCATCCCAGGAGGANCCGAGTCCCTACAGGTCNTTAGANCAGTCAGTGAGAGATTTCCGCGCCCTCCAAGGTTAGGCAGGGACGACAACCCTGTTCAGCAGGAAGTAGCTTCAGAAGATGAGATCTTCGGCCCTTTCTCCTTAAGAATAAGGAGGGTGAAATCTCTCAGGGGGGAA
|
TF motifs of the concenus sequence
Use FIMO to detect transcription factor motifs in the concenus sequence of the TE family.
TE_family | TFBS | Start | End | Strand | Score | Matched sequence |
---|---|---|---|---|---|---|
HERV35I | Stat5b | 1971 | 1979 | - | 16.36 | TTCCCAGAA |
HERV35I | cg | 3600 | 3610 | - | 16.34 | TCACACACACA |
HERV35I | Prdm4 | 3224 | 3234 | + | 16.33 | CCTAGAAACTG |
HERV35I | POU2F2 | 5561 | 5573 | - | 16.31 | TTATGCAAATAAC |
HERV35I | ZBTB6 | 5904 | 5912 | - | 16.28 | CCTTGAGCC |
HERV35I | Nr1h3::Rxra | 4717 | 4732 | + | 16.26 | TGACTTATGGTGACCT |
HERV35I | eor-1 | 1111 | 1123 | - | 16.24 | AGAGAGAGAGAGG |
HERV35I | Prdm15 | 1739 | 1749 | + | 16.20 | AAAAACCTGGA |
HERV35I | SPT15 | 2452 | 2462 | + | 16.14 | GCTATATATAT |
HERV35I | CDF5 | 4293 | 4313 | - | 16.11 | TGTGCTTTTTATTTTAATGTT |
TFBS enrichment in GRCh38
Use Fisher's exact test to perform enrichment analysis of transcription factor binding sites in the TE family of GRCh38.