HERV35I
Basic information Differential Expression Stage analysis Survival analysis Correlation analysisDF ID | DF0000171 |
---|---|
TE superfamily | ERV1 |
TE class | LTR |
Species | Haplorrhini |
Length | 6918 |
Kimura value | 14.35 |
Tau index | 1.0000 |
Description | Internal region of an ERV1 endogenous retrovirus, HERV35I subfamily |
Comment | Internal sequence of an endogenous retrovirus with associated LTR35 LTRs. This is an ancient, non-autonomous LTR retrotransposon. The primer binding site is complementary to proline tRNA. |
Sequence |
ATTCTTTCGGGGCTCGTCCGGGATCACGGGACGTGGGGAGCATTTTCCTCCCCGGAGGGGGAGGCTTGTGAGCCAGCAGGACNGCCGGGCGTGACCCCTTCGCGGCTGACGGGCGGCCGCCTGAATCTTTGATTCAGCGTCGCCGCAACTGGTGAGTTTTCCTCCGGCCTCCCGGAGACTCCTCGCCANCCCCCCACAGACAATGCTTTTCCTCCCCTCCTGTCCCCNNTATTCGTTGTGTCTTTCTTTTTCCTTCTTCTTTCCGNCGCCCNNNNCGCTTTCCCTCTCTTCCTTCGCTTTTCATTAACTTCATCGGCTCNGCCTGAATAGACACCCNTGCGGGACGGATTGAAACGGCNNNNNNNNNNAGCTGGTTTTGGCTCAGCCTGAATAGACATCCGTGCAGGATGGATTGAAACGGNTGACTNNCCGGGNCTGATCGGTCCAGCTGGTAGGAAACTCTGTCTGGCGCCCTGCCTTTGACNTCCGTNNTCTNGCCTAAGTCGNCTNGGTATTGAGTNCCAAGAAAANNNNNTCTCTCTCTCCCTTTGTCACTCTCCCTNCCTGGCACCCTGGCCCTTGATCCTGTAACTATTCNAAACCCNTCATTACTTCACTTCCCTTCTNGTGGGGAAGGGAGGCCTGTNATNTTTCNGGGCGTCTGTCTGTCCGAACGTGTGGTCCTGTCAGNTNNGGGGNNNAGANTGCCTNAGACAGGGTGCTGGGGATGCCCGGCTGGCCTTCAGGAAGGCACCAGGNACACCTGGGTNCGAAGTTTGCANTATTGGTNTCCTGATCCGNTTTTCCTTTACAATAAGAAAAGTTNTGNGTTTAANTTGACAACTTNTTCCCCCATGCAGCCCGTTGGGCTGCATCTTGCAAAAANNNTTGAGAGGCTTTTGCCTATGGTTCCATGAAATGGAAAAGGATGATTTTCTTTNCGNNNNNNNNNCTNTTNNNNNTGTAACGCGGCTTGGCCCCCACAGCTATGGCGCAGCGAGCAGGGTCACCAAAAGCCGCTCCGCTCTTCCGGAAGCCGCAGNGAAAGGGAACCCAGAAACCTGGCANGCCGGCAAAAGGGTAAGAATTTCTTACCAGCCAGGCTTCTGGCCTCTCTCTCTCTGTGCAAACCGGTTGAGTGAACGGTAAAAATCACTGTTTGTCTCCTCTGCAAGGTTTTGATTAATGGGAAAAAGGATTTGTGAGACTAGTCTTAGGCTGTAGCGAATCTGGTGTACTTTGTGCTATGAATTTGTCTTTCTGTGTCGTTCTGTCATAAAGAGGGGTACCATAGGATAGAACGCGGGCCTAGGACCCCTATAAGCCCGCTGTTCGAGCCGGCCCTGCAGACTGGTCAGTTACAAACTTTGCTGCGGGTCCCTGAAACAAAAACCGGATGAGGTTTCCCTCTCGTCTTGTTTTATGTCCTTGAGAGCTTGACTTTGTGACCATGTGGGGGTACTCTCTCTTGGTCTCCGCCATCCGGAGGGCGGGAATTTTCGGGTTCATGTCAGGCGGCCGGTCTGAAAGGACCGGGAGTCCGAGACGCGTCAGCACACTCTTCGTCCGAATGTGTCAAGCCCTTGGGTGAGTTTTGTCTTAAAAGGTCCCATCCCTACGGGGCTTTTGTCGTCTTTTGCTATCTTAAGCCCATTTCTGAGAGTGAATTCTTGGGGATCATGGAGATGCCTCCTCTACCCCCTCTCTAGAAATACCTCTTGCTTATATGGTNNCCGNNAAAAACCTGGAAAATTACCATCTGGGCTTTAAAAGGCTTTTGGATTGAGTCGCTATTGGAACTAAGTACACCATTAAAAGAAAAAGGATTTTAGAGATCTCTTATTCTAAACAATTGATNAAAAAGGTTTAAATTAAAAGAAGGATACATAATAATGTCATGGCTAGCCTTAAAAATTCTCTTGAGCAGTTNAAAATCCTTTGCAAGCTCGAAANTGNCTGCTCTAGACTCCTTCTGGGAAGAGCAATGGCGACCGCCCCATGCTGTAGCTCAGTAGCTAAGGCTTTGCCCTTTCACGATGGCGGCCTGGGTTCAATTCCTGGCTTAGGGAATGAGTCCTTTCTGGTTTGATATTTGTGTGACTTTTGCCATTTATTGATTCTTTTCCCCTCCATGGACAGCTTCTGATTTCCTGTCTTGAATTTTCCTTTCTCTGAGCTACCTTTGGGGTGATTCTAGATCTTGTAAAAACCGCTTGCCATCTCTTTGGAGACACCTCGTGCGTCCGTGGTTAAGTCATAACCTTAGTTAAGGCTTATTGGTTTCACTTGGGAGGATACCTTTGGNNANAAAAAAANAAAAAAGGCTTAAAAGCCAGAGGTATCGGCTGTTTGTCCCGGCTAAAGTCTGGTAATAAGAGATTTAAAAGGNTTTTTNTTNNNNNAAAAGAGCTCTATGGTTAAAAGTCAGCTTAATTAAAAGCNGATATCCAAGCTATATATATATTTAAAAGGCCTTTATGCTTTTTTCTCTTCTTGGATCTTGTTTTTTGAGAAAACGNNNNNNNCGTTTGAGAAAAAAAGTTTTTTTTTCTTCTCAGTCGACTGAATTGTTTCTCCATTTACTTCTGTCTGTCTTCTTGCCACCCTCGATGCCCACATGAGAGGACCTAAGGTAATTTCTGACAGCCTGGGACTCCTTGGGAAAAACAGNNAAGGCGCCACAGACCCCGTTTTGGGAGAAACCTCTGTTTTCCTCATGGAACCCCAAGAACTGTAAGCGGACAGGTCCCTCTCAAAATCTAAGGCTCTGCTCTGTTTTGCNTTGCGTCGTNTTACCTGACCTTTTTGACTTTTGGGGGCATCAGAAATTACTTTGCATTATGAGAAAACTTTTAGCCTTGGTGTGTAATAGCTAGGTAAGAGATATACTTTTAGGGATGGCTAATGGCAGTTGCTTACAGTGAGTGGTTATTACTACAGGGCGATACTCCTTTCTTTGCGCGTTTAGATAAGAAAAGCGTGCTCTTGGGCACCTAGAAGGTATGGAATGGGGGGATGGGCTGATTACAGAGTGGGCTGATTGGCNTTGGGTTGCCCACCAGCCTCGGGGAAATGTCCTTGCAATGAAATGCACCGTGGAAGCATTGCACTGTCTCGTCCCGTAGCGTTTCCCTCTTTTNGGGGACCCAGGATTCGGTGTAAAAATGGGATCCTTGATTTTTGGGGATCTGTTTTGCCTTCCAGCTGTGCCTGCTTATTAGGCCCTAGAAACTGCATGCTTTCCTGGCCCTGTTCCTTAAAAGGCTCCACCCTAAAGCCAGTAATCCAATTNAGAAACTNACATCTTTAAGGAAATCTCCACGTGTAAGAGTGTCTGCTTTTCCTGGCCATCTTAACTGAACTTTTACTCACACCATTTTTCCTTGGTTTGAGTAAAATATAAATTCTCTACCTTGTTTCACCTAAGAGTCGTCCCTTTAGAAATGCAAATTTAGAGTTGCCTAGCTAACAATTGTTTAGGGCAGGGAACAGGTAATCAAGAGACTGATGGTCTAAAATGGGAAAGAGAAACTTAAAAACTGGCAAATGAAAAATCTTATAACTCTACNAGATCTGCTTCTGTCTGTNTATTTATGTNTTGTGTGTGTGATGTATATATAAAAGAGCTCTAATTAATTGGCTTAAAGAAAAATAAGCGCTTAAATNAAATATTTTGTCAGAAAAAATAGAAACTTNAATGCCTTTTAGTTCACGTGACTTTAGTAATCTTTGGTAAATAAAGACAGTTTTAAAGATTATTGGTAAAATAAAATAAAAACGTCTTCAAAATTTAGACATTTGGTCTAAATTAGGCAGGTCAGATACTGTCTTTGCTAGATGCTTTAAGGTCATAAACTGCTTCTNTGACTTTTGATAATTGTTCGACTTGCCTGCTTTAGAGCCATTAGATTCTAGGTAAGGCCTGGGGACATGTGGAGTTAGCCATGCCCCCTAGCTATGCTGGAAAGAGTCAGACNTTATCTGCAGTTCTGTCCTGTGTCCTAGGCTCTGCACCTGGTACATAATTAAAATTGCTTACACTAAAAATAAAAATTATGTGTTTTTGGTAAAAGGTTATAAAAAGGCATGGGAATGTGGTTTTTTAAGAGAAAGTAATTTTGTCTAGTTTAGAGGGTTTNAAGGATGTTTTAAGTTNNAAAGAAAGAAGAATAAAACTGAAGGTTTAAGCAAGTTGTAGAAGGTTTGTGAAAGATTAATCTTGTAAAAGAAATTCTGTGTGTGAGCAAGTTGGCTAAAATTTAAAGGGNATTATTTAGTTTTTCCGTAAATTGAACATTAAAATAAAAAGCACACTGATGCAGGGCCAGAATCTGGGCCCNTGTGTCNGAATAACAGGGTTTTCTTGGAGCATTGATCTGCTCTTTAACAGAAAATTGTAAAGGGTTATAAAAGGTTTATGAAAATCTTACCTTATGGTCAAACTGATTAAGATTGGATAGATTTGTTTATNNNAAGGTTTTATTAAAATTGGNTTTAGCATTAATACACTAATGCAAAGGTAAAATTTGGTTTTCTCTTTTGAACAAGATTTTCGTGTACCTGCAGAAAAAAGGGAGAGAGAAGAGACAGATTCAGTTGGCCTCATGCTGTCTTTATTGGGTCTTGTTGTTTGGAAAGCTGAGTCTCCCCTCTATCAANGAGTAAAGGTTTTTGNCTTTNTTAAAATNTTTGAAGTNATCATTTTGGCTAAATAAATGACTTATGGTGACCTGNGATTCTATTTTGTGATATCAAGTGTTTTAAACCTTTNGATATTTGACAAACTTTCCAAAATCAAATTTTTGACCTNATTAANCTTTTTAGATATTAGGTCCCCTGAAGTCCAAAAGAGACATATTCGGCTTATTTGGTATATTAAAATCATACAGGAAGCATTGTCAAATATAAAATGGTGTTTAACTTTCTTTGGGTTATATTTATATGTTATTAGTATGTGTTCCAAAATTGTATGAGATTCCTATAATTCTGATATGTCTCAGTATATGTTATCAGTAATAATTATGATTGTTATGTTAAATTATTGTGTGCCACAGAGATAACCAGATTTCCTTGTCGATTGTGTCTTTAACCGTGGCTGTCCTAAGACTTTTGTCATCCACAGACAATTGTTGTCTTGTTTTGATCCTTTTCAAAAGGCGGTTTATAATCAGCTATAGGACTCTGACAGGTGCTCTTGAATGCAGGTTTCTGATAACTTTGGAGATTGTGNCATTGGAATAGAGGGAAAAACTTCCAGGACTCTCATGGAGAGCTGATGTGTTCATGAATATCGAGCAGAACAGGAGTTAATTGCATGGACTGAACTAATAGAAGACTGAAATAATCTTTTTATGACTTTTTGCTTGAAACATTGCTGATTCTTTTTGNTTTGTTTTTCAGAGTCAAGAAAACTTTTTTTCCTTTTGAGCTATTTACAGCTTTTAACAATTGAGTAAAGTATACTCCTGTGAGCAAAATTTGGAGCATATTTCTTTCTCTCTACCTGATTTCTCCAGAATTTGGAAACTATTTGTGAGTATTCTTAATTTATGGCAATATAGTTATTTGCATAAGTTCAATAAGAATCTGTTTTCTTTTGTAACAGGACACAATTGGAGACACTGGTTATTTTACCAAGGCTTTGACTGGAATGGCATGCTTTCAGATATAAACAGACTGCTTTAAGGAATCGAAGTTGACTTATAGAGCCGATAAAAGCCCCTTGGGAAAACTGGCCTCATACCTTGTCTACGCAGTCCCTGTACAGGGTTCCTGACCTGTGGTAAGTAAAGAATGTCACTTTCTGACAGGCCCAGGAGCCCCAAGTTATCTTGGGACCTCGAGAGGAGAGGAATTCACCCAATTCATACAGGTATTTGCAGGCACAGATAAATCCGTGGCTGGGCTCAAGGCTTTAAAAAGTCTAATCTGAGATTCCTTATGGAACAAAGTTCCAGCAAAGCCAATTTAAAAAAGAGCCTATATGGCAAATAATTATTCTTGCTGCACTTTATGCAAATAATCAGGCCAAGTATAATAAGACTAAAACTTATTTTGCAAATAAATTNGTCCTACTATGATTTGTCTTTGGTAAAAATGGGAGACTGGAGAGAGAAAAATTATAGTACACCTGTTATTAGATTCTAGTCTTGTCCGTTGTTTNTTGAGTTTTTNNNNNNNNATTATTTTCTACAATTTGGACTGAATCCTGAATTCTTTCCGGGCTACAAGTCTCCAAACTAACGCTTTCAAATTTTTCTTCCATTTTTCTGACTTGGACTCAATGAAATTGCTACTACCTTTTTCCTGAGGCCCTGCAAGCTGAAGCTTATTCCTTGTGATACAGGCGAGAAAAACGTGTCAGATTGCCACCGCCTTCCTCCTCTGTAACTAAAGATGCTTTGAGTCTAACATCTGGATAAATTGTGCCCAACATTAACCTTTGTTTTTCTTCTGTTTCCATAGAAATGCCTCTTATTAAAAATCTGTTTGCCTTATATTTCAGACAACAGGAGACTGGTTTTCCAGCCTATTCACTTAGATTCCAAATGGCATCTGATCTCTTCTTATAAGCATTGTTAAACTGGGCTTAAGCATTTTATTAATTATCACTGGGTGCTATTTGATTTTTAAAATAATTATTTGTTATATTCAACAGGGGTGCAGACGGTTAAAGTTTATGTCTTCCAGGCTTCAACAGTTCCAAGTCAAGCTAATGATGGCCCAAGGATTCCAACCCGTACCATCCCAGGAGGANCCGAGTCCCTACAGGTCNTTAGANCAGTCAGTGAGAGATTTCCGCGCCCTCCAAGGTTAGGCAGGGACGACAACCCTGTTCAGCAGGAAGTAGCTTCAGAAGATGAGATCTTCGGCCCTTTCTCCTTAAGAATAAGGAGGGTGAAATCTCTCAGGGGGGAA
|
TF motifs of the concenus sequence
Use FIMO to detect transcription factor motifs in the concenus sequence of the TE family.
TE_family | TFBS | Start | End | Strand | Score | Matched sequence |
---|---|---|---|---|---|---|
HERV35I | IDD11 | 1625 | 1636 | - | 18.39 | AAGACGACAAAA |
HERV35I | IDD1 | 1625 | 1636 | + | 18.39 | TTTTGTCGTCTT |
HERV35I | IDD5 | 1625 | 1638 | + | 18.29 | TTTTGTCGTCTTTT |
HERV35I | IDD6 | 1624 | 1639 | + | 18.14 | CTTTTGTCGTCTTTTG |
HERV35I | IDD6 | 1624 | 1639 | + | 18.11 | CTTTTGTCGTCTTTTG |
HERV35I | CDF5 | 242 | 262 | + | 17.88 | CTTTCTTTTTCCTTCTTCTTT |
HERV35I | REV | 5014 | 5027 | - | 17.88 | AATCATAATTATTA |
HERV35I | STAT1::STAT2 | 3521 | 3533 | - | 17.74 | AGTTTCTCTTTCC |
HERV35I | RAMOSA1 | 1113 | 1126 | - | 17.30 | CACAGAGAGAGAGA |
HERV35I | MGP | 1624 | 1636 | - | 17.27 | AAGACGACAAAAG |
TFBS enrichment in GRCh38
Use Fisher's exact test to perform enrichment analysis of transcription factor binding sites in the TE family of GRCh38.