HERV35I

Basic information Differential Expression Stage analysis Survival analysis Correlation analysis

DF ID DF0000171
TE superfamily ERV1
TE class LTR
Species Haplorrhini
Length 6918
Kimura value 14.35
Tau index 1.0000
Description Internal region of an ERV1 endogenous retrovirus, HERV35I subfamily
Comment Internal sequence of an endogenous retrovirus with associated LTR35 LTRs. This is an ancient, non-autonomous LTR retrotransposon. The primer binding site is complementary to proline tRNA.
Sequence
ATTCTTTCGGGGCTCGTCCGGGATCACGGGACGTGGGGAGCATTTTCCTCCCCGGAGGGGGAGGCTTGTGAGCCAGCAGGACNGCCGGGCGTGACCCCTTCGCGGCTGACGGGCGGCCGCCTGAATCTTTGATTCAGCGTCGCCGCAACTGGTGAGTTTTCCTCCGGCCTCCCGGAGACTCCTCGCCANCCCCCCACAGACAATGCTTTTCCTCCCCTCCTGTCCCCNNTATTCGTTGTGTCTTTCTTTTTCCTTCTTCTTTCCGNCGCCCNNNNCGCTTTCCCTCTCTTCCTTCGCTTTTCATTAACTTCATCGGCTCNGCCTGAATAGACACCCNTGCGGGACGGATTGAAACGGCNNNNNNNNNNAGCTGGTTTTGGCTCAGCCTGAATAGACATCCGTGCAGGATGGATTGAAACGGNTGACTNNCCGGGNCTGATCGGTCCAGCTGGTAGGAAACTCTGTCTGGCGCCCTGCCTTTGACNTCCGTNNTCTNGCCTAAGTCGNCTNGGTATTGAGTNCCAAGAAAANNNNNTCTCTCTCTCCCTTTGTCACTCTCCCTNCCTGGCACCCTGGCCCTTGATCCTGTAACTATTCNAAACCCNTCATTACTTCACTTCCCTTCTNGTGGGGAAGGGAGGCCTGTNATNTTTCNGGGCGTCTGTCTGTCCGAACGTGTGGTCCTGTCAGNTNNGGGGNNNAGANTGCCTNAGACAGGGTGCTGGGGATGCCCGGCTGGCCTTCAGGAAGGCACCAGGNACACCTGGGTNCGAAGTTTGCANTATTGGTNTCCTGATCCGNTTTTCCTTTACAATAAGAAAAGTTNTGNGTTTAANTTGACAACTTNTTCCCCCATGCAGCCCGTTGGGCTGCATCTTGCAAAAANNNTTGAGAGGCTTTTGCCTATGGTTCCATGAAATGGAAAAGGATGATTTTCTTTNCGNNNNNNNNNCTNTTNNNNNTGTAACGCGGCTTGGCCCCCACAGCTATGGCGCAGCGAGCAGGGTCACCAAAAGCCGCTCCGCTCTTCCGGAAGCCGCAGNGAAAGGGAACCCAGAAACCTGGCANGCCGGCAAAAGGGTAAGAATTTCTTACCAGCCAGGCTTCTGGCCTCTCTCTCTCTGTGCAAACCGGTTGAGTGAACGGTAAAAATCACTGTTTGTCTCCTCTGCAAGGTTTTGATTAATGGGAAAAAGGATTTGTGAGACTAGTCTTAGGCTGTAGCGAATCTGGTGTACTTTGTGCTATGAATTTGTCTTTCTGTGTCGTTCTGTCATAAAGAGGGGTACCATAGGATAGAACGCGGGCCTAGGACCCCTATAAGCCCGCTGTTCGAGCCGGCCCTGCAGACTGGTCAGTTACAAACTTTGCTGCGGGTCCCTGAAACAAAAACCGGATGAGGTTTCCCTCTCGTCTTGTTTTATGTCCTTGAGAGCTTGACTTTGTGACCATGTGGGGGTACTCTCTCTTGGTCTCCGCCATCCGGAGGGCGGGAATTTTCGGGTTCATGTCAGGCGGCCGGTCTGAAAGGACCGGGAGTCCGAGACGCGTCAGCACACTCTTCGTCCGAATGTGTCAAGCCCTTGGGTGAGTTTTGTCTTAAAAGGTCCCATCCCTACGGGGCTTTTGTCGTCTTTTGCTATCTTAAGCCCATTTCTGAGAGTGAATTCTTGGGGATCATGGAGATGCCTCCTCTACCCCCTCTCTAGAAATACCTCTTGCTTATATGGTNNCCGNNAAAAACCTGGAAAATTACCATCTGGGCTTTAAAAGGCTTTTGGATTGAGTCGCTATTGGAACTAAGTACACCATTAAAAGAAAAAGGATTTTAGAGATCTCTTATTCTAAACAATTGATNAAAAAGGTTTAAATTAAAAGAAGGATACATAATAATGTCATGGCTAGCCTTAAAAATTCTCTTGAGCAGTTNAAAATCCTTTGCAAGCTCGAAANTGNCTGCTCTAGACTCCTTCTGGGAAGAGCAATGGCGACCGCCCCATGCTGTAGCTCAGTAGCTAAGGCTTTGCCCTTTCACGATGGCGGCCTGGGTTCAATTCCTGGCTTAGGGAATGAGTCCTTTCTGGTTTGATATTTGTGTGACTTTTGCCATTTATTGATTCTTTTCCCCTCCATGGACAGCTTCTGATTTCCTGTCTTGAATTTTCCTTTCTCTGAGCTACCTTTGGGGTGATTCTAGATCTTGTAAAAACCGCTTGCCATCTCTTTGGAGACACCTCGTGCGTCCGTGGTTAAGTCATAACCTTAGTTAAGGCTTATTGGTTTCACTTGGGAGGATACCTTTGGNNANAAAAAAANAAAAAAGGCTTAAAAGCCAGAGGTATCGGCTGTTTGTCCCGGCTAAAGTCTGGTAATAAGAGATTTAAAAGGNTTTTTNTTNNNNNAAAAGAGCTCTATGGTTAAAAGTCAGCTTAATTAAAAGCNGATATCCAAGCTATATATATATTTAAAAGGCCTTTATGCTTTTTTCTCTTCTTGGATCTTGTTTTTTGAGAAAACGNNNNNNNCGTTTGAGAAAAAAAGTTTTTTTTTCTTCTCAGTCGACTGAATTGTTTCTCCATTTACTTCTGTCTGTCTTCTTGCCACCCTCGATGCCCACATGAGAGGACCTAAGGTAATTTCTGACAGCCTGGGACTCCTTGGGAAAAACAGNNAAGGCGCCACAGACCCCGTTTTGGGAGAAACCTCTGTTTTCCTCATGGAACCCCAAGAACTGTAAGCGGACAGGTCCCTCTCAAAATCTAAGGCTCTGCTCTGTTTTGCNTTGCGTCGTNTTACCTGACCTTTTTGACTTTTGGGGGCATCAGAAATTACTTTGCATTATGAGAAAACTTTTAGCCTTGGTGTGTAATAGCTAGGTAAGAGATATACTTTTAGGGATGGCTAATGGCAGTTGCTTACAGTGAGTGGTTATTACTACAGGGCGATACTCCTTTCTTTGCGCGTTTAGATAAGAAAAGCGTGCTCTTGGGCACCTAGAAGGTATGGAATGGGGGGATGGGCTGATTACAGAGTGGGCTGATTGGCNTTGGGTTGCCCACCAGCCTCGGGGAAATGTCCTTGCAATGAAATGCACCGTGGAAGCATTGCACTGTCTCGTCCCGTAGCGTTTCCCTCTTTTNGGGGACCCAGGATTCGGTGTAAAAATGGGATCCTTGATTTTTGGGGATCTGTTTTGCCTTCCAGCTGTGCCTGCTTATTAGGCCCTAGAAACTGCATGCTTTCCTGGCCCTGTTCCTTAAAAGGCTCCACCCTAAAGCCAGTAATCCAATTNAGAAACTNACATCTTTAAGGAAATCTCCACGTGTAAGAGTGTCTGCTTTTCCTGGCCATCTTAACTGAACTTTTACTCACACCATTTTTCCTTGGTTTGAGTAAAATATAAATTCTCTACCTTGTTTCACCTAAGAGTCGTCCCTTTAGAAATGCAAATTTAGAGTTGCCTAGCTAACAATTGTTTAGGGCAGGGAACAGGTAATCAAGAGACTGATGGTCTAAAATGGGAAAGAGAAACTTAAAAACTGGCAAATGAAAAATCTTATAACTCTACNAGATCTGCTTCTGTCTGTNTATTTATGTNTTGTGTGTGTGATGTATATATAAAAGAGCTCTAATTAATTGGCTTAAAGAAAAATAAGCGCTTAAATNAAATATTTTGTCAGAAAAAATAGAAACTTNAATGCCTTTTAGTTCACGTGACTTTAGTAATCTTTGGTAAATAAAGACAGTTTTAAAGATTATTGGTAAAATAAAATAAAAACGTCTTCAAAATTTAGACATTTGGTCTAAATTAGGCAGGTCAGATACTGTCTTTGCTAGATGCTTTAAGGTCATAAACTGCTTCTNTGACTTTTGATAATTGTTCGACTTGCCTGCTTTAGAGCCATTAGATTCTAGGTAAGGCCTGGGGACATGTGGAGTTAGCCATGCCCCCTAGCTATGCTGGAAAGAGTCAGACNTTATCTGCAGTTCTGTCCTGTGTCCTAGGCTCTGCACCTGGTACATAATTAAAATTGCTTACACTAAAAATAAAAATTATGTGTTTTTGGTAAAAGGTTATAAAAAGGCATGGGAATGTGGTTTTTTAAGAGAAAGTAATTTTGTCTAGTTTAGAGGGTTTNAAGGATGTTTTAAGTTNNAAAGAAAGAAGAATAAAACTGAAGGTTTAAGCAAGTTGTAGAAGGTTTGTGAAAGATTAATCTTGTAAAAGAAATTCTGTGTGTGAGCAAGTTGGCTAAAATTTAAAGGGNATTATTTAGTTTTTCCGTAAATTGAACATTAAAATAAAAAGCACACTGATGCAGGGCCAGAATCTGGGCCCNTGTGTCNGAATAACAGGGTTTTCTTGGAGCATTGATCTGCTCTTTAACAGAAAATTGTAAAGGGTTATAAAAGGTTTATGAAAATCTTACCTTATGGTCAAACTGATTAAGATTGGATAGATTTGTTTATNNNAAGGTTTTATTAAAATTGGNTTTAGCATTAATACACTAATGCAAAGGTAAAATTTGGTTTTCTCTTTTGAACAAGATTTTCGTGTACCTGCAGAAAAAAGGGAGAGAGAAGAGACAGATTCAGTTGGCCTCATGCTGTCTTTATTGGGTCTTGTTGTTTGGAAAGCTGAGTCTCCCCTCTATCAANGAGTAAAGGTTTTTGNCTTTNTTAAAATNTTTGAAGTNATCATTTTGGCTAAATAAATGACTTATGGTGACCTGNGATTCTATTTTGTGATATCAAGTGTTTTAAACCTTTNGATATTTGACAAACTTTCCAAAATCAAATTTTTGACCTNATTAANCTTTTTAGATATTAGGTCCCCTGAAGTCCAAAAGAGACATATTCGGCTTATTTGGTATATTAAAATCATACAGGAAGCATTGTCAAATATAAAATGGTGTTTAACTTTCTTTGGGTTATATTTATATGTTATTAGTATGTGTTCCAAAATTGTATGAGATTCCTATAATTCTGATATGTCTCAGTATATGTTATCAGTAATAATTATGATTGTTATGTTAAATTATTGTGTGCCACAGAGATAACCAGATTTCCTTGTCGATTGTGTCTTTAACCGTGGCTGTCCTAAGACTTTTGTCATCCACAGACAATTGTTGTCTTGTTTTGATCCTTTTCAAAAGGCGGTTTATAATCAGCTATAGGACTCTGACAGGTGCTCTTGAATGCAGGTTTCTGATAACTTTGGAGATTGTGNCATTGGAATAGAGGGAAAAACTTCCAGGACTCTCATGGAGAGCTGATGTGTTCATGAATATCGAGCAGAACAGGAGTTAATTGCATGGACTGAACTAATAGAAGACTGAAATAATCTTTTTATGACTTTTTGCTTGAAACATTGCTGATTCTTTTTGNTTTGTTTTTCAGAGTCAAGAAAACTTTTTTTCCTTTTGAGCTATTTACAGCTTTTAACAATTGAGTAAAGTATACTCCTGTGAGCAAAATTTGGAGCATATTTCTTTCTCTCTACCTGATTTCTCCAGAATTTGGAAACTATTTGTGAGTATTCTTAATTTATGGCAATATAGTTATTTGCATAAGTTCAATAAGAATCTGTTTTCTTTTGTAACAGGACACAATTGGAGACACTGGTTATTTTACCAAGGCTTTGACTGGAATGGCATGCTTTCAGATATAAACAGACTGCTTTAAGGAATCGAAGTTGACTTATAGAGCCGATAAAAGCCCCTTGGGAAAACTGGCCTCATACCTTGTCTACGCAGTCCCTGTACAGGGTTCCTGACCTGTGGTAAGTAAAGAATGTCACTTTCTGACAGGCCCAGGAGCCCCAAGTTATCTTGGGACCTCGAGAGGAGAGGAATTCACCCAATTCATACAGGTATTTGCAGGCACAGATAAATCCGTGGCTGGGCTCAAGGCTTTAAAAAGTCTAATCTGAGATTCCTTATGGAACAAAGTTCCAGCAAAGCCAATTTAAAAAAGAGCCTATATGGCAAATAATTATTCTTGCTGCACTTTATGCAAATAATCAGGCCAAGTATAATAAGACTAAAACTTATTTTGCAAATAAATTNGTCCTACTATGATTTGTCTTTGGTAAAAATGGGAGACTGGAGAGAGAAAAATTATAGTACACCTGTTATTAGATTCTAGTCTTGTCCGTTGTTTNTTGAGTTTTTNNNNNNNNATTATTTTCTACAATTTGGACTGAATCCTGAATTCTTTCCGGGCTACAAGTCTCCAAACTAACGCTTTCAAATTTTTCTTCCATTTTTCTGACTTGGACTCAATGAAATTGCTACTACCTTTTTCCTGAGGCCCTGCAAGCTGAAGCTTATTCCTTGTGATACAGGCGAGAAAAACGTGTCAGATTGCCACCGCCTTCCTCCTCTGTAACTAAAGATGCTTTGAGTCTAACATCTGGATAAATTGTGCCCAACATTAACCTTTGTTTTTCTTCTGTTTCCATAGAAATGCCTCTTATTAAAAATCTGTTTGCCTTATATTTCAGACAACAGGAGACTGGTTTTCCAGCCTATTCACTTAGATTCCAAATGGCATCTGATCTCTTCTTATAAGCATTGTTAAACTGGGCTTAAGCATTTTATTAATTATCACTGGGTGCTATTTGATTTTTAAAATAATTATTTGTTATATTCAACAGGGGTGCAGACGGTTAAAGTTTATGTCTTCCAGGCTTCAACAGTTCCAAGTCAAGCTAATGATGGCCCAAGGATTCCAACCCGTACCATCCCAGGAGGANCCGAGTCCCTACAGGTCNTTAGANCAGTCAGTGAGAGATTTCCGCGCCCTCCAAGGTTAGGCAGGGACGACAACCCTGTTCAGCAGGAAGTAGCTTCAGAAGATGAGATCTTCGGCCCTTTCTCCTTAAGAATAAGGAGGGTGAAATCTCTCAGGGGGGAA



TF motifs of the concenus sequence

Use FIMO to detect transcription factor motifs in the concenus sequence of the TE family.

TE_family TFBS Start End Strand Score Matched sequence
HERV35I IDD11 1625 1636 - 18.39 AAGACGACAAAA
HERV35I IDD1 1625 1636 + 18.39 TTTTGTCGTCTT
HERV35I IDD5 1625 1638 + 18.29 TTTTGTCGTCTTTT
HERV35I IDD6 1624 1639 + 18.14 CTTTTGTCGTCTTTTG
HERV35I IDD6 1624 1639 + 18.11 CTTTTGTCGTCTTTTG
HERV35I CDF5 242 262 + 17.88 CTTTCTTTTTCCTTCTTCTTT
HERV35I REV 5014 5027 - 17.88 AATCATAATTATTA
HERV35I STAT1::STAT2 3521 3533 - 17.74 AGTTTCTCTTTCC
HERV35I RAMOSA1 1113 1126 - 17.30 CACAGAGAGAGAGA
HERV35I MGP 1624 1636 - 17.27 AAGACGACAAAAG


TFBS enrichment in GRCh38

Use Fisher's exact test to perform enrichment analysis of transcription factor binding sites in the TE family of GRCh38.




GTEx

The promoter activity across 46 body sites from The Genotype-Tissue Expression (GTEx) project.




TCGA

The promoter activity across 33 cancer types from The Cancer Genome Atlas (TCGA).