HERV35I

Basic information Differential Expression Stage analysis Survival analysis Correlation analysis

DF ID DF0000171
TE superfamily ERV1
TE class LTR
Species Haplorrhini
Length 6918
Kimura value 14.35
Tau index 1.0000
Description Internal region of an ERV1 endogenous retrovirus, HERV35I subfamily
Comment Internal sequence of an endogenous retrovirus with associated LTR35 LTRs. This is an ancient, non-autonomous LTR retrotransposon. The primer binding site is complementary to proline tRNA.
Sequence
ATTCTTTCGGGGCTCGTCCGGGATCACGGGACGTGGGGAGCATTTTCCTCCCCGGAGGGGGAGGCTTGTGAGCCAGCAGGACNGCCGGGCGTGACCCCTTCGCGGCTGACGGGCGGCCGCCTGAATCTTTGATTCAGCGTCGCCGCAACTGGTGAGTTTTCCTCCGGCCTCCCGGAGACTCCTCGCCANCCCCCCACAGACAATGCTTTTCCTCCCCTCCTGTCCCCNNTATTCGTTGTGTCTTTCTTTTTCCTTCTTCTTTCCGNCGCCCNNNNCGCTTTCCCTCTCTTCCTTCGCTTTTCATTAACTTCATCGGCTCNGCCTGAATAGACACCCNTGCGGGACGGATTGAAACGGCNNNNNNNNNNAGCTGGTTTTGGCTCAGCCTGAATAGACATCCGTGCAGGATGGATTGAAACGGNTGACTNNCCGGGNCTGATCGGTCCAGCTGGTAGGAAACTCTGTCTGGCGCCCTGCCTTTGACNTCCGTNNTCTNGCCTAAGTCGNCTNGGTATTGAGTNCCAAGAAAANNNNNTCTCTCTCTCCCTTTGTCACTCTCCCTNCCTGGCACCCTGGCCCTTGATCCTGTAACTATTCNAAACCCNTCATTACTTCACTTCCCTTCTNGTGGGGAAGGGAGGCCTGTNATNTTTCNGGGCGTCTGTCTGTCCGAACGTGTGGTCCTGTCAGNTNNGGGGNNNAGANTGCCTNAGACAGGGTGCTGGGGATGCCCGGCTGGCCTTCAGGAAGGCACCAGGNACACCTGGGTNCGAAGTTTGCANTATTGGTNTCCTGATCCGNTTTTCCTTTACAATAAGAAAAGTTNTGNGTTTAANTTGACAACTTNTTCCCCCATGCAGCCCGTTGGGCTGCATCTTGCAAAAANNNTTGAGAGGCTTTTGCCTATGGTTCCATGAAATGGAAAAGGATGATTTTCTTTNCGNNNNNNNNNCTNTTNNNNNTGTAACGCGGCTTGGCCCCCACAGCTATGGCGCAGCGAGCAGGGTCACCAAAAGCCGCTCCGCTCTTCCGGAAGCCGCAGNGAAAGGGAACCCAGAAACCTGGCANGCCGGCAAAAGGGTAAGAATTTCTTACCAGCCAGGCTTCTGGCCTCTCTCTCTCTGTGCAAACCGGTTGAGTGAACGGTAAAAATCACTGTTTGTCTCCTCTGCAAGGTTTTGATTAATGGGAAAAAGGATTTGTGAGACTAGTCTTAGGCTGTAGCGAATCTGGTGTACTTTGTGCTATGAATTTGTCTTTCTGTGTCGTTCTGTCATAAAGAGGGGTACCATAGGATAGAACGCGGGCCTAGGACCCCTATAAGCCCGCTGTTCGAGCCGGCCCTGCAGACTGGTCAGTTACAAACTTTGCTGCGGGTCCCTGAAACAAAAACCGGATGAGGTTTCCCTCTCGTCTTGTTTTATGTCCTTGAGAGCTTGACTTTGTGACCATGTGGGGGTACTCTCTCTTGGTCTCCGCCATCCGGAGGGCGGGAATTTTCGGGTTCATGTCAGGCGGCCGGTCTGAAAGGACCGGGAGTCCGAGACGCGTCAGCACACTCTTCGTCCGAATGTGTCAAGCCCTTGGGTGAGTTTTGTCTTAAAAGGTCCCATCCCTACGGGGCTTTTGTCGTCTTTTGCTATCTTAAGCCCATTTCTGAGAGTGAATTCTTGGGGATCATGGAGATGCCTCCTCTACCCCCTCTCTAGAAATACCTCTTGCTTATATGGTNNCCGNNAAAAACCTGGAAAATTACCATCTGGGCTTTAAAAGGCTTTTGGATTGAGTCGCTATTGGAACTAAGTACACCATTAAAAGAAAAAGGATTTTAGAGATCTCTTATTCTAAACAATTGATNAAAAAGGTTTAAATTAAAAGAAGGATACATAATAATGTCATGGCTAGCCTTAAAAATTCTCTTGAGCAGTTNAAAATCCTTTGCAAGCTCGAAANTGNCTGCTCTAGACTCCTTCTGGGAAGAGCAATGGCGACCGCCCCATGCTGTAGCTCAGTAGCTAAGGCTTTGCCCTTTCACGATGGCGGCCTGGGTTCAATTCCTGGCTTAGGGAATGAGTCCTTTCTGGTTTGATATTTGTGTGACTTTTGCCATTTATTGATTCTTTTCCCCTCCATGGACAGCTTCTGATTTCCTGTCTTGAATTTTCCTTTCTCTGAGCTACCTTTGGGGTGATTCTAGATCTTGTAAAAACCGCTTGCCATCTCTTTGGAGACACCTCGTGCGTCCGTGGTTAAGTCATAACCTTAGTTAAGGCTTATTGGTTTCACTTGGGAGGATACCTTTGGNNANAAAAAAANAAAAAAGGCTTAAAAGCCAGAGGTATCGGCTGTTTGTCCCGGCTAAAGTCTGGTAATAAGAGATTTAAAAGGNTTTTTNTTNNNNNAAAAGAGCTCTATGGTTAAAAGTCAGCTTAATTAAAAGCNGATATCCAAGCTATATATATATTTAAAAGGCCTTTATGCTTTTTTCTCTTCTTGGATCTTGTTTTTTGAGAAAACGNNNNNNNCGTTTGAGAAAAAAAGTTTTTTTTTCTTCTCAGTCGACTGAATTGTTTCTCCATTTACTTCTGTCTGTCTTCTTGCCACCCTCGATGCCCACATGAGAGGACCTAAGGTAATTTCTGACAGCCTGGGACTCCTTGGGAAAAACAGNNAAGGCGCCACAGACCCCGTTTTGGGAGAAACCTCTGTTTTCCTCATGGAACCCCAAGAACTGTAAGCGGACAGGTCCCTCTCAAAATCTAAGGCTCTGCTCTGTTTTGCNTTGCGTCGTNTTACCTGACCTTTTTGACTTTTGGGGGCATCAGAAATTACTTTGCATTATGAGAAAACTTTTAGCCTTGGTGTGTAATAGCTAGGTAAGAGATATACTTTTAGGGATGGCTAATGGCAGTTGCTTACAGTGAGTGGTTATTACTACAGGGCGATACTCCTTTCTTTGCGCGTTTAGATAAGAAAAGCGTGCTCTTGGGCACCTAGAAGGTATGGAATGGGGGGATGGGCTGATTACAGAGTGGGCTGATTGGCNTTGGGTTGCCCACCAGCCTCGGGGAAATGTCCTTGCAATGAAATGCACCGTGGAAGCATTGCACTGTCTCGTCCCGTAGCGTTTCCCTCTTTTNGGGGACCCAGGATTCGGTGTAAAAATGGGATCCTTGATTTTTGGGGATCTGTTTTGCCTTCCAGCTGTGCCTGCTTATTAGGCCCTAGAAACTGCATGCTTTCCTGGCCCTGTTCCTTAAAAGGCTCCACCCTAAAGCCAGTAATCCAATTNAGAAACTNACATCTTTAAGGAAATCTCCACGTGTAAGAGTGTCTGCTTTTCCTGGCCATCTTAACTGAACTTTTACTCACACCATTTTTCCTTGGTTTGAGTAAAATATAAATTCTCTACCTTGTTTCACCTAAGAGTCGTCCCTTTAGAAATGCAAATTTAGAGTTGCCTAGCTAACAATTGTTTAGGGCAGGGAACAGGTAATCAAGAGACTGATGGTCTAAAATGGGAAAGAGAAACTTAAAAACTGGCAAATGAAAAATCTTATAACTCTACNAGATCTGCTTCTGTCTGTNTATTTATGTNTTGTGTGTGTGATGTATATATAAAAGAGCTCTAATTAATTGGCTTAAAGAAAAATAAGCGCTTAAATNAAATATTTTGTCAGAAAAAATAGAAACTTNAATGCCTTTTAGTTCACGTGACTTTAGTAATCTTTGGTAAATAAAGACAGTTTTAAAGATTATTGGTAAAATAAAATAAAAACGTCTTCAAAATTTAGACATTTGGTCTAAATTAGGCAGGTCAGATACTGTCTTTGCTAGATGCTTTAAGGTCATAAACTGCTTCTNTGACTTTTGATAATTGTTCGACTTGCCTGCTTTAGAGCCATTAGATTCTAGGTAAGGCCTGGGGACATGTGGAGTTAGCCATGCCCCCTAGCTATGCTGGAAAGAGTCAGACNTTATCTGCAGTTCTGTCCTGTGTCCTAGGCTCTGCACCTGGTACATAATTAAAATTGCTTACACTAAAAATAAAAATTATGTGTTTTTGGTAAAAGGTTATAAAAAGGCATGGGAATGTGGTTTTTTAAGAGAAAGTAATTTTGTCTAGTTTAGAGGGTTTNAAGGATGTTTTAAGTTNNAAAGAAAGAAGAATAAAACTGAAGGTTTAAGCAAGTTGTAGAAGGTTTGTGAAAGATTAATCTTGTAAAAGAAATTCTGTGTGTGAGCAAGTTGGCTAAAATTTAAAGGGNATTATTTAGTTTTTCCGTAAATTGAACATTAAAATAAAAAGCACACTGATGCAGGGCCAGAATCTGGGCCCNTGTGTCNGAATAACAGGGTTTTCTTGGAGCATTGATCTGCTCTTTAACAGAAAATTGTAAAGGGTTATAAAAGGTTTATGAAAATCTTACCTTATGGTCAAACTGATTAAGATTGGATAGATTTGTTTATNNNAAGGTTTTATTAAAATTGGNTTTAGCATTAATACACTAATGCAAAGGTAAAATTTGGTTTTCTCTTTTGAACAAGATTTTCGTGTACCTGCAGAAAAAAGGGAGAGAGAAGAGACAGATTCAGTTGGCCTCATGCTGTCTTTATTGGGTCTTGTTGTTTGGAAAGCTGAGTCTCCCCTCTATCAANGAGTAAAGGTTTTTGNCTTTNTTAAAATNTTTGAAGTNATCATTTTGGCTAAATAAATGACTTATGGTGACCTGNGATTCTATTTTGTGATATCAAGTGTTTTAAACCTTTNGATATTTGACAAACTTTCCAAAATCAAATTTTTGACCTNATTAANCTTTTTAGATATTAGGTCCCCTGAAGTCCAAAAGAGACATATTCGGCTTATTTGGTATATTAAAATCATACAGGAAGCATTGTCAAATATAAAATGGTGTTTAACTTTCTTTGGGTTATATTTATATGTTATTAGTATGTGTTCCAAAATTGTATGAGATTCCTATAATTCTGATATGTCTCAGTATATGTTATCAGTAATAATTATGATTGTTATGTTAAATTATTGTGTGCCACAGAGATAACCAGATTTCCTTGTCGATTGTGTCTTTAACCGTGGCTGTCCTAAGACTTTTGTCATCCACAGACAATTGTTGTCTTGTTTTGATCCTTTTCAAAAGGCGGTTTATAATCAGCTATAGGACTCTGACAGGTGCTCTTGAATGCAGGTTTCTGATAACTTTGGAGATTGTGNCATTGGAATAGAGGGAAAAACTTCCAGGACTCTCATGGAGAGCTGATGTGTTCATGAATATCGAGCAGAACAGGAGTTAATTGCATGGACTGAACTAATAGAAGACTGAAATAATCTTTTTATGACTTTTTGCTTGAAACATTGCTGATTCTTTTTGNTTTGTTTTTCAGAGTCAAGAAAACTTTTTTTCCTTTTGAGCTATTTACAGCTTTTAACAATTGAGTAAAGTATACTCCTGTGAGCAAAATTTGGAGCATATTTCTTTCTCTCTACCTGATTTCTCCAGAATTTGGAAACTATTTGTGAGTATTCTTAATTTATGGCAATATAGTTATTTGCATAAGTTCAATAAGAATCTGTTTTCTTTTGTAACAGGACACAATTGGAGACACTGGTTATTTTACCAAGGCTTTGACTGGAATGGCATGCTTTCAGATATAAACAGACTGCTTTAAGGAATCGAAGTTGACTTATAGAGCCGATAAAAGCCCCTTGGGAAAACTGGCCTCATACCTTGTCTACGCAGTCCCTGTACAGGGTTCCTGACCTGTGGTAAGTAAAGAATGTCACTTTCTGACAGGCCCAGGAGCCCCAAGTTATCTTGGGACCTCGAGAGGAGAGGAATTCACCCAATTCATACAGGTATTTGCAGGCACAGATAAATCCGTGGCTGGGCTCAAGGCTTTAAAAAGTCTAATCTGAGATTCCTTATGGAACAAAGTTCCAGCAAAGCCAATTTAAAAAAGAGCCTATATGGCAAATAATTATTCTTGCTGCACTTTATGCAAATAATCAGGCCAAGTATAATAAGACTAAAACTTATTTTGCAAATAAATTNGTCCTACTATGATTTGTCTTTGGTAAAAATGGGAGACTGGAGAGAGAAAAATTATAGTACACCTGTTATTAGATTCTAGTCTTGTCCGTTGTTTNTTGAGTTTTTNNNNNNNNATTATTTTCTACAATTTGGACTGAATCCTGAATTCTTTCCGGGCTACAAGTCTCCAAACTAACGCTTTCAAATTTTTCTTCCATTTTTCTGACTTGGACTCAATGAAATTGCTACTACCTTTTTCCTGAGGCCCTGCAAGCTGAAGCTTATTCCTTGTGATACAGGCGAGAAAAACGTGTCAGATTGCCACCGCCTTCCTCCTCTGTAACTAAAGATGCTTTGAGTCTAACATCTGGATAAATTGTGCCCAACATTAACCTTTGTTTTTCTTCTGTTTCCATAGAAATGCCTCTTATTAAAAATCTGTTTGCCTTATATTTCAGACAACAGGAGACTGGTTTTCCAGCCTATTCACTTAGATTCCAAATGGCATCTGATCTCTTCTTATAAGCATTGTTAAACTGGGCTTAAGCATTTTATTAATTATCACTGGGTGCTATTTGATTTTTAAAATAATTATTTGTTATATTCAACAGGGGTGCAGACGGTTAAAGTTTATGTCTTCCAGGCTTCAACAGTTCCAAGTCAAGCTAATGATGGCCCAAGGATTCCAACCCGTACCATCCCAGGAGGANCCGAGTCCCTACAGGTCNTTAGANCAGTCAGTGAGAGATTTCCGCGCCCTCCAAGGTTAGGCAGGGACGACAACCCTGTTCAGCAGGAAGTAGCTTCAGAAGATGAGATCTTCGGCCCTTTCTCCTTAAGAATAAGGAGGGTGAAATCTCTCAGGGGGGAA



TF motifs of the concenus sequence

Use FIMO to detect transcription factor motifs in the concenus sequence of the TE family.

TE_family TFBS Start End Strand Score Matched sequence
HERV35I BPC1 538 561 - 20.65 GGGAGAGTGACAAAGGGAGAGAGA
HERV35I RAMOSA1 536 549 - 20.36 AAGGGAGAGAGAGA
HERV35I DOF3.6 242 262 + 20.00 CTTTCTTTTTCCTTCTTCTTT
HERV35I RAMOSA1 1111 1124 - 19.89 CAGAGAGAGAGAGG
HERV35I GAF1 1625 1639 - 19.44 CAAAAGACGACAAAA
HERV35I ZNF816 3924 3938 + 19.25 TGGGGACATGTGGAG
HERV35I IDD7 1625 1638 - 19.09 AAAAGACGACAAAA
HERV35I NUC 1625 1636 + 18.55 TTTTGTCGTCTT
HERV35I JKD 1625 1636 + 18.53 TTTTGTCGTCTT
HERV35I ZBTB18 6410 6420 - 18.47 ATCCAGATGTT


TFBS enrichment in GRCh38

Use Fisher's exact test to perform enrichment analysis of transcription factor binding sites in the TE family of GRCh38.




GTEx

The promoter activity across 46 body sites from The Genotype-Tissue Expression (GTEx) project.




TCGA

The promoter activity across 33 cancer types from The Cancer Genome Atlas (TCGA).