|
- Identification and complete sequencing of novel human transcripts through the use of mouse orthologs and testis cDNA sequences
- Elisa N. Ferreira1*, Lilian C. Pires1*, Raphael B. Parmigiani1, Fabiana Bettoni1,
- Renato D. Puga3, Daniel G. Pinheiro17, Luís Eduardo C. Andrade4, Luciana O. Cruz3,
- Theri L. Degaki3, Milton Faria Jr.7, Fernanda Festa3, Daniel Giannella-Neto20,
- Ricardo R. Giorgi20, Gustavo H. Goldman8, Fabiana Granja9, Arthur Gruber10,
- Christine Hackel11, Flávio Henrique-Silva12, Bettina Malnic13, Carina V.B. Manzini13,
- Suely K.N. Marie14, Nilce M. Martinez-Rossi15, Sueli M. Oba-Shinjo14,
- Maria Ines M.C. Pardini16, Paula Rahal18, Cláudia A. Rainho21, Silvia R. Rogatto22,
- Camila M. Romano10, Vanderlei Rodrigues23, Magaly M. Sales16, Marcela Savoldi8,
- Ismael D.C.G. da Silva5, Neusa P. da Silva4, Sandro J. de Souza6, Eloiza H. Tajara19,
- Wilson A. Silva Jr.17, Andrew J.G. Simpson1,2, Mari C. Sogayar3, Anamaria A. Camargo1 and Dirce M. Carraro1,24
- 1Laboratory of Molecular Biology and Genomics, Ludwig Institute for Cancer Research,
- São Paulo, SP, Brazil
- 2Ludwig Institute for Cancer Research, New York, NY, USA
- 3Instituto de Química, Universidade de São Paulo, São Paulo, SP, Brasil
- 4Divisão de Reumatologia, Universidade de São Paulo, São Paulo, SP, Brasil
- 5Laboratório de Ginecologia Molecular, Departamento de Ginecologia,
- Universidade Federal de São Paulo, São Paulo, SP, Brasil
- 6Laboratório de Biologia Computacional, Instituto Ludwig de Pesquisa sobre o Câncer,
- São Paulo, SP, Brasil
- 7Departamento de Engenharia Química e de Informática, Bioinformática,
- Universidade de Ribeirão Preto, Ribeirão Preto, SP, Brasil
- 8Faculdade de Ciências Farmacêuticas de Ribeirão Preto, Universidade de São Paulo,
- Ribeirão Preto, SP, Brasil
- 9Laboratório de Genética Molecular do Câncer, Departamento de Clínica Médica,
- Faculdade de Ciências Médicas, Universidade Estadual de Campinas, Campinas, SP, Brasil
- 10Departamento de Patologia, Faculdade de Medicina Veterinária e Zootecnia,
- Universidade de São Paulo, São Paulo, SP, Brasil
- 11Departamento de Genética Médica, Faculdade de Ciências Médicas,
- Universidade Estadual de Campinas, Campinas, SP, Brasil
- 12Departamento de Genética e Evolução, Universidade Federal de São Carlos, São Carlos, SP, Brasil
- 13Departamento de Bioquímica, Instituto de Química, Universidade de São Paulo,
- São Paulo, SP, Brasil
- 14Departamento de Neurologia, Faculdade de Medicina, Universidade de São Paulo,
- São Paulo, SP, Brasil
- 15Departamento de Genética, Faculdade de Medicina de Ribeirão Preto, Universidade de São Paulo, Ribeirão Preto, SP, Brasil
- 16Laboratório de Biologia Molecular, Hemocentro, Faculdade de Medicina,
- Universidade Estadual Paulista, Botucatu, SP, Brasil
- 17Centro de Terapia Celular, Hemocentro e Departamento de Clínica Médica,
- Faculdade de Medicina de Ribeirão Preto, Universidade de São Paulo, Ribeirão Preto, SP, Brasil
- 18Departamento de Biologia, Instituto de Biociências, Letras e Ciências Exatas,
- Universidade Estadual Paulista, São Jose do Rio Preto, SP, Brasil
- 19Departamento de Biologia Molecular, Faculdade de Medicina de São José do Rio Preto,
- São José do Rio Preto, SP, Brasil
- 20Laboratório de Endocrinologia Molecular e Celular (LIM-25),
- Hospital das Clínicas da Faculdade de Medicina, Universidade de São Paulo, São Paulo, SP, Brasil
- 21Departamento de Genética, Instituto de Biociências, Universidade Estadual Paulista,
- Botucatu, SP, Brasil
- 22Laboratório NeoGene, Departamento de Urologia, Faculdade de Medicina,
- Universidade Estadual Paulista, Botucatu, SP, Brasil
- 23Departamento de Bioquímica e Imunologia, Faculdade de Medicina de Ribeirão Preto,
- Universidade de São Paulo, Ribeirão Preto, SP, Brasil
- 24Laboratory of Gene Expression Analysis, Ludwig Institute for Cancer Research,
- São Paulo, SP, Brazil
- *These authors contributed equally to this study.
- Corresponding author: D.M. Carraro
- E-mail: [email protected]
- Genet. Mol. Res. 3 (4): 493-511 (2004)
- Received October 4, 2004
- Accepted December 7, 2004
- Published December 30, 2004
ABSTRACT. The correct identification of all human genes, and their derived transcripts, has not yet been achieved, and it remains one of the major aims of the worldwide genomics community. Computational programs suggest the existence of 30,000 to 40,000 human genes. However, definitive gene identification can only be achieved by experimental approaches. We used two distinct methodologies, one based on the alignment of mouse orthologous sequences to the human genome, and another based on the construction of a high-quality human testis cDNA library, in an attempt to identify new human transcripts within the human genome sequence. We generated 47 complete human transcript sequences, comprising 27 unannotated and 20 annotated sequences. Eight of these transcripts are variants of previously known genes. These transcripts were characterized according to size, number of exons, and chromosomal localization, and a search for protein domains was undertaken based on their putative open reading frames. In silico expression analysis suggests that some of these transcripts are expressed at low levels and in a restricted set of tissues.
Key words: Novel human transcripts, Mouse orthologous sequence, Testis cDNA
|