skip to main content
Language:
Search Limited to: Search Limited to: Resource type Show Results with: Show Results with: Search type Index

Development of bioinformatics methods for high-dimensional single-cell data analysis and their application to the study of cell heterogeneity

Digital Resources/Online E-Resources

Citations Cited by
  • Title:
    Development of bioinformatics methods for high-dimensional single-cell data analysis and their application to the study of cell heterogeneity
  • Author: Cortal, Akira
  • Subjects: Dimensionality reduction ; Fonction biologique ; Functional analysis ; Gene signatures ; Omics ; Omiques ; Réduction de la dimensionalité ; Signatures géniques ; Single-Cell ; Séquençage d'ARN sur cellule unique
  • Description: La première découverte d'un micro-organisme et l'observation d'une cellule a été réalisée à l'aide de microscopes par Robert Hooke et Antoni van Leeuwenhoek à la fin du XVIIe siècle. Dès lors, de nombreux moyens ont été déployés pour caractériser les cellules et leur hétérogénéité dans les organismes multicellulaires. Les progrès technologiques récents permettent maintenant de caractériser les cellules grâce à différentes technologies de séquençage d'"omiques" sur cellule unique. Ainsi, les composants génomiques, épigénétiques, transcriptomiques, protéomiques et métaboliques peuvent maintenant être identifiés à grande échelle à la résolution unicellulaire afin de déchiffrer les modules moléculaires qui orchestrent les fonctions cellulaires. L'exploration de l'hétérogénéité cellulaire et de ses constituants moléculaires sous-jacents est essentielle à la compréhension des mécanismes biologiques complexes et à leur participation dans les maladies. Cette exploration exhaustive de l'hétérogénéité des cellules, nécessite une identification des signatures moléculaires de manière non biaisée, qui peuvent servir de cartes d'identité pour chaque cellule du corps. Cependant, la variabilité et les erreurs techniques associées au séquençage sur cellule unique a rendu nécessaire l'utilisation d'approches computationnelles basées sur le partitionnement de données dans lesquelles la caractérisation de l'hétérogénéité de type cellulaire est effectuée à un niveau de sous-population cellulaire plutôt qu'au niveau de la cellule unique. Dans cette thèse, j'ai développé une méthode statistique multivariée sans partitionnement de données, appelée Cell-ID, qui permet l'extraction robuste de signatures géniques, par cellule, à partir de données de séquençage sur cellule unique. Via de nombreuses évaluations effectués sur divers ensembles de données de séquençage unicellulaire, je démontre que les signatures extraites par Cell-ID permettent une reconnaissance impartiale de l'identité cellulaire entre différents donneurs, tissus d'origine, organismes et technologies "omiques" sur cellule unique. De plus, j'illustre par une analyse exploratoire que les signatures extraites par CellID englobent les signaux liés aux mécanismes biologiques complexes et peuvent être utilisées pour étudier les voies biologiques fonctionnelles. La méthode CellID a été implémentée en tant que package R open-source et peut être facilement intégrée dans les flux de travail existants d'analyse des données de séquençage sur cellule unique par la communauté de recherche. Dans l'ensemble, la méthode originale que j'ai développée tout au long de cette thèse aidera à capturer l'hétérogénéité cellulaire individuelle en fournissant des signatures robustes et non biaisées. CellID peut notamment être utilisé pour construire un catalogue complet d'identité cellulaire de référence en l'appliquant à des projets d'encyclopédie cellulaire à grande échelle tels que l'encyclopédie des cellules humaines (Human Cell Atlas) ou l'encyclopédie des cellules de souris (Mouse Cell Atlas), et aussi, entre autres, étudier les voies moléculaires associées aux maladies. Ce travail sera également très pertinent dans un avenir, proche avec l'avènement du séquençage multimodal à l'échelle de la cellule unique, où il sera nécessaire de caractériser les cellules par la combinaison de plusieurs "omiques". The first discovery of a microorganism and, by extension, the observation of a cell was achieved using microscopes by Robert Hooke and Antoni van Leeuwenhoek in the late 17th century. Since then, many scientific efforts have been deployed to characterize cells and their heterogeneity in multicellular organisms. Recent technological advances allow now to molecularly profile cells through different single-cell omics technologies. Thus, large-scale genomic, epigenomic, transcriptomic, proteomic, and metabolomic components may now be identified at single-cell resolution in order to disentangle the molecular programs that jointly orchestrate cell functions. The exploration of the cell heterogeneity and its underlying molecular constituents is essential for the understanding of complex biological mechanisms and their involvement in health or disease states. This exhaustive exploration of human cell heterogeneity requires the unbiased identification of molecular signatures that can serve as unique cell identity cards for every cell in the body. However, the stochasticity associated with high-throughput single-cell sequencing has made it necessary to use clustering-based computational approaches in which the characterization of cell-type heterogeneity is performed at a cell-subpopulation level rather than at full single-cell resolution. In this thesis, I developed a clustering-free multivariate statistical method, called Cell-ID, which allows the robust extraction of per-cell gene signatures from single-cell sequencing data. Through extensive benchmarks performed on a large collection of diverse single-cell sequencing datasets, I demonstrate that Cell-ID signatures allow unbiased cell identity recognition across different donors, tissues-of-origin, model organisms, and single-cell omics technologies. Moreover, I illustrate through exploratory analysis that CellID signatures encapsulate the signal related to complex biological mechanisms and can be used to investigate functional pathways and ontology. The CellID method has been implemented as an open-source R package and can be easily integrated into existing single-cell analysis workflows by the research community. Overall, the original method that I have developed throughout this thesis will help capture individual cell heterogeneity by providing robust and unbiased signatures. Notably, it can be used to build a comprehensive reference catalog of cell identity by applying it on large-scale cell atlas projects such as the Human Cell Atlas or Mouse Cell Atlas and investigating molecular pathways associated with diseases. This work will be strongly relevant also in the near future as single-cell technologies enter a new era driven by multimodal sequencing, and cells will be characterized by the combination of several omics patterns.
  • Creation Date: 2020
  • Language: English
  • Source: Theses.fr

Searching Remote Databases, Please Wait