数据分析
数据分析是将连接组学数据转化为知识,并且推动科学发现的过程。
形态重构相当于是将样本图像信息处理成可挖掘数据的过程,数据分析则是充分发掘数据价值,将数据转化为知识的过程。 因而如何有效地将零散的数据归纳成知识的形式,并进一步推动科学发现的是数据分析阶段的主要任务。
在对连接组学样本进行一系列耗时费力的形态重构之后,我们能够得到大量原始形态学数据,这些数据按照重构时采用的数据标注方式可以分为像素化标注的完全重构和骨架化标注的简化重构;也可以按照数据组织类别分为神经元形态数据和神经环路连接数据。 不同的研究内容对于数据形式有不同的需求1,一般来说研究人员会根据其研究目的在在数据标注阶段就采用对应的标注策略,最终在其所需的数据形式上进行数据分析。
像素标注分析
一种常见连接组学数据分析方式是目的导向的,研究人员基于连接组学像素化标注结果的进行形态学分析,不需要对所有数据完成标注,只需要对感兴趣的区域和内容进行重点标注即可。标注所得的体式重构数据一方面提供了前所未有的高分辨细节,另一方面还能够从多个角度展示对应的神经结构,因此使得研究人员能够真正“身临其境”地深入神经系统内部探索其结构奥秘。这种分析方式可以常用于亚细胞级的细胞器研究,例如小鼠视感受器内段线粒体的对称性分布2以及斑马鱼视觉感受器线粒体的昼夜动态变化3;也可以用于发现新的细胞间神经环路,例如灵长类视网膜用于非成像视觉的色觉神经环路4以及灵长类视网膜上用于边缘检测的短视锥神经环路5;甚至用于系统级神经科学规律的验证,例如在视网膜6、海马体7和新皮层8的数据均对突触形成和物理距离之间的相关性提出了质疑。这种分析方式对于数据量要求不高,但是对数据标注的可靠性以及研究人员的领域知识有很强的依赖,整体分析难度不高,因此相比于分析工具来说,有效地对形态结果进行可视化展示更加重要,通常数据标注软件自带的可视化工具就能满足需求,除此以外Blender9也是常用于此类研究的可视化渲染工具。【内容扩展👉】
骨架标注分析
另一种比较常见的连接组学数据分析方式数据驱动的,是基于连接组学骨架化标注结果的形态学分析以及基于神经连接结果的神经环路分析。像素级的标注结果包含神经元的完整信息,便于研究人员在三维空间观察神经元的形态特征,但是这种数据形式并不利于系统性的神经形态学分析,而更加抽象的骨架化标注结果虽然丢失了一些三维细节,但是更有利于神经元的分枝结构的拓扑化展示,因此更适合用于形态学统计分析。已经有许多基于连接组学数据对神经元进行系统性的形态学分析,拓宽并加深了我们对神经元的认识,例如小鼠视网膜神经节细胞的数字博物馆10,小鼠视网膜内网层重构11等。完整的神经元连接图谱是进行连接组学研究所追求的目标,但是复杂的神经元连接信息在数据分析和可视化过程中均存在诸多障碍,而如果把连接图谱看成是有向有权图,就可以利用图论中的方法对连接信息进行更直观的展示以及更高效的分析,一些典型的应用包括研究发育过程中线虫的连接图谱变化12,兔视网膜神经环路中的ON/OFF信号翻转motif13等。针对这两种数据分析需求,目前领域内尚无统一方案(见文献1表一)。natverse14是最近基于R开发的开源形态学分析工具包,能够完成绝大多数的神经形态学分析操作,并且具有很好的扩展性,非常适用于连接组学的形态学统计分析;DotMotif15是面向生物研究人员开发的开源子图搜索与查询工具,抽象了计算机与图论专业知识,使得研究人员能够跨越技术障碍更加专注于神经连接数据分析。【内容扩展👉】
神经系统仿真
连接组学研究的根本目的是对推动人类对神经系统的认识,尽管连接组学技术能够帮助研究人员在极高分辨率下解析神经系统的结构,但是这仍然不足以解释神经系统工作机制,必须与其它形式的研究技术相结合才有可能完成对神经系统的全方位认知,而神经系统仿真则是目前整合各种模态神经科学数据的最佳方式16。因此出现了一种新兴的连接组学数据应用方式,不同于上面两种方式中对连接组学数据进行直接分析,研究人员将连接组学数据作为神经系统仿真的原始数据17,通过建模仿真的手段对数据展开进行更加深入的理解。对于单个神经元的高精度仿真,连接组学数据能够提供神经元的高精度物理形态以及突触结构在神经元上的准确坐标;对于大规模神经环路仿真,连接组学数据能够提供环路中神经元的空间分布规律,神经元之间的突触连接规律,以及神经环路中motif的统计信息。尽管将连接组学数据用于神经系统精细仿真能够进一步上发挥数据的价值,但是如此高精度的仿真对计算资源提出了极高的需求,权衡仿真精度与计算能力是在实际研究中需要重点考虑的因素。目前领域内已经有许多工具可以用于神经系统的精细仿真,例如NEURON1819、Arbor20等。【内容扩展👉】
以上是三类较为常见的连接组学数据分析方式,针对大规模完整的重构连接组学数据,其应用方式远不止此。而且从整体来看,数据分析的进展仍然落后于数据产生的速度,充分挖掘连接组学数据的价值建立在我们对神经系统进一步了解的基础之上,而反之数据又能推动我们对神经系统的认识。因此,深入理解和应用大规模连接组学数据是连接组学面临的下一个难题,对于推动连接组学本身甚至神经科学发展具有重要意义。
-
Louis K Scheffer. Analysis tools for large connectomes. Frontiers in Neural Circuits, 12:85, 2018. ↩↩
-
Ingrid P Meschede, Nicholas C Ovenden, Miguel C Seabra, Clare E Futter, Marcela Votruba, Michael E Cheetham, and Thomas Burgoyne. Symmetric arrangement of mitochondria: plasma membrane contacts between adjacent photoreceptor cells regulated by opa1. Proceedings of the National Academy of Sciences, 117(27):15684–15693, 2020. ↩
-
Michelle M Giarmarco, Daniel C Brock, Brian M Robbings, Whitney M Cleghorn, Kristine A Tsantilas, Kellie C Kuch, William Ge, Kaitlyn M Rutter, Edward D Parker, James B Hurley, and others. Daily mitochondrial dynamics in cone photoreceptors. Proceedings of the National Academy of Sciences, 117(46):28816–28827, 2020. ↩
-
Sara S Patterson, James A Kuchenbecker, James R Anderson, Maureen Neitz, and Jay Neitz. A color vision circuit for non-image-forming vision in the primate retina. Current Biology, 30(7):1269–1274, 2020. ↩
-
Sara S Patterson, James A Kuchenbecker, James R Anderson, Andrea S Bordt, David W Marshak, Maureen Neitz, and Jay Neitz. An s-cone circuit for edge detection in the primate retina. Scientific Reports, 9(1):1–11, 2019. ↩
-
Kevin L Briggman, Moritz Helmstaedter, and Winfried Denk. Wiring specificity in the direction-selectivity circuit of the retina. Nature, 471(7337):183–188, 2011. ↩
-
Yuriy Mishchenko, Tao Hu, Josef Spacek, John Mendenhall, Kristen M Harris, and Dmitri B Chklovskii. Ultrastructural analysis of hippocampal neuropil from the connectomics perspective. Neuron, 67(6):1009–1020, 2010. ↩
-
Narayanan Kasthuri, Kenneth Jeffrey Hayworth, Daniel Raimund Berger, Richard Lee Schalek, José Angel Conchello, Seymour Knowles-Barley, Dongil Lee, Amelio Vázquez-Reina, Verena Kaynig, Thouis Raymond Jones, and others. Saturated reconstruction of a volume of neocortex. Cell, 162(3):648–661, 2015. ↩
-
Blender Online Community. Blender—a 3d modelling and rendering package. Blender Foundation, 2018. ↩
-
J Alexander Bae, Shang Mu, Jinseop S Kim, Nicholas L Turner, Ignacio Tartavull, Nico Kemnitz, Chris S Jordan, Alex D Norton, William M Silversmith, Rachel Prentki, and others. Digital museum of retinal ganglion cells with dense anatomy and physiology. Cell, 173(5):1293–1306, 2018. ↩
-
Moritz Helmstaedter, Kevin L Briggman, Srinivas C Turaga, Viren Jain, H Sebastian Seung, and Winfried Denk. Connectomic reconstruction of the inner plexiform layer in the mouse retina. Nature, 500(7461):168–174, 2013. ↩
-
Daniel Witvliet, Ben Mulcahy, James K Mitchell, Yaron Meirovitch, Daniel R Berger, Yuelong Wu, Yufang Liu, Wan Xian Koh, Rajeev Parvathala, Douglas Holmyard, and others. Connectomes across development reveal principles of brain maturation. Nature, 596(7871):257–261, 2021. ↩
-
Robert E Marc, Bryan W Jones, Carl B Watt, James R Anderson, Crystal Sigulinsky, and Scott Lauritzen. Retinal connectomics: towards complete, accurate networks. Progress in retinal and eye research, 37:141–162, 2013. ↩
-
Alexander Shakeel Bates, James D Manton, Sridhar R Jagannathan, Marta Costa, Philipp Schlegel, Torsten Rohlfing, and Gregory SXE Jefferis. The natverse, a versatile toolbox for combining and analysing neuroanatomical data. Elife, 9:e53350, 2020. ↩
-
Jordan K Matelsky, Elizabeth P Reilly, Erik C Johnson, Jennifer Stiso, Danielle S Bassett, Brock A Wester, and William Gray-Roncal. Dotmotif: an open-source tool for connectome subgraph isomorphism search and graph queries. Scientific reports, 11(1):1–14, 2021. ↩
-
Xue Fan and Henry Markram. A brief history of simulation neuroscience. Frontiers in neuroinformatics, 13:32, 2019. ↩
-
Jonathan Gornet and Louis K Scheffer. Simulating extracted connectomes. bioRxiv, pages 177113, 2017. ↩
-
Michael L Hines and Nicholas T Carnevale. The neuron simulation environment. Neural computation, 9(6):1179–1209, 1997. ↩
-
Michael L Hines and Nicholas T Carnevale. Neuron: a tool for neuroscientists. The neuroscientist, 7(2):123–135, 2001. ↩
-
Nora Abi Akar, Ben Cumming, Vasileios Karakasis, Anne Küsters, Wouter Klijn, Alexander Peyser, and Stuart Yates. Arbor—a morphologically-detailed neural network simulation library for contemporary high-performance computing architectures. In 2019 27th euromicro international conference on parallel, distributed and network-based processing (PDP), 274–282. IEEE, 2019. ↩