三上悠亚在线av python的scanpy库读取几种常见要领的单细胞数据文献汇总

栏目分类

胖白系列: 什么叫做爱; 庭院里的女人; 做爱知识; 性技巧; 性爱游戏在线观看; 男女性爱

热点资讯

洋萝莉系创金合信基金甘静芸：静待计谋加码和经济基本面变化

洋萝莉系案中有案！女子网恋奔现后被骗10万元，报案后反被警

男同表情包鼻炎，鼻塞反复不好，多是阳气欠亨，送你一个方子

捆绑调教 “长裙+长裤”凭什么频频圈粉上海女生，3张对比图

勾引初中生终于官宣! 全新《龙珠》动画曝光, 2024年

空姐偷拍涉案1000余万元！制售假冒伪劣手机团伙就逮

sites like 91porn 国度数据局局长刘烈宏主握

洋萝莉系售价近300万的豪华手机未配备录像头还只维握4G

AYA最新番号曼城VS伊普斯维奇：对阵“升班马”，曼城能赢

AYA最新番号龟龄饮食找到了！商讨发现，这样吃，或将中国东

你的位置：胖白系列 > 什么叫做爱 >

三上悠亚在线av python的scanpy库读取几种常见要领的单细胞数据文献汇总

发布日期：2024-08-24 08:55 点击次数：127

三上悠亚在线av python的scanpy库读取几种常见要领的单细胞数据文献汇总

率先你需要有Python，以及它配套的代码裁剪器哈。从零驱动驱动学习一个编程言语，咱们服气是率先得装配好它，比如前边咱们解说了Python的装配，它多个版块的相反以及治理，详见：Python初体验之弄清亮版块相反和怎样装配治理，然后给出来了两个Python裁剪器，等于PyCharm大约JupyterLab，任选其一路不错翻开你的Python从零驱动之旅。若是你如实是从零驱动三上悠亚在线av，提议参考咱们的推选的学习府上哈：Python从零驱动的配套b站视频和书本。

scanpy 是用于单细胞数据分析的 Python 库，需要有Python基础，才有可能跟底下的教程进行scanpy的单细胞数据分析历程哦！

读前热身准备：

在Python编程体系读取单细胞文献数据会用到scanpy这个库，是以需要装配scanpy这个库：

pip install scanpy -i https://pypi.tuna.tsinghua.edu.cn/simple

装配好之后，就不错使用了。率先泄露一下单细胞抒发量矩阵的多种文献要领，主要包括以下几种：

Matrix Market Exchange Format (MEX):.mtx 文献，该文献包含了一个脱落矩阵，其中每一溜代表一个基因，每一列代表一个细胞，而每个元素则暗示基因在相应细胞中的抒发量。频繁会有三个文献构成：barcodes.tsv（细胞标记）、features.tsv（基因标记）和 matrix.mtx（抒发矩阵）。Hierarchical Data Format (HDF5):.h5 文献，HDF5 是一种用于存储和组织大范围科学数据的文献要领。在单细胞数据中，不错使用 HDF5 存储抒发矩阵、基因和细胞的元数据等信息。AnnData:.h5ad 文献，是基于 HDF5 的文献要领，由 anndata 库界说。它不错包含单细胞数据的抒发矩阵、基因和细胞的元数据、样品信息等。Comma-Separated Values (CSV) 或文本文献:.csv 或 .txt 文献，包含抒发矩阵的文本文献。每一溜代表一个基因，每一列代表一个细胞，元素是抒发量。1.读取h5文献骚波妹影视

图片

使用scanpy读取如上图所示的h5文献，咱们不错用read_10x_h5()这个函数进行h5文献读取，底下是爽气的示范；

read_10x_h5(filename）

参数：

filename：文献名，填写你要读取的h5文献，比如:"/home/my/data/GSE10086_filtered_bc.h5"这么的文献旅途。

更多细目见：https://scanpy.readthedocs.io/en/latest/generated/scanpy.read_10x_h5.html

实战：

上图中这个文献的下载地址：https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM5344nnn/GSM5344024/suppl/GSM5344024_B1.KO_normal.adjacent.lung_filtered_feature_bc_matrix.h5

我依然把这个文献下载好了并放在C:/Users/my/Desktop/data目次下，当今驱动读取h5文献吧！

代码如下：

#导入scanpy库import scanpy as sc#读取h5文献data=sc.read_10x_h5('C:/Users/my/Desktop/data/GSM5344024_B1.KO_normal.adjacent.lung_filtered_feature_bc_matrix.h5')#搜检数据print(data)

遵循如下：

AnnData object with n_obs × n_vars = 13113 × 31053    var: 'gene_ids', 'feature_types', 'genome'

不错看出读取文献之后的data变量是一个AnnData数据对象，包含13113个细胞和31053个基因。

2.读取txt文献

txt等于普正常通的文本文献汉典，是以很容易读取：

图片

使用scanpy读取如上图所示的txt文献，咱们不错用**read_text()**这个函数进行txt文献读取，底下是爽气的示范；

read_text(filename)

参数：

filename：文献名，填写你要读取的txt文献，比如:"/home/my/data/GSE10086_filtered_bc.txt.gz"这么的文献旅途。

更多细目见:https://scanpy.readthedocs.io/en/latest/generated/scanpy.read_text.html#scanpy.read_text

实战：

上图中这个文献的下载地址：https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM5101nnn/GSM5101014/suppl/GSM5101014_Pt1_Superficial_CountMatrix.txt.gz

我依然把这个文献下载好了并放在C:/Users/my/Desktop/data目次下，当今驱动读取txt文献吧！

代码如下：

#导入scanpy库import scanpy as sc#读取txt文献data=sc.read_text('C:/Users/my/Desktop/data/GSM5101014_Pt1_Superficial_CountMatrix.txt.gz')#搜检数据print(data)

遵循如下：

AnnData object with n_obs × n_vars = 32738 × 2315

不错看出读取文献之后的data变量是一个AnnData数据对象，包含32738个细胞和2315个基因。

3.读取tab文献

它试验上亦然txt文本文献，不管是csv要领和tsv要领，齐是不异的。

图片

使用scanpy读取如上图所示的tab文献，咱们不错用read_text()这个函数进行tab文献读取，底下是爽气的示范；

read_text(filename)

参数：

filename：文献名，填写你要读取的tab文献，比如:"/home/my/data/GSE10086_filtered_bc.tab.gz"这么的文献旅途。

更多细目见https://scanpy.readthedocs.io/en/latest/generated/scanpy.read_text.html#scanpy.read_text

实战：

上图中这个文献的下载地址：https://ftp.ncbi.nlm.nih.gov/geo/series/GSE131nnn/GSE131935/suppl/GSE131935_SS2_15_0160_rpkms.tab.gz

我依然把这个文献下载好了并放在C:/Users/my/Desktop/data目次下，当今驱动读取tab文献吧！

代码如下：

#导入scanpy库import scanpy as sc#读取tab文献data=sc.read_text('C:/Users/my/Desktop/data/GSE131935_SS2_15_0160_rpkms.tab.gz')#搜检数据print(data)

遵循如下：

AnnData object with n_obs × n_vars = 24490 × 384

不错看出读取文献之后的data变量是一个AnnData数据对象，包含24490个细胞和384个基因。

4.读取10X要领的文献

图片

使用scanpy读取如上图所示的10X要领文献，咱们不错用**read_10x_mtx()**这个函数进行3个文献读取，底下是爽气的示范；

read_10x_mtx(path)

参数：

path：上图中的3个文献方位的文献目次，比如:"/home/my/data/GSE10086_RAW"这么的文献旅途。

更多细目见：https://scanpy.readthedocs.io/en/latest/generated/scanpy.read_10x_mtx.html

实战：

上图中这3个文献的下载地址：

https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM6567nnn/GSM6567952/suppl/GSM6567952_Control-features.tsv.gz

https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM6567nnn/GSM6567952/suppl/GSM6567952_Control-barcodes.tsv.gz

https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM6567nnn/GSM6567952/suppl/GSM6567952_Control-matrix.mtx.gz

我依然把这3个文献下载好了并放在C:/Users/my/Desktop/data/GSM6567952目次下，并把这三个文献重定名如下：

features.tsv.gzbarcodes.tsv.gzmatrix.mtx.gz

若是不重定名的话，scanpy就会识别不了这三个文献而导致不行读取文献，当今驱动读取10X文献吧！

代码如下：

#导入scanpy库import scanpy as sc#读取tab文献data=sc.read_10x_mtx('C:/Users/my/Desktop/data/GSM6567952')#搜检数据print(data)

遵循如下：

AnnData object with n_obs × n_vars = 6794880 × 27998    var: 'gene_ids', 'feature_types'

不错看出读取文献之后的data变量是一个AnnData数据对象，包含6794880个细胞和27998个基因。

5.读取h5ad文献

h5ad文献底本等于Python编程言语体系的单细胞存储要领的文献，是以是最浮浅的，关联词它对r言语用户来说就不友好了哦。

图片

使用scanpy读取如上图所示的h5ad文献，咱们不错用read_h5ad()这个函数进行h5ad文献读取，底下是爽气的示范；

read_h5ad(filename)

参数：

filename：文献名，填写你要读取的tab文献，比如:"/home/my/data/GSE10086_filtered_bc.h5ad.gz"这么的文献旅途。

更多细目见：https://scanpy.readthedocs.io/en/latest/generated/scanpy.read_h5ad.html

实战：

上图中这个文献的下载地址：https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM4648nnn/GSM4648564/suppl/GSM4648564_adipose_raw_counts.h5ad.gz

我依然把这个文献下载好并解压好后，放在C:/Users/my/Desktop/data目次下。

真贵：这个文献要进行解压后，scanpy才调读取文献：

#导入scanpy库import scanpy as sc#读取h5ad文献data=sc.read_h5ad('C:/Users/my/Desktop/data/GSM4648564_adipose_raw_counts.h5ad')#搜检数据print(data)

遵循如下：

AnnData object with n_obs × n_vars = 33694 × 11167

不错看出读取文献之后的data变量是一个AnnData数据对象，包含33694个细胞和11167个基因。

其它文献

常见的单细胞数数据文献差未几就这些了，不同文献使用scanpy的不同读取函数进行读取就行了。

若是是遭受了比拟冷门的单细胞矩阵文献，也接待留言换取哈。基本上就遇河架桥，碰到问题处理问题即可。

scanpy的其它功能

咫尺scanpy是Python编程体系最流行的单细胞数据处理库了，是以它服气是不单是是读取单细胞转录组抒发量矩阵那么爽气，它包罗万象，不错出几十个以致上百个札记冉冉指挥全球泄露它哈。它提供了好多用于处理和分析单细胞RNA测序数据的功能三上悠亚在线av，以下是 scanpy 常见的功能：

数据加载：提拔多种要领的数据加载，包括常见的文本要领（如CSV、TXT）、AnnData要领等。数据预处理：包括数据归一化、基因过滤、细胞过滤、批次效应消除等。可视化器具：提供了丰富的可视化器具，包括绘图细胞聚类、基因抒发、UMAP、t-SNE等。细胞聚类：包括常见的聚类算法，如k均值聚类（K-means）、DBSCAN等。基因记号：用于记号不同细胞类型的基因，通过基因相反抒发分析来温暖。细胞亚群温暖：通过分析细胞的抒发方式，识别细胞亚群。细胞气象揣度：通过分析基因抒发的神气，揣度细胞的气象，如细胞周期阶段。相反抒发分析：用于比拟不同细胞类型或气象之间的基因抒发相反。数据集整合：提供了一些器具，用于整合来自不同实验或批次的单细胞数据。轨迹分析：用于分析单细胞数据中细胞的发育轨迹，了解细胞发育和分化过程。单细胞网罗分析：探索单细胞数据中的细胞间相互作用网罗。高等可视化：提拔使用高等图形库，如umap-learn和igraph，进行更复杂的数据可视化。本站仅提供存储奇迹，统共内容均由用户发布，如发现存害或侵权内容，请点击举报。

上一篇：AYA最新番号揭秘：世界各地初度性行径年纪