生物信息学

2024/4/11 21:01:20

Loss-augmented Max-margin Constraint Generation(LAM-CG) algorithm

Computational approaches for RNA energy parameter estimation Year: 2010 Authors: MIRELA ANDRONESCU, ANNE CONDON, HOLGER H. HOOS, DAVID H. MATHEWS, and KEVIN P. MURPHY Journal Name: BIOINFORMATICS Motivation 将最大间隔应用于CG模型中 Research Objective …

De Novo Prediction of RNA 3D Structures with Deep Learning

De Novo Prediction of RNA 3D Structures with Deep Learning Year: 2022 Authors: Julius Ramakers, Christopher Frederik Blum, Sabrina Konig, Stefan Harmeling, Markus Kollmann Journal Name: bioxiv 1 Innovation 结合自回归深度生成模型、蒙特卡罗树搜索和分数模型…

如何选择参考基因组和注释文件

参考基因组是生信分析的基础,重测、芯片、转录组等测序数据都需要首先与参考基因组进行比对,才能进行后续分析 需要注意的是,下载的参考基因组一定要使用与其对应的注释文件,不能再Ensemble中下载参考基因组,却在NCBI…

GTF/GFF文件的差异及其相互转换(转载)

转载自GTF/GFF文件的差异及其相互转换 - 简书 文件转换 #gff2gtf gffread my.gff3 -T -o my.gtf #gtf2gff gffread merged.gtf -o- > merged.gff3

BiomaRt 包进行基因ID转换

R中两个常用的基因ID转换包:BiomaRt和clusterProlifer 1. clusterProlifer 总体来说clusterProlifer用起来是比较方便的,通过现成的org.*.eg.db文件,能够满足常规的gene id转换,例如ensembl id,entrez id&#xff0c…

关于PAGA轨迹分析的一些理解

PAGA(Partition-based graph abstraction)轨迹分析功能包含在Scanpy软件中,是一种基于python的软件,对于没有python使用经验的人来说用起来还是比较吃力的。2019年发表的文献对其工作原理进行了详细阐述,下面是我在做轨…

cellranger 操作笔记-2:构建绵羊单细胞转录组参考基因组

参考10X官方教程:Find the input files -Software -Single Cell Gene Expression -Official 10x Genomics Support 1. 说明 用于单细胞测序数据的参考基因组与bulk转录组、芯片、重测的参考基因组存在差别,需要对下载好的参考基因组进行加工。 10X提供构…

根据配置文件随机裁剪结构模版以及蛋白质序列特征

random_crop_to_size函数实现根据配置文件随机裁剪结构模版以及蛋白质序列特征。 对于结构模版,先随机打乱模版顺序,再随机挑选起始,最后从起始位置开始选择模版; 对于氨基酸序列:裁剪后的长度是给定的,只有…

生物信息(bioinformation)学名词解释

什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序…

ArchR 报错“Error in H5Fopen(file) : HDF5. File accessibility. Unable to open file.\n“

非常恶心的报错,尝试了很久都没有解决,最后重装了 ArchR 就正常运行了 最开始在服务器上安装ArchR也是比较困难的,通过conda勉强安上能用,但是在运行ArchR时需要手动加载很多包,发生这个报错很可能是因为ArchR不能有效…

cellranger 操作笔记-1:分析数据命名规则

1. 明确.fastq.gz文件路径,修改文件名称(Specifying Input FASTQ Files for 10x Pipelines),文件必须符合cellranger相关命名规则 [Sample Name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gzWhere Read Type is one of:I1: Sa…

构建绵羊(非常见物种)BSgenome参考基因组

1. Ensembl 下载绵羊参考基因组和注释文件,虽然这里用不到注释文件,但最好备份一下 2. .fa 格式参考基因组转为 .2bit 格式 # cd software directory wget -b -c http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/faToTwoBit # cd reference dir…

利用AlphaMissense准确预测蛋白质组范围内的错义变体效应

Editor’s summary 蛋白质中单个氨基酸的变化有时影响不大,但通常会导致蛋白质折叠、活性或稳定性方面的问题。只有一小部分变体进行了实验研究,但有大量的生物序列数据适合用作机器学习方法的训练数据。程等人开发了AlphaMissense,这是一种…

ImageJ划痕实验分析

一、计算划痕面积 1. file-open:打开要分析的划痕图片 2. Image-Type-8bit 3. Process-Enhance Contrase-Smooth-Find Edges 4. Image-Adjust-Threshold-Apply 下线为0,上限根据情况设为10-30 5. 魔棒工具选择目标区域 6. Analyze-Measure即可计算出…

Monocle操作笔记-1:软件安装

1. monocle 2安装 方式一:官网安装方式 官网描述的是调用bioconductor.org中的biocLite.R脚本安装biocLite命令,但是按照下边命令总是报错,无法调用biocLite source("http://bioconductor.org/biocLite.R") biocLite() biocLite…

cellranger-atac 操作笔记-1:安装并构建绵羊单细胞ATAC参考基因组

1. 10X 官网下载cellranger-atac软件包,解压,添加路径 wget -O cellranger-atac-2.1.0.tar.gz "https://cf.10xgenomics.com/releases/cell-atac/cellranger-atac-2.1.0.tar.gz?Expires1653943816&PolicyeyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjo…

使用pysam读取DNA序列

先创建一个读对象: fasta_open pysam.Fastafile(fasta_file)读出来的DNA序列是字符串的格式: seq_dna fasta_open.fetch(chr1, 0, 100) # output:NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN…

BLAST

Basic Local Alignment Search Tool Year: 1990 Authors: Stephen F. Altschul, Warren Gish, Webb Miller, Eugene W. Myers and David J. Lipman Journal Name: Journal of Molecular Biology Abstract 一个快速进行序列比较的新方法:基本局部比对搜索工具( ba…

高通量测序的方式:单端测序、paired-end/mate-paired(PE/MP)测序 解释

高通量测序的方式主要有:单端测序、paired-end/mate-paired(PE/MP)测序 高通量测序的方式主要有:单端测序、paired-end/mate-paired(PE/MP)测序 [8] 。当要进行多 个样品同时测序时可以给不同的样品添加不同接头,混合后一起测序。 其…

cellranger atac 操作笔记-3:count 输出文件解读 (2-1)

cellranger-atac -idsamplename 参数会指定输出目录samplename,samplename/out 下存储主要的分析结果 1. summary.csv 和 web summary 两个文件基本包含一样的内容,主要介绍web summary 1.1 sample 描述 1.2 测序数据质量。sequenced read pairs&…

Linux系统或服务器运行Fastqc

Fastqc官网:Babraham Bioinformatics - FastQC A Quality Control tool for High Throughput Sequence Data 正确命令 fastqc --noextract 201645A_200048_1_S1_L001_R1_001.fastq.gz 当拿到测序数据的第一件事往往是进行质检,Fastqc是较为常用的质…

报错“Computation failed in `stat_summary_hex()`”

报错原因:没有加载或安装hexbin 包

exomePeak2学习使用记录

exomePeak2学习&使用记录 文章目录exomePeak2学习&使用记录写在前面关于exomePeak2下载exomePeak2下载出错的一些情况记录...关于exomePeak2的使用**帮助文档对该算法包的描述:**调用函数exomePeak2使用方法无处理组,寻找富集峰[Peak Calling]有…

Dynamic programming algorithm

Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information Year: 1981 Authors: Michael Zuker and Patrick Stiegler Journal Name: Nucleic Acids Research Motivation 将动态规划算法与热动力学数据结合。 Research Objective …

R语言绘图教程汇总 | 2023

2023年总结 2023年即将结束,我们即将迎来2024年。2023年,我们做了什么呢??这个是个值得深思的问题…? 12月份是个快乐且痛苦时间节点。前一段时间,单位需要提交2023年工作总结,真的是憋了好久才可以下笔…

HISAT2 - StringTie - DESeq2 pipeline 进行bulk RNA-seq

软件官网: Hisat2: Manual | HISAT2 StringTie:StringTie 文章:Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown | Nature Protocols 建议看保姆级教程: 1. RN…

cellranger-atac 操作笔记-2:映射单细胞ATAC数据

1. cellranger-atac 输入测序文件命名规则参考cellranger 分析数据命名规则,两者一致。 cellranger 分析数据命名规则_韩建刚(CAAS-UCD)的博客-CSDN博客 一个样本名文件夹包含所有该样本的测序数据,单个lane或多个lane&#xff0…

一篇五分生信临床模型预测文章代码复现——Figure 10.机制及肿瘤免疫浸润(四)

之前讲过临床模型预测的专栏,但那只是基础版本,下面我们以自噬相关基因为例子,模仿一篇五分文章,将图和代码复现出来,学会本专栏课程,可以具备发一篇五分左右文章的水平: 本专栏目录如下: Figure 1:差异表达基因及预后基因筛选(图片仅供参考) Figure 2. 生存分析,…

基于 bioMart 构建绵羊(非常见物种) OrgDb 包/数据库

OrgDb (organism database)文件主要用于基因注释、ID转换、GO富集分析等,Bioconductor - BiocViews 仅提供部分物种正式发布的 OrgDb 包。此外还可通过 AnnotationHub 包检索一些未正式发布的 OrgDb 数据库,以绵羊为例&#xff0c…

PAGA轨迹分析报错问题

用的别人写的paga.py代码,整合了多个工作模块,无法公开,但也是调用scanpy里边的paga程序,可能出现的报错应该也差不多 1. ImportError: dlopen: cannot load any more object with static TLS 一个非常玄学的bug,不仅…

Linux中运行某个python程序报错 Permission denied

(base) [hanjiangangjianglin adipogenesis]$ ./stringtie_expression_matrix.pl -bash: ./stringtie_expression_matrix.pl: Permission denied 原因:没有访问权限,可以自己改或用root账号改成全部权限

BEDTools使用详细说明

简介 1、概述 BEDTools是可用于genomic features的比较,相关操作及进行注释的工具。而genomic features通常使用Browser Extensible Data (BED) 或者 General Feature Format (GFF)文件表示,用UCSC Genome Browser进行可视化比较。该工具的主要功能如下图…

bowtie和bowtie2使用条件区别及用法

一、转录组还是基因组? map常用的工具有bowtie/bowtie2, BWA,SOAP1/SOAP2等。这个问题又会被分成两个问题,是基因组测序(DNA-seq)还是转录组测序(mRNA-seq)。其中的区别是对于真核生物而言,mRNA序列与DNA序列并不完全相…

Monocle操作笔记-2:数据读取和预处理

monocle操作数据格式CellDataSet (CDs),相较于seurat的seurat object,该格式数据更为精简 1. 数据输入输出 首先需要利用3个文件生成CellDataSet格式单细胞表达数据 (1) exprs,基因表达数据,行-基因,列-细胞 monoc…

二代测序之SNV检测总结笔记

二代测序之SNV检测总结笔记 文章目录二代测序之SNV检测总结笔记Short variant calling的流程:测序常见错误:Germline:HaplotypeCaller (单倍体) in GATK过滤候选的Variant信息筛选流程:Somatic Calling Wor…

Linux 下安装R包的几种方式

直接在 Linux 安装 R 是非常复杂以及具有挑战性的,因此,我们通过 anaconda 构建虚拟环境,在虚拟环境中安装 R。Linux 下 R 安装方法可以参考下边的文章,安装好后,可以直接在虚拟环境运行 R,并安装 R 包。由…

cellranger atac 操作笔记-3:count 输出文件解读 (2-2)

3. 细胞barcode质控信息,singlecell.csv 包含barcode中的片段质控信息,barcode中signal信号,与TSS重叠的片段数量等各种指标信息。 singlecell.csv文件纵坐标为barcode, total, duplicate, chimeric, unmapped, lowmapq, mitochondrial, non…

创建hg38的索引文件

bwa index -a bwtsw hg38.fa export PATH/local/zzx/softwares/bwa-master/:$PATH

samtools从fastq到bam再到bigwig(bw)

首先需要使用bowtie2和samtools将fastq序列比对到参考基因组上,生成.bam文件: 单末端: "bowtie2 -p 10 -x mm10-U input.fq | samtools sort -O bam - 10 -o - > output.bam双末端: bowtie2 -p 10 -x mm10-1 input_1.fq…

linux下samtools安装

首先下载安装包并解压: wget https://github.com/samtools/samtools/releases/download/1.9/samtools-1.9.tar.bz2 tar -xzvf samtools-1.9.tar.bz2进入samtools文件夹: cd samtools-1.9安装: ./configure make sudo make install如果是非…

JTVAE( Junction Tree Variational Autoencoder )

Junction Tree Variational Autoencoder for Molecular Graph Generation Year: 2018 Authors: Wengong Jin, Regina Barzilay, Tommi Jaakkola Journal Name: ICML Contributions 使用分子图自动设计分子结构将整个任务分为编码(以连续方法表示分子)…

PINN potentials

Physically informed artificial neural networks for atomistic modeling of materials Year: 2019 Authors: G. P. Purja Pun, R. Batra, R. Ramprasad & Y. Mishin Journal Name: Nature Communications Innovation 扩展物理模型,使其具有广泛适用性&…

ARES( Atomic Rotationally Equivariant Scorer )

Geometric deep learning of RNA structure Year: 2021 Authors: Raphael J. L. Townshend, Stephan Eismann, Andrew M. Watkins, Ramya Rangan, Maria Karelina, Rhiju Das, Ron O. Dror Journal Name: Science Method 网络结构如下图所示 Equivariant convolution 等变…

单细胞降维聚类

单细胞数据最常用的聚类方法有两种,t-SNE和UMAP (Uniform Manifold Approximation and Projection (T-distributed Stochastic Neighbor Embedding),选择哪种方法进行可视化在最开始是非常纠结的,因为选择哪一个都不能说错,搜集了…

NCBI 本地Blast+的学习记录

NCBI 本地Blast的学习记录 写在前面的话 之前下载的blast版本为2.1.0,所以出现了以下的情况。 上网查了好多好多问题,才发现是2.1.0这个版本很有问题啊,所以就下载了最新版本的blast,才得以完成以下的结果。 到官网上下载&…

单细胞分析涉及的各种数据类型

检索到一篇比较有用的文章,简要介绍了Seurat的S4类,SingleCellExperiment的sce,scanpy的anndata和h5文件 为什么要以数据库的思维来理解单细胞数据 - 简书

R 安装/更新 package 报错:failed to lock directory ‘/home/anaconda3/envs/R4.1.2/lib/R/library’

出现这种报错时,检查 package 安装目录(/home/anaconda3/envs/R4.1.2/lib/R/library)是否存在“00LOCK-packagename”文件夹。删除后再次安装,成功解决。

MXfold2

RNA secondary structure prediction using deep learning with thermodynamic integration Year: 2021 Authors: Kengo Sato, Manato Akiyama & Yasubumi Sakakibara Journal Name: Nature Communications Motivation 在多参数模型种经常会出现过拟合现象 Research Ob…

Constraint generation(CG) approach

Efficient parameter estimation for RNA secondary structure prediction Year: 2007 Authors: Mirela Andronescu, Anne Condon, Holger H. Hoos, David H. Mathews, and Kevin P. Murphy Journal Name: Bioinformatics Motivation 基于自由能的RNA二级序列预测模型Turner…

SPOT-RNA

RNA secondary structure prediction using an ensemble of two-dimensional deep neural networks and transfer learning Year: 2019 Authors: Jaswinder Singh, Jack Hanson, Kuldip Paliwal & Yaoqi Zhou Journal Name: Nature Communications Dataset 初始训练的数…

药物基因组学_个体化实验分析_实验报告

文章目录一、实验目的1、(学会)收集特定癌种特定药物的包含药物响应与否相关的基因表达谱数据(TCGA/GEO)2、(掌握)根据响应信息将样本划分为耐药或者敏感两类3、(掌握)构建分类器4、…

Cell Ranger count (gene expression) 输出文件解读

cellranger count 将结果输出到提前设置好的--ID<name>文件夹中&#xff08;如下&#xff09;&#xff0c;主要结果在outs/文件夹中 tree outs/ . ├── analysis │ ├── clustering │ │ ├── graphclust │ │ │ └── clusters.csv │ │ ├…

sam/bam文件

SAM (Sequence Alignment/Map) 格式是一种通用的比对格式&#xff0c;用来存储reads到参考序列的比对信息。 SAM是sanger制定&#xff0c;是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示&#xff0c;当然也可以表示任意的多重比对结果。 详…

TaWRKY19/61/82激活糖转运蛋白TaSTP3从而增强小麦条锈病敏感性

文章信息 题目&#xff1a;Sugar transporter TaSTP3 activation by TaWRKY19/61/82 enhances stripe rust susceptibility in wheat 刊名&#xff1a;New Phytologist 作者&#xff1a;Baoyu Huai&#xff0c;Zhensheng Kang,Jie Liu et al. 单位&#xff1a;Northwest A&…

蛋白序列比对生成多序列比对(MSA)文件

### 1. uniref 数据库下载 # https://www.uniprot.org/help/downloads # 下载 uniref50&#xff0c;uniref90 等数据 wget https://ftp.uniprot.org/pub/databases/uniprot/uniref/uniref90/uniref90.fasta.gz ## 下载中断后&#xff0c;可以通过-c &#xff08;--continue…

LinearPartition

LinearPartition: linear-time approximation of RNA folding partition function and base-pairing probabilities Year: 2020 Authors: He Zhang, Liang Zhang, David H. Mathews and Liang Huang Journal Name: Bioinformatics Motivation 传统分割方法的复杂度与序列长度…

Linux 中 screen 函数用法

1. 参考 linux screen 命令详解 - David_Tang - 博客园 2. 常用命令和快捷键&#xff1a; screen -S test 新建名为 test 的 screen&#xff0c;并直接进入screen -d远程退出 testctrl a d远程退出 test &#xff08;快捷键&#xff09;screen -ls查看有效运行中的 screens…

运行 ArchR 报错“createArrowFiles has encountered an error, checking if any ArrowFiles completed..”

ArchR 运行 createArrowFiles() 报错如下内容&#xff1a; Batch Execution w/ safelapply!, 0 mins elapsed. 2022-06-14 10:38:14 : createArrowFiles has encountered an error, checking if any ArrowFiles completed.. ArchR logging successful to : ArchRLogs/ArchR-cr…

R语言图形绘制 | 桑基图绘制教程

原文链接&#xff1a;R语言绘制桑基图教程 写在前面 在昨天3月10日&#xff0c;我们在知乎、B站等分享了功能富集桑基气泡图的绘制教程。相关链接&#xff1a;NC|高颜值功能富集桑基气泡图&#xff0c;桑基气泡组合图。 确实&#xff0c;目前这个图在文章中出现的频率相对比较…

关于我花费六千多组了台window+Linux主机

一边学习&#xff0c;一边总结&#xff0c;一边分享&#xff01; 写在前面 我在2023年12月组了一台“洋垃圾”的主机&#xff0c;一边当做台式机使用&#xff0c;一边当做服务器使用。这个方案算是相对比较划算的方案。我开始是打算直接单做服务器使用的&#xff0c;以及内存…

基于 gff 文件构建 TxDb 包

首先&#xff0c;TxDb 包是用 GenomicFeatures 包构建的&#xff0c;用于专门注释基因组中转录本、外显子、内含子等的包。 1. 如果是构建从 Ensembl 下载的参考基因组的 TxDb &#xff08;transcript database&#xff09;包&#xff0c;有两种构建方式&#xff0c;一种是直接…

CS224W摘要18.Graph Neural Networks in Computational Biology

文章目录背景介绍问题与挑战药物及药物组合的安全性挑战解决方案&#xff1a;Polypharmacy Knowledge GraphPolypharmacy Dataset例子效果患者预后及疾病分类挑战解决方案&#xff1a;Subgraph Neural NetworksOverviewSubgraph Message PassingProperty-aware RoutingSubgraph…

构建蛋白质序列的atom14特征

根据蛋白质中氨基酸序列&#xff08;protein[aatype]&#xff09;氨基酸的结构和编号&#xff0c;构建 protein[atom14_atom_exists]、protein[residx_atom14_to_atom37]、 protein[atom37_atom_exists] 以及protein[residx_atom37_to_atom14]特征 import tensorflow as tf i…

一篇五分生信临床模型预测文章代码复现——Figure 10.机制及肿瘤免疫浸润(一)

之前讲过临床模型预测的专栏,但那只是基础版本,下面我们以自噬相关基因为例子,模仿一篇五分文章,将图和代码复现出来,学会本专栏课程,可以具备发一篇五分左右文章的水平: 本专栏目录如下: Figure 1:差异表达基因及预后基因筛选(图片仅供参考) Figure 2. 生存分析,…

多序列比对sto格式转a3m

多序列比对&#xff08;Multiple Sequence Alignment&#xff0c;MSA&#xff09;是对多个生物序列进行对齐的过程&#xff0c;以揭示它们之间的共同模式和结构。在生物信息学中&#xff0c;有多种文件格式用于存储多序列比对的结果&#xff0c;其中包括Stockholm (.sto) 和 A3…

miRNA测序数据生信分析——第四讲,未知物种的生信分析实例

miRNA测序数据生信分析——第四讲&#xff0c;未知物种的生信分析实例 miRNA测序数据生信分析——第四讲&#xff0c;未知物种的生信分析实例1. 下载测序数据2. 原始数据质控——软件fastqc3. 注释tRNA和rRNA&#xff0c;使用Rfam数据库——软件blast&#xff0c;Rfam_statisti…

3D火山图绘制教程

一边学习&#xff0c;一边总结&#xff0c;一边分享&#xff01; 本期教程内容 **注&#xff1a;**本教程详细内容 Volcano3D绘制3D火山图 一、前言 火山图是做差异分析中最常用到的图形&#xff0c;在前面的推文中&#xff0c;我们也推出了好几期火山图的绘制教程&#xff0…

易基因|一种全新的检测DNA羟甲基化的技术:ACE-Seq

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑做组学科研服务的易基因。今天给大家介绍一种全新的检测DNA羟甲基化的技术&#xff1a;APOBEC-coupled epigenetic sequencing&#xff0c;简称【ACE-seq】。 前言 DNA序列中胞嘧啶&#xff08;C&#xff09;5’ 碳…

18G大小的R包 | 将你需要的R包全部下载

写在前面 在上周&#xff0c;我们在社群讨论。安装R包是个玄学”有时候真的很奇怪&#xff0c;在自己的电脑上就是无法安装&#xff0c;但是在其他电脑都可以正常安装…&#xff0c;不是感到很无语&#xff1f;&#xff1f;&#xff1f;&#xff1f;没有办法&#xff0c;类似的…

服务器磁盘挂载及格式化

一边学习,一边总结,一边分享! 写在前面 最近一直折腾组装的电脑,来回折腾了很久关于我花费六千多组了台window+Linux主机,目前基本是可以使用了。对于Windows主机配置基本是没问题,一直在使用,以及桌面化软件,都可以自己安装,只是说这台主机有些软件可能一时半会安装…

haiku定义简单的模型并初始化参数

Haiku 是一个基于 JAX 的深度学习库&#xff0c;旨在提供简洁、灵活且易于使用的 API&#xff0c;以构建和训练神经网络模型。 import haiku as hk import jax import jax.numpy as jnp### 1. 定义简单的二层神经网络 class SimpleNN(hk.Module):def __init__(self, hidden_si…

R语言,数据类型转换

原文链接&#xff1a;R语言技能 | 不同数据类型的转换 本期教程 写在前面 今天是4月份的第一天&#xff0c;再过2天后再一次迎来清明小假期。木鸡大家是否正常放假呢&#xff1f; 我们在使用R语言做数据分析时&#xff0c;会一直对数据进行不同类型的转换&#xff0c;有时候…

论文解读:《DataPype:用于计算机辅助药物设计的全自动统一软件平台》

论文解读&#xff1a;《DataPype: A Fully Automated Unified Software Platform for Computer-Aided Drug Design》 1.文章概述2.背景2.方法2.1 DataPype概述2.2 数据2.3 分子和蛋白质数据的处理2.3.1 配体处理2.3.2 蛋白质加工 2.4 CADD方法2.5 基准研究2.5.1 单个 CADD 制备…

bowtie和bowtie2用法详解

bowtie 短序列比对工具详解 常见的短序列比对工具有很多&#xff0c;如fasta、blast、bowtie、shrimp、soap等。每个工具都有其自身的优点&#xff0c;但同时也具备了一些缺点。权衡利弊&#xff0c;我选择bowtie作为主要的短序列比对工具。它速度很快&#xff0c;比对结果也容…

R语言技能 | 不同数据类型的转换

原文链接&#xff1a;R语言技能 | 不同数据类型的转换 本期教程 写在前面 今天是4月份的第一天&#xff0c;再过2天后再一次迎来清明小假期。木鸡大家是否正常放假呢&#xff1f; 我们在使用R语言做数据分析时&#xff0c;会一直对数据进行不同类型的转换&#xff0c;有时候…

二分类结局变量Logistic回归临床模型预测—— 模型评价(二)

本节讲的是二分类结局变量的临床模型预测,与之前讲的Cox回归不同,https://lijingxian19961016.blog.csdn.net/article/details/124088364https://lijingxian19961016.blog.csdn.net/article/details/124088364https://lijingxian19961016.blog.csdn.net/article/details/1240…

SummarizedExperiment 对象访问、操作和转换

SummarizedExperiment object SummarizedExperiment for Coordinating Experimental Assays, Samples, and Regions of Interest SummarizedExperiment 对象能够存储多个样本的观测值,同时存储用于描述观测值和样本的元数据(metadata)。SummarizedExperiment 能够紧密结合…

【生信】R语言在RNA-seq中的应用

R语言在RNA-seq中的应用 文章目录 R语言在RNA-seq中的应用生成工作流环境读取和处理数据由targets文件提供实验定义对实验数据进行质量过滤和修剪生成FASTQ质量报告 比对建立HISAT2索引并比对 读长量化读段计数样本间的相关性分析 差异表达分析运行edgeR可视化差异表达结果计算…

使用Sentieon加速甲基化WGBS数据分析

全基因组甲基化测序(WGBS)是一种研究DNA甲基化的方法&#xff0c;以全面了解在基因组水平上的表观遗传变化。在进行WGBS数据分析时&#xff0c;通常需要使用专门的比对工具&#xff0c;因为这些工具需要能够处理亚硫酸盐转化后的数据。 以下是四个不同的WGBS比对分析流程&…

Msa类处理多序列比对数据

同源搜索&#xff0c;多序列比对等都是常用的方式&#xff0c;但是有很多的软件可以实现这些同源搜索和多序列比对&#xff0c;但是不同的软件输出的文件格式却是不完全一致&#xff0c;有熟悉的FASTA格式的&#xff0c;也有A2M, A3M,stockholm等格式。 详细介绍&#xff1a; …

TemplateHit中提取query和hit比对上序列索引的映射字典

template_hits(Sequence[TemplateHit]数据格式)来自结构数据库搜索结果 python运行hhsearch二进制命令的包装器类 映射索引计算&#xff1a;TemplateHit 中含有 indices_query&#xff0c;需要换算成在原始query序列中的index&#xff0c;hit 中indices_hit 需要减去最小index…

bash命令——linux command

bash命令——linux command 1. Linux下的命令结构2. 重点命令学习2.1 基础命令2.2 文件操作2.3 文件权限2.4 目录操作2.5 环境变量2.6 进程信息2.7 grep命令2.8 awk命令2.9 cut命令2.10 bc命令2.11 sort命令 3. 其他知识点3.1 批量执行某条命令3.2 windows下载数据3.3 创建shel…

医学生考研考博太卷,一篇文章轻松助力上岸——生物信息学及R语言基础知识之向量的运算(二)

考研考博太卷了,卷不过,想没想过本科发一篇文章呢? 330分考研人淘汰390分考研人这个故事,大家应该都知道吧。 本专栏带你六个月内,搞定一篇文章,本科生发文章也很容易。 在卷考研的同时,再卷一篇SCI,你就是新一任卷王。 本专栏教你不用花钱发一篇生信文章,从三个方…

Volcano3D绘制3D火山图

一边学习&#xff0c;一边总结&#xff0c;一边分享&#xff01; 本期教程内容 **注&#xff1a;**本教程详细内容 Volcano3D绘制3D火山图 一、前言 火山图是做差异分析中最常用到的图形&#xff0c;在前面的推文中&#xff0c;我们也推出了好几期火山图的绘制教程&#xff0…

易基因:WGBS等揭示丹参甲基化表征及DNA甲基化在丹参酮生物合成中的调控机制|科研速递

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 丹参&#xff08;Salvia miltiorrhiza&#xff0c;S. miltiorrhiza&#xff09;是一种具有重要经济价值和药用价值的模式药用植物&#xff0c;丹参的根会合成一组称为丹参酮&#xff08;…

易基因:综合全基因组DNA甲基化和转录组学分析鉴定调控骨骼肌发育潜在基因 | 研究进展

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 DNA甲基化是骨骼肌发育中关键的表观遗传调控机制。但胚胎鸭骨骼肌发育中负责DNA甲基化的调控因子仍然未知。 2023年10月23日&#xff0c;南京农业大学动物科技学院于敏莉副教授团队在《…

R语言绘图 | 散点小提琴图

原文链接&#xff1a;R语言绘图 | 散点小提琴图 本期教程 写在前面 本期的图形来自发表在Nature期刊中的文章&#xff0c;这样的基础图形在日常分析中使用频率较高。 获得本期教程数据及代码&#xff0c;后台回复关键词&#xff1a;20240405 绘图 设置路径 setwd("You…

专栏十:10X单细胞的聚类树绘图

经常在文章中看到对细胞群进行聚类,以证明两个cluster之间的相关性,这里总结两种绘制这种图的方式和代码,当然我觉得这些五颜六色的颜色可能是后期加的,本帖子只总结画树状图的方法 例一 文章Single-cell analyses implicate ascites in remodeling the ecosystems of pr…

QIIME 2介绍

QIIME 2&#xff08;Quantitative Insights Into Microbial Ecology 2&#xff09;是一个用于分析和解释微生物组数据的开源生物信息学工具。它是QIIME的第二个版本&#xff0c;经过重新设计以提高灵活性、可扩展性和可重复性。 1. 关于QIIME 2的一些重要特征和概念&#xff1…

生物信息学 | 借助 AI 更高效地开启研究

生物信息学 (Bioinformatics) 是指利用应用数学、信息学、统计学和计算机科学的方法&#xff0c;研究生物学问题。 随着计算机科学技术的发展&#xff0c;AI 在解决复杂又颇具挑战的生物学研究问题方面&#xff0c;显露出极大的优势&#xff0c;进一步加速了传统研究范式的转变…

PyRosetta加载pose对象

在PyRosetta中&#xff0c;pose 是一个非常重要的对象&#xff0c;代表了蛋白质的构象和结构信息&#xff0c;它为蛋白质结构建模和分析提供了丰富的功能和工具。 ### 1. 加载包 from pyrosetta import * init() #dir(pyrosetta) # 查看pyrosetta包中的函数### 2. 加载pose对象…

kalign 进行多序列比对

Kalign是一种用于多序列比对的开源软件&#xff0c;可以通过命令行或在程序中调用它来执行多序列比对。 ### 1. conda安装 conda install Kalign3### 2. 序列比对 kalign -i test.fasta -o test.alnkalign input1.fasta input2.fasta input3.fasta -o output.fasta # 这将比对…

人工智能AI系列 - AI赋能生物医药 - DNA序列搜索

目录&#xff1a; http://aias.top/ DNA序列搜索 本例子提供了DNA序列搜索&#xff0c;支持上传文件文件&#xff0c;使用spark mlib计算模型提取特征&#xff0c;并基于milvus向量引擎进行后续检索。 引擎特性 底层使用特征向量相似度搜索单台服务器十亿级数据的毫秒级搜索…

基于R语言绘制-散点小提琴图

原文链接&#xff1a;R语言绘图 | 散点小提琴图 本期教程 写在前面 本期的图形来自发表在Nature期刊中的文章&#xff0c;这样的基础图形在日常分析中使用频率较高。 获得本期教程数据及代码&#xff0c;后台回复关键词&#xff1a;20240405 绘图 设置路径 setwd("You…

干货系列:高通量测序后的下游实验验证方法——m6A RNA甲基化篇|易基因

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。此前&#xff0c;我们分享了m6A RNA甲基化研究的数据挖掘思路&#xff08;点击查看详情&#xff09;&#xff0c;进而筛选出m6A修饰目标基因。做完MeRIP-seq测序后&#xff0c;如果需要对分…

一篇五分生信临床模型预测文章代码复现——Figure 4-6 临床模型构建(七)

之前讲过临床模型预测的专栏,但那只是基础版本,下面我们以自噬相关基因为例子,模仿一篇五分文章,将图和代码复现出来,学会本专栏课程,可以具备发一篇五分左右文章的水平: 本专栏目录如下: Figure 1:差异表达基因及预后基因筛选(图片仅供参考) Figure 2. 生存分析,…

Nature Methods - method to watch 用于基因组学的大模型

文章目录 一、前言二、主要内容三、总结🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一、前言 在人工智能(AI)和大语言模型(LLMs)背景下,基础模型是开发更专业和更高级模型的基础,它代表了对语言和各种任务的全面而概括的理解,是建立更专业模型的基础。OpenAI …

肺癌相关文献6

第十四篇 Classification of lung adenocarcinoma based on stemness scores in bulk and single cell transcriptomes IF&#xff1a;6.0 中科院分区:2区 生物学WOS分区&#xff1a;Q1被引次数&#xff1a; 4 背景&#xff1a;癌细胞具有无限期自我更新和增殖的能力[2]。在一…

Hisat-Trinity-PASA等组学分析流程

一边学习&#xff0c;一边总结&#xff0c;一边分享&#xff01; 详细教程请访问&#xff1a; 组学分析流程 本期分析流程 Hisat2-SamtoolsTrinity_GG_denovoPASA … 本期教程文章 题目&#xff1a;Genomic insights into local adaptation and future climate-induced vu…

EasyMicrobiome-易扩增子、易宏基因组等分析流程依赖常用软件、脚本文件和数据库注释文件

啥也不说了&#xff0c;这个好用&#xff0c;给大家推荐&#xff1a;YongxinLiu/EasyMicrobiome (github.com) 大家先看看引用文献吧&#xff0c;很有用&#xff1a;https://doi.org/10.1002/imt2.83 还有这个&#xff0c;后面马上介绍&#xff1a;YongxinLiu/EasyAmplicon: E…

易基因:ChIP-seq等揭示转录因子NRF1调控原始生殖细胞发育、增殖和存活的表观遗传机制|科研进展

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 原始生殖细胞&#xff08;Primordial germ cell&#xff0c;PGC&#xff09;是生殖细胞前体&#xff0c;可以产生卵母细胞和精子&#xff0c;确保生命延续。尽管PGC特化&#xff08;PGC …

毅硕科技携手Sentieon独家赞助第21届亚太生物信息学大会(APBC 2023)

APBC介绍 亚太生物信息学大会&#xff08;Asia Pacific Bioinformatics Conference, APBC&#xff09;是一年一度的行业国际盛会&#xff0c;汇聚区域间生物信息学领域的学者、研究人员和产业领导者&#xff0c;共同探讨生物信息学领域的研究进展、技术发展和应用创新。自2003…

易基因-MeRIP-seq揭示衰老和神经变性过程中m6A RNA甲基化修饰的保守下调机制

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。2023年02月22日&#xff0c;《美国国家科学院院刊》(Proc Natl Acad Sci USA)期刊发表了题为“Conserved reduction of m6A RNA modifications during aging and neurodegeneration is lin…

项目文章:oxBS揭示复发性膀胱癌的DNA甲基化和羟甲基化变化并鉴定预测PD-L1表达标记物

近日&#xff0c;徐州市中心医院&#xff08;徐州医科大学徐州临床学院&#xff09;史振铎等为第一作者、韩从辉教授为通讯作者在《Biomarker Research》杂志发表题为“Integrative multi-Omics analysis depicts the methylome and hydroxymethylome of recurrent bladder can…

解决Xshell下不能绘图问题:unable to open connection to X11 display

解决流程&#xff1a; 1. 不管有没有用把所有的与 X11 有关的库通过 anaconda 全都安上&#xff1a;libx11&#xff0c;xorg-x11 Search :: Anaconda.org Search :: Anaconda.org 2. 下载安装 Xmanager&#xff0c;当然是破解版&#xff0c;自己搜或者私聊资源 3. 配置 X…

上海见 | 易基因科技与您相约2023年中国微生物学会学术年会

由中国微生物学会、上海市微生物学会主办&#xff0c;复旦大学、复旦大学上海医学院、上海交通大学、华东理工大学承办的“2023年中国微生物学会学术年会”将于2023年10月20—23日在上海光大会展中心有限公司国际大酒店举行。会议热忱欢迎全国从事微生物学研究、教学和微生物开…

易基因:细菌微生物基因表达调控表观研究方案|原核三代甲基化+转录组

1、原核甲基化 原核生物中的DNA甲基化 原核生物甲基化为什么基于三代测序&#xff1f; 第三代DNA测序为原核细菌的甲基化和表观遗传的研究开辟了一条新的途径&#xff0c;能够在基因组的水平上获取整个表观遗传的序列信息&#xff0c;绘制全基因组甲基化组。 细菌中DNA甲基化…

Cytoscape软件下载、安装、插件学习[基础教程]

写在前面 今天分享的内容是自己遇到问题后&#xff0c;咨询社群里面的同学&#xff0c;帮忙解决的总结。 关于Cytoscape&#xff0c;对于做组学或生物信息学的同学基本是陌生的&#xff0c;可能有的同学用这个软件作图是非常溜的&#xff0c;做出来的网络图也是十分的好看&am…

mmCIF 格式字符串解析

mmCIF&#xff08;macromolecular Crystallographic Information File&#xff09;是一种用于存储生物大分子结构数据的标准文件格式。它是 PDB&#xff08;Protein Data Bank&#xff09;数据文件格式的一种扩展&#xff0c;用于存储 X 射线晶体学和核磁共振测定的生物大分子的…

一篇五分生信临床模型预测文章代码复现——FIgure 9.列线图构建,ROC分析,DCA分析 (三)

之前讲过临床模型预测的专栏,但那只是基础版本,下面我们以自噬相关基因为例子,模仿一篇五分文章,将图和代码复现出来,学会本专栏课程,可以具备发一篇五分左右文章的水平: 本专栏目录如下: Figure 1:差异表达基因及预后基因筛选(图片仅供参考) Figure 2. 生存分析,…

群辉中使用Hyper Backup备份数据及套件教程

写在前面 我在去年花费1千多元资金组了一台NAS&#xff0c;容量为4T&#xff0c;阵列为raid 1。**我感觉这是去年做的最有意义的事情&#xff01;**为什么这么说呢&#xff1f;在11月中旬&#xff0c;我的M.2的硬盘突然间崩掉了&#xff0c;就是的那种莫名其妙的。事情的发展经…

易基因:全基因组DNA甲基化和小RNA分析揭示甘蓝型油菜种子的基因组不对称性 | 植物发育

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 多倍体是被子植物基因组进化中的一种持续现象&#xff0c;有助于现存开花植物的多样性。甘蓝型油菜&#xff08;Brassica napus&#xff09;是世界上最重要的被子植物油料作物品种之一&a…

【EI会议征稿】第四届生物信息学与智能计算国际学术研讨会(BIC 2024)

第四届生物信息学与智能计算国际学术研讨会&#xff08;BIC 2024&#xff09; 2024 4th International Conference on Bioinformatics and Intelligent Computing 2024年第四届生物信息学与智能计算国际学术研讨会 &#xff08;BIC 2024&#xff09;将定于2024年1月26-28日在…

阅读文献-胃癌

写在前面 今天先不阅读肺癌的了&#xff0c;先读一篇胃癌的文章 文献 An individualized stemness-related signature to predict prognosis and immunotherapy responses for gastric cancer using single-cell and bulk tissue transcriptomes IF:4.0 中科院分区:2区 医学…

蛋白质序列FeatureDict转化为TensorDict

主要转化语句为 tensor_dict {k: tf.constant(v) for k, v in np_example.items() if k in features_metadata}。 增加了特征名称的选择&#xff0c;不同特征维度&#xff0c;特征数的判断等。 from typing import Dict, Tuple, Sequence, Union, Mapping, Optional #import …

二分类结局变量Logistic回归临床模型预测(二)——基线特征及三线表绘制(二)

本节讲的是二分类结局变量的临床模型预测,与之前讲的Cox回归不同,https://lijingxian19961016.blog.csdn.net/article/details/124088364https://lijingxian19961016.blog.csdn.net/article/details/124088364https://lijingxian19961016.blog.csdn.net/article/details/1300…

linux下bowtie2安装

先把菠菜软件的压缩包下载下来&#xff1a; wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.4.4/bowtie2-2.4.4-linux-x86_64.zip/download想要其它版本也可以去官网看一下&#xff1a;http://bowtie-bio.sourceforge.net/bowtie2/index.shtml 然后解压&…

专栏六:复习差异分析(1)-limma-芯片

概览 包括芯片和测序的数据 目录 概览 安装课程相应的R包 01 Limma 芯片 GEO2R直接分析 读取数据 数据结构

samtools常用命令详解

samtools的说明文档&#xff1a;http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。以下是常用命令的介绍 1. view view命令的主要功能是&#xff1a;将sam文件转换成bam文件&#xff1b;然后对bam文件进行各种操…

安装配置deep learning开发环境

1. 下载安装anacondahttps://www.anaconda.com/download-success vim ~/.condarcchannels: - bioconda - https://mirrors.ustc.edu.cn/anaconda/pkgs/main/ - https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/ - https://mirrors.tuna.tsinghua.edu.cn/anaco…

易基因单细胞转录组测序(smart-seq2)|技术推介

大家好&#xff0c;这是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。今天跟大家介绍一下易基因的新产品&#xff1a;单细胞转录组测序&#xff08;smart-seq2&#xff09;。时下火热的10X Genomics公司Chromium解决方案无法满足某些特殊或者少量细胞样本甚至单…

2023年教程汇总 | 《小杜的生信笔记》

2023年总结 2023年即将结束&#xff0c;我们即将迎来2024年。2023年&#xff0c;我们做了什么呢&#xff1f;&#xff1f;这个是个值得深思的问题…? 12月份是个快乐且痛苦时间节点。前一段时间&#xff0c;单位需要提交2023年工作总结&#xff0c;真的是憋了好久才可以下笔…

易基因: Nature Biotech:番茄细菌性青枯病的噬菌体联合治疗|国人佳作

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 生物防治是利用细菌接种剂来改变植物根际微生物群落的组成&#xff0c;但在以往研究中存在有接种的细菌在根际建立不良&#xff0c;与本地微生物组争夺资源&#xff0c;干扰本地微生物的…

GCE的安装和使用

GCE的安装和使用 GCE的安装使用1. GCE的安装2. GCE的使用补充&#xff1a;一个简单的R脚本——kmerpdf.R&#xff0c;用于绘制kmer的种类和数量分布图 GCE的安装使用 一个基因组评估软件。其他同类型软件Genomescope 1. GCE的安装 Github官网&#xff1a;https://github.com…

易基因:表观遗传学和表观转录组修饰在植物金属和准金属暴露中的作用 | 抗逆综述

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 非必需金属&#xff08;non-essential metal&#xff09;和准金属&#xff08;metalloid&#xff0c;也称类金属&#xff09;对土壤的污染是全球许多地区面临的严重问题。这些非必需金属…

生物信息学及其研究方向与应用

生物信息学是生物er在AI以及cs时代的出路&#xff0c;所以AI以及生信一定是生物er的出路&#xff0c;21世纪的生物只有和最具生产力的行业结合&#xff0c;才能爆发出生命力&#xff0c;哦不&#xff0c;拿到高薪。 生物信息学可以理解为“生物”“信息学”&#xff0c;但不是…

NCBI数据下载-sra

NIBI数据下载-sraNCBI数据下载步骤进入NCBI选择需要的数据选择需要的数据查看数据相信信息点击数据连链接&#xff0c;进入下载页面下载并安装SRA ToolkitNCBI数据下载步骤 NCBI具有强大的功能&#xff0c;今天就sra数据下载为例进行简单的介绍 进入NCBI 百度NCBI官网&#…

jax.random.PRNGKey创建伪随机数生成器密钥

jax.random.PRNGKey 是 JAX 库中用于创建伪随机数生成器密钥&#xff08;PRNG key&#xff09;的函数。 PRNG key 是 JAX 中用于生成伪随机数序列的关键要素&#xff0c;通过分割&#xff08;splitting&#xff09;可以生成新的 PRNG key&#xff0c;确保生成的随机数序列是不相…

PSSM矩阵(位置权重矩阵)

PSSM矩阵&#xff08;位置权重矩阵&#xff09; 定义 -参考维基百科 -同时参考这篇优秀的博客&#xff1a; http://www.nohup.cc/article/112/ 可以反映出每个位置上不同碱基出现的频率&#xff0c;矩阵每一列表示相应位置上碱基出现的频率。 构造PSSM的第一步&#xff1a;通过…

二代测序之SNV基础知识笔记总结

二代测序之SNV基础知识笔记总结 文章目录二代测序之SNV基础知识笔记总结SNV基础知识SNVsMutation vs. Variant[变异和突变]不同层次的突变DNA&#xff1a;1.编码DNA&#xff08;coding DNA&#xff09; c.2.非编码DNA&#xff08;non-coding DNA&#xff09; n.3.基因组&#x…

R语言 | 组学各类图形绘制资源

一边学习&#xff0c;一边总结&#xff0c;一边分享&#xff01; 写在前面 今天分享在GitHub中找到的教程资源&#xff0c;此教程是来自iMeta期刊及“农心生信工作室”的作品。发表在GitHub中&#xff0c;大家可以自行下载。 包含了21个图形的绘制&#xff0c;我大体看了一下…

易基因:DNA羟甲基化和TET酶在胎盘发育和妊娠结局中的作用 | 深度综述

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 胎盘是支持哺乳动物胚胎和胎儿发育所必需的临时器官。了解滋养层细胞分化和胎盘功能的分子机制可能有助于改善产科并发症的诊断和治疗。印迹基因是调控胎盘发育的基础&#xff0c;表观遗…

回顾2023,自己做了啥呢 | R语言绘图

2023年总结 2023年即将结束&#xff0c;我们即将迎来2024年。2023年&#xff0c;我们做了什么呢&#xff1f;&#xff1f;这个是个值得深思的问题…? 12月份是个快乐且痛苦时间节点。前一段时间&#xff0c;单位需要提交2023年工作总结&#xff0c;真的是憋了好久才可以下笔…

易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIP、RRBS和WGBS)| 研究综述

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 CpG密度&#xff08;CpG density&#xff09;与各种组织中的DNA甲基化相关。基因组按CpG密度分为&#xff1a;CpG岛&#xff08;CpG island&#xff0c;CGI&#xff09;、CpG岛上下游2kb…

易基因:动脉粥样硬化中的DNA甲基化和组蛋白修饰及其表观遗传治疗视角|综述

动脉粥样硬化&#xff08;Atherosclerosis, as&#xff09;是一种以动脉血管壁炎症和斑块积聚为特征的血管病变&#xff0c;是大多数心血管疾病的重要病因。除了脂质沉积和慢性炎症外&#xff0c;越来越多的证据表明表观遗传修饰与动脉粥样硬化越来越相关&#xff0c;并从治疗和…

Biopython序列比对

从InterPro网站&#xff08;https://www.ebi.ac.uk/interpro/download/Pfam/&#xff09;下载多序列比对文件Pfam-A.seed.gz&#xff08;含多个多序列比对&#xff09; ​wget https://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.seed.gz解压&#xff0c;取第一…

易基因:NAR:RCMS编辑系统在特定细胞RNA位点的靶向m5C甲基化和去甲基化研究|项目文章

喜讯&#xff01;易基因表观转录组学RNA-BS技术服务见刊《核酸研究》 大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 2024年2月15日&#xff0c;吉林大学张涛、赵飞宇、李金泽为共同第一作者&#xff0c;吉林大学李占军、隋婷婷及赖良…

医学生考研考博太卷,一篇文章轻松助力上岸(一)

考研考博太卷了&#xff0c;卷不过&#xff0c;想没想过本科发一篇文章呢&#xff1f; 330分考研人淘汰390分考研人这个故事&#xff0c;大家应该都知道吧。 本专栏带你六个月内&#xff0c;搞定一篇文章&#xff0c;本科生发文章也很容易。 在卷考研的同时&#xff0c;再卷…

构建每个聚类的profile和deletion_mean特征

通过summarize_clusters函数构建每个聚类的protein[cluster_profile]和protein[cluster_deletion_mean]特征。目的是把extra_msa信息反映到msa中。 集成函数数据处理流程&#xff1a; sample_msa ->make_masked_msa -> nearest_neighbor_clusters -> summarize_clu…

易基因:DNA甲基化和转录组分析揭示野生草莓干旱胁迫分子调控机制|植物抗逆

大家好&#xff0c;这里专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 干旱胁迫是对农业生产产生不利影响的关键环境因素。为此&#xff0c;植物发展出各种响应机制&#xff08;干旱逃逸、避免、耐受和回复&#xff09;&#xff0c;以通过进化增强抗旱性&#…

专栏十五:omicverse在单细胞分析中的实际使用体验和小改动

写一些自己的理解吧,一些小步骤,正在更新中。。。 安装 原作者写的很清楚了 大部分直接抄 个别地方:去选择下载适合自己的pytorch版本PyTorch, 比如我的是cuda12,下载命令实际是 pip3 install torch torchvision torchaudio 查看cuda版本命令 nvidia-smi 当然还有个命…

R语言绘制桑基图教程

原文链接&#xff1a;R语言绘制桑基图教程 写在前面 在昨天3月10日&#xff0c;我们在知乎、B站等分享了功能富集桑基气泡图的绘制教程。相关链接&#xff1a;NC|高颜值功能富集桑基气泡图&#xff0c;桑基气泡组合图。 确实&#xff0c;目前这个图在文章中出现的频率相对比较…

一篇五分生信临床模型预测文章代码复现——Figure 8 生存曲线鲁棒性分析

之前讲过临床模型预测的专栏,但那只是基础版本,下面我们以自噬相关基因为例子,模仿一篇五分文章,将图和代码复现出来,学会本专栏课程,可以具备发一篇五分左右文章的水平: 本专栏目录如下: Figure 1:差异表达基因及预后基因筛选(图片仅供参考) Figure 2. 生存分析,…

易基因:人类大脑的单细胞DNA甲基化和3D基因组结构|Science

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 高通通量表观基因组分析技术可用于阐明大脑中细胞复杂性的基因调控程序。5-甲基胞嘧啶 (5mCs)是哺乳动物基因组中最常见的修饰碱基&#xff0c;大多数5mCs发生在胞嘧啶-鸟嘌呤二核苷酸&a…

【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 读取数据集2. 质量控制&#xff08;可选&#xff09;3. 基于距离的亲和力矩阵4. 绘制基因表达的Heatmap5. 基于皮尔逊相关系数的亲和力矩阵6. 代码整合 一、实验介绍 计算亲和力…

易基因:MeRIP-seq等揭示m6A reader YTHDF1在结直肠癌PD-1免疫治疗中的作|Gut

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 结直肠癌&#xff08;colorectal cancer &#xff0c;CRC&#xff09;是全球最常见的癌症之一&#xff0c;转移性CRC患者的5年生存率低于20%。免疫检查点阻断&#xff08;Immune checkpo…

C#,生信软件实践(01)——序列文件(如FASTA)合并工具的源代码

1 生物信息学简介 生物信息学&#xff08;BioInformatics&#xff09;是研究生物信息的采集、处理、存储、传播&#xff0c;分析和解释等各方面的学科&#xff0c;也是随着生命科学和计算机科学的迅猛发展&#xff0c;生命科学和计算机科学相结合形成的一门新学科。它通过综合…

项目文章 | 总石油烃-重金属污染与土壤微生态系统:细菌多样性、组装和生态功能研究

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组许科研服务的易基因。 2023年9月30日&#xff0c;中南大学张杜博士为第一作者、李骞教授为通讯作者在《Chemosphere》杂志上发表题为“Effects of single and combined contamination of total petroleum hydr…

易基因:禾本科植物群落的病毒组丰度/组成与人为管理/植物多样性变化的相关性 | 宏病毒组

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 现代农业通过简化生态系统、引入新宿主物种和减少作物遗传多样性来影响植物病毒的出现。因此&#xff0c;更好理解农业生态中种植和未种植群落中的病毒分布&#xff0c;以及它们之间的病…

Aspera和Aspera_cli软件的安装和使用

Aspera和Aspera_cli软件的安装和使用 Aspera和Aspera_cli软件NCBI数据库和EBI-ENA数据库的下载用户和地址信息1. ASpera 4.X.X1.1 ASpera 4.X.X安装1.2 ASpera 4.X.X密钥文件1.3 ASpera 4.X.X简单使用 2. ASpera 3.X.X2.1 ASpera 3.X.X安装2.2 ASpera 3.X.X密钥文件2.3 ASpera …

让ChatGPT给你写代码????

原文链接&#xff1a;使用ChatGPT写代码靠谱吗&#xff1f; 写在前面 对于ChatGPT从我们“惊讶”到现在已经快一年多了&#xff0c;但是&#xff0c;对于个人来说&#xff0c;使用还是比较少的。更确切的来说&#xff0c;也许有些同学是没有使用过。 ChatGPT功能确实比较强大…

C#,生信软件实践(06)——DNA数据库GenBank文件的详解介绍及解释器之完整C#源代码

1 GenBank 1.1 NCBI——美国国家生物技术信息中心&#xff08;美国国立生物技术信息中心&#xff09; NCBI&#xff08;美国国立生物技术信息中心&#xff09;是在NIH的国立医学图书馆&#xff08;NLM&#xff09;的一个分支。它的使命包括四项任务&#xff1a;1. 建立关于分…

使用R语言包clusterProfiler做KEGG富集分析时出现的错误及解决方法

使用enrichKEGG做通路富集分析时&#xff0c;一直报错&#xff1a;显示No gene can be mapped....k <- enrichKEGG(gene gene, organism "hsa", pvalueCutoff 1, qvalueCutoff 1)但是之前用同样的基因做分析是能够成功地富集到通路&#xff0c;即便是网上的数据…