生物信息学
未读
该部分内容难度不大,以蛋白质的结构为思路,关联记忆即可
主要分为蛋白质结构特征与结构数据库、蛋白质结构测定结构比对结构预测、蛋白质折叠和疾病 三大部分
第一节 蛋白质结构组织层次一、蛋白质结构
蛋白质分子结构的多样性、复杂性是功能多样性的基础
一级结构 —> 二级结构 —> 超二级结构 —> 结构域 —> 三级结构 —> 四级结构
1.1一级结构
是指多肽链的氨基酸残基的排列顺序。
蛋白质结构层次体系的基础。
决定更高层结构的主要因素。
1.2二级结构
是指多肽链主链原子借助于氢键沿一维方向排列成具有周期性的结构构象
是多肽链局部的空间结构
包括 螺旋、折叠、转角、无规卷曲
1.2.1 α螺旋
最常见、最典型、含量最丰富的结构元件。
α螺旋结构特征:
主链骨架围绕中心轴盘绕形成右手螺旋。
螺旋每上升一圈是3.6个氨基酸残基,螺距为0.54nm。
相邻螺旋圈之间形成氢键。
侧链基团位于螺旋的外侧。
不利于α螺旋形成的因素:
存在侧链基团较大的氨基酸残基。
连续存在带有相同电荷的氨基酸残基。
存在脯氨基酸残基。
1.2.2 ...
偶然看到几个Nginx视频,感觉讲的还可以,基础入门的话足够,特此整理下笔记,附上视频链接 B站GeekHour
一、Nginx 简介
目前最流行的web服务器
俄罗斯程序员Igor Sysoev开发,为了解决并发连接问题。
二、Nginx安装及基础操作2.1安装方式一、包管理器Linux:
12345sudo apt updatesudo apt install nginxnginx -V #查看nginx的信息nginx -t #查看nginx的安装位置
nginx的常见安装位置:
/etc/nginx ubuntu系统
/usr/local/etc/nginx
/opt/homebrew/etc/nginx
Moc:
1brew install nginx
Windows:
12scoop install nginxchoco install nginx
方式二、编译安装
方式三、Docker12docker pull nginxdocker run ...
生物信息学
未读一、认识序列什么是序列序列(squence) 可以理解为 字符串(string)
Si 表示序列的第i个元素
S‘ 代表S的子序列
蛋白质序列:由20个不同的字母(氨基酸)组合而成。
核酸序列:由4个不同的字母(碱基)排列组合而成
序列常用格式:
FASTA格式
第一行:大于号 + 名称 或 其他注释
第二行:每行60个字母或80个(根据需要不一定)
二、序列的相似性序列一致度和相似度前提:两个序列长度相等
一致度:两条序列对应位置上相同的残基(一个字母,氨基酸或碱基)的数目占总长度的百分数。
相似度:两条序列对应位置上相似的残基与相同的残基的数目和占总长度的百分比
什么是[残基]:氨基和羧基脱水缩合后剩余的部分
那么 哪个残基与哪个残基算作相似呢?
可以用替换计分矩阵来计算。
三、替换记分矩阵是反应残基之间互相替换率的矩阵,它描述了残基两两相似的量化关系,分为DNA替换记分矩阵和蛋白质替换记分矩阵
3.1常见DNA序列的替换记分矩阵
等价矩阵
相同和核苷酸之间的匹配得分为1分,不同核苷酸间的替换得分为0。
实际的序列比较中较少使用
转换-颠换矩阵:
嘌 ...
生物信息学
未读生物数据库简介什么是数据库
是一类用于存储和管理数据的计算机文档
是统一管理的相关数据的集合
数据库的类型目前为止,生物学数据库使用了4种不同的数据库结构类型,分别是:
平面文件
关系型数据库
面向对象数据库
基于Internet平台的XML
生物学数据库在生物信息学者们的努力下,人类基因组序列数据连同其他多种模式生物的序列数据及各种相应的基因结构与功能信息皆可供众多生物学家们免费接入和使用。
根据存放数据类型区分
序列数据库
(三维)结构数据库
文献数据库
基因组图谱数据库
表达谱数据库
等
根据存储的具体内容区分一级数据库库中主要内容来源于实验室操作所得到的原始数据,也包含一些基本的说明(序列所属的物种、类型、序列发表的文献出处等)
核酸序列数据库GenBank、EMBL、DDBJ
蛋白质数据库PDB
二级数据库
在一级数据库的基础上进行计算加工处理并增加了许多的人为注释而构成的
也可能会出现一部分误导信息,尤其是由程序自动计算得到的结果
如何查找与研究相关的生物学资源
利用公共引擎搜索
了解重要的生物信息学门户站点
利用Nucleic Acid Resear ...
计算机组成原理
未读指令系统指令(机器指令)是指计算机执行某种操作的命令,程序由一条条指令构成。
一台计算机的所有指令的集合构成了指令系统,也称指令集。
指令的基本格式
指令是一组有意义的二进制代码,一条指令通常包括操作码和地址码两部分。
指令的长度是指一条指令中包含的二进制代码位数,其长度取决于操作码长度、操作数地址码的长度和操作数地址的个数,与机器字长没有固定关系。
通常把指令长度等于机器字长的指令称为单字节指令,同理得半字长指令、双字长指令。
一个指令系统中,若所有指令的长度都是相等的,则称为定长指令字结构,反之则称为百年擦汗给你指令字结构。由于主存一般是按照字节编址的,所有指令字长多为字节的整数倍。
零地址指令只有操作码
不需要操作数的指令,如空操作指令、停机指令等。
CISC和RISC的基本概念CISC 复杂指令系统计算机特点
指令复杂庞大,指令数目一般在200条以上
指令长度不固定,指令格式多,寻址方式多
可以访存的指令不受限制
各种指令使用频度相差很大
各种指令执行时间相差很大,大多数指令需要多个时钟周期才能完成
控制器大多数使用微控制器。有些指令非常复杂,以至于无法采用硬连线控制 ...
计算机组成原理
未读计算机发展历程计算机硬件的发展
第一代计算机(1946-1957):使用电子管
第二代计算机(1958-1964):使用晶体管
第三代计算机(1965-1971):使用较小规模的集成
第四代计算机(1972-至今):使用较大规模的集成
晶体管之父:肖克利(1956年诺贝尔物理学奖得主)
1957年,”八叛徒”创立了仙童半导体1959年,仙童半导体发明了“集成电路”1968年,摩尔离开仙童,创立intel1969年,仙童销售部负责人桑德斯离开仙童,创立AMD
已经经历了4代,计算机的速度越来越快,并且体积变得越来越小。发展趋势:更微型、多用途;更巨型、超高速
摩尔定律:集成电路上的晶体管数量每18月就会翻一番,所以每18月计算机的处理效率就会提高一倍。
计算机软件的发展计算机软件技术的发展,促进计算机系统的发展。
计算机语言的发展经历了面向机器的机器语言和汇编语言、面向问题的高级语言。其中高级语言的发展真正促进了软件的发展,它经历了从科学计算和工程计算的 FORTRAN、结构化程序设计的 PASCAL到面向对象的C++和适应网络环境的Java。
同时,直接影响计算机系统性能提升的各 ...
Linux分类及软件包管理工具Linux分类一般来说linux系统基本上分两大类:
RedHat系列:Redhat、Centos、Fedora等Debian系列:Debian、Ubuntu等
RedHat 系列
常见的安装包格式 rpm包,安装rpm包的命令是“rpm -参数”
包管理工具 yum
支持tar包
Debian系列
常见的安装包格式 deb包,安装deb包的命令是“dpkg -参数”
包管理工具 apt-get
支持tar包
yumyum是RedHat系列的高级软件包管理工具
主要功能是更方便的添加/删除/更新RPM包。
它能自动解决包的依赖性问题。
它能便于管理大量系统的更新问题。
yum的特点
可以同时配置多个资源库(Repository)
简洁的配置文件(/etc/yum.conf)
自动解决增加或删除rpm包时遇到的倚赖性问题
保持与RPM数据库的一致性
yum可以用于运作rpm包,例如在CentOS/RedHat系统上对某个软件的管理
123安装:yum install <package_nam ...
深度学习
未读随着Chatgpt爆火以来,国内外各大互联网厂商纷纷开始相关的产业布局,纷纷推出自家的大模型,并规划将自己的大模型要接入自家的产品,于是乎我诞生了一个想法:我们实验室什么时候可以有自己的大模型可以接入实验室的项目,这样科技含量(含金量)岂不是可以大大增加。从头打造一个大模型无论是技术还是人力物力来说都不现实,但是最近一个多月来开源的文本大模型出现了很多,如果能将开源大模型作为预训练模型,能降低很多成本,于是乎我选择了清华大学开源的ChatGLM-6B模型,尝试部署和进行一些简单的训练。
ChatGLM-6B 是什么?ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已 ...
由于平时项目开发也一直在使用Node和Git,因此在配置的过程中相比网上的一些博客来说少了很多流程,相对比较便捷,也没有出现较大的问题。对比Gitee来说,将博客挂在Github好处就是不用进行实名认证,也不用每次提交之后手动部署一遍,之前也尝试过Gitee,感觉较为繁琐,因此最终选择了github。
现在大三,大学时光也进入了下半程。在过去两年多时间里,一直参与实验室的一些项目开发,前端、后端都学会了不少技术,但是一直没有做技术积累,有一种边学边忘的感觉。相比之下,舍友轩哥一直在坚持写博客,他自己说就是记一些笔记,但是积少成多,能坚持到现在也很厉害了。如今我也正在备战考研,在此过程中,我也想对过去的接触过的一些技术做一个回顾和总结,并且想再学习一些新技术,为可能到来的研究生生涯或者找工作做一些准备,希望自己不要因为备战考研而对一些技术遗忘殆尽。前面也提到了也学习过前端的相关技术,也做过纯前端的小项目,之所以没有选择自己写一个博客工程的原因就是觉得有点麻烦,前端样式设计、购买服务器等等相对来说成本较大,目前也没有足够的时间,hexo的基本符合我目前的需要,所以直接使用了。在众多UI主题 ...