linux基本操作
ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5代表“服务器用户名@服务器ip地址:上传目的路径”-P是端口,ubuntu是服务器名,1. 本地文件传到linux服务器。2. 解压zip文件。
1. 本地文件传到linux服务器
用命令行操作
-P是端口,ubuntu是服务器名,
ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5代表“服务器用户名@服务器ip地址:上传目的路径”
scp -P 7022 yolov5.zip ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5
2. 本地文件夹传到linux服务器
scp -P 7022 -r 文件夹名绝对路径 ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5
3. 解压zip文件
unzip yolov5.zip
4. 当前文件夹查看
pwd
5. 下一级目录
cd 文件夹名称
6. 上一级目录
cd ..
7. 上一级上一级目录
cd ../..
8. 返回根目录
cd或者cd ~
9. 打开当前文件夹下的文件
小文件:cat **.**(文件名加后缀名称);终止命令:ctrl+C
大文件: less **.**(文件名加后缀名称);终止命令: Q ;在打开的文件查找某个信息 :/**(查找的字段);如果想看查找内容对应的行号运用less -N **.**(文件名加后缀名称); 如果想看查找内容对应的行号不换行运用less -N -S 11**.**(文件名加后缀名称)
10. 清除目前窗口的所有代码
CTRL+L
11. 不需要看文件里的全部内容,只是大致看一下里面的内容
head **.**(文件名加后缀名称):查看前十行;如果想看前面3行,head -n 3 **.**(文件名加后缀名称);如果想将前三行保存成新的fasta文件,head -n 3 **.** > head3.**,如果想要对head3.**进行重新赋值,tail -n 3 **.** > head3.**,如果想要对head3.**进行增加赋值,tail -n 3 **.** >> head3.**,
tail **.**(文件名加后缀名称):查看末尾十行
12. 去除第400-500行
head -n 500 atha.gff > temp.gff
tail -n 101 temp.gff > subset.gff
rm temp.gff
上面的使用管道: head -n 500 atha.gff|tail -n 101 > subset.gff
13. 查看文件中有多少条序列
grep ">" **.**|wc
grep -c ">" **.**
14.
-a 显示隐藏文件,隐藏文件形式是以.开头的文件
在 ls -h 命令中,-h 是一个常用选项,它的含义是 "human-readable"(人类可读的)。

15. 去除文件中的重复序列
grep ">" **.**|sort |uniq
sort进行排序
uniq进行去重复,只是把相邻的去重复
16. |wc含义
在 Linux/Unix 命令中,|wc 表示将前一个命令的输出通过管道(|)传递给 wc 命令进行处理。
wc 是 "word count" 的缩写,主要用于统计文本内容的工具,默认会输出三个数值:
- 行数(lines)
- 单词数(words)
- 字节数(bytes)
17. vim编辑

打开文件:vi **.**
这个界面删除 DD; 撤销U;
要想修改需要输入i,修改结束退出Esc
要想保存输入 :wq(保存并退出);
要想不保存退出输入 :q!
想要替换文件中输入 :s/替换字段/替换后字段(只替换目前光标后面的第一个该字段)
s/替换字段/替换后字段/g(替换目前光标所在行的所有该字段)
%s/替换字段/替换后字段/g(替换该文件的所有该字段)
18. 修改文件名称
mv a.** b.**
19. 压缩/解压缩文件
压缩: gzip **.**;
解压缩: gunzip **.**;
多个文件打包: tar -c -f all.tar *.fasta;多个文件打包并压缩: tar -c -z -f all.tar.gz *.fasta;多个文件打包并压缩以及显示进度条: tar -c -z -v -f all.tar.gz *.fasta(可简写成tar -czvf all.tar.gz*.fasta, 其中除了f不可以换位置外,其余均可以换位置);
tar(打包解包);c(打包):f(打包文件名称);
rm *.fasta 删除所有的fasta文件;
解包: tar -c -f all.tar; 解包并: tar -c -f all.tar;
20. 新建文件夹
mkdir 文件夹名称
21. 环境变量配置
只对当前有用,重启后还是找不到
export PATH=$PATH:/home/visual/software/fastqc_v0.12.1/FastQC/(该程序的绝对路径)
export PATH=$PATH:/home/peiruili/software/fastqc_v0.12.1/FastQC
想要每次重启都可以找到
vi .bashrc
在打开的文件最下面添加export PATH=$PATH:/home/peiruili/software/fastqc_v0.12.1/FastQC并保存(:wq)退出;然后source .bashrc
22. 程序运行代码
/home/peiruili/software/fastqc_v0.12.1/FastQC/fastqc(绝对位置/程序名称)
23. 执行程序后出现
Permission denied,代表没有权限
增加权限代码:chmod u+x 程序名称
24. 查看所有的环境变量路径
echo $PATH
25. miniconda3在ubantu中安装
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
当conda激活前面出现(base);想要去除使用命令conda deactivate;想要再次激活,运用命令conda activate
26. conda安装fastqc
vi .condarc(新建.condarc文件,里面输入如下字段
channels:
- bioconda
- conda-forge
- r
- defaults)
conda search fastqc
conda install fastqc=0.12.1
27. ubantu忘记登录密码操作方法

28. vim查看文件中fi语法

29. 拷贝
cp **.** **.**
拷贝某个文件到当前目录下
cp /home/pei/workspace/rnaseq-apple-training/linux-basic/DATA/atha.fasta ./
拷贝某个文件到当前目录下并重新命名
cp /home/pei/workspace/rnaseq-apple-training/linux-basic/DATA/atha.fasta ./**.fasta
30. 使用less -S atha.fasta打开文件查找数据时,如果找不到,可以Q退出,再次执行该代码并查找(怀疑可能如果你查找的在光标上面,它会显示找不到)
31. 多个文件合并并保存成新的文件
cat gmax.fasta atha.fasta sind.fasta >all.fasta
32. 查看文件绝对位置
which **.**
33. 第一步:blast数据库的构建
makeblastdb -dbtype prot -in all.fasta -out all
-dbtype prot蛋白数据库
-in all.fasta输入文件名
-out all输出文件名
第二步:blast比对
blastp -query query.fasta -db all -out blast.out -evalue 1e-10 -outfmt 7
-query query.fasta输入目标文件
-db all输入目标文件对应的数据库
-out blast.out输出文件
-outfmt 7输出的形式
第三步:过滤结果
grep -v "#" blast.out |less -S
将blast.out文件中的含有“#”的行去除
awk '$3>50 && $11<1e-30' blast2.out >blast3.out
过滤序列比对>50,evalue<1e-10的结果并保存到blast3.out
awk '{print $2}' blast3.out(与上面的代码合并为awk '$3>50 && $11<1e-30 {print $2}' blast2.out >blast3.out)
将blast3.out文件中的第二列过滤出来
sort blast3.out |uniq
去除重复名称
以上文件全部合并如下:
grep -v "#" blast.out |awk '$3>50 && $11<1e-30 {print $2}' |sort|uniq >protein_ids.txt
第四步:提取蛋白序列
seqtk subseq all.fasta protein_ids.txt >result.fasta
34. 日志
run.sh文件中的代码需要跟使用的代码一致,不一致会出现问题
标准应该是:sh run.sh 1>run.log 2>run.err
实际正常以及报错的均放入:sh run.sh 1>run.log 2>&1
将该程序放入后台执行:nohup sh run.sh 1>run.log 2>&1 &
进度查看: htop -u 用户名
35. less -S进行缩写
alias le='less -S'
alias重新启动就不可用了,需要设置环境变量vi .bashrc,在最下面输入alias le='less -S',退出后强制更新.bashrc文件
36. ll简写在ubuntu中已经定义,在debian中没有,需要自己添加
alias ll='ls -alF'
更多推荐


所有评论(0)