1. 本地文件传到linux服务器
用命令行操作

-P是端口,ubuntu是服务器名,

ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5代表“服务器用户名@服务器ip地址:上传目的路径”

scp -P 7022 yolov5.zip ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5

2. 本地文件夹传到linux服务器

scp -P 7022 -r 文件夹名绝对路径 ubuntu@ip:/home/ubuntu/ai/projects/cv/yolo/yolov5

3. 解压zip文件

unzip yolov5.zip

4. 当前文件夹查看

pwd

5. 下一级目录

cd 文件夹名称

6. 上一级目录

cd ..

7. 上一级上一级目录

cd ../..

8. 返回根目录

cd或者cd ~

9. 打开当前文件夹下的文件

小文件:cat **.**(文件名加后缀名称);终止命令:ctrl+C

大文件: less **.**(文件名加后缀名称);终止命令: Q ;在打开的文件查找某个信息 :/**(查找的字段);如果想看查找内容对应的行号运用less -N     **.**(文件名加后缀名称); 如果想看查找内容对应的行号不换行运用less -N     -S 11**.**(文件名加后缀名称)

10. 清除目前窗口的所有代码

CTRL+L

11. 不需要看文件里的全部内容,只是大致看一下里面的内容

head **.**(文件名加后缀名称):查看前十行;如果想看前面3行,head -n 3 **.**(文件名加后缀名称);如果想将前三行保存成新的fasta文件,head -n 3 **.** > head3.**,如果想要对head3.**进行重新赋值,tail -n 3 **.** > head3.**,如果想要对head3.**进行增加赋值,tail -n 3 **.** >> head3.**,

tail **.**(文件名加后缀名称):查看末尾十行

12. 去除第400-500行

head -n 500 atha.gff > temp.gff
tail -n 101 temp.gff > subset.gff
rm temp.gff

上面的使用管道: head -n 500 atha.gff|tail -n 101 > subset.gff

13. 查看文件中有多少条序列

grep ">"  **.**|wc

grep -c  ">"  **.**

14. 

-a 显示隐藏文件,隐藏文件形式是以.开头的文件

在 ls -h 命令中,-h 是一个常用选项,它的含义是 "human-readable"(人类可读的)

15. 去除文件中的重复序列

grep ">"  **.**|sort |uniq 

sort进行排序

uniq进行去重复,只是把相邻的去重复

16. |wc含义

在 Linux/Unix 命令中,|wc 表示将前一个命令的输出通过管道(|)传递给 wc 命令进行处理。

wc 是 "word count" 的缩写,主要用于统计文本内容的工具,默认会输出三个数值:

  1. 行数(lines)
  2. 单词数(words)
  3. 字节数(bytes)

17.  vim编辑

打开文件:vi   **.**

这个界面删除 DD; 撤销U;

要想修改需要输入i,修改结束退出Esc

要想保存输入     :wq(保存并退出);

要想不保存退出输入    :q!

想要替换文件中输入  :s/替换字段/替换后字段(只替换目前光标后面的第一个该字段)

s/替换字段/替换后字段/g(替换目前光标所在行的所有该字段)

%s/替换字段/替换后字段/g(替换该文件的所有该字段)

18. 修改文件名称

mv a.**  b.**

19. 压缩/解压缩文件

压缩:   gzip **.**;

解压缩:  gunzip **.**;

多个文件打包: tar -c -f all.tar *.fasta;多个文件打包并压缩: tar -c -z -f all.tar.gz *.fasta;多个文件打包并压缩以及显示进度条: tar -c -z -v -f all.tar.gz *.fasta(可简写成tar -czvf all.tar.gz*.fasta, 其中除了f不可以换位置外,其余均可以换位置);

tar(打包解包);c(打包):f(打包文件名称);

rm *.fasta  删除所有的fasta文件;

解包: tar -c -f all.tar;  解包并: tar -c -f all.tar;

20. 新建文件夹

mkdir 文件夹名称

21. 环境变量配置

只对当前有用,重启后还是找不到

export PATH=$PATH:/home/visual/software/fastqc_v0.12.1/FastQC/(该程序的绝对路径)
export PATH=$PATH:/home/peiruili/software/fastqc_v0.12.1/FastQC

想要每次重启都可以找到

vi .bashrc

在打开的文件最下面添加export PATH=$PATH:/home/peiruili/software/fastqc_v0.12.1/FastQC并保存(:wq)退出;然后source .bashrc

22. 程序运行代码

/home/peiruili/software/fastqc_v0.12.1/FastQC/fastqc(绝对位置/程序名称)

23. 执行程序后出现

Permission denied,代表没有权限

增加权限代码:chmod u+x 程序名称

24. 查看所有的环境变量路径

echo $PATH

25. miniconda3在ubantu中安装

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

bash Miniconda3-latest-Linux-x86_64.sh

当conda激活前面出现(base);想要去除使用命令conda deactivate;想要再次激活,运用命令conda activate
 

26. conda安装fastqc

vi .condarc(新建.condarc文件,里面输入如下字段

channels:

 - bioconda

 - conda-forge

 - r

 - defaults)

conda search  fastqc

conda install fastqc=0.12.1

27. ubantu忘记登录密码操作方法

28. vim查看文件中fi语法

29. 拷贝

cp **.**  **.**

拷贝某个文件到当前目录下

cp /home/pei/workspace/rnaseq-apple-training/linux-basic/DATA/atha.fasta ./

拷贝某个文件到当前目录下并重新命名

cp /home/pei/workspace/rnaseq-apple-training/linux-basic/DATA/atha.fasta ./**.fasta

30. 使用less -S atha.fasta打开文件查找数据时,如果找不到,可以Q退出,再次执行该代码并查找(怀疑可能如果你查找的在光标上面,它会显示找不到)

31. 多个文件合并并保存成新的文件

cat gmax.fasta atha.fasta sind.fasta >all.fasta

32. 查看文件绝对位置

which **.**

33. 第一步:blast数据库的构建

makeblastdb -dbtype prot -in all.fasta -out all

-dbtype prot蛋白数据库

-in all.fasta输入文件名

-out all输出文件名

第二步:blast比对

blastp -query query.fasta -db all -out blast.out -evalue 1e-10 -outfmt 7
-query query.fasta输入目标文件

-db all输入目标文件对应的数据库

-out blast.out输出文件

-outfmt 7输出的形式

第三步:过滤结果

grep -v "#" blast.out |less -S
将blast.out文件中的含有“#”的行去除

awk '$3>50 && $11<1e-30' blast2.out >blast3.out

过滤序列比对>50,evalue<1e-10的结果并保存到blast3.out

awk '{print $2}' blast3.out(与上面的代码合并为awk '$3>50 && $11<1e-30 {print $2}' blast2.out >blast3.out)

将blast3.out文件中的第二列过滤出来

sort blast3.out |uniq

去除重复名称

以上文件全部合并如下:

grep -v "#" blast.out |awk '$3>50 && $11<1e-30 {print $2}' |sort|uniq >protein_ids.txt

第四步:提取蛋白序列

seqtk subseq all.fasta protein_ids.txt >result.fasta

34. 日志

run.sh文件中的代码需要跟使用的代码一致,不一致会出现问题

标准应该是:sh run.sh 1>run.log 2>run.err
实际正常以及报错的均放入:sh run.sh 1>run.log 2>&1

将该程序放入后台执行:nohup sh run.sh 1>run.log 2>&1 &

进度查看: htop  -u 用户名

35. less -S进行缩写

alias le='less -S'

alias重新启动就不可用了,需要设置环境变量vi .bashrc,在最下面输入alias le='less -S',退出后强制更新.bashrc文件

36. ll简写在ubuntu中已经定义,在debian中没有,需要自己添加

alias ll='ls -alF'


 


 

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐