计算机常用工具汇总
打算开一个新的专栏,写一些计算机和读写论文必学的东西我会假设你什么也没学过,实际上你也并不需要专门去精通一门技术,短时间内成为一名科研民工要求没有那么高,特别是在ai已经到处都是的情况下,起码快速上手能够解决你很多的困惑,这在没有ai的时代的古法科研是难以想象的,算是时代的便利了如果找工作可能会有另外的要求,暂且不论,他们的需求是不一样的,对你的考核地方也不太一样,因此本文在这方面的意义就没有那么
打算开一个新的专栏,写一些计算机和读写论文必学的东西
我会假设你什么也没学过,实际上你也并不需要专门去精通一门技术,短时间内成为一名科研民工要求没有那么高,特别是在ai已经到处都是的情况下,起码快速上手能够解决你很多的困惑,这在没有ai的时代的古法科研是难以想象的,算是时代的便利了
如果找工作可能会有另外的要求,暂且不论,他们的需求是不一样的,对你的考核地方也不太一样,因此本文在这方面的意义就没有那么明显
机场
你绕不开这个,偏偏在这又没法讲。最靠谱的方法自然是找组里的师兄师姐或者同学分享一下,常规价格在几块到一两百一年,太高怕卷钱跑路,太低怕不稳定——这玩意跑路是常态,自行解决,后面很多东西都用得上,这个谁也帮不了你,这都找不明白说明你缺乏基本的“探索”精神,还得练
论文搜索
读文献,领悟论文思想占科研民工工作时间的很大一部分,师兄师姐会敦促你多读高质量顶刊顶会上。在入门阶段你了解本领域的主要手段就是读论文,把经典的重要方法学会,把近两三年的研究方法看个大概,这样才能算入门,起码看得懂别人的工作大概在干什么
如果熟练了,那你了解最新款论文并产生idea的方式就可能变成公众号,arxiv等的介绍了
(众所周知,人工智能三大《顶刊》是新智元,量子位,机器之心 doge)
中文期刊肯定是查知网和万方,如果甚至不能再这个上发刊的,那么借鉴效果实在有限,不建议耗费过多时间阅读

英文论文主要分领域:
计算机科学主要领域顶刊(按领域分类)
-
人工智能 & 机器学习
- IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)
- Journal of Machine Learning Research (JMLR)
- Neural Computation
- IEEE Transactions on Neural Networks and Learning Systems (TNNLS)
-
计算机视觉
- IEEE Transactions on Computer Vision and Pattern Recognition (TCVPR)
- International Journal of Computer Vision (IJCV)
-
自然语言处理
- Computational Linguistics (CL)
- Transactions of the Association for Computational Linguistics (TACL)
-
数据挖掘 & 数据库
- IEEE Transactions on Knowledge and Data Engineering (TKDE)
- ACM Transactions on Database Systems (TODS)
- Data Mining and Knowledge Discovery (DMKD)
-
网络安全 & 密码学
- IEEE Transactions on Information Forensics and Security (TIFS)
- Journal of Cryptology
- ACM Transactions on Privacy and Security (TOPS)
-
计算机网络
- IEEE/ACM Transactions on Networking (TON)
- IEEE Transactions on Mobile Computing (TMC)
- IEEE Transactions on Networking and Service Management (TNSM)
-
软件工程
- IEEE Transactions on Software Engineering (TSE)
- ACM Transactions on Software Engineering and Methodology (TOSEM)
- Empirical Software Engineering (EMSE)
-
理论计算机科学
- Journal of the ACM (JACM)
- SIAM Journal on Computing (SICOMP)
- ACM Transactions on Computation Theory (TOCT)
-
高性能计算
- IEEE Transactions on Parallel and Distributed Systems (TPDS)
- Journal of Parallel and Distributed Computing (JPDC)
CSdiy中推荐的信息来源:

不过他这博客起点有点高,不建议随意模仿,他这个英语要求就高的一笔,虽然浏览器有自动翻译功能,但终究会差点意思
我推荐这么个方式:
0,全程需要ai参与,让他给你讲一讲本领域有哪些适合的课程,或者应该学习那些前置知识。我并不认为新手有能力一头扎进去,但是完全不懂总不是一件好事,借助这个了解一些基本概念能让你兜兜转转。任何不熟悉的概念都可以直接让ai给你解释,一定要多询问,抛开可能的幻觉问题,ai是除了你在网上搜索资料以外最好的老师了。不过你应该学会一些交叉验证的过程,保证自己学的不是假知识
1,知乎+csdn+b站搜索关键词,找些基础学习路线等(小红书比较奇特,它适合学习很基础的python等,以及看大佬分享前沿的领域,但是具体学习帮助不是特别大)
2,知网搜索硕博论文,这个阶段的论文略微有点水,比不了顶刊但是基本够你学一下别人怎么用。可以研究一下他们的方法部分,为了凑字数这部分的图片和公式写的会比较详细,我当时很多不熟悉的领域都是看这些学的
3,如果需要高质量一些的博客,可以去github等搜索,搜索的方式一般是XXX具体关键词(英文)-开启网页翻译,网页翻译不明白再转会原文琢磨一下
4,开始阅读本领域高质量经典论文和前沿顶刊。这些就需要结合ai工具慢慢琢磨了,网上可能有讲解论文的一些博客,大部分不会太详细,理由是这些论文已经是很详细的领域了,学到这里的博主很多都默认你已经有了一定的水平,他们写的更多是自己可能不太理解的地方,与你的知识可能并不完全重合,因此如果读的不太明白显然不一定是你自己的问题,不必过多自责。你可以试着在评论区问问作者,但是更靠谱的方式还是直接问问导师或者师兄。
如果不熟悉看什么论文好,建议多请教组里的大佬们,多开口问问胜过自己瞎琢磨半天
一些信息检索必备的:
https://csdiy.wiki/%E5%BF%85%E5%AD%A6%E5%B7%A5%E5%85%B7/%E4%BF%A1%E6%81%AF%E6%A3%80%E7%B4%A2/#github
笔记
读论文或者博客不太可能一点笔记都不做,我这里推荐的方式都是很懒的,做笔记的目的是自己理解知识,排版/美观什么的都是其次。因此学习博主喜欢推荐一堆花里胡哨的工具,我只推荐几个必须的:
1,obsidian
2,overleaf
3,豆包
4,gpt/grok
在这里强调,豆包并不是最好用的ai,它非常倔,能把你气的吐血。放在这里是因为它功能比较齐,打开pdf并翻译英文文献,读取论文中的公式/图片并分析含义,以及多篇论文比较,边读论文和slide边做笔记之类的都能做到。
4的GPT和Grok同理,获取门槛低,够用,仅此而已
obsidian和豆包结合起来是因为,obsidian适合分门别类建立笔记库,管理pdf和md格式文件,二豆包输出的也基本是md文件
md如何操作并不是我们关注的重点,在绝大多数情况下你也不可能花很多时间去做格式整理,这种杂活交给豆包做就行。它之所以好用是因为格式限制远不如latex严格(大多数文本类笔记也不需要那么高深的要求)并且复制粘贴能同步在csdn/知乎等网站上
这个学习成本极低,一小时内边复制边学习掌握绰绰有余。他的数学公式部分基本兼容latex,这个对于word等来说也是巨大的利好,因为你把md复制到word后也可以按alt和+号键快速变换,省去敲公式的很多时间
虽然ai好用,但是我有必要加粗强调,做出了笔记不等于你学会了,能把自己学的东西无障碍讲给别人听(起码让人听懂八成)才算你学会了。ai做出笔记不能无脑粘贴,自己读懂了吗?自己不看稿子能讲出来吗?ai只是省去你自己敲键盘的步骤,没有办法帮你思考,切勿沉浸在记笔记的快乐中。
更重要的是,像数学公式这一类需要耗费一定精力才能学明白的,有能力最好自己手写一遍——实际上很多数院的课程老师都会直接板书,这并不是不愿意拥抱变化,而是因为带着你手动推导一遍且你自己跟得上了,这才是学习最快的方式
上述所有的文字都不是ai写的,我虽然博客中很喜欢用ai帮忙写偷懒,但这些最关键的东西并不希望读者忽略掉。
这个看懂了会做笔记了就简单很多了,grok和gpt起到一个交叉验证的作用。你甚至可以用ai写个提示词,交给另一个ai来完成工作
并且相看两相厌,一个ai用久了你会觉得它变笨,这并不是错觉,跳着用起码不会让你血压狂飙
latex则是用来写用于大作业/投稿论文/beamer的,主要好处是不用自己反复调整每一个字的格式。写过本科课设的都知道这是一件很恶心人的事。这是广大的大佬提供的latex,可以自己学着用overleaf编辑一下。为了训练读者的能力,我不打算放教程在这里,可以自己琢磨一下
https://github.com/Ian-Jhon/GZHU_Thesis_Latex_Template
overleaf的学习成本比md高一大截,但有了ai这并不是不可接受的
ai+overleaf自动编辑可以省去很多配环境的麻烦
beamer是latex版的ppt,不过说实在的,通用模板并不适合很多的计算机领域,相反,它更适合数学等对模式图等要求比较低而需要写很多公式的部分
考虑到广州大学并没有好心人做beamer,大家大多用的学校的学长学姐发的模板。我自己写过一个beamer,拿经典模板改的。但是反馈不太行,普遍评论是非常丑,我打算有空好好打磨打磨,到时候发一个,敬请期待
论文跑通
github要学会的东西其实没有那么多,工作的话可能需要团队协作,搞模块和分支管理等。但是读论文浮现试验需要考虑的就没有那么多了
最简单粗暴的,找到项目,右上角code-download,选择下载zip,根据md进行环境配置
稍微需要操作一点的,配置docker,fork项目并配置到本地,尝试运行。知乎和b站都有非常详细的教程,自行搜索完全足以解决问题,直接搜github即可
在此需要黑字强调:
强者改变环境,智者适应环境
如果你水平不高,那么你就应该找公开代码,fork和star多的项目,找那种个位数star或者不公开的论文实在自找苦吃
如果论文发表时间过早,使用的技术很老,比如python2.xu或者tensorflow1.x系列,改成更靠近当前的代码所需工作不亚于重新写一份新的——甚至可能更多,不要高估自己和ai的水平
最最重要的一点,即使你能跑也不一定能复现效果。受制于设备/环境等,换一下各种参数等有几个点的波动是正常的。为了刷高几个点需要做的一些表面工作可能超出你的想象
深度学习顶会,为什么公开数据集,代码,也跑不出论文的结果? - Cv大法代码酱的回答 - 知乎
https://www.zhihu.com/question/621649777/answer/1975241661262078767

虽然很多情况下这并不是你自己的问题,但是如果你积极求教都没有办法解决,这说明继续研究下去的意义可能没有那么大了,有些作者比你自己还怕论文被复现出来——我的建议是情愿目空一切相信自己而不是怀疑自己的水平,前提是你用claude,cusor等水平较高的代码工具都无法分析出错误来源,或者实在结局不出来的情况下。不要狂妄自大,但更不应该妄自菲薄
代码基础
这方面反而是放在很后面讲的,理由很简单,ai能解决你的大部分问题,不需要现场学习到精通。
我只讲一些基础的:
无论是何种语言,写出来语言到能顺利运行,中间需要配置各种环境以及所需要的包等,由于历史原因,很多包本身是相互冲突的,解决这些包冲突等所需要的时间反而会长的超乎想象,尤其代码被开发者有意或者无意设计的很复杂的时候
配置环境是第一步,也是足以拦住很多人的一步,理由是很多需要在linux上运行,或者虚拟机,对于不熟悉的人来说会产生恐惧心理
其次,无论如何不能迷信ai
据我研究体验,ai设计函数和代码超过三四百行的水平就会急速下降,像trae和混元等ai软件的确能几行要求就给你批量生成大量代码,但你放心用吗?它们犯的错可能会很隐蔽,但是会让i非常抓狂
一个很理想的方式是让它按照严格的代码规范给你开发函数,然后你自己将函数的功能写进提示词,让他帮你缝合,然后你基于已有功能写出一些测试函数来看是否能够正常运行
我朋友在一个小公司板砖,主要业务是写交易脚本,通常任务也就千八百行的代码,但是即使这样的脚本要完成依旧需要有专业背景知识的员工研究一两天才能琢磨出来,如果真的只要ai就能完成任务这些人早就失业了。
水论文本质上也是与他们的工作没有区别,把自己的思想研究成脚本出来,在数据集上刷个高分,让老板和员工满意,一手交钱一手交货,完事
我推荐个简单的工具:trae,字节旗下的ide,不太复杂的任务都能完成
复杂的任务也不太可能随随便便交给你来完成,就得多个ai协助了
杂七杂八
写到这里其实差不多了,不利用ai自己慢慢琢磨会浪费不少时间,只靠ai则不太可能学到有用的东西,这个道理希望大家都懂
因此,我决定写点代码之外的东西,代码本身需要学的反而在本片中不是很重要
https://csdiy.wiki/%E5%BF%85%E5%AD%A6%E5%B7%A5%E5%85%B7/%E4%BF%A1%E6%81%AF%E6%A3%80%E7%B4%A2/#_9
csdiy中推荐的工具非常多,但实际上我只推荐这个,小白最需要的还是信息检索的能力
https://csdiy.wiki/%E5%BF%85%E5%AD%A6%E5%B7%A5%E5%85%B7/tools/
这里面最推荐的还是zlib,搜索pdf的神器
当然我还有一个门路,那就是百度贴吧,真正的冷门集合处——前提是你要足够诚心,态度诚恳端正。小红书和抖音也能做到这种功能,但是显然没有这么好用
至于这里面的scripts,cmake等,我的评价是,对于ai方面python居多的小伙伴来说,绕开了大部分工作的你面向ai写python就已经能完成绝大多数工作了
在写这个之前,我也曾啥也不会(虽然现在也是)但是这些应该能基本能满足你作为零基础小白上手所需的任务和工作了,希望我的博客对你们有帮助
我写的不是非常全,后面争取继续补充!
更多推荐

所有评论(0)