:台球博士 第四章 科研日常( ..)陈峰做的医学图像处理领域的数据集少得可怜,这个很容易理解,跟医药相关的数据大多都是各大医院的机密,论文作者不会轻易公开。也就是因为陈峰的导师跟花城市第一人民医院有项目合作,所以才能拿到部分相关数据。但拿到数据只是个开始,还需要陈峰自己进行数据处理。
凌志就没这么幸运了,他的研究方向跟社交媒体中的舆情分析有关,具体而言就是找出社交网络中的水军,也就是属于同一个现实世界的人类的不同账号。他们通过多个账号发布垃圾评论扰乱社交网络秩序为乐,甚至有的商业机构会专门雇佣水军发表负面言论攻击竞争对手,影响十分恶劣。但水军自然不会告诉你自己是水军,而且社交网络的数据大多都很敏感,很少有人专门整理,所以这样的数据集很难弄到。凌志在过去一年的时间里在数据集上花费了大量的时间,目前他所用的比较好的办法是将同一个人发布的推文分成2份,假装是2个账号发布的,虽然不够真实,但从做实验的角度看足够了。
凌志并不觉得有数据集和没有数据集这两种情况孰优孰劣,但凌志相信一句话,只要你付出,虽然不一定成功,但一定会有收获。虽然凌志在科研上进展缓慢,但采集社交网络数据的过程让他掌握了数据采集、数据分析以及数据预处理等多项技能。虽然算不上是处理数据领域的专家,但也算是积累了丰富的经验。
“唉,话虽这么说,但是内心还是很痛苦的呀,老哥。我自己觉得效果差不多了,但是我导并不放过我啊。”
“那算你倒霉,不过既然你导不满意,目前来看也只能在数据处理上再下下功夫了啊。”
“只能这样了,我回去再挑一挑数据,看看有没有不干净的。”
“那你努力,需要帮忙跟我说一声。”
“行,没问题。那我先走了,拜拜。”
“拜拜。”
陈峰去了学院楼五楼,而凌志的实验室在二楼,所以陈峰坐电梯上去,而凌志直接开11路走楼梯上去了。
时间还早,实验室只来了一个人,周敏师兄。
周敏师兄比自己大1届,预计明年毕业。研究方向是导师王海波的老本行,多目标车辆路径优化问题。老王在这个领域深耕了多年,发表多篇论文。底下弟子也带过很多届了,一开始都是做这个方向。而从周敏师兄这一届开始,老王幡然醒悟,想要带领部分学生在其他研究领域开荒,所以就有了凌志现在的研究方向。
凌志并没有觉得有什么不好,做老王的老本行也不见得万事轻松,你的每一个实验细节不到位都可能会遭受到王导的火眼金睛。开荒虽然也有开荒的难处,但是胜在能学到更多新知识,也有一定自由度。这里的自由度并不是说随意地编造实验结果,这属于学术造假,凌志是不会干这种事的。实际上说的是你数据采集的量,处理到的程度,代码的参数设置等。而当你用自己采集到的数据集以及自己编写的代码跑出一个不错的实验结果时,即便这个实验再简单,你也会有无与伦比的成就感。所以凌志对于自己的现状非常满足。
“早啊,周敏师兄。”
“早。”
边说着,师兄打了一个大大的哈欠。凌志也没在意,坐到自己的座位上,打开电脑,准备将一篇跟词向量相关的文章打印出来仔细看看。实验室配备有一台专门的打印机,凌志拷好论文之后拿到打印机旁边那台电脑上插进去,可过了半天也没读出来盘。
“不对啊,应该不是我u盘坏了啊。”
凌志不知道哪里出了问题。
“师兄,打印机旁边这条电脑坏了吗?怎么读不出来我的u盘?”
凌志问道。
“哦,那台啊,我刚刚也想打印来着,也读不出来盘,我猜应该是卡住了吧。”
“哦,这样啊,那为什么不重启一下?”
“因为我想起你小欣师姐说她在跑一个多线程程序,需要用到咱们实验室平时闲置不怎么用的电脑的cpu来运算。我猜她应该是用到了那台电脑吧,等你师姐来了我问问她。”
“哦哦,怪不得。”
凌志按住键盘上的“ctrl+shift+esc”,想打开任务管理器看看资源占用情况,结果电脑卡的连任务管理器也打不开。
凌志长叹一声,师姐跑个程序也太难了,多线程跑程序都这么卡。
默默替师姐默哀之后,凌志回到自己的位置,准备在电脑上看论文。虽然有点伤眼睛,但问题也不是太大。
过了一会儿,凌志大概已经掌握了论文的核心思想。于是创建了一个ppt文档,准备做个ppt,明天组会分享一下这篇论文。
这时候实验室已经来了一部分人了,凌志这个时候也想休息一下,顺便去倒杯水。这时候,小欣师姐刚好过来了。
“唉,小欣,你是不是在打印机那台电脑上跑了程序啊,那台电脑太卡了,我们都打印不了东西了,要不你看看程序跑得怎么样了?”
师姐叫张小欣,跟周敏师兄做的是同一个研究方向。
“啊!对不起对不起,都卡成这样了吗,我马上去看。”