科学家们使用的计算机变得越来越强大。但在世界上的许多地方,可靠的电力和互联网接入,更不用说超级计算能力,仍然难以捉摸。然而,研究人员还是可以做一些事情的。一些在资源有限地区有经验的科学家分享了他们的建议。

便宜的计算

拥有最先进的技术是件好事,但高昂的成本意味着这通常是不切实际的。为了最大程度地提高投资回报,计算机科学家Nicolás Wolovick和他的同事们购买他们所谓的过时一两代的“后处理”计算机部件,并将它们组装成更大的部件。Wolovick是阿根廷国立大学Córdoba的图形处理单元通用计算小组的负责人。

2017年,Wolovick的团队建立了Eulogia,这是一个用最新型号的英特尔Xeon Phi处理器构建的超级计算集群。Eulogia的峰值速度约为每秒40万亿次浮点运算(每秒40万亿次浮点运算)。沃罗维克说,这只是目前世界500强超级计算机中排名最低的成员——中国的互联网服务a——的一小部分,截至2018年11月,它的峰值性能为1817.6万亿次浮点运算,但对于许多研究任务来说已经足够了。例如,Córdoba的一个团队使用该系统模拟了天文学家认为围绕星系和其他宇宙结构的暗物质晕的旋转。

集中你的资源

当资金紧张时,集中资源是关键。这对计算机来说是真的——例如,Wolovick已经要求同事们避开个人台式电脑,转而使用联合计算集群。“大多数时候(那些台式电脑)都是闲置的,”他说。科学仪器也是如此。蒙得维的亚共和国大学乌拉圭科学高性能计算计划主任Sergio Nesmachnow说,在乌拉圭,科学家们享受着国家超级计算中心的好处以及可靠的电力和互联网接入,但科学设备——例如产生大量基因数据需要强大计算机进行分析的高通量基因组测序仪——却短缺。Nesmachnow说:“这里用于科学设备的典型资金约为1万美元。”“有这么多钱,根本不可能买到精密设备。”维护成本、服务合同和其他费用使一些仪器更加遥不可及。

Nesmachnow说,结果乌拉圭的研究小组经常把钱集中起来购买新设备、修理损坏的仪器和支付技术人员的工资。“每个群体都根据自己的能力做出贡献,以充分利用我们所拥有的稀缺资源。”

去移动

电脑价格昂贵,在一些国家,互联网连接可能时断时续。因此,津巴布韦哈拉雷理工学院信息安全和保障负责人、网络安全研究员罗伯特·罗森塔尔·肖尼瓦建议,与其购买笔记本电脑在实地工作,不如使用移动电话。

Rosenthal Shoniwa说,尽管宽带接入可能参差不齐,但“基本上每个人都有一部手机”。使用手机,即使是身处偏远地区的研究人员也可以将数据上传到互联网上。“你不需要买一整台笔记本电脑;依赖移动平台成本更低。”

对于许多任务,移动电话的功能足以在本地处理数据,而不需要将数据传输到功能更强大的远程计算机。Rosenthal Shoniwa的学生Blessing Sibanda开发了一款Android应用程序,可以分析番茄叶子的照片,帮助农民判断植物是健康还是患病,而不需要传输数据。Rosenthal Shoniwa说:“所有的处理都是在手机上完成的,在这个过程中没有使用数据连接。”

互联网创新

和世界各地的学生一样,南非的学生是寻找和利用优质公共Wi-Fi热点的专家。但在大学校园里,“Wi-Fi是垃圾”,许多学生还携带以太网电缆,“把它们插到他们能找到的以太网端口上”,南非克莱蒙德电子研究培训和咨询公司Talarify的创始人阿内尔达·范德沃特(Anelda van der Walt)说。

但她指出,建立人脉的方法不止一种。van der Walt说,在中非国家加蓬的一个研讨会上,研究人员购买了路由器和SIM卡,用他们的手机创建自己的热点。她说:“这显然成本很高。”

研究人员还可以通过USB密钥或外部硬盘驱动器传输数据。但要注意:邮寄的存储设备可能会丢失、损坏、卡在海关或只是包含错误的文件。但范德沃尔特说:“有时候没有别的办法。”

找到力量

有限的计算资源意味着处理数据可能需要几天时间。如果在这段时间内电力或互联网连接中断,这可能会产生问题,而这在世界上一些地方是很常见的。哈拉雷理工学院(Harare Institute of Technology)的大数据研究员Nyasha Thusabantu表示,如果在处理数据的过程中发生了停电,“你只能重新开始,可能会损失一两天”。

备用发电机或不间断电源会有所帮助。Rosenthal Shoniwa说,太阳能电池板也可以,他自己买了一些太阳能电池板,这样即使在停电期间他也可以在家工作。“津巴布韦一年中大部分时间阳光充足,”他说。“当地大多数人都采用了太阳能系统。”

或者研究人员可以只看当地新闻。Thusabantu指出,津巴布韦有时会提前安排停电,使研究人员能够相应地计划他们的计算工作。

开源

美国和西欧的科学家通常可以依靠可靠的互联网,但在其他地方却很少如此。“在发达国家,互联网的永远在线模式是一种非常优越的观点,”加利福尼亚旧金山the Carpentries的前会员和技术总监乔纳·杜克利斯(Jonah Duckles)说,该公司在世界各地经营科学计算研讨会。“当今世界,大多数主要的软件产品——Adobe、微软、谷歌——要么需要活跃的互联网连接,要么需要定期的家庭电话,这种以设计为基础的现代软件工具方法,加剧了互联网有限地区的数字鸿沟。”

他说,开源工具可以填补这一空白。许多闭源程序如果无法连接到公司服务器就会完全停止工作,而开源工具则可以在没有互联网连接的情况下工作。通过使用Python和R等开源编程语言,以及将他们在代码共享网站GitHub上找到的软件拼接在一起,“现在的科学家可以做大量的研究”,杜克利斯说。而且他们不需要支付昂贵的软件许可费。

利用你的社交网络

也许在资源有限的环境中,科学计算的最佳策略是利用社会网络而不是电子网络。毕竟,同事们可能会知道你忽略的资产。例如,Rafael Mayo-García是总部设在马德里的伊比利亚美洲高性能计算(HPC)网络RICAP的负责人,该网络旨在为没有HPC基础设施的拉丁美洲集团提供免费的HPC资源访问。尽管如此,许多研究人员仍然不知道这个组织以及它的工作,Mayo-García说。“经常听到科学家们没有意识到这种可能性。”

范德华特指出,在跟上新技术的步伐时,合作也被证明是必不可少的。如果南非的研究人员缺乏相关的超级计算机经验,并且在自己的机构中找不到可以合作的人,他们通常可以在其他地方找到具有所需经验和资源的合作伙伴。“关键是不要被吓住,”她说。

最后,Duckles说,“你必须有一种心态,你认为你可以解决你的问题。”