四川大学计算机学院西南地区第一个大数据分析GPU深度神经网络计算平台是个什么水平?

论坛 期权论坛 期权     
匿名用户   2018-9-24 01:01   20990   8
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

8 个回复

倒序浏览
2#
匿名用户   | 2018-9-24 01:01:42 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
3#
叛逆者  6级职业 | 2018-9-24 01:01:43 发帖IP地址来自
注意,“第一个”的限定条件是“西南地区”。

技术上来说,只要有机器,装了caffe,就行了。纯粹体力活而已。
4#
机器永不为奴  1级新秀 | 2018-9-24 01:01:44 发帖IP地址来自
如此客观的新闻,都能这般招黑……真是吃不到葡萄说葡萄酸
我之前的实验室,做MRI形态学重构,一个人的数据要跑一天,做复杂网络分析,一个人又是一天,一来就是几百人样本,而我们实验室没!有!服!务!器!一样可以做,是的,我征用了七八台电脑,昼夜不停的跑。
你说西南第一的gpu集群在学术上有多大价值,放在那里不用,一点价值没有,用起来,就是以前一周的实验,现在一天不到就搞定了!你说有用没有用?你说该不该学校首页来个新闻!
至于那些说给我钱也行的,也是够了。本来就是这样,这是实验室的设备,而不是实验室的技术核心。一个实验室都是不能干活的,当然药丸,但是都是能干活的却练个好锄头都没有,也是很蛋疼。
5#
匿名用户   | 2018-9-24 01:01:46 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
6#
Coldwings  5级知名 | 2018-9-24 01:01:47 发帖IP地址来自
介于许多人对巨型机啊集群啊什么的没太多认识,所以说有些东西稍稍科普一下我觉得也算合理。

巨型机什么的,真不是「一台电脑」,你在单台机器上跑的程序丢巨型机上去不见得就会更快(其实大多数时候会更慢……如果那程序就个单线程的话)。巨型机什么的其实是一个集群,是一大堆电脑的总和。它真正意义上的快,在于有数量众多的计算节点可以完成工作,且计算节点间的通信速度足够快。就好像说叫一个普通人挣15亿元钱,这很难,甚至因为量太大了而做不到(还没弄完呢结果人死了);反之如果全国人民一人给你一块,15亿就够了。

那么要如何让全国人民都给你一块钱呢?首先,你要告诉所有人,请他们一人给你一块;然后他们想办法拿出来这一块钱付给你;最后把钱全都汇总起来。

然而这个事情确实就很难做到:首先你要保证大家都忙得过来,愿意给你这一块钱;然后大家总得通过什么途径给你,到你身边把一块钱交你手里显然是不行的,银行汇款也得银行愿意干,加之要是排个队那就惨了……你说网上转账,咱大过年抢个火车票都可能网页刷不出来,大家一起登网银大概也会要崩。最后你拿到15亿了总得派上用场不是?当然这其实是最省事的事情了。再想想看,如果这些步骤中间出了什么岔子,还是有可能凑不齐15亿。

类似的,做巨型机,并不是拿去累CPU堆GPU。首先你得把它们连起来,其次要让那堆机器可以协同工作。可以的话,最好能给编程提供方便,不然就做好现有工具链的兼容。


在一个国家,这种类似一人交一块钱的事情叫做收税,从上到下有许多人组成了各级税务部门来管理这些事情;巨型机中,这些钱可以看作计算资源,每个人可以当作计算节点,税收的法规就是需要执行的程序,发票、收据,以及银行服务提供了通信。此外,为了保证每个人都拿得出这一块钱,计算节点一般都用统一或者类似的配置(甚至相近的产品批次),为了确保就算有谁死了也能正常运转,节点有验证,有冗余……要是纯粹摆一堆台式机丢一起,占地方不说,通信带宽和响应速度有限,网络压力大时包冲突明显,随便坏个一两台机器还得一个个找。更关键的是,随着节点数增加,在网络通信、任务分配等方面的开销也会增加,恰巧其中不少都是非线性的——单纯堆CPU和GPU,堆到一定规模,总效率都不会再提高了。


所以说,构成一台巨型机是个工程项目。当然如果能改进一些硬件瓶颈(主要是通信,其次是能耗)和一些软件瓶颈(主要是任务分配、结果核算、故障保障之类),就能够大幅度提高整体效能。


—————————————————


然后就说这次西南的巨型机——就它而言,真的没啥创新,指标并不高,体系结构也是沿用已有的内容,就CS而言基本上没啥意义。当然了,它给西部地区提供了个就近能用的计算中心,也摆明了西南地区对相关产业的支持力度……这些意义大都是政治和经济层面上,而非技术层面上的。


但是别把天河跟这个玩意做对比。天河至少有定制但兼容Unix的BSD类OS,有定制的编译器,有为了解决通信问题而自行设计生产的光通信设备,有自己的任务分配算法和相关软件基础,甚至专门搞了个流片线搞了个定制CPU(天河1A),也确实做到了有学术意义——尽管这个意义可能并不见得比更节能或者平台更特别或者架构更新的它国巨型机更大,但至少我觉得没必要黑的。
7#
匿名用户   | 2018-9-24 01:01:48 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
8#
张华  5级知名 | 2018-9-24 01:01:49 发帖IP地址来自
成都在搞大数据产业,政府这方面比较给力。
电子科大周涛搞了一个(中国)大数据研究中心,又搞了好几个公司,具体做什么不清楚,这家伙很会炒作包装(中性偏褒义)。
川大这位院长是IEEE Fellow,肯定是有料的,GPU深度神经网络计算平台本身没什么太尖端的前沿意义,就是用GPU并行能力做深度运算,算是很流行、主流的技术,但是如果做出成熟方案和服务,也很厉害。
9#
匿名用户   | 2018-9-24 01:01:50 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:24326
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP