|
这种新的编程语言承诺上大数据的4倍的速度提升.远程控制软件,灰鸽子远程控制软件
它提供更好的内存管理对于大型,分散的数据集
内存管理是不够的挑战传统的数据集,但在大数据进入图片,事情可以减缓一路下跌。由麻省理工学院在本周宣布新的编程语言的目的是解决这个问题,到目前为止,它已经发现,在常见的算法实现四倍的速度提升。
局部性原理是当今大多数计算机芯片支配的内存管理,这意味着如果一个程序需要存储在某些内存位置的数据块,它通常假设需要邻近块为好。在大数据,但是,这并不总是如此。相反,方案往往必须采取行动只是散落在庞大的数据集的几个数据项。
获取从主内存中的数据在今天的芯片主要性能瓶颈,因此不必把它拿来比较频繁可以显着降低执行。“它是那样的话,你想麦片一勺每次你打开冰箱,打开牛奶盒,倒入一勺牛奶,关闭纸箱,并把它放回冰箱,解释说:”弗拉基米尔Kiriansky,博士生在麻省理工学院电气工程和计算机科学。
考虑到这一挑战,Kiriansky和麻省理工学院的计算机科学与人工智能实验室(CSAIL)其他研究人员已经创造了牛奶,一种新的语言,可以让应用程序开发人员,随着大型数据集的散乱数据点的处理程序更有效地管理内存。
从本质上讲,牛奶增加了OpenMP的,对于语言如C和Fortran的API,使得它更易于编写代码,针对多核处理器的几个命令。使用它,程序员插入代码周围的任何指示一些额外的线条,通过大量的数据收集迭代寻找一个相对较小的项目数。那么牛奶的编译器计算出如何相应地管理内存。
写在牛奶的程序中,当芯发现它需要一个片的数据,它不请求它 - 和随之而来的相邻的数据 - 从主存储器。相反,它增加了该数据项的地址和本地存储的地址的列表。当列表变得足够长,所有的芯片的芯池他们的列表,组一起那些彼此靠近的地址,并把它们重新分配到芯。通过这种方式,每个核心的请求仅数据项,它知道它需要和可以有效地检索。
在几种常见的算法测试中,写在新的语言课程是快四倍那些写在现有的语言中,麻省理工学院说。这可能会获得更好,也为研究人员合作,进一步提高技术。他们的项目在本周举行的国际会议上并行体系结构和编译技术呈现出的纸张。
|
-
灰鸽子
|