課題一:并行文件系統(tǒng)的應(yīng)用研究(系統(tǒng)運(yùn)行部)
介紹:隨著計(jì)算能力的增強(qiáng)、存儲(chǔ)容量的增大、應(yīng)用課題規(guī)模和復(fù)雜度的增加,高性能計(jì)算機(jī)對(duì)并行文件系統(tǒng)性能要求越來(lái)越高,在海量小文件頻繁創(chuàng)刪和大規(guī)模并發(fā)I/O操作的應(yīng)用場(chǎng)景中,文件系統(tǒng)元數(shù)據(jù)吞吐率成為限制其性能的關(guān)鍵因素。當(dāng)元數(shù)據(jù)IO負(fù)載大到一定程度,元數(shù)據(jù)服務(wù)進(jìn)程掛起,導(dǎo)致文件系統(tǒng)無(wú)法正常工作。研究調(diào)度方式改變,以分散作業(yè)元數(shù)據(jù)的負(fù)載,改善高性能計(jì)算中的元數(shù)據(jù)瓶頸問(wèn)題,或者可以通過(guò)研究監(jiān)控上層節(jié)點(diǎn)IO,找到IO負(fù)載大的上層節(jié)點(diǎn)。另外現(xiàn)有的Lustre并行文件系統(tǒng),對(duì)數(shù)據(jù)容錯(cuò)主要是通過(guò)底層raid技術(shù),當(dāng)一個(gè)存儲(chǔ)數(shù)據(jù)節(jié)點(diǎn)故障,導(dǎo)致文件系統(tǒng)無(wú)法讀寫(xiě),研究文件系統(tǒng)故障節(jié)點(diǎn)自動(dòng)數(shù)據(jù)遷移,在文件系統(tǒng)正常工作前提下,更換故障節(jié)點(diǎn)。
研究方向:并行文件系統(tǒng)數(shù)據(jù)智能遷移研究、并行文件系統(tǒng)IO負(fù)載研究、并行文件系統(tǒng)元數(shù)據(jù)研究、并行文件系統(tǒng)數(shù)據(jù)容錯(cuò)研究
課題二:基于龍芯集群平臺(tái)的科學(xué)計(jì)算關(guān)鍵技術(shù)研究(高性能計(jì)算部)
介紹:利用深圳超算中心的龍芯集群,建立起龍芯集群應(yīng)用軟件性能剖析環(huán)境并推廣其應(yīng)用,使我國(guó)全國(guó)產(chǎn)高性能計(jì)算機(jī)從花錢(qián)“搭建”進(jìn)步到全面掌控的國(guó)際領(lǐng)先水平。研究?jī)?nèi)容分為科學(xué)問(wèn)題研究和工程應(yīng)用研發(fā)兩部分,前者主要是研究龍芯集群上的性能優(yōu)化與測(cè)評(píng)方法,后者主要是完成有價(jià)值的應(yīng)用在深圳超算龍芯集群上的移植和優(yōu)化。
一、龍芯集群的性能測(cè)評(píng)與優(yōu)化。主要包含科學(xué)及計(jì)算庫(kù)、自動(dòng)向量化、CC-NUMA架構(gòu)優(yōu)化和性能剖析工具研究4個(gè)內(nèi)容:
(1)科學(xué)計(jì)算庫(kù)在支持通用的科學(xué)計(jì)算應(yīng)用:
1)針對(duì)基于全新GS464E架構(gòu)的單路四核龍芯3A2000和四路十六核龍芯3B2000高性能通用處理器,對(duì)GotoBLAS庫(kù)Level3級(jí)核心函數(shù)DGEMM及其他核心函數(shù)進(jìn)行優(yōu)化算法和優(yōu)化手段的研究。
2)針對(duì)大型CC-NUMA系統(tǒng)中多層存儲(chǔ)結(jié)構(gòu),將OpenMP與BLAS庫(kù)結(jié)合起來(lái)協(xié)同優(yōu)化。
(2)自動(dòng)向量化:
1)完善針對(duì)基本塊的SLP向量化和針對(duì)嵌套循環(huán)的多面體模型(PolyhedralFramework)等自動(dòng)向量化技術(shù),使龍芯3B的SIMD擴(kuò)展指令得到編譯器的有效利用。
2)在GCC中實(shí)現(xiàn)龍芯3B的向量化支持,增加龍芯3B的體系結(jié)構(gòu)信息。
(3)CC-NUMA架構(gòu)優(yōu)化:
1)研究類似于IntelParallelStudio的PGO(profile-GuidedOptimization)的優(yōu)化框架;
2)將局部性泄露的定量評(píng)估引入到線程和內(nèi)存布局的最優(yōu)求解過(guò)程中,形成新的布局求解算法;
3)嘗試將布局算法結(jié)合到GCC中或編譯器預(yù)處理模塊上。
(4)性能剖析工具研究:
1)分析現(xiàn)有的眾多性能剖析工具,評(píng)估其在龍芯上的實(shí)用性情況和移植工作量;
2)選擇三個(gè)層次上的最基本功能,確定出龍芯性能剖析工具的框架;
3)開(kāi)發(fā)或移植相應(yīng)的性能剖析工具,形成可用的軟件套件。
二、應(yīng)用優(yōu)化實(shí)踐研究。涉及到應(yīng)用軟件的移植、測(cè)評(píng)和優(yōu)化實(shí)施:
1)將若干備選的應(yīng)用軟件移植到龍芯集群,分析和評(píng)估移植可行性;
2)完成代碼的移植、編譯、調(diào)試和試運(yùn)行;
3)利用本項(xiàng)目研究的性能剖析工具進(jìn)行性能測(cè)評(píng)和分析,評(píng)估其可優(yōu)化空間。
4)聯(lián)合第三方用戶單位,將應(yīng)用軟件實(shí)施有效運(yùn)行。
課題三:高性能計(jì)算環(huán)境應(yīng)用服務(wù)優(yōu)化關(guān)鍵技術(shù)研究(高性能計(jì)算部)
介紹:本課題隸屬于863重大專項(xiàng)高效能計(jì)算機(jī)及應(yīng)用服務(wù)環(huán)境(二期),主要內(nèi)容是立足已有的高性能計(jì)算環(huán)境基礎(chǔ),重點(diǎn)研究高性能計(jì)算環(huán)境的應(yīng)用服務(wù)優(yōu)化關(guān)鍵技術(shù),包括資源彈性調(diào)度、統(tǒng)一認(rèn)證與系統(tǒng)安全、應(yīng)用服務(wù)共享、資源監(jiān)控和運(yùn)行管理、資源記賬統(tǒng)計(jì)等,開(kāi)發(fā)一套基礎(chǔ)軟件,集成國(guó)內(nèi)優(yōu)秀的高性能計(jì)算資源,建立具有新型運(yùn)行機(jī)制和豐富應(yīng)用資源的高性能計(jì)算應(yīng)用服務(wù)環(huán)境,提高高性能計(jì)算資源的利用率;同時(shí),依托國(guó)家高性能計(jì)算應(yīng)用服務(wù)環(huán)境,在工業(yè)產(chǎn)品設(shè)計(jì)、新藥創(chuàng)制、數(shù)字媒體和文化創(chuàng)意三個(gè)應(yīng)用領(lǐng)域建立具有新型運(yùn)行模式的領(lǐng)域應(yīng)用社區(qū),結(jié)合領(lǐng)域背景知識(shí),為用戶定制應(yīng)用服務(wù),降低高性能計(jì)算應(yīng)用成本,全面提升高性能計(jì)算應(yīng)用服務(wù)水平。
課題四:主機(jī)惡意行為監(jiān)控與分析關(guān)鍵技術(shù)研究(高性能計(jì)算部)
介紹:項(xiàng)目以研究未來(lái)互聯(lián)網(wǎng)環(huán)境下的主機(jī)惡意行為、惡意軟件(代碼)檢測(cè)、網(wǎng)絡(luò)行為識(shí)別與審計(jì)技術(shù)為基礎(chǔ),重點(diǎn)研究信息安全核心共性技術(shù),并且將其廣泛應(yīng)用于下一代防火墻軟件、互聯(lián)網(wǎng)網(wǎng)絡(luò)審計(jì)系統(tǒng)等信息安全產(chǎn)品及解決方案中。重點(diǎn)研究以下六項(xiàng)信息安全核心共性技術(shù):
一、基于主機(jī)狀態(tài)、主機(jī)網(wǎng)絡(luò)交互信息的行為分析技術(shù),包括網(wǎng)絡(luò)交互信息的逐層分析規(guī)則、主機(jī)狀態(tài)分析規(guī)則以及綜合行為分析技術(shù)。
二、木馬、蠕蟲(chóng)、僵尸等惡意代碼的深化家族變種技術(shù)。
三、開(kāi)放、可擴(kuò)展的威脅場(chǎng)景知識(shí)庫(kù)的框架,研究威脅場(chǎng)景知識(shí)庫(kù)的自動(dòng)化構(gòu)造技術(shù)以及高效的惡意行為確認(rèn)機(jī)制。
四、主機(jī)行為信息的描述方法,研究面向海量網(wǎng)絡(luò)行為信息的快速分析技術(shù)。
五、面向大規(guī)模網(wǎng)絡(luò)的遠(yuǎn)程控制技術(shù),遠(yuǎn)程支持對(duì)行為異常設(shè)備的監(jiān)控。
六、基于主機(jī)行為監(jiān)控與分析系統(tǒng)的自身抗毀技術(shù),抵御各種惡意軟件及應(yīng)用對(duì)該系統(tǒng)的攻擊與損毀。
課題五:基于超級(jí)計(jì)算機(jī)的深度學(xué)習(xí)軟件平臺(tái)系統(tǒng)關(guān)鍵技術(shù)研究(高性能計(jì)算部)
介紹:基于超級(jí)計(jì)算機(jī)的深度學(xué)習(xí)網(wǎng)絡(luò)模型,即深度神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)設(shè)計(jì),為語(yǔ)音識(shí)別、圖像識(shí)別和自然語(yǔ)言處理等提供了高效的計(jì)算能力和算法實(shí)現(xiàn)基礎(chǔ),針對(duì)以上應(yīng)用的大規(guī)模問(wèn)題的高效求解,可以為深度學(xué)習(xí)應(yīng)用開(kāi)發(fā)提供良好的平臺(tái)。目前該核心技術(shù)國(guó)內(nèi)處于起步階段。計(jì)劃構(gòu)建的深度學(xué)習(xí)網(wǎng)絡(luò)模型通用計(jì)算平臺(tái),基于國(guó)產(chǎn)超級(jí)計(jì)算機(jī)環(huán)境實(shí)現(xiàn)深度學(xué)習(xí)領(lǐng)域中深度神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)等環(huán)境,為深度學(xué)習(xí)提供自主可控的獨(dú)立計(jì)算環(huán)境,構(gòu)建多模型融合的深度學(xué)習(xí)網(wǎng)絡(luò)模型通用計(jì)算平臺(tái),實(shí)現(xiàn)深度學(xué)習(xí)獨(dú)立自主研究和構(gòu)建超算中心可持續(xù)發(fā)展能力。
主要研究?jī)?nèi)容包括以下幾個(gè)方面:
1、面向深度學(xué)習(xí)的大規(guī)模深度學(xué)習(xí)算法及工具集的研究;
2、面向深度學(xué)習(xí)的分布式并行深度學(xué)習(xí)執(zhí)行模式的研發(fā);
3、面向深度學(xué)習(xí)的分布式并行系統(tǒng)的研究;
4、面向大規(guī)模應(yīng)用的工程系統(tǒng)實(shí)現(xiàn)研究。
課題六:基于大數(shù)據(jù)平臺(tái)的智慧交通分析(市場(chǎng)推廣部)
介紹:智能交通的分析對(duì)象是整個(gè)城市的交通,具有海量數(shù)據(jù)的固有特性,車牌識(shí)別、交通監(jiān)控視頻、GPS等交通相關(guān)的數(shù)據(jù)量級(jí)已從TB級(jí)別躍升到PB級(jí)別,并且存在著嚴(yán)重的信息孤島,系統(tǒng)之間信息共享困難、信息傳遞延緩等問(wèn)題。本課題主要分析在當(dāng)今智慧城市智能交通的大環(huán)境下,如何利用大數(shù)據(jù)實(shí)時(shí)處理能力、高可用高穩(wěn)定特點(diǎn)及云計(jì)算技術(shù)特有的超強(qiáng)計(jì)算能力、動(dòng)態(tài)資源調(diào)度、按需提供服務(wù)以及海量信息集成化管理機(jī)制建設(shè)智慧城市的海量異構(gòu)的交通大數(shù)據(jù)平臺(tái)來(lái)實(shí)現(xiàn)智能交通數(shù)據(jù)分析。
主要研究方向如下:
1、基于大數(shù)據(jù)的交通流信息采集分析;
2、基于大數(shù)據(jù)的智能交通指揮調(diào)度;
3、基于大數(shù)據(jù)的違法及事故分析;
4、基于大數(shù)據(jù)的車駕分析研判;
5、基于大數(shù)據(jù)的交通誘導(dǎo)信息服務(wù);
6、基于大數(shù)據(jù)的交通信號(hào)控制。